[go: up one dir, main page]

WO2002010334A2 - Element d'adn promoteur de l'activite de transcription, actif dans les cellules humaines et methode generale pour en ajuster l'activite - Google Patents

Element d'adn promoteur de l'activite de transcription, actif dans les cellules humaines et methode generale pour en ajuster l'activite Download PDF

Info

Publication number
WO2002010334A2
WO2002010334A2 PCT/FR2001/002438 FR0102438W WO0210334A2 WO 2002010334 A2 WO2002010334 A2 WO 2002010334A2 FR 0102438 W FR0102438 W FR 0102438W WO 0210334 A2 WO0210334 A2 WO 0210334A2
Authority
WO
WIPO (PCT)
Prior art keywords
sequence
promoter
transcription
stuffer
activity
Prior art date
Application number
PCT/FR2001/002438
Other languages
English (en)
Other versions
WO2002010334A3 (fr
Inventor
Jean-Paul Issartel
Pierre Lescuyer
Original Assignee
Genome Express
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genome Express filed Critical Genome Express
Priority to EP01960836A priority Critical patent/EP1305403A2/fr
Publication of WO2002010334A2 publication Critical patent/WO2002010334A2/fr
Publication of WO2002010334A3 publication Critical patent/WO2002010334A3/fr

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1247DNA-directed RNA polymerase (2.7.7.6)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)

Definitions

  • the present invention relates to a DNA sequence having a capacity for activating transcription equivalent to that of a strong viral promoter system.
  • the second aspect of the invention relates to the adjustment of the activity of this promoter or of any other promoter, by the insertion of a DNA fragment of variable size between the promoter fragment and the sequence of interest to be transcribed. .
  • RNA polymerases whose activity is initiated at the level of the promoters and can be modulated by transcription factors.
  • the operating modes of eukaryotic (and very particularly human) promoters are very little known.
  • the promoters used in the expression vectors are essentially "strong" promoters of viral origin. Generally refers to a strong promoter promoter whose presence allows increased transcription of the gene by at least 100 relative to the transcription of the gene in the absence of any promoter sequence. A majority of these promoters require the presence of enhancer sequence
  • the mitochondria are more numerous in the cells of the muscle than in other tissues, it is therefore necessary to adapt the quantity of a mitochondrial protein that one would like to express in the muscle compared to another tissue which calls for less mitochondrial functioning.
  • level of expression of a protein is to control the level of transcription and therefore consequently the level of synthesis of this protein.
  • transcriptional regulatory elements have been highlighted not only in the 5 ′ part upstream of the genes, but also in their introns. These sequences can act as transcription activators or they can be used for specific expression within a tissue or a cell type. Negative regulating intragenic elements have also been characterized in eukaryotic genes. In all cases, the transcriptional regulatory elements relate to a specific nucleotide sequence responsible for the binding of transcription factors. The influence of these sequences strongly depends on the cell type considered. The problem today is therefore twofold.
  • FIG. 1 illustrates a sequence comprising this promoter.
  • the invention according to a first aspect relates to this promoter, or a promoter having a homologous sequence, sharing at least 70% of identity with the promoter mentioned and / or sharing with it CCAAT motifs.
  • a promoter according to the first aspect of the invention will be called "NDUFS8 promoter”.
  • the invention provides a promoter sequence including the preceding promoter, also active in human cells and of non-viral origin, but which moreover has a promoter activity as "strong as the viral promoter SV40. hereinafter referred to as “promoter sequence NDUFS8”
  • promoter sequence NDUFS8 the strength of said promoter can be adjusted by introducing a DNA sequence, called stuffer, between the promoter and the sequence to be transcribed and which acts as The promoter's transcription activity decreases linearly depending on the size of the stuffer.
  • a fourth aspect of the invention makes it possible to attenuate the transcription activity of a promoter sequence, it can be adjusted by introducing a DNA sequence (stuffer) between this promoter sequence and the sequence to be transcribed, this stuffer acting as drive.
  • the NDUFS8 promoter is a promoter functional in human cells.
  • the human origin of this promoter is an additional advantage of the invention.
  • the promoter sequence according to the second aspect of the invention is active as a promoter without requiring the presence of an additional enhancer sequence (“enhancer”) and it has one of the strongest promoter activity known at present.
  • the third aspect of the invention makes it possible to modulate the rate of transcription induced by the promoter sequence
  • NDUFS8 NDUFS8. It is therefore possible to create a range of promoters having the same basic sequence according to the first aspect and differing only in the length of the stuffer, therefore a very homogeneous range in which the elements differ from each other by only one. feature.
  • the homogeneity of the promoters makes the cloning strategy much simpler than for promoters of diverse origin as was the case in the previous solutions where it was necessary to rethink the cloning strategy and the choice of sites of- -restriction for all the various constructions envisaged.
  • the invention according to its fourth aspect widens the possibility of regulating the transcription activity to other promoters. It is thus possible 'from a given promoter adapted to create a range of promoters having the same promoter sequence base and differing only in the length of the stuffer, hence a very uniform array whose elements differ from each other than by a single characteristic. The homogeneity of the promoters makes the cloning strategy much simpler.
  • Gene A nucleic acid molecule encoding a functional polypeptide or RNA molecule, containing transcriptional regulatory sequences.
  • the gene can also include non-coding sequences. Introns may be present.
  • Coding sequence DNA fragment coding for a functional polypeptide or an RNA molecule.
  • Promoter Region of initiation of transcription. This region includes the sequence elements necessary for initiation of transcription by the appropriate RNA polymerase. In general, this region, located upstream of the coding sequence, is 5 'to the site of initiation of transcription.
  • Promoter sequence A sequence comprising a promoter and transcriptional regulatory elements.
  • Transcription activity generated by a promoter sequence it is generally defined by the number of RNA molecules initiated per unit of time.
  • Transcriptional regulatory element Any element in a nucleic acid sequence which has the ability, alone or in combination with other cellular components (such as proteins), to initiate, promote, suppress, induce or complete the transcription of genomic DNA into RNA. In most cases, the genomic DNA whose transcription is regulated by this element, is located close to it, in 3 'or 5'.
  • transcriptional regulatory factor includes promoters, enhancers, repressors and transcription termination signals.
  • Transcription factor Cellular component (such as a protein) capable of interacting with a transcriptional regulatory element on a DNA sequence and participating in the regulation of transcription.
  • Chimeric gene Gene comprising sub-parts of different origins, for example a coding sequence from a first species and a promoter from a second species.
  • a gene is also considered to be a chimeric gene if it comprises sub-parts originating from different genes of the same species, or else from the same gene from different species.
  • Heterologous Two entities are heterologous towards each other when there is not naturally an association of these two sequences. For example, two nucleic acid sequence are hcierolo 'gues relative to each other if the sequences are not from the same organism or not the result of the same gene in a given organism.
  • % nucleic acid identity This percentage indicates the degree of identity between two nucleic acid sequences along the whole of the sequences, for sequences having more than 12 nucleic acids, for example more than 30 nucleic acids . If the sequences considered are of different size, the% identity is expressed as a function of the total length of the shortest sequence. To calculate the% identity, the two sequences are superimposed so as to maximize the number of identical bases by allowing intervals, then the number of identical bases is divided by the total number of bases of the shortest sequence.
  • the percentage of identity between two sequences can also be defined using the 'BLAST 2 Sequences' program.
  • This program uses the BLAST algorithm for two-to-two DNA-DNA sequence comparisons. A version of this program is available - on the website: http: //www.ncbi .nlm.nih.gov / blast / bl2seq / bl2.html.
  • Fragment Part of an entity that does not include the entire entity. For example, a nucleic acid sequence fragment refers to parts or segments of this sequence but does not include the entire sequence.
  • Stuffer A piece of DNA that goes between the promoter (or promoter sequence) and the coding sequence, " whose main functional characteristic is to keep these two elements apart.
  • a stuffer can include from zero base pairs to a few thousand base pairs, for example from 0 to 2000 base pairs, particularly from 0 to 1500.
  • the stuffer does not contain transcription regulatory elements recognized as such by the cell in question and it does not interact with the promoter or promoter sequence NRF1 binding site: Nucleic acid sequence on which the transcription factor binds
  • NRF1 nuclear respiratory factor 1 which acts in cis.
  • Functional transcript RNA obtained by the transcription of a DNA fragment, gene or chimeric gene, initiated at the level of a promoter sequence and the quality and size of which confer all of the functions encoded by said DNA fragment , that is to say antisense RNA capable of hybridizing with a specific messenger RNA, or messenger RNA comprising all the signals allowing its translation into a protein or a polypeptide coded by the coding sequence of the DNA fragment transcribed.
  • a first aspect according to the present invention relates to a promoter of small size active in human cells.
  • the inventors have demonstrated the very strong promoter activity of a fragment of a chromosome sequence llql3 located upstream of the human NDUFS8 gene.
  • This gene codes for the 23kDa subunit (also called TYKY or NDUFS8 subunit) of complex I (NADH-ubiquinone oxidoreductase-EC 1.6.5.3) of the mitochondrial respiratory chain.
  • the promoter element of the RNA polymerase transcription activity for this gene is included in the region separating the 3 'end of the ALDH7 gene upstream on the chromosome and the start of the first exon of the NDUFS8 gene. This region is illustrated in FIG. 2.
  • the promoter element is located more particularly in the 241 base pairs preceding the start of this first exon and represented in FIG.
  • An NDUFS8 promoter covers a DNA sequence having a percentage identity of more than 70% with the sequence described above of 241 base pairs and / or which comprises at least one of the three CCAAT motifs, preferably two of these patterns and at best all three.
  • the sequence has a percentage of identity with the sequence of FIG. 1 of more than 80%, for example more than 90%.
  • the percentage of identity is greater than 95%, for example more than 97%, more than 98%, for example more than 99%.
  • These latter variants preferably correspond to -allelic variants which are distinguished from the reference sequence by the insertion, deletion or replacement of 1 to 10 nucleotides; preferably with conservation of function.
  • an NDUFS8 promoter covers a DNA sequence capable of hybridizing with the sequence described above of 241 base pairs during a Southern blot under stringent conditions.
  • stringent conditions is meant the conditions which allow the specific hybridization of two single-stranded DNA sequences at approximately 65 ° C. for example in a solution of 6x SSC, 0.5% SDS, 5X Denhardt's solution and 100 ⁇ g non-specific carrier DNA or any other solution of equivalent ionic strength and after washing at 65 ° C, for example in a solution of at most 0.2 x SSC and 0.1% SDS or any other solution of ionic strength equivalent.
  • a promoter sequence according to the second aspect of the invention contains the previously described NDUFS8 promoter followed by at least part of exon I of the NDUFS8 gene and at least part of intron I of this same gene.
  • An NDUFS8 promoter sequence according to the invention contains at most one NRF1 binding site.
  • exon I is present in its entirety (base C1871 to base G1962 in FIG. 1) and intron I is present in part, this part having at least 500 to 1000 base pairs.
  • this region contains binding sites for the transcription factor Spl and for the respiratory nuclear factor NRF1.
  • a preferred variant of the invention contains a 3 'truncated form of the intron I.
  • the sequence corresponds to the 3' truncated form at the BamHI restriction site at G2081. This sequence is 452 base pairs and is framed by the restriction sites of Apal in 5 'and BamHI in 3'.
  • the promoter activity of the described sequence is comparable to that of SV40. Indeed, it has been cloned into the expression vector pGL-3basic Promega ®, containing the luc + gene for firefly luciferase. The level of production of luciferase was compared with the level of production in a similar construction but containing the viral promoter SV40 and the amplifier ("enhancer") SV40. The inventors have shown that the transcription levels induced by these two promoters are comparable. The SV40 promoter is reputed to have one of the strongest transcription activation capacities. The inventors have therefore demonstrated a short sequence of human genomic DNA endowed with a very strong transcriptional activation capacity, without requiring an additional enhancer sequence (as is the case for the SV40 promoter).
  • this sequence according to the invention has a promoter activity in eukaryotic cells.
  • the more particularly human origin of the sequence gives it activity in animal cells, particularly mammalian cells such as murine, simian, bovine cells, preferably it is also active in human cells.
  • the NDUFS8 promoter sequence according to the invention also has an adjustable transcriptional activation capacity.
  • the transcription activity generated by a promoter sequence is generally defined by the number of RNA molecules initiated per unit of time. In fact, several ways of modifying the transcriptional activity of a promoter sequence are conceivable. A first means would consist in changing the properties of the promoter sequence in itself, that is to say changing its efficiency or the speed of initiation of transcription.
  • modifications can be carried out by modifying the sequence or by adding binding sites for amplifiers (“enhancers”) or silencers.
  • Another means consists in intervening further downstream, once the transcription is initiated, by modifying the number of functional transcripts relative to the number of initiated transcripts. According to this second possibility, the promoter activity proper is not affected, but on the other hand the rate of functional transcripts is modulated. It is this second possibility that the inventors have exploited.
  • RNA polymerase To increase the number of correctly initiated but unsuccessful transcripts (truncated 3 'before the transcription termination site of the sequence to be transcribed), that is to say the "failure rate" of RNA polymerase, the inventors have inserted a DNA fragment called a “stuffer” between the promoter sequence and the sequence to be transcribed. Although the mechanism of action of this system has not yet been fully elucidated, the inventors postulate that, because of the presence of this fragment, the probability that the RNA polymerase will drop out of the DNA strand before the signal end of transcription is increased.
  • the fusion of the stuffer just downstream of the promoter sequence therefore makes it possible to modify the rate of functional transcripts obtained.
  • the stuffer lengthens the promoter sequence in 3 '. This lengthening compared to the basic construction of the promoter leads to the modulation of the activity transcriptional.
  • the stuffer is inserted downstream of the transcription initiation site.
  • the essential characteristic of the stuffer is its size in number of base pairs. The attenuation of the transcriptional activity with respect to the base sequence is an increasing linear function of the size of the stuffer, therefore the transcriptional activity decreases as the length of the stuffer increases.
  • the promoter sequence considered is the sequence of 452 base pairs located upstream of the KDUFS8 gene, containing the promoter of the gene, the first exon and a fragment of the first intron of the NDUFS8 gene, corresponding to the sequence represented in the Figure 1 between positions C1630 and G2081.
  • the stuffer does not contain a binding site for transcription factors, it is not an element of regulation of transcription according to the definition given above. In particular, it does not contain sites for amplifiers ("enhancers") or silencers. It is independent of the promoter sequence, it does not belong to this sequence in the sense that it does not modify its promoter activity.
  • the stuffer attenuates the transcription activity of the montage without affecting the efficiency or the speed of initiation of transcription by the promoter.
  • a stuffer according to the invention does not contain a transcription termination signal so that the RNA polymerase can therefore transcribe the sequence placed 3 'relative to the stuffer.
  • the sequence to be transcribed can be a sequence coding for a functional polypeptide.
  • the sequence to be transcribed can also serve as a template for synthesizing antisense RNA.
  • a “stuffer” sequence according to the invention mention may be made of all or part of the sequence of the NDUFS8 gene extending from nucleotide G2082 to nucleotide G3319, PCR fragments derived from the amplification of any regions of the genes NDUFS2 from chromosome lq23-25 and the NDUFS7 gene from chromosome 19pl3.
  • a stuffer according to the invention can be a perfectly random nucleic acid sequence, for example a synthetic sequence with equiprobability for the four bases A, T, C, G.
  • Another example of stuffer according to the invention comes from the digestion, enzymatic of genomic DNA, provided that the cells providing the DNA to be digested and those into which the stuffer is to be inserted are of very different species, for example of kingdoms. different . Fragments from the enzymatic digestion of prokaryotic organisms can serve as
  • fragments of bacterial or yeast DNA obtained by enzymatic digestion are potential candidates for use as a stuffer in human cells.
  • the present invention also relates to the chimeric genes containing a promoter sequence, a DNA fragment called stuffer whose size makes it possible to modulate the activity of the promoter sequence and a sequence to be transcribed.
  • the promoter sequence is either an NDUFS8 promoter, or else an NDUFS8 promoter sequence (NDUFS8 promoter supplemented by the first exon and a fragment of the first intron of the NDUFS8 gene).
  • NDUFS8 promoter NDUFS8 promoter supplemented by the first exon and a fragment of the first intron of the NDUFS8 gene.
  • the sequence to be transcribed is heterologous with respect to the promoter sequence.
  • the sequence to transcribing is therefore not that coding for the NDUFS8 subunit.
  • the modulation allowed by the stuffer is a decrease in the transcription activity of the promoter sequence placed upstream. This decrease is an increasing linear function of the length of the stuffer
  • the modulation factor thus allowed is very important.
  • the promoter sequence corresponds to the sequence of 452 base pairs of the NDUFS8 gene illustrated in FIG. 1 and. where the sequence to be expressed, located downstream of the fusion between promoter sequence and stuffer, is that of the Iuc + gene in the expression vector pGL-3basic
  • a stuffer of 1200-1500 base pairs leads to a transcriptional activity of approximately 2 5 times that of the gene in the absence of any promoter sequence.
  • the stuffer is reduced to a few bases or reduced to nothing, a transcriptional activity equal to 200 times that observed in the absence of any promoter sequence is observed. Between the two situations, there is therefore a factor of 40 to 100.
  • the range of promoters with variable expression forces is therefore particularly wide.
  • a stuffer according to the invention is not a transcription regulation element therefore it does not contain a transcription termination signal.
  • a preferred stuffer according to the invention does not contain the ATG sequence which could lead to its translation after transcription.
  • Such a stuffer also does not contain any other signal that could lead to its translation. So that the influence of the stuffer remains limited within the cell and to avoid undesirable interactions or interference in the host cell, a variant of the invention consists in considering the stuffer as a first intron vis-à-vis screw of the sequence placed downstream in the chimeric gene. Therefore, a stuffer according to the invention would contain the signals necessary for its splicing after transcription. The mRNA produced by the host cell then corresponds to that which would have been generated after transcription only of the sequence to be transcribed of interest.
  • the sequence to be transcribed which is located within the chimeric gene, is not translated.
  • the construction of the chimeric gene can be carried out in order to synthesize antisense RNA to block for example the synthesis of other proteins of the host cell, it can also be carried out to synthesize ribozymes.
  • the sequence to be transcribed is translated.
  • This sequence of interest to translate placed in the 3 ′ part of the chimeric gene, contains an ATG which can be recognized by riboso es to allow translation of the reading frame. Therefore, after the transcription of the fusion between stuffer and sequence of interest, the translation will start exactly at the desired location at the start of the coding sequence of interest placed downstream of the ATG.
  • sequences to be transcribed As an example of a sequence to be transcribed, mention may be made of sequences coding for selection agents, markers, hormones, receptors, reporter proteins such as luciferase.
  • This sequence to be transcribed, once translated into a polypeptide can be used to trigger in the host the production of antibodies against the polypeptide encoded by said sequence.
  • the present invention also relates to vectors containing chimeric genes as described above. These vectors allow the introduction and possibly the expression of the chimeric gene in a host cell. Examples of vectors include the plasmid expression vectors, viral vectors' integrative vectors, autosomal vectors.
  • the present invention also relates to a family of expression vectors. Indeed, from an NDUFS8 promoter according to the invention, or else from an NDUFS8 promoter sequence according to the invention, it is possible to generate a range of expression vectors which differ from each other only by the size of the stuffer fused downstream of the promoter or of the promoter sequence. Expression vectors are thus obtained having a range of transcriptional activity. It is then possible to classify the vectors according to an order relation based on transcriptional activity.
  • This order relation between them as a function of transcriptional activity does not depend on the cell type. From a sample of this family of expression vectors, it is possible to obtain different levels of expression of a heterologous protein. Depending on the results, the level of expression can therefore be optimized so as not to be toxic, or it can be adjusted to a level required in a particular tissue or according to the therapeutic objectives.
  • the present invention relates to cells transformed with a chimeric gene.
  • the transformed cells are stable.
  • the cells are transiently transformed.
  • Favorite cells according to the invention are of mammalian origin and especially cells of human origin.
  • the invention also relates to non-human organisms transformed by a chimeric gene defined above, for example transgenic mammals such as mice, monkeys, bovines.
  • the methods employed for introducing the chimeric genes of the invention into cells are those usually described in the manuals.
  • the conventional techniques for the introduction of vectors into plant or bacterial cells are electroporation, chemical treatments accompanied by thermal cycles, bombardment with glass or metal beads, in particular for the introduction of plasmids.
  • the techniques of infection and transfection are also those conventionally described in the manuals; for example infection of Sf9 cells with a baculovirus.
  • the invention accounts for a process for the production of a heterologous protein.
  • a heterologous protein such production supposes the construction of a chimeric gene as described above.
  • the promoter is chosen between the NDUFS8 promoter of the invention, or the NDUFS8 promoter sequence of the invention.
  • the stuffer is defined according to the desired level of expression of the protein of heterologous interest.
  • the sequence to transcribe placed downstream of the stuffer is the coding sequence to translate corresponding to the protein of interest. This sequence contains an ATG which can be recognized by ribosomes to allow translation of the reading frame.
  • the chosen host cell is transformed with the constructed chimeric gene. Conditions are then applied to the host cell that allow the expression of chimeric genes.
  • the method according to the invention can comprise, in a last step, the extraction of the heterologous protein produced. This extraction can take place directly on the cells, after cell lysis, or else from the culture supernatant.
  • the present invention defines a means of attenuating the transcription activity of a promoter or of a promoter sequence.
  • the invention is a generalization to other promoters of the construction making it possible to adjust the transcription activity of an NDUFS8 promoter or of an NDUFS8 promoter sequence.
  • the invention according to this aspect relates to chimeric genes constructed from a given promoter sequence.
  • These chimeric genes contain a promoter sequence, a DNA fragment called stuffer, the size of which makes it possible to modulate the activity of the promoter sequence and a sequence to be transcribed.
  • the fusion of the stuffer just downstream of the promoter sequence makes it possible to attenuate the rate of functional transcripts. This attenuation from the base sequence is an increasing linear function of the size of the stuffer.
  • the stuffer according to this fourth aspect of the invention is used in the same way as in the third aspect where it is associated with the promoter sequence NDUFS8.
  • the stuffer also has the same characteristics as those presented above, in particular it modifies the rate of functional transcripts without strictly speaking modifying the promoter activity of the promoter sequence placed upstream.
  • the sequence to be transcribed is not translated.
  • the construction of the chimeric gene can be carried out in order to synthesize antisense RNAs to block, for example, the synthesis of other proteins of the host cell.
  • the sequence to be transcribed is translated. This sequence of interest to translate, placed in the 3 ′ part of the chimeric gene, contains an ATG which can be recognized by the ribosomes to allow translation of the reading frame. Therefore, after the transcription of the fusion between stuffer and sequence of interest, the translation will start exactly at the desired location at the start of the coding sequence of interest placed downstream of the ATG.
  • a possible chimeric gene according to the invention would consist of the promoter SV 40 fused with a stuffer. This construction makes it possible to decrease the activation force of the transcription of the SV40 promoter which is particularly strong.
  • the promoter sequence consists of a promoter, an exon and an intron fragment.
  • the promoter sequence comprises the fragment from -500 to +1400 base pairs of the COLIAI human gene corresponding to the promoter, to the first exon and to part of the first intron of the gene of the ⁇ 1 chain of the type I procollagen.
  • promoter sequence is the sequence -734 at +85 base pairs relative to the translation signal of the human gene NDUFS3.
  • Another example of a promoter sequence is the fragment from -436 to +49 base pairs of the human succinate dehydrogenase gene b gene.
  • the present invention also relates to vectors containing chimeric genes as described above. These vectors are used in a manner comparable to that described previously for the promoter sequence NDUFS8.
  • the present invention also relates to a family of expression vectors. Indeed, from an NDUFS8 promoter according to the invention, or from an NDUFS8 promoter sequence according to the invention, or from any other promoter or promoter sequence, it is possible to generate a range of expression vectors which differ from each other only in the size of the stuffer fused downstream of the promoter or promoter sequence. Expression vectors are obtained in this way having a range of transcriptional activity. It is then possible to classify the vectors according to an order relation based on transcriptional activity.
  • This order relation between them as a function of transcriptional activity does not depend on the cell type. From a sample of this family of expression vectors, it is possible to obtain different levels of expression of a heterologous protein. Depending on the results, the level of expression can therefore be optimized so as not to be toxic, or it can be adjusted to a level required in a particular tissue or according to the therapeutic objectives.
  • promoter sequence NDUFS8 for expressing endogenous or heterologous proteins in eukaryotic cells, in particular human cells.
  • the NDUFS8 promoter or / and of the NDUFS8 promoter sequence, with or without stuffer are particularly valuable.
  • the invention provides a promoter making it possible not only to express this protein in human cells, but also to adjust this expression to a required level by modulating the size of the stuffer.
  • montages promoter, + stuffer, fragment to transcribe and translate
  • Figure 1 ( Figure 1a continuing in Figure 1b): Sequence of the region of the NDUFS8 gene analyzed by transient transfection comprising 3403 base pairs, the 3 'end of the terminal exon of the ALDH7 gene is shown. The numbering begins at the nucleotide marked "1" corresponding to a cytosine.
  • AP2 nucleotides G359-G366 and C632-C639
  • CCAAT nt A1713-C1718, G1773-C1779, G1825-C1832
  • Ets nt C1674- C1683
  • NRFl nt G2053-C2062 and G2145-C2156
  • Spl nt C2156-C2161 and C2373-C2378
  • Sacl nt G-5-C1
  • BamHI nt G2081-C2086 and G3319-C3324
  • the enzyme restriction fragment obtained after digestion at the Sacl site and at the 2nd BamHJ site comprises 3319 base pairs.
  • ATG (nt A3396-G3398) at the 3 'end of the fragment is the translation initiation codon used for the expression of the premature form of the 23kDa subunit.
  • Exon 1 (nt C1871-G1962) is shown in bold. Intron 1 extends from nucleotide G1963 to nucleotide G3395.
  • Figure 2 Representation of the NDUFS8 gene region analyzed by transient transfection; . AP2, CCAAT, Ets, NRFl, Spl are homologous sequences of transcription factor binding sites. The 3 'end of the terminal exon of the ALDH7 gene is indicated. Sac1 and BamHI are the restriction sites used for the subcloning of the analyzed sequence; the ATG at the 3 ′ end of the fragment is the translation initiation codon used for the expression of the premature form of the 23kDa subunit. Exon 1 (represented by a hatched box) corresponds to the 5 'end of the NDUFS8 gene transcript; this part is not coding.
  • Figure 3 Representation of the inserts of the constructions made in the pGL3-basic vector.
  • Alu Jb and Alu Sx are intergenic sequences corresponding to listed patterns known as an “aluminum sequence” of Jb or Sx type.
  • S, B and A correspond respectively to the Sac1, BamHI and Apal restriction sites.
  • figure 3d Representation of the inserts of clones 42, 31 and 43
  • figure 3e Representation of the inserts of clones 46, 33, 29
  • Figure 4 Relative transcriptional activities of constructs 1, 3 and of the vector pGL3-control (promoter SV40 + enhancer).
  • the data in the graph represent the relative promoter force of the different inserts integrated into the pGL3-basic vector. These values correspond to the Firefly luciferase activities measured for the various constructions and corrected by the Renilla luciferase activities measured for the control vector pRL-TK. These values are reported for an activity of clone 1 arbitrarily fixed at a value of 1.
  • Relative transcriptional activity [(Firefly luciferase activity of the clone) - (Firefly luciferase activity of pGL3-basic)] / (Renilla luciferase activity of pRL-TK).
  • Transcriptional activities are shown for transient expression experiments in human 143B and mouse C2C12 cells in culture.
  • Figure 5 Relative transcriptional activities of constructions 1, 7, 3, 5, 26 and 9.
  • the data in the graph represent the relative promoter force of the different inserts integrated into the vector pGL3-basic. These values correspond to the Firefly luciferase activities measured for the various constructions and corrected by the Renilla luciferase activities measured for the control vector pRL-TK. These values are reported for an activity of clone 1 arbitrarily fixed at a value of 1.
  • Relative transcriptional activity [(Firefly luciferase activity of the clone) - (Firefly luciferase activity of pGL3-basic)] / (Renilla luciferase activity of pRL-TK).
  • FIG. 6 Relative transcriptional activities of constructs 1, 3, 26, 46, 33 and 29.
  • the data in the graph represent the relative promoter force of the different inserts integrated into the vector pGL3-basic. These values correspond to the Firefly luciferase activities measured for the various constructions and corrected by the Renilla luciferase activities measured for the control vector pRL-TK. These values are reported for an activity of clone 1 arbitrarily fixed at a value of 1.
  • Relative transcriptional activity [(Firefly luciferase activity of the clone) - (Firefly luciferase activity of pGL3-basic)] / (Renilla luciferase activity of pRL-TK ).
  • Figure 7 Relative transcriptional activities of constructs 3, 1, 14, 5, 7, 15 and 16.
  • the data in the graph represent the relative promoter force of the different inserts integrated into the vector pGL3-basic. These values correspond to the Firefly luciferase activities measured for the various constructions and corrected by the Renilla luciferase activities measured for the control vector pRL-TK. These values are reported for an activity of clone 1 arbitrarily fixed at a value of 1.
  • Relative transcriptional activity [(Firefly luciferase activity of the clone) - (Firefly luciferase activity of pGL3-basic)] / (Renilla luciferase activity of pRL-TK).
  • Figure 8 Relative transcriptional activities of constructs 5, 26, 42, 31, 43, 7 and 1. The data in the graph represent the relative promoter force of the different inserts integrated into the vector pGL3-basic. These values correspond to the Firefly luciferase activities measured for the various constructions and corrected by the Renilla luciferase activities measured for the control vector pRL-TK. These values are reported for an activity of clone 1 arbitrarily fixed at a value of 1.
  • Relative transcriptional activity [(Firefly luciferase activity of the clone) - (Firefly luciferase activity of pGL3-basic)] / (Renilla luciferase activity of pRL-TK ).
  • Figure 9 Variation in transcriptional activity depending on the addition of the stuffer.
  • the relative transcriptional activity of the constructs is represented as a function of the size (in number of base pairs) of the DNA sequence between the start of exon 1 and the start of the luc + DNA fragment coding for the Firefly. luciferase. Transcriptional activity is measured by the Dual-Luciferase system (Pro éga). The activity of clone 3 is chosen as a 100% reference.
  • FIG. 9a transfection into human cells 143B
  • Figure 10 Amplification by RT-PCR of the mRNA of the luc + gene.
  • the RNA from 143B cells transfected with clone 1 or with clone 3 were extracted and used as template in order to carry out an RT-PCR reaction under the conditions described in the material and methods section.
  • the primers used for the PCR reaction are specific to the sequence of the luc + gene.
  • the amplifiers are visualized under UV by staining with ethidium bromide after electrophoresis on a 1.5% agarose gel. The intensity of the bands is estimated using Gel Analyst software (Iconix). For each clone, 5 dilutions of the RT product were amplified by PCR: 1/10, 1/50, 1/100, 1/250, 1/500.
  • M stands for DNA fragment size markers (1 Kb ladder, Life Technologies); Tc- means negative control of the PCR reaction (PCR performed in the absence of. RNA).
  • the objective consisted in studying the transcriptional regulation of the human NDUFS8 gene coding for the 23 kDa subunit (also called TYKY or NDUFS8 subunit) of the complex I (NADH-ubiquinone oxidoreductase - EC 1.6.5.3) mitochondrial.
  • the characterization of this gene (De Sury et al., 1998) made it possible to show the presence of the gene coding for 1 ⁇ LDH7, upstream of NDUFS8, and the existence of a first non-coding exon for the NDUFS8 gene.
  • the sequence studied corresponds to a fragment of 3319 base pairs (bp) comprised between a fragment of the 3 'terminal part of the ALDH7 gene and the 3' end of the first intron of the NDUFS8 gene. This fragment is bounded by the SacI (5 'side) and BamHI (3' side) restriction sites. The 3 'end of this sequence is located 76 bp upstream of the translation initiation codon of the NDUFS8 gene.
  • Transient transfection experiments using a vector containing a nucleic acid fragment encoding firefly luciferase (Firefly luciferase - gene luc +) were carried out to identify the presence, in the sequence presented in FIG.
  • the lengthening of the sequence located 3 ′ with respect to this basic construction (see clone 26 of FIG. 3b) and upstream of the luc + fragment encoding the Firefly luciferase leads to a progressive and linear decrease in l transcription activity.
  • the invention therefore makes it possible to have: "a short sequence of human genomic DNA endowed with a very high capacity for activating transcription;” in addition, this transcriptional activity can be modulated as a function of the size of the fragment of DNA inserted into an expression vector between this sequence and the gene to be expressed.
  • Clone 1 contains the entire region studied. It was prepared from two inserts: a SacI / BamHI fragment of 2081 bp (part 5 ') and a BamHI / BamHI fragment of 1238 bp (part 3') ( Figure 1 and 2). These inserts are from digested human genomic DNA
  • Clone 3 contains the SacI / BamHI fragment of 2081 bp (part 5 ') and clone 9, the BamHI / BamHI fragment of 1238 bp (part 3').
  • Clones 5 and 7 were prepared respectively from clones 3 and 1 by eliminating an Apal / Apal restriction fragment corresponding to bases 194 to 1629 of the sequence studied.
  • Clone 26 contains the region 1630-2081. To make clone 14, the same two inserts as for clone 1 were used, but the BamHI / BamHI fragment of 1238 bp (in 3 ′) was integrated in the reverse orientation.
  • the human osteosarcoma cells of line 143B (ATCC, CRL-8303) are cultured in DMEM medium supplemented with 10% fetal calf serum and 0.1 mg / l of 5-bromo-2 '-deoxyuridine.
  • the murine myoblasts of the C2C12 line (ATCC, CRL-1772) are cultured in DMEM medium supplemented with 10% fetal calf serum. Cell cultures are carried out by incubation at 37 ° C. in an atmosphere containing 5% of CO 2.
  • the vector pRL-TK expresses a sea urchin luciferase (Renilla luciferase) under the control of the thymidine kinase promoter of the Herpes simplex virus. The constitutive expression of this luciferase serves as an internal control of the efficiency of the transfection.
  • Three microliters ( ⁇ l) of FuGENE 6 are used per well. The cells are then incubated 48 hours before being lysed for the measurement of luciferase activities.
  • the transfected cells are lysed in 100 or 500 ⁇ l of Passive Lysis Buffer IX depending on the activity of the transfected constructs.
  • the luminescence measurements are carried out on 5, 10 or 20 ⁇ l of cell lysate depending on the activity of the transfected constructs.
  • the Firefly luciferase corresponding to the constructions in the vector pGL3-basic, is assayed by the addition of 100 ⁇ l of Luciferase Assay Reagent II.
  • 100 ⁇ l of Stop & Glo reagent are added for the measurement of the Renilla luciferase activity corresponding to the control vector pRL-TK.
  • a 6-well plate is seeded with 10 5 143B cells per well. After 24 hours of culture, the cells contained in each well are transfected using 3 ⁇ g of DNA and 9 ⁇ l of FuGENE 6. Clone 1 and clone 3 are each transferred to 3 wells. The cells of the 3 wells corresponding to each transfected DNA are combined after 48 hours of incubation. Each cell pellet is lysed with 600 ⁇ l of RLT buffer (Promega) plus 6 ⁇ l of ⁇ -mercaptoethanol. The RNAs are extracted on RNeasy Mini Kit columns (Promega) according to the instructions provided by the manufacturer.
  • RNA For reverse transcription, 3 ⁇ g of RNA are treated with DNasel (DNasel amplification grade, Life Technologies) for 15 minutes at 30 ° C then the enzyme is inactivated for 10 minutes at 65 ° C in the presence of EDTA.
  • DNasel DNasel amplification grade, Life Technologies
  • the effectiveness of the DNase treatment is controlled by the absence of amplification of a fragment using a PCR carried out on 1 ⁇ l of the reaction product.
  • the primers used are the same as those used for RT-PCR and are specific for the Iuc + gene sequence.
  • the reverse transcription reaction is then carried out in a total volume of 30 ⁇ l in the presence of 0.1 millimolar (mM) of oligo (dT).
  • the reaction is carried out in a total volume of 25 ⁇ l containing 1 ⁇ l of a 1/10, 1/50, 1/100, 1/250 or 1/500 dilution of the product of the reverse transcription, 25 pmol of each primer, 200 mM of each deoxyribonucleotide triphosphate and 1 unit of Taq polymerase (Promega).
  • the incubation conditions are as follows: 5 minutes of denaturation at 95 ° C, 30 cycles consisting of 30 seconds of denaturation at 94 ° C, 30 seconds of hybridization at 58 ° C and 1 minute of extension at 72 ° C then, after the 30 cycles, 5 minutes of final elongation at 72 ° C.
  • the amplifiers are visualized under UV light after electrophoresis on a 1.5% agarose gel in TAE IX buffer (Tris acetate 0.04 M, 2 mM EDTA) and staining with ethidium bromide. • The intensity of the bands is estimated using the quantification software • Gel Analyst (Iconix).
  • luciferase activity of the constructs (Firefly luciferase) on luciferase activity of the control vector pRL-TK (Renilla luciferase), make it possible to compare the capacity for activation of transcription by the different DNA fragments tested.
  • a reference value of 1 is assigned to the ratio measured for clone 1 which corresponds to the entire sequence studied.
  • the values corresponding to the relative transcriptional activities determined in cells 143B (human origin) and C2C12 (murine origin) are presented in FIGS. 4, 5, 6, 7 and 8. The results obtained with normal human fibroblasts are qualitatively identical to those obtained with 143B cells, but are not presented in this document.
  • the comparison of clones 1 and 3 (FIG. 4) reveals two important data: on the one hand the presence of powerful transcription activators in the 5 ′ region constituted by the first 2081 bp, on the other hand the presence of a or several inhibitory elements in the 3 'part (1238 bp). Indeed, in human cells, the activity measured with clone 3 is approximately 30 times greater than that measured with clone 1. (approximately 40 times greater in murine cells).
  • the promoter force of the insert of clone 3 is very important since it is comparable to that measured for the vector pGL3-control (Promega) in which the transcription of the luc + gene is controlled by the viral promoter SV40 associated with an enhancer element ( "Enhancer”) SV40.
  • the insert of clone 3 consists of the 3 'end of the ALDH7 gene, the intergene region, the first exon of the NDUFS8 gene and the first 119 bases of the first intron.
  • Analysis of clone 9 shows that the 3 ′ region of 1238 bp is not capable of activating the transcription of the luc + gene. This result is explained by the fact that in this construction the transcription initiation site of the NDUFS8 gene, located in the inserts of clones 5 and 26, is absent.
  • Constructions were carried out in order to extend the 3 ′ end downstream of the minimal active region to determine which elements were responsible for the reduction in the promoter activity between clone 3 (very active) and clone 1 (not very active) .
  • the lengthening of the 3 'region leads to a gradual decrease in transcriptional activity ( Figure 8)
  • Figure 8 As shown in the graphs of Figures 9a and 9b, the decrease in luciferase activity measured with clones 42, 31, 43, 7 and 1 is linear and proportional to the size of the 3 'sequence of exon 1.
  • Quantification of the luc + gene mRNA This test was carried out in order to check that the enzymatic activities measured were well correlated with the ability of the sequences studied to activate transcription. Indeed, it could be envisaged that the presence of fragments of an intronic sequence in certain constructions could be at the origin of an alternative splicing phenomenon involving the luc + gene and disturbing the functioning of the enzyme rather than the transcription activity. A phenomenon of this type could explain the decrease in activity measured during the increase in the size of the intronic sequence. It was therefore important to check whether the production of mRNAs by the constructions was stimulated or reduced according to the activities measured in order to eliminate artifacts related to translation disruption.
  • the mRNAs were amplified by RT-PCR using primers which hybridize in the sequence of the luc + gene. These amplifications - were carried out from cells transfected either with clone 1 or with clone 3. The products of RT-PCR reactions are visualized under UV light after electrophoretic migration in an agarose gel in the presence ethidium bromide. The intensity of the bands is estimated using one . quantification software. The results are presented in FIG. 10.
  • the results therefore present .
  • the first corresponds to the demonstration of a human genomic DNA sequence of reduced size having a transcription activation capacity equivalent to that of a strong viral promoter system constituted by the promoter of the SV40 virus associated with an element. SV40 amplifier (pGL3-control vector, Promega).
  • the second is the possibility of reducing the activity of this promoter, almost at will, as a function of the size of the DNA fragment positioned between the promoter fragment and the gene of interest to be expressed.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

La présente invention concerne un élément promoteur de l'activité de transcription de l'ARN polymérase caractérisé en ce qu'il comprend : i) les 241 nucléotides, s'étendant de la position 1630 à la position 1870, de la séquence illustrée dans la figure 1 ou ; ii) une partie de la séquence i) comprenant au moins l'un des trois motifs CCAAT représentés dans la figure 1 ou ; iii) une séquence ayant au moins 70 % d'identité avec la séquence i) ; le dit élément contenant au plus un site de fixation NRF1.

Description

ELEMENT D'ADN PROMOTEUR DE L'ACTIVITE DE TRANSCRIPTION, ACTIF DANS LES CELLULES HUMAINES ET METHODE GENERALE POUR EN
AJUSTER L'ACTIVITE
La présente invention concerne une séquence d'ADN ayant une capacité d'activation de la transcription équivalente à celle d'un système promoteur viral fort. Le deuxième aspect de l'invention concerne l'ajustement de l'activité de ce promoteur ou de tout autre promoteur, par l'insertion d'un fragment d'ADN de taille variable entre le fragment promoteur et la séquence d'_intérêt à transcrire.
Au sein de la cellule, le niveau d'expression des protéines est régulé à de nombreuses étapes, et tout particulièrement par l'intermédiaire du niveau de transcription de l'ADN codant pour une protéine d'intérêt. La transcription de l'ADN en ARN est réalisée par des ARN- polymérases dont l'activité est initiée au niveau des promoteurs et peut être modulée par des facteurs de transcription.
A l'heure actuelle, les modes de fonctionnement des promoteurs eucaryotes (et tout particulièrement humains) sont très mal connus. De ce fait, les promoteurs utilisés dans les vecteurs d' expression sont essentiellement des promoteurs « forts » d'origine virale. On entend généralement par promoteur fort un promoteur dont la présence permet de multiplier la transcription' du gène par au moins 100 par rapport à la transcription du gène en l'absence de toute séquence promotrice. Une majorité de ces promoteurs nécessite la présence de séquence amplificatrice
(« enhancer ») supplémentaire pour que le facteur multiplicatif soit optimal.
Enfin, les possibilités de contrôle à façon du niveau de transcription des gènes d'un vecteur d'expression n'existent pas. Seul un contrôle binaire est envisageable par l' état de la technique ,- l' introduction de certains facteurs exogènes ou substances chimiques permettant d'activer ou de désactiver le promoteur. Cependant", ~quand on introduit une séquence hétérologue dans un organisme, l'adaptation de la force du promoteur pour optimiser l'expression de cette séquence est parfois essentielle. C'est le cas si la surexpression de la protéine codée par la séquence hétérologue est toxique. C'est aussi le cas si l'on veut ajuster l'expression de la protéine à un taux requis dans un tissu particulier ou selon les objectifs thérapeutiques. Par exemple, étant donné que les mitochondries sont plus nombreuses dans les cellules du muscle que dans d'autres tissus, il faut donc adapter la quantité d'une protéine mitochondriale que l'on voudrait exprimer dans le muscle par rapport à un autre tissu qui -fait appel à un fonctionnement mitochondrial moindre. Un des moyens de contrôler le niveau d'expression d'une protéine est d'en contrôler le niveau de transcription et donc par voie de conséquence le niveau de synthèse de cette protéine.
Si l'on • veut obtenir différents niveaux de transcription d'un gène, la solution antérieure consiste à créer des vecteurs d'expression avec différents promoteurs de forces inégales . Mais le choix de promoteurs reste limité. De plus, cette solution complique les aspects pratiques du clonage de fragments de gène à exprimer. Enfin, il est difficile de comparer a posteriori les différences d'efficacité des vecteurs, dans la mesure où après transfection cellulaire, l'on n'est plus tout-à-fait sûr des réponses individuelles de chaque promoteur dans le contexte physiologique particulier de la cellule transfectée.
Au niveau de la cellule eucaryote, il a été montré que de nombreux facteurs de transcription se fixaient sur l'ADN et permettaient in vivo de moduler le niveau de transcription. De manière plus récente, des éléments de régulation transcriptionnelle ont été mis en évidence non seulement dans la partie 5' en amont des gènes, mais aussi dans leurs introns. Ces séquences peuvent jouer le rôle d'activateurs de transcription ou bien elles peuvent servir pour l'expression spécifique au sein d'un tissu ou d'un type cellulaire. Des éléments intragéniques de régulation négative ont aussi été caractérisés dans des gènes eucaryotes. Dans tous les cas, les éléments de régulation transcriptionnelle concernent une séquence nucléotidique spécifique, responsable de la fixation de facteurs de transcription. L'influence de ces séquences dépend fortement du type cellulaire considéré. Le problème à l'heure actuelle est donc double. Non seulement il s'agit d'exprimer des protéines dans les cellules humaines en s'affranchissant du risque sanitaire encouru par l'introduction d'un promoteur d'origine virale. Mais il s'agit de plus, de réussir à moduler aisément le niveau d'expression de la protéine d'intérêt, sur une échelle très large, pour l'adapter au niveau requis dans la cellule-hôte.
C'est un des objectifs de la présente invention de fournir un promoteur actif dans les cellules humaines et qui ne soit pas d'origine virale. Le promoteur du gène NDUFS8 appartenant au chromosome humain n°ll répond à cet objectif. La figure 1 illustre une séquence comprenant ce promoteur. L'invention selon un premier aspect concerne ce promoteur, ou un promoteur ayant une séquence homologue, partageant au moins 70% d'identité avec le promoteur cité et/ou partageant avec celui-ci des motifs CCAAT. Un promoteur selon le premier aspect de l'invention sera dénommé « promoteur NDUFS8 ». Selon un second aspect, l'invention fournit une séquence promotrice incluant le promoteur précédent, également active dans les cellules humaines et d' origine non-virale, mais qui de plus présente une activité promotrice aussi" forte que le promoteur viral SV40. Nous la désignerons par la suite par « séquence promotrice NDUFS8 » . Selon un troisième aspect de l'invention, la force dudit promoteur peut être ajustée en introduisant une séquence d'ADN, appelée stuffer, entre le promoteur et la séquence à transcrire et qui agit comme variateur. L'activité de transcription du promoteur décroît linéairement en fonction de la taille du stuffer.
Un quatrième aspect de l'invention permet d'atténuer l'activité de transcription d'une séquence promotrice, elle peut être ajustée en introduisant une séquence d'ADN (stuffer) entre cette séquence promotrice et la séquence à transcrire, ce stuffer agissant comme variateur.
La. présente invention possède donc de nombreux avantages. Tout d'abord, le promoteur NDUFS8 est un promoteur fonctionnel dans les cellules humaines. L'origine humaine de ce promoteur est un atout supplémentaire de l'invention. De plus, la séquence promotrice selon le second aspect de l'invention est active en tant que promoteur sans nécessiter la présence de séquence amplificatrice (« enhancer ») supplémentaire et elle a une activité promotrice parmi les plus fortes connues à l'heure actuelle.
Le troisième aspect de l'invention permet de moduler le taux de transcription induit par la séquence promotrice
NDUFS8. Il est de ce fait possible de créer une gamme de promoteurs ayant la même séquence de base selon le premier aspect et ne différant que par la longueur du stuffer, donc une gamme très homogène dont les éléments ne diffèrent les uns des autres que par une seule caractéristique. L'homogénéité des promoteurs rend la stratégie de clonage nettement plus simple que pour des promoteurs d' origine diverse comme c'était le cas dans les solutions antérieures où il fallait repenser la stratégie de clonage et le choix des sites de- -restriction pour toutes les différentes constructions envisagées .
L'invention selon son quatrième aspect élargit la possibilité de régulation de l'activité de transcription à d'autres promoteurs. Il est donc ainsi possible' à partir d'un promoteur adapté donné de créer une gamme de promoteurs ayant la même séquence promotrice de base et ne différant que par la longueur du stuffer, donc une gamme très homogène dont les éléments ne diffèrent les uns des autres que par une seule caractéristique. L'homogénéité des promoteurs rend la stratégie de clonage nettement plus simple.
Dans le contexte de la présente invention, les termes ci-dessous sont définis de la manière suivante :
Gène : Molécule d'acides nucléiques codant pour un polypeptide fonctionnel ou une molécule d'ARN, contenant des séquences de régulation de la transcription. Le gène peut aussi comprendre des séquences non codantes . Des introns peuvent être présents .
Séquence codante : Fragment d'ADN codant pour un polypeptide fonctionnel ou une molécule d'ARN.
Promoteur : Région de l'initiation de la transcription. Cette région comprend les éléments de séquence nécessaires pour l'initiation de la transcription par l'ARN polymerase appropriée. En général, cette région, située en amont de la séquence codante, est en 5' par rapport au site d'initiation de la transcription. Séquence promotrice : Séquence comprenant un promoteur et des éléments de régulation de transcription.
Activité de transcription engendrée par une séquence promotrice : elle se définit généralement par le nombre de molécules d'ARN initiées par unité de temps .
Elément de régulation de transcription : Elément quelconque dans une séquence d' acides nucléiques qui a la capacité, seul ou bien associé à d'autres composants cellulaires (tels que des protéines) , d'initier, de favoriser, de réprimer, d'induire ou de terminer la transcription d'ADN genomique en ARN. Dans la plupart des cas, l'ADN genomique dont la transcription est régulée par cet élément, est située à proximité de lui, en 3' ou en 5' . Le terme facteur de régulation de transcription inclut les promoteurs, les amplificateurs (« enhancers ») , les répresseurs et les signaux de terminaison de transcription.
Facteur de transcription : Composant cellulaire (tel qu'une protéine) capable d' interagir avec un élément de régulation de transcription sur une séquence d'ADN et de participer à la régulation de la transcription.
Gène chimère : Gène comprenant des sous-parties de différentes origines, par exemple une séquence codante provenant d'une première espèce et un promoteur venant d'une deuxième espèce. Un gène est également considéré comme un gène chimère s'il comprend des sous-parties provenant de différents gènes d'une même espèce, ou bien d'un même gène de différentes espèces . Hétérologue : Deux entités sont hétérologues l'une vis-à-vis de l'autre quand il n'existe pas naturellement d'association de ces deux séquences. Par exemple, deux séquence d'acides nucléiques sont hétérolo'gues l'une par rapport à l'autre si les séquences ne proviennent pas du même organisme ou bien ne proviennent pas du même gène pour un organisme donné. % d'identité d'acides nucléiques : Ce pourcentage indique le degré d'identité entre- deux séquences d' acides nucléiques le long des séquences dans leur entier, pour des séquences possédant plus de 12 acides nucléiques, par exemple plus de 30 acides nucléiques . Si les séquences considérées sont de taille différente, le % d'identité est exprimé en fonction de la longueur totale de la plus courte séquence. Pour calculer le % d'identité, les deux séquences sont superposées de façon à maximiser le nombre de bases identiques en autorisant des intervalles, puis le nombre de bases identiques est divisé par le nombre total de bases de la plus courte séquence .
Le pourcentage d'identité entre deux séquences peut également être défini en utilisant le programme 'BLAST 2 Séquences'. Ce programme utilise l'algorithme BLAST pour des comparaisons de séquences ADN-ADN deux à deux. Une version de ce programme est disponible- sur le site web : http://www.ncbi .nlm.nih.gov/blast/bl2seq/bl2.html . Fragment : Partie d'une entité n'incluant pas l'entité dans son entier. Par exemple, un fragment de séquence d'acides nucléiques se réfère à des parties ou segments de cette séquence mais n'inclut pas la séquence dans son intégralité. Stuffer : Fragment d'ADN qui se place entre le promoteur (ou la séquence promotrice) et la séquence codante," dont la principale caractéristique fonctionnelle est d' éloigner ces deux éléments . Un stuffer peut comprendre de zéro paire de bases à quelques milliers de paires de bases, par exemple de 0 à 2000 paires de bases, particulièrement de 0 à 1500. Le stuffer ne contient pas d'éléments de régulation de transcription reconnus comme tels par la cellule en question et il n' interagit pas avec le promoteur ou la séquence promotrice . Site de fixation NRF1 : Séquence d'acides nucléiques sur laquelle se fixe le facteur de transcription
NRF1 (nuclear respiratory factor 1) qui agit en cis. Transcrit fonctionnel : ARN obtenu par la transcription d'un fragment d'ADN, gène ou gène chimère, initiée au niveau d'une séquence promotrice et dont la qualité et la taille lui confèrent l'intégralité des fonctions codées par ledit fragment d'ADN, c'est-à-dire ARN anti-sens capable d'hybrider avec un ARN messager spécifique, ou ARN messager comportant tous les signaux permettant sa traduction en une protéine ou un polypeptide codés par la séquence codante du fragment d'ADN transcrit.
L'invention va maintenant être décrite plus en détails.
Un premier aspect selon la présente invention concerne un promoteur de petite taille actif dans les cellules humaines .
Les inventeurs ont mis en évidence la très forte activité promotrice d'un fragment de séquence du chromosome llql3 situé en amont du gène humain NDUFS8. Ce gène code pour la sous-unité 23kDa (encore appelée TYKY ou sous-unité NDUFS8) du complexe I (NADH-ubiquinone oxydoréductase-EC 1.6.5.3) de la chaîne respiratoire mitochondriale . L'élément- promoteur de l'activité de transcription de l'ARN polymerase pour ce gène est compris dans la région séparant l'extrémité 3' du gène ALDH7 en amont sur le chromosome et le début du premier exon du gène NDUFS8. Cette région est illustrée dans la figure 2. L'élément promoteur est situé plus particulièrement dans les 241 paires de bases précédent le début de ce premier exon et représenté dans la figure 1 entre les positions C1630 et A1870. Cette région en amont du premier exon est caractérisée par la présence de trois motifs « CCAAT-like » aux positions -153, -92 et -39 par rapport au nucléotide C1871 qui définit vraisemblablement le début du premier exon. Aucune « TATA box » consensuelle n'est présente en aval du second et du troisième motif CCAAT. En amont des sites CCAAT se trouve un motif qui correspond à un site de fixation pour « Ets », un facteur ayant un rôle général dans l'activation de la transcription. Le rôle des motifs CCAAT est important dans l'activité promotrice. Des fragments d'ADN tronqués en 5' et donc ne contenant qu'un ou deux des trois motifs CCAAT présentent une activité promotrice affaiblie par rapport à la séquence de 241 paires de bases décrite mais conservent néanmoins une activité.
Un promoteur NDUFS8 selon l'invention recouvre une séquence d'ADN présentant un pourcentage d'identité de plus de 70% avec la séquence décrite plus haut de 241 paires de bases et/ou qui comprend au moins l'un des trois motifs CCAAT, de préférence deux de ces motifs et au mieux les trois. De préférence, la séquence présente un pourcentage d'identité avec la séquence de la figure 1 de plus de 80%, par exemple plus de 90%. De préférence, le pourcentage d'identité est supérieur à 95%, par exemple plus de 97%, plus de 98%, par exemple plus de 99% .
Ces dernières variantes correspondent de préférence à des variantes -alléliques qui se distinguent de la séquence de référence par l'insertion, la dêlétion ou le remplacement de 1 à 10 nucleotides ; avec de préférence une conservation de fonction.
Selon une autre variante, un promoteur NDUFS8 selon l'invention recouvre une séquence d'ADN capable de s'hybrider avec la séquence décrite plus haut de 241 paires de bases lors d'un Southern Blot sous conditions stringentes. Par « conditions stringentes », on entend les conditions qui permettent l'hybridation spécifique de deux séquences d'ADN simple brin à environ 65°C par exemple dans une solution de 6x SSC, 0,5% SDS, 5X Denhardt's solution et 100 μg d'ADN carrier non spécifique ou toute autre solution de force ionique équivalente et après un lavage à 65°C, par exemple dans une solution d'au plus 0,2 x SSC et 0,1% SDS ou toute autre solution de force ionique équivalente.
Une séquence promotrice selon le deuxième aspect de l'invention, appelée séquence promotrice NDUFS8, contient le promoteur NDUFS8 précédemment décrit suivi d'au moins une partie de l'exon I du gène NDUFS8 et d'au moins une partie de l'intron I de ce même gène. Une séquence promotrice NDUFS8 selon l'invention contient au plus un site de fixation NRF1.
De préférence, l'exon I est présent dans sa totalité (base C1871 à base G1962 dans la figure 1) et l'intron I est présent en partie, cette partie ayant au moins 500 à 1000 paires de bases. En effet, cette région contient des sites de fixation pour le facteur de transcription Spl et pour le facteur nucléaire respiratoire NRF1. Une variante préférée de l'invention contient une forme tronquée en 3' de l'intron I. De préférence, la séquence correspond à la forme tronquée en 3' au site de restriction BamHl au G2081. Cette séquence fait 452 paires de bases et est encadrée par les sites de restriction de Apal en 5' et BamHI en 3' .
L'activité promotrice de la séquence décrite est comparable à celle de SV40. Elle a en effet été clonée dans le vecteur d'expression pGL-3basic de Promega®, contenant le gène luc+ pour la luciferase de luciole. Le niveau de production de la luciferase a été comparé au niveau de production dans une construction similaire mais contenant le promoteur viral SV40 et l'amplificateur (« enhancer ») SV40. Les inventeurs ont montré que les niveaux de transcription induits par ces deux promoteurs sont comparables. Or le promoteur SV40 est réputé ayant une capacité d'activation de la transcription parmi les plus fortes . Les inventeurs ont donc mis en évidence une courte séquence d'ADN genomique humain dotée d'une très forte capacité d'activation transcriptionnelle, sans nécessiter de séquence amplificatrice (« enhancer ») supplémentaire comme c'est le cas pour le promoteur SV40.
Comme elle provient d'un chromosome d'une cellule eucaryote, cette séquence selon l'invention a une activité promotrice dans les cellules eucaryotes. De plus, l'origine plus particulièrement humaine de la séquence lui confère une activité dans les cellules animales, particulièrement des cellules mammifères telles que les cellules murines, simiennes, bovines, de préférence elle est aussi active dans les cellules humaines . La séquence promotrice NDUFS8 selon l'invention possède de plus une capacité d'activation transcriptionnelle ajustable. L'activité de transcription engendrée par une séquence promotrice se définit généralement par le nombre de molécules d'ARN initiées par unité de temps. De fait, plusieurs façons de modifier l'activité transcriptionnelle d'une séquence promotrice sont envisageables. Un premier moyen consisterait à changer les propriétés de la séquence promotrice en el-le-même, c'est-à-dire changer son efficacité ou la vitesse d'initiation de la transcription. Ces modifications peuvent être réalisées en modifiant la séquence ou en ajoutant des sites de fixation pour des amplificateurs (« enhancers ») ou des silencers. Un autre moyen consiste à intervenir plus en aval, une fois que la transcription est initiée, en modifiant le nombre de transcrits fonctionnels par rapport au nombre de transcrits initiés. Selon cette deuxième possibilité, l'activité promotrice proprement dite n'est pas affectée, mais en revanche le taux de transcrits fonctionnels est modulé . C'est cette seconde possibilité que les inventeurs ont exploitée.
Pour augmenter le nombre de transcrits correctement initiés mais non aboutis (tronqués en 3' avant le site de terminaison de transcription de la séquence à transcrire) , c'est-à-dire le « taux d'échec » de l'ARN polymerase, les inventeurs ont inséré un fragment d'ADN appelé « stuffer » entre la séquence promotrice et la séquence à transcrire. Bien que le mécanisme d'action de ce système n'ait pas encore été complètement élucidé, les inventeurs postulent que, du fait de la présence de ce fragment, la probabilité que l'ARN polymerase se décroche du brin d'ADN avant le signal de fin de transcription est augmentée.
La fusion du stuffer juste en aval de la séquence promotrice permet donc de modifier le taux de transcrits fonctionnels obtenus. Le stuffer allonge en 3' la séquence promotrice. Cet allongement par rapport à la construction de base du promoteur conduit à la modulation de l'activité transcriptionnelle. Normalement, le stuffer s'insère en aval du site d'initiation de la transcription. La caractéristique essentielle du stuffer est sa taille en nombre de paires de bases. L'atténuation de l'activité transcriptionnelle par rapport à la -séquence de base est une fonction linéaire croissante de la taille du stuffer, donc l'activité transcriptionnelle diminue au fur et à mesure de l'allongement du stuffer. Selon une construction préférée, la séquence promotrice considérée est la séquence de 452 paires de bases située en amont du gène KDUFS8, contenant le promoteur du gène, le premier exon et un fragment du premier intron du gène NDUFS8, correspondant à la séquence représentée dans la figure 1 entre les positions C1630 et G2081. Le stuffer ne contient pas de site de fixation pour des facteurs de transcription, il n'est pas un élément de régulation de la transcription selon la définition donnée plus haut. En particulier, il ne contient pas de sites pour des amplificateurs (« enhancers ») ou des silencers. Il est indépendant de la séquence promotrice, il n'appartient pas à cette séquence dans le sens où il ne modifie pas son activité promotrice. En effet, comme spécifié ci-dessus, le stuffer atténue l'activité de transcription du montage sans pour autant affecter l'efficacité ou la vitesse d'initiation de la transcription par le promoteur. Un stuffer selon l'invention ne contient pas de signal de terminaison de transcription afin que 1 'ARN-polymérase puisse donc transcrire la séquence placée en 3' par rapport au stuffer.
La séquence à transcrire peut être une séquence codant pour un polypeptide fonctionnel. La séquence à transcrire peut aussi servir de matrice pour synthétiser de l'ARN antisens. Comme exemples de séquence « stuffer » selon l'invention, l'on peut citer toute ou partie de la séquence du gène NDUFS8 s'étendant du nucléotide G2082 au nucléotide G3319, des fragments de PCR issus de l'amplification de régions quelconques des gènes NDUFS2 du chromosome lq23-25 et du gène NDUFS7 du chromosome 19pl3.
Un stuffer selon l'invention peut être une séquence d'acides nucléiques parfaitement aléatoire, par exemple une séquence synthétique avec une équiprobabilité pour les quatre bases A, T, C, G. Un autre exemple de stuffer selon l'invention est issu de la digestion, enzymatique d'ADN genomique, à condition que les cellules fournissant l'ADN à digérer et celles dans lesquelles le stuffer doit être inséré soient d'espèces très différentes, par exemple de règnes . différents . Des fragments issus de la digestion enzymatique d'organismes procaryotes peuvent servir de
- stuffer dans des cellules eucaryotes . Selon un autre exemple, des fragments d'ADN bactérien ou de levure obtenus par digestion enzymatique sont des candidats potentiels pour être utilisés comme stuffer dans des cellules humaines.
La présente invention concerne aussi les gènes chimères contenant une séquence promotrice, un fragment d'ADN appelé stuffer dont la taille permet de moduler l'activité de la séquence promotrice et une séquence à transcrire. La séquence promotrice est ou bien un promoteur NDUFS8, ou bien une séquence promotrice NDUFS8 (promoteur NDUFS8 complété par le premier exon et un fragment du premier intron du gène NDUFS8) . Dans les gènes chimères, la séquence à transcrire est hétérologue par rapport à la séquence promotrice. Dans le cas particulier où la séquence promotrice est composée du promoteur, de l'exon I et d'une partie de l'intron I du gène NDUFS8 , la séquence à transcrire n'est donc pas celle codant pour la sous-unité NDUFS8.
La modulation permise par le stuffer est une diminution de l'activité de transcription de la séquence promotrice placée en amont . Cette diminution est une fonction linéaire croissante de la longueur du stuffer
(figure 9a et 9b) .
Le facteur de modulation ainsi permis est très important . Dans le cas particulier où la séquence promotrice correspond à la séquence de 452 paires de base du gène NDUFS8 illustrée dans la figure 1 et . où la séquence à exprimer, située en aval de la fusion entre séquence promotrice et stuffer, est celle du gène Iuc+ dans le vecteur d'expression pGL-3basic, un stuffer de 1200-1500 paires de bases entraîne une activité transcriptionnelle d'environ 2 à 5 fois celle du gène en l'absence de toute séquence promotrice. Par contre, si le stuffer est réduit à quelques bases ou réduit à néant, on observe une activité transcriptionnelle égale à 200 fois celle observée en l'absence de toute séquence promotrice. Entre les deux situations, on a de ce fait un facteur de 40 à 100. La gamme de promoteurs présentant des forces d'expression variables est donc particulièrement étendue.
Un stuffer selon l'invention n'est pas un élément de régulation de la transcription donc il ne contient pas de signal de terminaison de transcription.
L'addition du stuffer ne doit pas non plus perturber la traduction de la séquence à transcrire placée en aval . De ce fait, un stuffer préféré selon l'invention ne contient pas la séquence ATG qui pourrait entraîner sa traduction après la transcription. Un tel stuffer ne contient pas non plus tout autre signal qui pourrait conduire à sa traduction. Pour que l'influence du stuffer reste limitée au sein de la cellule et pour éviter des interactions ou interférences non désirables dans la cellule-hôte, une variante de l'invention consiste à considérer le stuffer comme un premi-er intron vis-à-vis de la séquence placée en aval dans le gène chimère. De ce fait, un stuffer selon l'invention contiendrait les signaux nécessaires à son épissage après transcription. L'ARNm produit par la cellule- hôte correspond alors à celui qui aurait été généré après la transcription uniquement de la séquence à transcrire d'intérêt.
Selon une variante de l'invention, la séquence à transcrire, qui se trouve au sein du gène chimère, n'est pas traduite. En particulier, la construction du gène chimère peut être réalisée afin de synthétiser des ARN anti-sens pour bloquer par exemple la synthèse d'autres protéines de la cellule-hôte, elle peut aussi être réalisée pour synthétiser des ribozymes .
Selon une autre variante de l'invention, la séquence à transcrire est traduite. Cette séquence d'intérêt à traduire, placée dans la partie 3' du gène chimère, contient un ATG qui peut être reconnu par les riboso es pour permettre la traduction du cadre de lecture. De ce fait, après la transcription de la fusion entre stuffer et séquence d'intérêt, la traduction débutera exactement à l'endroit voulu au début de la séquence codante d'intérêt placée en aval de l'ATG.
Comme exemple de séquence à transcrire, l'on peut citer des séquences codant pour des agents de sélection, des marqueurs, des hormones, des récepteurs, des protéines reporters telles que la luciferase. Cette séquence à transcrire, une fois traduite en polypeptide, peut servir à déclencher chez l'hôte la production d'anticorps contre le polypeptide codé par ladite séquence.
La présente invention concerne aussi des vecteurs contenant des gènes chimères comme décrits précédemment . Ces vecteurs permettent l'introduction et éventuellement l'expression du gêne chimère dans une cellule-hôte. Comme exemple de vecteurs, on peut citer les vecteurs d'expression plasmidiques , les vecteurs viraux,' les vecteurs intégratifs, les vecteurs autosomaux. La présente invention touche aussi .une famille de vecteurs d'expression. En effet, à partir d'un promoteur NDUFS8 selon l'invention, ou bien d'une séquence promotrice NDUFS8 selon l'invention, il est possible de générer une gamme de vecteurs d' expression qui ne diffèrent les uns des autres que par la taille du stuffer fusionné en aval du promoteur ou de la séquence promotrice. On obtient de cette manière des vecteurs d' expression présentant une gamme d'activité transcriptionnelle. Il est alors possible de classer les vecteurs selon une relation d'ordre basée sur l'activité transcriptionnelle. Cette relation d'ordre entre eux en fonction de l'activité transcriptionnelle ne dépend pas du type cellulaire. A partir d'un échantillon de cette famille de vecteurs d'expression, il est possible d'obtenir différents niveaux d'expression d'une protéine hétérologue. En fonction des résultats, le taux d'expression peut donc être optimisé pour ne pas être toxique, ou bien il peut être ajusté à un taux requis dans un tissu particulier ou selon les objectifs thérapeutiques.
La présente invention concerne des cellules transformées par un gène chimère. Selon une variante de l'invention, les cellules transformées le sont de manière stable. Selon une autre variante, les cellules sont transformées de manière transitoire. Des cellules préférées selon l'invention sont d'origine mammifère et tout spécialement des cellules d'origine humaine. L'invention concerne aussi des organismes non humains transformés par un gène chimère défini ci-dessus, par exemple des mammifères transgéniques tels que des souris, des singes, des bovins.
Les procédés employés pour introduire les gènes chimères de l'invention dans les cellules sont ceux décrits habituellement dans les manuels . Les techniques classiques pour l'introduction de vecteurs dans des cellules végétales ou bactériennes sont l'électroporation, les traitements chimiques accompagnés de cycles thermiques, le bombardement avec des billes de verre ou métalliques, notamment pour l'introduction de plasmides . Pour les cellules animales, les techniques d' infection et transfection sont aussi celles classiquement décrites dans les manuels ; par exemple l'infection de cellules Sf9 par un baculovirus .
Dans un aspect supplémentaire, l'invention rend compte d'un procédé pour la production d'une protéine hétérologue. Une telle production suppose la construction d'un gène chimère comme décrit précédemment. Dans ce cas, le promoteur est choisi entre le promoteur NDUFS8 de l'invention, ou la séquence promotrice NDUFS8 de l'invention. Le stuffer est défini en fonction du taux souhaité d' expression de la protéine d'intérêt hétérologue. La séquence à transcrire placée en aval du stuffer est la séquence codante à traduire correspondant à la protéine d' intérêt . Cette séquence contient un ATG qui peut être reconnu par les ribosomes pour permettre la traduction du cadre de lecture. La cellule-hôte choisie est transformée avec le gène chimère construit . On applique ensuite à la cellule-hôte des conditions permettant l'expression de gènes chimères. Le procédé selon l'invention peut comprendre dans une dernière étape l'extraction de la protéine hétérologue produite. Cette extraction peut avoir lieu directement sur les cellules, après lyse cellulaire, ou bien à partir du surnageant de culture .
Selon un quatrième aspect, la présente invention définit un moyen d'atténuer l'activité de transcription d'un promoteur ou d'une séquence promotrice. Selon cet aspect, l'invention est une généralisation à d'autres promoteurs de la construction permettant d'ajuster l'activité de transcription d'un promoteur NDUFS8 ou d'une séquence promotrice NDUFS8.
L'invention selon cet aspect concerne des gènes chimères construits à partir d'une séquence promotrice donnée . Ces gènes chimères contiennent une séquence promotrice, un fragment d'ADN appelé stuffer dont la taille permet de moduler l'activité de la séquence promotrice et une séquence à transcrire. La fusion du stuffer juste en aval de la séquence promotrice permet d'atténuer le taux de transcrits fonctionnels . Cette atténuation par rapport à la séquence de base est une fonction linéaire croissante de la taille du stuffer.
Le stuffer selon ce quatrième aspect de l'invention est utilisé de la même manière que dans le troisième aspect où il est associé à la séquence promotrice NDUFS8. Le stuffer possède de plus les mêmes caractéristiques que celles présentées ci-dessus, notamment il modifie le taux de transcrits fonctionnels sans modifier à proprement parler l'activité promotrice de la séquence promotrice placée en amont .
Selon une variante de l'invention, la séquence à transcrire n'est pas traduite. En particulier, la construction du gène chimère peut être réalisée afin de synthétiser des ARN anti-sens pour bloquer par exemple la synthèse d'autres protéines de la cellule-hôte. Selon une autre variante de l'invention, la séquence à transcrire est traduite. Cette séquence d'intérêt à traduire, placée dans la partie 3' du gène chimère, contient un ATG qui peut être reconnu par les ribosomes pour permettre la traduction du cadre de lecture. De ce fait, après la transcription de la fusion entre stuffer et séquence d'intérêt, la traduction débutera exactement à l'endroit voulu au début de la séquence codante d'intérêt placée en aval de l'ATG. Un gène chimère possible selon l'invention serait constitué du promoteur SV 40 fusionné avec un stuffer. Cette construction permet de diminuer la force d'activation de la transcription du promoteur SV40 qui est particulièrement forte. Selon une autre possibilité offerte par l'invention, la séquence promotrice est constituée d'un promoteur, d'un exon et d'un fragment d' intron. Par exemple, la séquence promotrice comprend le fragment de -500 à +1400 paires de bases du gêne humain COLIAI correspondant au promoteur, au premier exon et à une partie du premier intron du gène de la chaîne αl du procollagène de type I.
Un autre exemple de séquence promotrice est la séquence -734 à +85 paires de bases par rapport au signal de traduction du gène humain NDUFS3. Un autre exemple de séquence promotrice est le fragment de -436 à +49 paires de bases du gène humain de la succinate deshydrogénase gène b.
La présente invention concerne aussi des vecteurs contenant des gènes chimères comme décrits précédemment . Ces vecteurs sont utilisés de manière comparable à celle décrite précédemment pour la séquence promotrice NDUFS8. La présente invention concerne aussi une famille de vecteurs d'expression. En effet, à partir d'un promoteur NDUFS8 selon l'invention, ou d'une séquence promotrice NDUFS8 selon l'invention, ou bien de tout autre promoteur ou séquence promotrice, il est possible de générer une gamme de vecteurs d' expression qui ne diffèrent les uns des autres que par la taille du stuffer fusionné en aval du promoteur ou de la séquence promotrice . On obtient de cette manière des vecteurs d'-expression présentant une gamme d'activité transcriptionnelle. Il est alors possible de classer les vecteurs selon une relation d'ordre basée sur l'activité transcriptionnelle. Cette relation d'ordre entre eux en fonction de l'activité transcriptionnelle ne dépend pas du type cellulaire. A partir d'un échantillon de cette famille de vecteurs d'expression, il est possible d'obtenir différents niveaux d'expression d'une protéine hétérologue. En fonction des résultats, le taux d'expression peut donc être optimisé pour ne pas être toxique, ou bien il peut être ajusté à un taux requis dans un tissu particulier ou selon les objectifs thérapeutiques.
Parmi les applications de l'invention, on peut citer l'exploitation de la séquence promotrice NDUFS8 pour exprimer des protéines endogènes ou hétérologues dans des cellules eucaryotes, en particulier des cellules humaines.
Il est aussi possible en insérant de manière « tête-bêche » un ADNc en aval de la séquence promotrice NDUFS8 de produire dans la cellule des ARN anti-sens. De plus, la forte efficacité promotrice de cette séquence permettrait « d'inonder » la cellule avec des quantités massives d'un ARN anti-sens spécifique qui bloquera l'expression du gène dont on a clone l'ADNc en sens inverse, en aval de la séquence promotrice.
Parmi les applications plus spécifiques de la présente invention, on peut citer l'utilisation du promoteur NDUFS8 ou/et de la séquence promotrice NDUFS8, avec ou sans stuffer, comme outils dans les stratégies de thérapie gënique. Des promoteurs actifs dans les cellules humaines y sont particulièrement précieux. Pour une protéine donnée à produire par thérapie génique, l'invention fournit un promoteur permettant non seulement d' exprimer cette protéine dans des cellules humaines, mais aussi d'ajuster cette expression à -un niveau requis en modulant la taille du stuffer.
Enfin, il est envisageable, avec cette invention, d'utiliser des montages (promoteur, + stuffer, fragment à transcrire et traduire) pour les procédés de vaccination par l'ADN nu (l'injection en l'état du gène chimère dans une cellule conduisant à la production d'anticorps du fait de la synthèse endogène de la protéine codée par la séquence à transcrire) .
Légende des figures
Figure 1 (Figure la se poursuivant sur la Figure 1b) : Séquence de la région du gène NDUFS8 analysée par transfection transitoire comprenant 3403 paires de bases, l'extrémité 3' de l'exon terminal du gène ALDH7 est représentée. La numérotation commence au nucléotide marqué « 1 » correspondant à une cytosine.
Les principaux sites de restriction pertinents sont annotés. AP2 (nucleotides G359-G366 et C632-C639) , CCAAT (nt A1713-C1718, G1773-C1779, G1825-C1832) , Ets (nt C1674- C1683), NRFl (nt G2053-C2062 et G2145-C2156) , Spl (nt C2156- C2161 et C2373-C2378) sont des séquences homologues de sites de fixation de facteurs de transcription. Apal (nt G189-C194 et G1625-C1630) correspond aux sites de restriction utilisés pour la construction de certains montages d' expression présentés dans les figures 3a à 3e ; Sacl (nt G-5-C1) et BamHI (nt G2081-C2086 et G3319-C3324) sont les sites de restriction utilisés pour le sous-clonage de la séquence analysée. Le fragment de restriction enzymatique obtenu après digestion au niveau du site Sacl et du 2ιeme site BamHJ comprend 3319 paires de bases. L'ATG (nt A3396-G3398) à l'extrémité 3' du fragment est le codon d'initiation de la traduction servant à l'expression de la forme prémature de la sous-unité 23kDa.
L'exon 1 (nt C1871-G1962) est représenté en gras. L'intron 1 s'étend du nucléotide G1963 au nucléotide G3395.
Figure 2 : Représentation de la région du gène NDUFS8 analysée par transfection transitoire ;. AP2, CCAAT, Ets, NRFl, Spl sont des séquences homologues de sites de fixation de facteurs de transcription. L'extrémité 3' de l'exon terminal du gène ALDH7 est indiquée . Sacl et BamHI sont les sites de restriction utilisés pour le sous-clonage de la séquence analysée ; l'ATG à l'extrémité 3' du fragment est le codon d'initiation de la traduction servant à l'expression de la forme prémature de la sous-unité 23kDa. L'exon 1 (représenté par une boîte hachurée) correspond à l'extrémité 5' du transcrit du gène NDUFS8 ; cette partie n'est pas codante.
Figure 3 : Représentation des inserts des constructions réalisées dans le vecteur pGL3-basic. Alu Jb et Alu Sx sont des séquences intergéniques correspondant à des motifs répertoriés dites « séquence alu » de type Jb ou Sx. S, B et A correspondent respectivement aux sites de restriction Sacl, BamHI et Apal.
• figure 3a : Représentation des inserts des clones 1, 3 et 9
• figure 3b : Représentation des inserts des clones 5, 7 et 26 • figure 3c : Représentation des inserts des clones 14, 15 et 16
• figure 3d : Représentation des inserts des clones 42, 31 et 43 • figure 3e : Représentation des inserts des clones 46, 33, 29
Figure 4 : Activités transcriptionnelles relatives des constructions 1, 3 et du vecteur pGL3-control (promoteur SV40+ enhancer) . Les données du graphique représentent la force promotrice relative des différents inserts intégrés dans le vecteur pGL3-basic. Ces valeurs correspondent aux activités Firefly luciferase mesurées pour les différentes constructions et corrigées par les activités Renilla luciferase mesurées pour le vecteur contrôle pRL-TK. Ces valeurs sont rapportées pour une activité du clone 1 fixée arbitrairement à une valeur de 1.
Activité transcriptionnelle relative = [ (Activité Firefly luciferase du clone) - (Activité Firefly luciferase de pGL3-basic) ]/ (Activité Renilla luciferase de pRL-TK) .
Les activités transcriptionnelles sont montrées pour des expériences d'expression transitoire dans les cellules humaines 143B et murines C2C12 en culture.
Figure 5 : Activités transcriptionnelles relatives des constructions 1, 7, 3, 5, 26 et 9. Les données du graphique représentent la force promotrice relative des différents inserts intégrés dans le vecteur pGL3-basic. Ces valeurs correspondent aux activités Firefly luciferase mesurées pour les différentes constructions et corrigées par les activités Renilla luciferase mesurées pour le vecteur contrôle pRL-TK. Ces valeurs sont rapportées pour une activité du clone 1 fixée arbitrairement à une valeur de 1.
Activité transcriptionnelle relative = [ (Activité Firefly luciferase du clone) - (Activité Firefly luciferase de pGL3-basic) ]/ (Activité Renilla luciferase de pRL-TK) .
Figure 6 : Activités transcriptionnelles relatives des constructions 1, 3, 26, 46, 33 et 29. Les données du graphique représentent la force promotrice relative des différents inserts intégrés dans le vecteur pGL3-basic. Ces valeurs correspondent aux activités Firefly luciferase mesurées pour les différentes constructions et corrigées par les activités Renilla luciferase mesurées pour le vecteur contrôle pRL-TK. Ces valeurs sont rapportées pour une activité du clone 1 fixée arbitrairement à une valeur de 1. Activité transcriptionnelle relative = [ (Activité Firefly luciferase du clone) - (Activité Firefly luciferase de pGL3-basic) ]/ (Activité Renilla luciferase de pRL-TK) .
Figure 7 : Activités transcriptionnelles relatives des constructions 3, 1, 14, 5, 7, 15 et 16. Les données du graphique représentent la force promotrice relative des différents inserts intégrés dans le vecteur pGL3-basic. Ces valeurs correspondent aux activités Firefly luciferase mesurées pour les différentes constructions et corrigées par les activités Renilla luciferase mesurées pour le vecteur contrôle pRL-TK. Ces valeurs sont rapportées pour une activité du clone 1 fixée arbitrairement à une valeur de 1.
Activité transcriptionnelle relative = [ (Activité Firefly luciferase du clone) - (Activité Firefly luciferase de pGL3-basic) ]/ (Activité Renilla luciferase de pRL-TK) . Figure 8 : Activités transcriptionnelles relatives des constructions 5, 26, 42, 31, 43, 7 et 1. Les données du graphique représentent la force promotrice relative des différents inserts intégrés dans le vecteur pGL3-basic. Ces valeurs correspondent aux activités Firefly luciferase mesurées pour les différentes constructions et corrigées par les activités Renilla luciferase mesurées pour le vecteur contrôle pRL-TK. Ces valeurs sont rapportées pour une activité du clone 1 fixée arbitrairement à une valeur de 1. Activité transcriptionnelle relative = [ (Activité Firefly luciferase du clone) - (Activité Firefly luciferase de pGL3-basic) ]/ (Activité Renilla luciferase de pRL-TK) .
Figure 9 : Variation de l'activité transcriptionnelle en fonction de l'addition du stuffer. L'activité transcriptionnelle relative des constructions est représentée en fonction de la taille (en nombre de paires de bases) de la séquence d'ADN comprise entre le début de l'exon 1 et le début du fragment d'ADN luc+ codant pour la Firefly luciferase. L' 'activité transcriptionnelle est mesurée par le système Dual-Luciferase (Pro éga) . L'activité du clone 3 est choisie comme référence 100%.
• figure 9a :transfection dans des cellules humaines 143B
• figure 9b :transfection dans des cellules murines C2C12
Figure 10 : Amplification par RT-PCR de l'ARNm du gène luc+ . Les ARN de cellules 143B transfectées par le clone 1 ou par le clone 3 ont été extraits et utilisés comme matrice afin de réaliser une réaction de RT-PCR dans les conditions décrites dans la section matériel et méthodes. Les amorces utilisées pour la réaction de PCR sont spécifiques de la séquence du gène luc+ . Les amplifiats sont visualisés sous UV par coloration au bromure d'éthidium après électrophorèse sur un gel d'agarose 1,5%. L'intensité des bandes est estimée en utilisant le logiciel Gel Analyst (Iconix) . Pour chaque clone, 5 dilutions du produit de RT ont été amplifiées par PCR : 1/10, 1/50, 1/100, 1/250, 1/500. M signifie marqueurs de taille de fragments d'ADN (1 Kb ladder, Life Technologies) ; Te- signifie témoin négatif de la réaction PCR (PCR réalisée en l'absence d.'ARN) .
EXEMPLE
L'objectif a consisté à étudier la régulation transcriptionnelle du gène humain NDUFS8 codant pour la sous-unité 23 kDa (encore appelée TYKY ou sous-unité NDUFS8) du complexe I (NADH-ubiquinone oxydoréductase - EC 1.6.5.3) de la chaîne respiratoire mitochondriale . La caracterisation de ce gène (De Sury et al . , 1998) a permis de montrer la présence du gène codant pour 1ΑLDH7, en amont de NDUFS8, et l'existence d'un premier exon non codant pour le gène NDUFS8.
La séquence étudiée (figure 1) correspond à un fragment de 3319 paires de bases (pb) compris entre un fragment de la partie 3' terminale du gène ALDH7 et l'extrémité 3' du premier intron du gène NDUFS8. Ce fragment est délimité par les sites de restriction Sacl (côté 5') et BamHI (côté 3'). L'extrémité 3' de cette séquence est située 76 pb en amont du codon d'initiation de la traduction du gène NDUFS8 . Des expériences de transfection transitoire utilisant un vecteur contenant un fragment d'acides nucléiques codant pour la luciferase de luciole (Firefly luciferase - gène luc+) ont été réalisées pour identifier la présence, dans la séquence présentée dans la figure 1, d'une région capable de fonctionner comme promoteur de l'expression d'un gène d'une part et d' éléments ayant une activité de régulation de la transcription -d' autre part . Ces expériences ont permis de délimiter une région de 452 pb, englobant le premier exon (voir clone 26 de la figure 3b) , stimulant très fortement la transcription du gène luc+ .
D'autre part, l'allongement de la séquence située en 3' par rapport à cette construction de base (voir clone 26 de la figure 3b) et en amont du fragment luc+ codant la Firefly luciferase conduit à une décroissance progressive et linéaire de l'activité transcriptionnelle. L'invention permet donc de disposer: " d'une courte séquence d'ADN genomique humain dotée d'une très forte capacité d'activation de la transcription; " de plus, cette activité transcriptionnelle peut être modulée en fonction de la taille du fragment d'ADN inséré dans un vecteur d'expression entre cette séquence et le gène à exprimer.
Matériel et méthodes :
Constructions :
Toutes les constructions ont été réalisées dans le vecteur pGL3-basic (Promega) . Ces constructions sont présentées dans les figures 3a à 3e. Le clone 1 contient la totalité de la région étudiée. Il a été préparé à partir de deux inserts : un fragment SacI/BamHI de 2081 pb (partie 5') et un fragment BamHI/BamHI de 1238 pb (partie 3') (Figure 1 et 2) . Ces inserts proviennent d'ADN genomique humain digéré
(partiellement) par BamHI et sous-cloné dans le plasmide pUC18. Le clone 3 contient le fragment SacI/BamHI de 2081 pb (partie 5') et le clone 9, le fragment BamHI/BamHI de 1238 pb (partie 3 ' ) . Les clones 5 et 7 ont été préparés respectivement à partir des clones 3 et 1 en éliminant un fragment de restriction Apal/Apal correspondant aux bases 194 à 1629 de - la séquence étudiée. Le clone 26 contient la région 1630-2081. Pour réaliser le clone 14, les deux mêmes inserts que pour le clone 1 ont été utilisés mais le fragment BamHl/BamHI de 1238 pb (en 3') a été intégré dans l'orientation inverse. Dans le clone 15, les 1238 pb de l'extrémité 3' de la séquence ont été introduites dans le clone 5, en position 194. Dans le clone 16, cette séquence a été insérée à la même position mais en orientation inverse. Les inserts des clones 42, 31, 43, 46, 33 et 29 ont été obtenus par PCR et correspondent respectivement aux segments 1630-2423, 1630-2586, 1630-2915, 1695-2081, 1761-2081 et 1791-2081 de la séquence étudiée. Dans les clones 37, 38, 39 et 40, des séquences d'ADN étrangères au gène NDUFS8 ont été intégrées en 3' de l' insert du clone 3. Dans le clone 37 et 40, il s'agit de séquences d'ADN aléatoires de 1 kilobase (kb) . Dans les clones 38 et 39, c'est une séquence aléatoire de 1,5 kb dans les deux orientations.
Culture de cellules :
Les cellules d'ostéosarcome humain de la lignée 143B (ATCC, CRL-8303) sont cultivées dans du milieu DMEM supplémenté avec 10 % de sérum foetal de veau et 0,1 mg/ l de 5-bromo-2' -déoxyuridine.
Les cultures primaires de fibroblastes normaux humains (cellules sans origine identifiée) sont réalisées dans du milieu DMEM supplémenté avec 10 % de sérum foetal de veau.
Les myoblastes murins de la lignée C2C12 (ATCC, CRL- 1772) sont cultivés dans du milieu DMEM supplémenté avec 10 % de sérum foetal de veau. Les cultures de cellules sont effectuées par mise en incubation à 37°C dans une atmosphère à 5 % de C02.
Transfections : Vingt-quatre heures avant transfection, les cellules
(143B ou C2C12) sont mises en culture dans une plaque 24 puits à raison de 2.104 cellules par puits. Le FuGENE 6
(Roche) est employé comme agent transfectant. Ce réactif est utilisé selon les instructions du fabricant. Pour chaque puits, 975 ng d'une construction réalisée .dans le vecteur pGL3-basic (Pro ega) et 25 ng du vecteur pRL -TK (Promega) sont transfectés, soit une quantité totale d'ADN de 1 μg. Le vecteur pRL-TK exprime une luciferase d'oursin (Renilla luciferase) sous le contrôle du promoteur de la thymidine kinase du virus Herpès simplex. L'expression constitutive de cette luciferase sert de contrôle interne de l'efficacité de la transfection. Trois microlitres (μl) de FuGENE 6 sont utilisés par puits. Les cellules sont ensuite incubées 48 heures avant d' être lysées pour la mesure des activités luciferase.
Dosage Puai-Luciferase (Promega) :
Les cellules transfectées sont lysées dans 100 ou 500 μl de Passive Lysis Buffer IX en fonction de l'activité des constructions transfectées. Les mesures de luminescence sont réalisées sur 5, 10 ou 20 μl de lysat cellulaire en fonction de l'activité des constructions transfectées. Dans un premier temps, la Firefly luciferase, correspondant aux constructions dans le vecteur pGL3-basic, est dosée par l'ajout de 100 μl de Luciferase Assay Reagent II. Puis 100 μl de réactif Stop & Glo sont ajoutés pour la mesure de l'activité Renilla luciferase correspondant au vecteur contrôle pRL-TK. Le calcul du rapport des activités mesurées pour les 2 enzymes permet de s'affranchir des variations liées au rendement de la transfection. De plus, la valeur de l'activité obtenue avec le vecteur pGL3-basic (ie, ne contenant aucun insert en amont du gène luc+) est soustraite des valeurs obtenues avec les différentes constructions .
Quantification de l'ARNm du gène luc+ :
Un plaque 6 puits est ensemencée avec 105 cellules 143B par puits. Après 24 heures de culture, les cellules contenues dans chaque puits sont transfectées en utilisant 3 μg d'ADN et 9 μl de FuGENE 6. Le clone 1 et le clone 3 sont transfeσtés chacun dans 3 puits. Les cellules des 3 puits correspondant à chaque ADN transfecté sont réunies après 48 heures d'incubation. Chaque culot cellulaire est lysé par 600 μl de tampon RLT (Promega) plus 6 μl de β- mercaptoéthanol . Les ARN sont extraits sur des colonnes RNeasy Mini Kit (Promega) suivant les instructions fournies par le fabricant. Pour la transcription inverse, 3 μg d'ARN sont traités par la DNasel (DNasel amplification grade, Life Technologies) pendant 15 minutes à 30°C puis l'enzyme est inactivée pendant 10 minutes à 65°C en présence d'EDTA. L'efficacité du traitement à la DNase (à détruire l'ADN) est contrôlée par l'absence d'amplification d'un fragment à l'aide d'une PCR réalisée sur 1 μl du produit de la réaction. Les amorces utilisées sont les mêmes que celles employées pour la RT-PCR et sont spécifiques de la séquence du gêne Iuc+. La réaction de transcription inverse est ensuite réalisée dans un volume total de 30 μl en présence 0,1 millimolaire (mM) d'oligo(dT). Après une incubation de 10 minutes à 70°C, le mélange est placé 2 minutes dans la glace puis 200 unités de transcriptase inverse Superscript II RNase H- (Life Technologies) sont ajoutées. L'ensemble est incubé 50 minutes à 42°C puis pendant 10 minutes à 70°C. Les ADNc sont alors amplifiés par PCR en utilisant des amorces s'hybridant dans la séquence codante du gène luc+ (bases 123 à 445 de la séquence du vecteur pGL3-basic) . La réaction est réalisée dans un volume total de 25 μl contenant 1 μl- d'une dilution au 1/10, 1/50, 1/100, 1/250 ou 1/500 du produit de la transcription inverse, 25 pmoles de chaque amorce, 200 mM de chaque désoxyribonucléotide triphosphate et 1 unité de Taq polymerase (Promega) . Les conditions d' incubation sont les suivantes : 5 minutes de dénaturâtion à 95°C, 30 cycles constitués de 30 secondes de dénaturation à 94°C, 30 secondes d'hybridation à 58°C et 1 minute d' êlongation à 72°C puis, après les 30 cycles, 5 minutes d' êlongation finale à 72°C. Les amplifiats sont visualisés sous lumière UV après électrophorèse sur un gel d'agarose 1,5 % dans du tampon TAE IX (Tris acétate 0,04 M, EDTA 2 mM) et coloration au bromure d'éthidium. L'intensité des bandes est estimée en utilisant le logiciel de quantification Gel Analyst (Iconix) .
Résultats :
Mesure des activités transcriptionnelles :
Les valeurs du rapport : . activité luciferase des constructions (Firefly luciferase) sur activité luciferase du vecteur contrôle pRL-TK (Renilla luciferase) , permettent de comparer la capacité d'activation de la transcription par les différents fragments d'ADN testés. Une valeur de référence de 1 est attribuée au rapport mesuré pour le clone 1 qui correspond à la totalité de la séquence étudiée. Les valeurs correspondant aux activités transcriptionnelles relatives déterminées dans les cellules 143B (origine humaine) et C2C12 (origine murine) sont présentées dans les figures 4, 5, 6, 7 et 8. Les résultats obtenus avec des fibroblastes humains normaux sont qualitativement identiques à ceux obtenus avec les cellules 143B, mais ne sont pas présentés dans ce document.
La comparaison des clones 1 et 3 (figure 4) fait apparaître deux données importantes : d'une part la présence de puissants activateurs de la transcription dans la région 5' constituée par les 2081 premières pb, d'autre part la présence d'un ou plusieurs éléments inhibiteurs dans la partie 3' (1238 pb) . En effet, dans les cellules humaines, l'activité mesurée avec le clone 3 est environ 30 fois supérieure à celle mesurée avec le clone 1 .(environ 40 fois supérieure dans les cellules murines) . La force promotrice de l' insert du clone 3 est très importante puisqu'elle est comparable à celle mesurée pour le vecteur pGL3-control (Promega) dans lequel la transcription du gène luc+ est contrôlée par le promoteur viral SV40 associé à un élément amplificateur (« enhancer ») SV40. L' insert du clone 3 est constitué par l'extrémité 3' du gène de l'ALDH7, la région intergënique, le premier exon du gêne NDUFS8 et les 119 premières bases du premier intron. L'analyse du clone 9 (figure 5) montre que la région 3' de 1238 pb n'est pas capable d'activer la transcription du gène luc+ . Ce résultat s'explique par le fait que dans cette construction le site d' initiation de transcription du gène NDUFS8, localisé dans les inserts des clones 5 et 26, est absent.
Par ailleurs, la similitude des données obtenues entre le clone 1 et le clone 7 d'une part, et de celles obtenues entre le clone 3 et les clones 5 et 26 d'autre part (figure 5) semble indiquer l'absence d'éléments possédant une activité de régulation de la transcription dans les 1629 nucleotides situés en 5' de la séquence étudiée, c'est à dire entre l'extrémité du gène de l'ALDH7 et le site Apal localisé 241 pb en amont de l'exon 1 du gène NDUFS8. Cette séquence représente la plus grande partie de la région dite intergénique située entre la fin du gène ALDH7 et le début du gène NDUFS8.
Les résultats obtenus avec les clones 46, 33 et 29 (figure 6) montrent à l'inverse la présence dans les 241 pb en amont de l'exon 1 de séquences activatrices puissantes.
Le raccourcissement progressif de cette région entraîne en effet une diminution très nette de la force promotrice.
Dans le but d'étudier l'impact inhibiteur de la 'région 3' sur l'activité promotrice du fragment actif mis en évidence dans les clones 5 et 26, une série de constructions a été réalisée. La comparaison des activités des clones 1, 3 et 14 d'une part et des clones 5 et 7 (figure 7) d'autre part montre clairement que la partie 3' des constructions, constituée par le fragment BamHI/BamHI de 1238 pb, réduit de manière considérable l'activité de la région promotrice minimale localisée dans les clones 5 et 26. Les activités mesurées pour les clones 14, 15 et 16 (figure 7) montrent ensuite que cet effet inhibiteur n' est pas dépendant de l'orientation du fragment de 1238 pb mais qu'il est dépendant de sa position par rapport à la région promoteur. En effet, lorsque ce fragment est placé en amont de la structure minimale la plus active déterminée dans le clone 26 sa capacité d'inhibition de la transcription est supprimée (voir clones 15 et 16 vs clone 5) .
Des constructions ont été réalisées afin de prolonger l'extrémité 3' en aval de la région minimale active pour déterminer quels éléments étaient responsables de la diminution de l'activité promotrice entre le clone 3 (très actif) et le clone 1 (peu actif) . L'allongement de la région 3' conduit à une diminution progressive de l'activité transcriptionnelle (figure 8) Comme le montrent les graphes des figures 9a et 9b, la diminution de l'activité luciferase mesurée avec les clones 42, 31, 43, 7 et 1 est linéaire et proportionnelle à la taille de la séquence en 3' de l'exon 1. Pour déterminer si cette diminution de l'activité transcriptionnelle est spécifique de la séquence de l'intron 1, plusieurs constructions ont été testées en introduisant en 3 ' de 1' insert du clone 3 des fragments d'ADN non apparentés au gène NDUFS8. Ces fragments présentent des longueurs et des origines variées. Dans le cas des cellules 1.43B, les valeurs mesurées avec les clones 37 et 40, contenant des fragments d'environ 1 kb, s'intègrent raisonnablement bien dans le graphique obtenu avec les clones 42, 31, 43 et 1. Les clones 38 et 39 ont également des activités luciferase faibles mais dans ce cas la taille du fragment d'ADN ajouté (1,5 kb) est supérieure à la taille de la séquence présente dans le clone 1 (1,25 kb) .
Quantification de l'ARNm du gène luc+ : Cet essai a été réalisé afin de contrôler que les activités enzymatiques mesurées étaient bien corrélées avec l'aptitude des- séquences étudiées à activer la transcription. En effet, il pourrait être envisagé que la présence de fragments d'une séquence intronique dans certaines constructions pourrait être à l'origine d'un phénomène d'ëpissage alternatif impliquant le gène luc+ et perturbant le fonctionnement de l'enzyme plutôt que l'activité de transcription. Un phénomène de ce type pourrait expliquer la décroissance de l'activité mesurée lors de l'augmentation de la taille de la séquence intronique. Il était donc important de vérifier si la production des ARNm par les constructions était bien stimulée ou réduite suivant les activités mesurées afin d'éliminer des artefacts liés à la perturbation de la traduction.
Les ARNm ont été amplifiés par RT-PCR en utilisant des amorces s'hybridant dans la séquence du gène luc+. Ces amplifications-- -ont été réalisées à partir de cellules transfectées soit par le clone 1, soit par le clone 3. Les produits des réactions de RT-PCR sont visualisés sous lumière UV après migration électrophoré ique dans un gel d'agarose en présence de bromure d'éthidium. L'intensité des bandes est estimée en utilisant un. logiciel de quantification. Les résultats sont présentés dans la figure 10. En considérant des bandes d' intensité voisine (dilution 1/10 du clone 1 et dilution 1/100 du clone 3 ou dilution 1/50 du clone 1 et dilution 1/500 du clone 3) , il est possible de déterminer qu'il y a environ 10 fois plus d'ARNm luc+ synthétisé avec le clone 3 qu'avec le clone 1. Parallèlement à la quantification des ARNm, des échantillons des cellules transfectées dans cette expérience ont été prélevés pour le dosage des activités enzymatiques. Le rapport entre les activités mesurées pour le clone 3 et le clone 1 est de 25. Compte tenu des limites de la technique PCR, ce résultat est cohérent avec le rapport d'environ 10 obtenu par la quantification des transcrits .
La variation de la taille de l' insert en 3' de la structure promoteur de base la plus active n'affecte pas la traduction de la luciferase, mais bien l'efficacité de la transcription du gène.
Conclusions Les résultats obtenus lors des expériences de transfection transitoire suggèrent que la séquence étudiée possède 3 caractéristiques fondamentales : l'absence d'éléments de régulation de la transcription dans les 1629 paires de bases situées en 5' du fragment genomique complet étudié,
- l'existence d'une courte région de 452 pb, englobant l'exon 1, dotée d'une force promotrice très importante, la décroissance linéaire de l'activité transcriptionnelle lors de l'augmentation de la taille du fragment d'ADN en 3 ' du fragment de 452 pb présentant l'activité promotrice maximale. Les résultats présentent donc . deux aspects particulièrement intéressants . Le premier correspond à la mise en évidence d'une séquence d'ADN genomique humain de taille réduite ayant une capacité d'activation de la transcription équivalente à celle d'un système promoteur viral fort constitué par le promoteur du virus SV40 associé à un élément amplificateur (« enhancer ») SV40 (vecteur pGL3-control, Promega). Le deuxième est la possibilité de réduire l'activité de ce promoteur, quasiment à volonté, en fonction de la taille du fragment d'ADN positionné entre le fragment promoteur et le gène d'intérêt à exprimer. Ces deux éléments pourraient être utilisés pour construire une famille de vecteurs d'expression dans lesquels le taux de transcription du gène d' intérêt serait déterminé par la taille du fragment d'ADN inséré. De plus, ces caractéristiques ont été confirmées dans deux types cellulaires provenant d'organismes différents (homme et souris) .
Enfin, la corrélation entre les mesures enzymatiques effectuées lors des expériences de transfection transitoire et l'activité transcriptionnelle des inserts testés a été confirmée avec la quantification par RT-PCR de l'ARNm du gène luc+ codant pour la luciferase du vecteur pGL3-basic. REFERENCE De Sury, et al ; 1998. Genomic structure of the human
NDUFS8 gène coding for the iron-sulfur TYKY subunit of the mitochondrial NADH :ubiquinone oxidoreductase. Gène 215 (1998), 1-10

Claims

REVENDICATIONS
- Elément promoteur de l'activité de transcription de l'ARN polymerase caractérisé en ce qu'il est constitué par ou qu'il comprend i) les 241 nucleotides, s'étendant de la position 1630 à la position 1870 de la séquence illustrée dans la figure 1 (SEQ ID N°l) ou ii) une partie de la séquence i) comprenant au moins l'un des trois motifs CCAAT représentés dans la figure 1 ou iii) une séquence ayant au moins 70% d'identité avec la séquence i) le dit élément contenant au plus un site de fixation NRFl . - Elément promoteur selon la revendication 1 caractérisé en ce qu'il comprend une partie de la séquence (i) contenant au moins deux des motifs CCAAT représentés dans la figure 1. - Elément promoteur selon la revendication 1 caractérisé en ce qu'il comprend une partie de la séquence (i) contenant les trois motifs CCAAT représentés dans la figure 1. - Séquence promotrice constituée par ou comprenant un élément promoteur selon la revendication 1 et i) tout ou partie du premier exon du gène NDUFS8 illustré dans la figure 1 et ii) le premier intron du gène NDUFS8 illustré dans la figure 1 et tronqué dans sa partie 3', ladite séquence promotrice contenant au plus un site de fixation NRFl. - Séquence promotrice selon la revendication 4 caractérisée en ce que le premier intron est tronqué dans sa partie 3 ' au niveau du premier site de restriction BamHI en position 2081 et illustré sur la figure 1. - Séquence promotrice selon l'une des revendications 1 à 5 caractérisée en ce qu'elle a une activité promotrice comparable à celle de l'association du promoteur SV40 et de l'amplificateur (« enhancer ») SV40. - Séquence promotrice selon l'une des revendications 1 à 5 caractérisée en ce qu'elle ne requiert pas de séquence amplificatrice (« enhancer ») supplémentaire pour avoir une force comparable à celle du promoteur SV40. - Séquence promotrice selon l'une des revendications 1 à 5 caractérisée en ce qu'elle a une activité promotrice de transcription dans les cellules humaines . - Séquence promotrice de l'activité de transcription de l'ARN polymerase possédant une activité de transcription ajustable caractérisée en ce qu'elle comprend i) un promoteur selon l'une des revendications 1 à 8 et ii) un fragment d'ADN appelé stuffer placé en aval du promoteur, dont la taille permet d'atténuer l'activité de transcription de l'élément (i) , ce stuffer étant lui-même dépourvu d'élément de régulation de transcription. 0- Séquence promotrice selon la revendication 9 caractérisée en ce que ledit stuffer ne contient pas de signal de terminaison de la transcription. - Gène chimère caractérisé en ce qu'il comprend : i) un promoteur choisi parmi les trois suivants : a- les 241 nucleotides s'étendant de la position 1630 à la position 1870 de la séquence illustrée dans la figure 1 (SEQ ID N°l) , b- une partie de la séquence (a) comprenant au moins l'un des trois motifs CCAAT représentés dans la figure 1 c- une séquence ayant au moins 70%- d' identité avec la séquence (a) ii) éventuellement un fragment d'ADN appelé stuffer permettant d'atténuer l'activité de transcription de la séquence promotrice, ce stuffer étant lui- même dépourvu d'élément de régulation de transcription, iii) une séquence à transcrire, hétérologue par rapport au promoteur. - Gène chimère selon la revendication 11 caractérisé en ce que l'élément (i) est complété en outre par : a- tout ou partie du premier exon du gène NDUFS8 illustré dans la figure 1 et b- tout ou partie du premier intron du gène NDUFS8 illustré dans la figure 1. - Gène chimère selon la revendication 11 caractérisé en ce que l'atténuation de l'activité de transcription de la séquence promotrice est une diminution linéaire en fonction de la taille du stuffer. - Gène chimère selon la revendication 11 caractérisé en ce que le fragment d'ADN appelé stuffer ne contient pas de signal de terminaison de la transcription. - Gène chimère selon la revendication 11 caractérisé en ce que le fragment d'ADN appelé stuffer ne contient pas la séquence nucléique ATG ou tout autre signal qui, après transcription, entraînerait la traduction dudit fragment . - - - Gène chimère selon la revendication 11 caractérisé en ce que le fragment d'ADN appelé stuffer contient un signal entraînant son épissage après transcription. - Gène chimère selon la revendication 11 caractérisé en ce que la séquence à transcrire n'est pas traduite. - Gène chimère selon la revendication 11 caractérisé en ce que la séquence à transcrire code pour un polypeptide et qu'elle comprend un ATG reconnaissable par les ribosomes pour permettre la traduction du cadre de lecture représenté par la séquence codante située immédiatement en aval de l'ATG. - Vecteur d'expression contenant un promoteur tel que décrit dans l'une des revendications 1 à 18. - Classe de vecteurs d'expression comprenant une série de vecteurs d'expression selon la revendication 19 se distinguant les uns des autres par la seule différence de taille du stuffer. - Cellules transformées par un gène chimère selon l'une des revendications 11 à 18. - Cellules selon la revendication 21 caractérisées en ce que la transformation est stable. - Cellules selon la revendication 21 caractérisées en ce qu'elles sont d'origine mammifère non humaine. - Cellules selon la revendication 21 caractérisées en ce qu'elles sont d'origine humaine. - Organismes transgéniques non humains comprenant des cellules selon l'une des revendications 21 à 23. - Procédé pour la transformation de cellules mammifères caractérisé par l'introduction dans les cellules d'un gène chimère selon l'une des revendications 11 à 18. - Procédé pour la production d'une protéine hétérologue dans une cellule caractérisé par i) l'introduction dans la cellule d'un gène chimère selon l'une des revendications 11 à 18 ou d'un vecteur selon la revendication 19, puis ii) l'application à la cellule de conditions permettant l'expression stable de gènes chimères iii) éventuellement l'extraction de la protéine hétérologue des cellules ou du surnageant. - Gène chimère caractérisée en ce qu'il' comprend : i) une séquence promotrice ii) un fragment d'ADN appelé stuffer placé en aval de l'élément (i) permettant d'atténuer l'activité de transcription de la séquence promotrice, ce stuffer étant lui-même dépourvu d'élément de régulation de transcription, iii) une séquence à transcrire le promoteur étant éventuellement complété par iv) tout ou partie de l'exon 1 d'un gène v) l'intron 1 du même gène, éventuellement tronqué dans sa partie 3 ' . - Gène chimère selon la revendication 28 caractérisé en ce que l'atténuation de l'activité de transcription de la séquence promotrice est une diminution linéaire en fonction de la taille du stuffer. - Gène chimère selon la revendication 28 caractérisé en ce que le fragment d'ADN appelé stuffer ne contient pas de signal de terminaison de transcription. - Gène chimère selon la revendication 28 caractérisé en ce que le fragment d'ADN appelé stuffer ne contient pas la séquence ATG ou tout autre signal qui, après transcription, entraînerait la traduction dudit fragment. - Gène chimère selon la revendication 28 caractérisé en ce que le fragment d'ADN appelé stuffer contient un signal entraînant son épissage après transcription. - Gène chimère selon la revendication 28 caractérisé en ce que le promoteur, l'exon et l'intron mentionnés sont ceux décrits dans la revendication 4. - Gène chimère selon la revendication 28 caractérisé en ce que le dit promoteur est le promoteur viral SV40. - Gène chimère selon la revendication 28 caractérisé en ce que la séquence à transcrire n'est pas traduite. - Gène chimère selon la revendication 28 caractérisé en ce que la séquence à transcrire code pour un polypeptide et qu'elle comprend un ATG reconnaissable par les ribosomes pour permettre la traduction du cadre de lecture représenté par la séquence codante située immédiatement en aval de l'ATG. - Gène chimère selon la revendication 28 caractérisé en ce que la séquence à transcrire comprend en outre des séquences de terminaison de transcription. - Vecteur d'expression contenant un gène chimère selon l'une des revendications 28 à 37. - Classe de vecteurs d'expression comprenant une série de vecteurs d'expression selon la revendication 38 se distinguant les uns des autres par la seule différence de taille du stuffer. - Cellules transformées par un gène chimère selon l'une des revendications 28 à 37. - Cellules selon la revendication 40 caractérisées en ce que la transformation est stable. - Procédé pour rendre ajustable le taux de transcription d'une séquence d'ADN à partir d'une séquence promotrice comprenant les étapes suivantes : i) la fusion en aval d'une séquence promotrice d'un fragment d'ADN appelé stuffer permettant d'atténuer l'activité de transcription de ladite séquence promotrice, ce stuffer étant lui-même dépourvu d'élément de régulation de transcription, ii) la fusion du fragment résultant de l'étape (i) à une séquence d'ADN à transcrire. - Procédé selon la revendication 42 caractérisé en ce que l'atténuation de l'activité de transcription de la séquence promotrice est une diminution linéaire en fonction de la taille du stuffer. - Procédé pour la production d'une protéine hétérologue dans une cellule caractérisé par i) l'introduction dans la cellule d'un gène chimère selon l'une des revendications 28 à 37 ou d'un vecteur selon la revendication 38, puis ii) l'application à la cellule de conditions permettant l'expression stable de gènes chimères iii) éventuellement l'extraction de la protéine hétérologue des cellules ou du surnageant .
PCT/FR2001/002438 2000-07-28 2001-07-25 Element d'adn promoteur de l'activite de transcription, actif dans les cellules humaines et methode generale pour en ajuster l'activite WO2002010334A2 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP01960836A EP1305403A2 (fr) 2000-07-28 2001-07-25 Element d'adn promoteur de l'activite de transcription, actif dans les cellules humaines et methode generale pour en ajuster l'activite

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR00/10007 2000-07-28
FR0010007A FR2812305B1 (fr) 2000-07-28 2000-07-28 Element d'adn promoteur de l'activite de transcription, actif dans les cellules humaines et methode generale pour en ajuster l'activite

Publications (2)

Publication Number Publication Date
WO2002010334A2 true WO2002010334A2 (fr) 2002-02-07
WO2002010334A3 WO2002010334A3 (fr) 2002-04-18

Family

ID=8853087

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2001/002438 WO2002010334A2 (fr) 2000-07-28 2001-07-25 Element d'adn promoteur de l'activite de transcription, actif dans les cellules humaines et methode generale pour en ajuster l'activite

Country Status (3)

Country Link
EP (1) EP1305403A2 (fr)
FR (1) FR2812305B1 (fr)
WO (1) WO2002010334A2 (fr)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995028490A1 (fr) * 1994-04-15 1995-10-26 Alliance Pharmaceutical Corp. Vecteur d'expression contenant un promoteur non viral
EP1053319A2 (fr) * 1998-01-28 2000-11-22 Chiron Corporation Genes humains et expression de produits genetiques ii

Also Published As

Publication number Publication date
FR2812305A1 (fr) 2002-02-01
EP1305403A2 (fr) 2003-05-02
FR2812305B1 (fr) 2005-01-07
WO2002010334A3 (fr) 2002-04-18

Similar Documents

Publication Publication Date Title
EP1453962B1 (fr) Oligonucleotides inhibiteurs et leur utilisation pour reprimer specifiquement un gene codant pour un recepteur aux androgenes
EP4032985B1 (fr) Micropeptides et leur utilisation pour moduler l'expression de genes
Lin et al. Localization of AU-rich element-containing mRNA in cytoplasmic granules containing exosome subunits
Sasaki et al. Isolation and characterization of cDNAs encoding an enzyme with glucosyltransferase activity for cyclo-DOPA from four o’clocks and feather cockscombs
Jakka et al. Cytoplasmic linker protein CLIP170 negatively regulates TLR4 signaling by targeting the TLR adaptor protein TIRAP
Watson et al. A hypomorphic allele of telomerase uncovers the minimal functional length of telomeres in Arabidopsis
Harn et al. Presence of multiple cDNAs encoding an isoform of ADP-glucose pyrophosphorylase large subunit from sweet potato and characterization of expression levels
Bhakta et al. Double MS2 guided restoration of genetic code in amber (TAG), opal (TGA) and ochre (TAA) stop codon
EP3256583B1 (fr) Procédé de fabrication de vecteurs d'adn à partir de briques moléculaires contenant des séquences d'intérêt
WO2002010334A2 (fr) Element d'adn promoteur de l'activite de transcription, actif dans les cellules humaines et methode generale pour en ajuster l'activite
Takeuchi et al. Regulation of ecdysteroid signaling: cloning and characterization of ecdysone oxidase: a novel steroid oxidase from the cotton leafworm, Spodoptera littoralis
FR2798391A1 (fr) Enzyme thyroidienne nadph oxydase, acide nucleique codant pour cette enzyme et leurs applications
WO2024083986A1 (fr) Nouveaux peptides et leur utilisation pour moduler l'accumulation d'une proteine
WO2010125293A1 (fr) Adressage d'acides nucléiques dans les mitochondries
Choi et al. Non-canonical splice junction processing increases the diversity of RBFOX2 splicing isoforms
Nakazawa et al. Stable nuclear transformation methods for Euglena gracilis and its application to a related Euglenida
Scholl et al. Spinal muscular atrophy: position and functional importance of the branch site preceding SMN exon 7
Anant et al. Apobec-1 transcription in rat colon cancer: decreased apobec-1 protein production through alterations in polysome distribution and mRNA translation associated with upstream AUGs
Martin et al. RETRACTED: TGF-β1 regulation of human AT1 receptor mRNA splice variants harboring exon 2
EP1852504B1 (fr) Préparation de calibrants et leur application de séquences nucléotidiques d'intérêt
FR2847588A1 (fr) METHODES D'EXPRESSION INDUCTIBLE D'ARNi DANS LES CELLULES, LES MOLECULES D'ACIDE NUCLEIQUE POUR SA MISE EN OEUVRE ET LES CELLULES TRANSFORMEES PAR CES MOLECULES
EP1678306A1 (fr) METHODE D'INDUCTION D'UNE ACTIVITE ARNi SPECIFIQUE DANS DES CELLULES ET ACIDES NUCLEIQUES POUR SA MISE EN OEUVRE
JP2024128054A (ja) グルコースデヒドロゲナーゼを用いた持続血糖測定
EP1102843A1 (fr) Sequences nucleiques codant pour une proteine (atip) interagissant avec le recepteur at2 et leurs applications
FR2859482A1 (fr) Vecteurs d'expression d'arn interferents, leurs procedes de preparation et leurs utilisations

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): CA JP US

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR

121 Ep: the epo has been informed by wipo that ep was designated in this application
AK Designated states

Kind code of ref document: A3

Designated state(s): CA JP US

AL Designated countries for regional patents

Kind code of ref document: A3

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2001960836

Country of ref document: EP

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWP Wipo information: published in national office

Ref document number: 2001960836

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: JP

WWW Wipo information: withdrawn in national office

Ref document number: 2001960836

Country of ref document: EP