La présente invention concerne des oligonucléotides et leur utilisation comme amorces universelles pour la détection et l'identification d'espèces d'oligochètes, notamment dans des substrats complexes et dégradés. L'identification taxonomique basée sur l'analyse de l'ADN est une approche couramment utilisée aujourd'hui pour identifier des espèces au sein d'un mélange. Un consortium international nommé Barcode for Life a été créé avec comme objectif de permettre la détection d'espèces animales ou végétales à partir d'une séquence d'ADN. Pour identifier les animaux, l'approche consiste à amplifier puis à séquencer une séquence de 648 paires de base du gène mitochondrial cytochrome c oxidase 1 ("CO1"). CO1 s'est montré efficace pour l'identification des oiseaux, papillons, poissons, mouches et autres groupes animaux (Hebert et al., 2003). Pour les végétaux, la situation est plus complexe et deux autres séquences d'ADN chloroplastiques, matK and rbcL, ont été proposées (Hollingsworth et al., 2009). Il s'avère néanmoins que les fragments choisis selon cette méthode sont de longueur trop longue (supérieure à 500 nucléotides) pour être utilisés dans des substrats dégradés. Or, dans de très nombreuses situations, les substrats à analyser contiennent de l'ADN dégradé, avec souvent des fragments de moins de 100 nucléotides. C'est le cas notamment des échantillons collectés dans l'environnement (sol, eau, fèces) ou des matrices utilisées dans l'industrie, par exemple les farines animales ou les plats industriels de l'industrie alimentaire. Une solution pour la détection et l'identification spécifique consiste à analyser des fragments d'ADN informatifs de petite taille (Poinar et al., 1998; Willersley et al., 2003 ; Willersley et al., 2007). Des amorces ont ainsi été définies afin d'amplifier des fragments d'ADN végétaux plus courts dans des échantillons de sols gelés. Néanmoins, les amorces permettent d'identifier les familles mais pas les espèces végétales. En outre, les amorces n'ont pas été choisies de manière à amplifier des séquences suffisamment conservées dans le règne végétal pour permettre l'amplification de toute espèce végétale. En d'autres mots, ces amorces ne sont pas véritablement universelles. WO 2006/024751 décrit un procédé permettant de détecter simultanément dans un échantillon de matière biologique la présence éventuelle de matières biologiques par réaction de polymérisation en chaîne (PCR) puis hybridation avec des sondes. Les amorces décrites sont très dégénérées (pratiquement chaque codon comporte un nucléotide dégénéré) et manquent par conséquent de spécificité pour l'amplification de l'ADN de vertébrés. Le brevet EP1797201 propose des oligonucléotides permettant la détection et l'identification de végétaux dans des substrats complexes ou dégradés car la région amplifiée est à la fois courte et très variable. Plus précisément, la région amplifiée correspond à une région variable de l'intron du gène chloroplastique trnL du tabac. A cet égard, référence est faite également à l'article de Taberlet et al., 2007. Les amorces décrites dans ce brevet sont spécifiques des espèces végétales et elles ne permettent pas l'identification et la détection des espèces d'oligochètes dans des substrats complexes ou dégradés. La présente invention propose de nouveaux oligonucléotides et leurs utilisations comme amorces universelles pour l'identification et la détection des espèces oligochètes. Ces amorces permettent à la fois d'amplifier une région courte (moins de 80 paires de base), une région très variable entre les espèces oligochètes et une région présentant dans le même temps des régions flanquantes très conservées permettant l'amplification à l'aide de deux paires d'amorces. Ainsi, ces amorces peuvent être utilisées dans des mélanges complexes et dégradés, par exemple des échantillons de sols, de fèces et d'eau. De telles amorces trouvent des applications dans l'analyse de l'ADN environnemental. Egalement de telles amorces trouvent des applications en agriculture, par exemple lors de l'analyse de la pollution des sols. Plus précisément, ces amorces permettent d'amplifier une région 16S de l'ADN mitochondrial. Il est particulièrement intéressant de disposer d'amorces permettant l'amplification d'ADN mitochondrial car celui-ci représente une cible très accessible dans le cas de substrats dégradés. De plus, l'ADN mitochondrial est présent de manière répétée dans chaque cellule. Les amorces universelles objet de la présente invention sont particulièrement avantageuses car elles sont extrêmement spécifiques des oligochètes et n'amplifient aucun autre groupe taxonomique.
Description de l'invention
La présente invention concerne un kit pour la détection d'une espèce oligochète dans un échantillon, comprenant : - une première paire d'oligonucléotides selon laquelle le premier oligonucléotide s'hybride de manière sélective à la séquence SEQ ID NO. 5 et le deuxième nucléotide s'hybride de manière sélective à la séquence SEQ ID NO. 6 et - une deuxième paire d'oligonucléotides selon laquelle le premier oligonucléotide s'hybride de manière sélective à la séquence SEQ ID NO. 7 et le deuxième nucléotide s'hybride de manière sélective à la séquence SEQ ID NO. 8 l'hybridation étant réalisée dans des conditions de stringences suffisantes pour l'amplification d'une région variable du gène mitochondrial 16S des oligochètes par réaction de polymérisation en chaîne (PCR). Selon un aspect de l'invention, la région amplifiée du gène mitochondrial 16S comporte moins de 80 nucléotides. Selon un autre aspect de l'invention, le premier oligonucléotide de la première paire d'oligonucléotides présente une séquence nucléotidique SEQ ID NO. 1 et le deuxième oligonucléotide de la première paire d'oligonucléotides présente une séquence nucléotidique SEQ ID NO. 2. Selon un autre aspect encore de l'invention, une séquence nucléotidique SEQ ID NO. 3 et le deuxième oligonucléotide de la première paire d'oligonucléotides présente une séquence nucléotidique SEQ ID NO. 4. Selon un autre aspect encore de l'invention, la région amplifiée par réaction de polymérisation en chaîne présente une séquence nucléotidique sélectionnée dans le groupe consistant en SEQ ID NOS.9-54.
La présente invention propose aussi un procédé d'amplification d'une région du gène mitochondrial 16S d'espèces oligochètes, comprenant les étapes suivantes : a) on dispose d'un échantillon susceptible de contenir de l'ADN d'espèces oligochètes ; b) on réalise une réaction d'amplification en chaîne en utilisant le kit selon l'invention. 3 La présente invention propose également un procédé de détection d'une espèce oligochète dans un échantillon, comprenant les étapes suivantes : a) on dispose d'un échantillon susceptible de contenir de l'ADN d'espèces oligochètes; b) on isole l'ADN total contenu dans l'échantillon ; c) on réalise une réaction d'amplification en chaîne en utilisant un kit de détection selon l'invention; et d) on détecte l'éventuelle présence d'un produit d'amplification.
La présente invention propose un procédé de détection et d'identification d'une espèce oligochète dans un échantillon, comprenant les étapes suivantes : a) on dispose d'un échantillon susceptible de contenir de l'ADN d'espèces oligochètes ; b) on isole l'ADN total contenu dans l'échantillon ; c) on réalise une réaction d'amplification en chaîne en utilisant un kit de détection selon l'invention; d) on détecte la présence d'un produit d'amplification ; et e) on détermine la séquence du produit d'amplification pour identifier l'espèce oligochète contenue dans l'échantillon.
La présente invention concerne aussi l'utilisation d'au moins une partie de la région du gène mitochondrial 16S des oligochètes correspondant aux positions 11839 à 11907 ou correspondant aux positions 11891 à 12002 du gène mitochondrial 16S de Lumbricus terrestris (U24570) pour détecter et/ou identifier des espèces oligochètes. Selon un aspect de l'invention, la partie de ladite région correspond à la région variable correspondant aux positions 11860 à 11890 ou 11908 à 11981 du gène mitochondrial 16S de Lumbricus terrestris (U24570) et est sélectionnée dans le groupe consistant en SEQ ID NOS.9-54.
Description du listaqe de séquences SEQ ID NO.1 : amorce ewB SEQ ID NO.2 : amorce ewC SEQ ID NO.3 : amorce ewD SEQ ID NO.4 : amorce ewE SEQ ID NO.5 : séquence de la région complémentaire de l'amorce ewB SEQ ID NO.6 : séquence de la région complémentaire de l'amorce ewC SEQ ID NO.7 : séquence de la région complémentaire de l'amorce ewD SEQ ID NO.8 : séquence de la région complémentaire de l'amorce ewE SEQ ID NOS.9-54 : exemples de séquences variables amplifiées de différentes espèces oligochètes SEQ ID NOS. 55-56 : amorces utilisées dans l'élaboration de la base de données
Kit de détection La présente invention concerne donc des oligonucléotides dérivés de deux régions conservées d'un gène 16S mitochondrial présent chez les oligochètes. Ces oligonucléotides peuvent être utilisés comme amorces pour l'amplification et donc la détection de l'ADN de oligochètes dans un échantillon susceptible de contenir un tel ADN. En effet, les régions conservées dont sont dérivés les polynucléotides de la présente invention flanquent une région à la fois courte et très variable de l'ADN des oligochètes, plus précisement une région courte et variable dans le gène 16S mitochondrial des oligochètes. La variablité de cette région entre espèces oligochètes peut donc être utilisée pour détecter et identifier les espèces d'oligochètes. Selon la présente invention, on entend par « oligonucléotide » une chaîne nucléotidique simple brin ou son complémentaire pouvant être de type ADN ou ARN, ou une chaîne nucléotidique double brin pouvant être de type ADN complémentaire ou génomique. Selon un mode réalisation, les oligonucléotides de l'invention sont de type ADN, notamment ADN double brin. Le terme « oligonucléotide » désigne également les polynucléotides modifiés. Les oligonucléotides modifiés sont par exemple des oligonucléotides conjugués à des réactifs de liaison (biotine par exemple) ou à des réactifs marqués (marqueurs fluorescents par exemple). Classiquement, les réactifs de liaison ou les réactifs marqués conjugués aux oligonucléotides facilitent la purification ou la détection de ces oligonucléotides. Les oligonucléotides de la présente invention peuvent être préparés par synthèse chimique ou par des techniques classiques de biologie moléculaire telles que décrites par Sambrook, Fristsch et Maniatis, dans leur ouvrage intitulé "Molecular cloning: a laboratory manual", édition : Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989. Les oligonucléotides de la présente invention peuvent également être isolés ou purifiés de leur environnement naturel. Le terme « polynucléotide » peut ici être utilisé en remplacement du terme « oligonucléotide » avec une signification équivalente. On entend par « amorce » une courte séquence d'oligonucléotides qui, hybridée avec une matrice d'acide nucléique, permet à une polymérase d'entamer la synthèse d'un nouveau brin de l'ADN. Le brin produit à partir de l'amorce est complémentaire au brin utilisé comme matrice. Les amorces sont notamment utilisées dans les réactions de polymérisation en chaîne (PCR). On entend par « espèce oligochète », tout organisme faisant partie de la sous-classe des oligochètes. Les « vers de terre » font notamment partis des oligochètes. La présente invention concerne donc kit contenant une première paire d'oligonucléotides selon laquelle le premier oligonucléotide s'hybride de manière sélective à une région très conservée du gène mitochondrial 16S des oligochètes et le deuxième nucléotide s'hybride de manière sélective à une autre région très conservée du gène mitochondrial 16S des oligochètes dans des conditions de stringences suffisantes pour l'amplification de la région variable du gène mitochondrial 16S des oligochètes par réaction de polymérisation en chaîne (PCR), par exemple dans des conditions de forte stringence. La séquence de la première région conservée correspond à la séquence de l'amorce ewB (SEQ ID NO. 1) et de sa séquence complémentaire (SEQ ID NO. 5). La séquence de la deuxième région conservée correspond à la séquence de l'amorce ewC (SEQ ID NO.2) et de sa séquence complémentaire (SEQ ID NO. 6). Le kit comprend en outre une deuxième paire d'oligonucléotides selon laquelle le premier oligonucléotide s'hybride de manière sélective à une région très conservée du gène mitochondrial 16S des oligochètes et le deuxième nucléotide s'hybride de manière sélective à une autre région très conservée du gène mitochondrial 16S des oligochètes dans des conditions de stringences suffisantes pour l'amplification de la région variable du gène mitochondrial 16S des oligochètes par réaction de polymérisation en chaîne (PCR), par exemple dans des conditions de forte stringence. La séquence de la première région conservée correspond à la séquence de l'amorce ewD (SEQ ID NO. 3) et de sa séquence complémentaire (SEQ ID NO. 7). La séquence de la deuxième région conservée correspond à la séquence de l'amorce ewE (SEQ ID NO.4) et de sa séquence complémentaire (SEQ ID NO. 8). A titre d'exemple, chez Lumbricus terrestris, le premier oligonucléotide de la première paire d'oligonucléotides se trouve aux positions 11839 à 11859 de la séquence U24570 et le second oligonucléotide de la première paire d'oligonucléotides se trouve aux positions 11891 à 11907 de cette même séquence. Additionnellement, le premier oligonucléotide de la deuxième paire d'oligonucléotides se trouve aux positions 11891 à 11907 de la séquence U24570 et le second oligonucléotide de la deuxième paire d'oligonucléotides se trouve aux positions 11982 à 12002 de cette même séquence.
L'homme du métier connaît les réactions d'amplification d'ADN et les conditions de stringence permettant une amplification sélective d'une séquence. L'homme du métier connaît en particulier les conditions de température d'hybridation et les conditions de composition du tampon d'hybridation. L'homme du métier pourra donc facilement définir différentes variantes des amorces ewB (SEQ ID NO. 1), ewC (SEQ ID NO. 2), ewD (SEQ ID NO. 3) et ewE (SEQ ID NO. 4) en utilisant des techniques de routine. Ces variantes s'hybrident aux séquences de référence et permettent l'amplification sélective de la région variable d'intérêt de l'ADN mitochondrial 16S. Habituellement, les variations de séquence sont plutôt introduites à l'extrémité 5' des oligonucléotides pour ne pas compromettre la réaction d'amplification. Classiquement, on peut par exemple introduire des nucléotides supplémentaires à l'extrémité 5' des oligonucléotides. Par « séquence capable de s'hybrider de manière sélective » ou « oligonucléotide capable de s'hybrider de manière sélective », on entend selon l'invention les séquences qui s'hybrident avec la séquence de référence à un niveau supérieur au bruit de fond de manière significative. Le niveau du signal généré par l'interaction entre la séquence capable de s'hybrider de manière sélective et les séquences de référence est généralement 10 fois, de préférence 100 fois plus intense que celui de l'interaction des autres séquences d'ADN générant le bruit de fond. Les conditions d'hybridation stringentes permettant une hybridation sélective sont connues de l'homme du métier. En général, la température d'hybridation et de lavage est inférieure d'au moins 5°C, par exemple 10°C, au Tm de la séquence de référence à un pH donné et pour une force ionique donnée. Typiquement, la température d'hybridation est d'au moins 30°C pour un polynucléotide de 15 à 50 nucléotides et d'au moins 60°C pour un polynucléotide de plus de 50 nucléotides. A titre d'exemple, l'hybridation est réalisée dans le tampon suivant : 6X SSC, 50 mM Tris-HCI (pH 7.5), 1 mM EDTA, 0.02% PVP, 0.02% Ficoll, 0.02% BSA, 500 pg/ml sperme de saumon denaturé DNA. Les lavages sont par exemple réalisés successivement à faible stringence dans un tampon 2X SSC, 0,1% SDS, à moyenne stringence dans un tampon 0,5X SSC, 01% SDS et à forte stringence dans un tampon 0,1X SSC, 0,1%SDS. L'hybridation peut bien entendu être effectuée selon d'autres méthodes usuelles connues de l'homme du métier (voir notamment Sambrook, Fristsch et Maniatis, dans leur ouvrage intitulé "Molecular cloning: a laboratory manual", édition : Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989). Par « stringence », on entend la rigueur des conditions opératoires (notamment la température et la force ionique) dans lesquelles se déroule une hybridation moléculaire. Le paramètre déterminant dans la spécificité et la réversibilité de l'hybridation moléculaire est le Tm ou température de fusion (melting temperature). C'est la température à laquelle la moitié de l'ADN est sous forme monobrin et l'autre moitié sous forme double brin. Le Tm dépend de nombreux facteurs tels que la longueur du fragment d'ADN considéré, sa richesse en cytosines et guanines et la concentration en sels, notamment en ion Na du milieu réactionnel. En pratique, l'expérimentateur peut créer ou supprimer l'hybridation moléculaire en choisissant une température du milieu réactionnel inférieure, égale ou supérieure au Tm. Les conditions de forte stringence sont celles pour lesquelles la température d'hybridation et de lavage est inférieure d'au moins 5°C et jusqu'à moins 10°C au Tm de la séquence de référence à un pH donné et pour une force ionique donnée. Par « amplification », on entend toute amplification enzymatique in vitro d'une séquence définie d'ADN, notamment du type réaction de polymérisation en chaîne (ou Polymerase Chain Reaction, PCR). Les amorces selon l'invention peuvent en outre comporter des étiquettes qui vont permettre d'identifier rapidement l'appartenance de chaque séquence amplifiée à un échantillon de départ. Le terme « queue » peut être utilisée de manière équivalente, à la place du terme « étiquette » (« tags » en anglais). Les étiquettes sont de courtes séquences nucléotidiques, généralement de longueur inférieure à 10 nucléotides. Ces étiquettes sont particulièrement utiles lorsqu'il s'agit d'utiliser des séquenceurs de nouvelle génération qui permettent de séquencer près de 100 000 séquences à la fois. En effet, chaque étiquette correspondant à un échantillon de départ à analyser, on peut ainsi mélanger plusieurs produits d'amplification avant de procéder au séquençage. Ceci est avantageux car mettre en oeuvre un séquençage via un séquenceur de nouvelle génération peut s'avérer être une opération coûteuse. Dans la pratique, les amorces selon l'invention peuvent comporter un fragment nucléotidique additionnel du coté 5' spécifique de chaque échantillon. Après amplification de plusieurs échantillons, mélange des différents produits d'amplification ainsi obtenus, et séquençage, chaque séquence amplifiée est ainsi facilement assignée à un échantillon de départ. Les étiquettes constituent donc un outil particulièrement avantageux lorsqu'il s'agit de séquencer à haut débit (Binladen et al., 2007). Habituellement, l'amplification comporte des cycles successifs (généralement de 20 à 40) d'amplification, eux-mêmes composés de trois phases: après une étape de dénaturation (séparation des deux brins de la double hélice) de l'ADN, le positionnement des amorces (courtes séquences d'oligonucléotides spécifiquement choisies) en face de leurs séquences complémentaires, sur les brins d'ADN, et leur fixation sur ces cibles constitue la deuxième phase du procédé (hybridation). La phase d'extension fait intervenir une enzyme, l'ADN polymérase, qui synthétise, à partir des amorces, le brin complémentaire de celui ayant servi de matrice. La répétition de ce cycle conduit à l'amplification exponentielle du fragment d'ADN, également appelé produit d'amplification ou ADN amplifié. Selon un aspect de l'invention, l'hybridation s'effectue à une température comprise entre 45 et 65°C. Notamment, l'hybridation peut s'effectuer à une température comprise entre 45 et 60°C lorsque les amorces ne comportent pas d'étiquette. Alternativement, l'hybridation peut s'effectuer à une température comprise entre 50 et 65°C lorsque les amorces comportent une étiquette. Selon un autre aspect, l'invention concerne un kit de détection comprenant une première paire d'oligonucléotides, selon laquelle le premier oligonucléotide s'hybride de manière sélective à la séquence SEQ ID NO. 5 et le deuxième nucléotide s'hybride de manière sélective à la séquence SEQ ID NO. 6 et une seconde paire d'oligonucléotides, selon laquelle le premier oligonucléotide s'hybride de manière sélective à la séquence SEQ ID NO. 7 et le deuxième nucléotide s'hybride de manière sélective à la séquence SEQ ID NO. 8, ces hybridations étant réalisées dans des conditions de stringences suffisantes pour l'amplification d'une région variable du gène mitochondrial 16S de Lumbricus terrestris (U24570) dont la séquence est représentée à la SEQ ID NO.50 et qui peut être utilisée comme séquence de référence. Selon un aspect de l'invention, la paire d'oligonucléotides permet l'amplification d'une région du gène mitochondrial 16S qui comporte moins de 80 nucléotides, en particulier moins de 78 ou moins de 75 nucléotides, amorces non comprises (c'est-à-dire sans compter la longueur des amorces). Disposer d'une paire d'amorce universelle qui permette l'amplification d'une région variable courte est très avantageuse car l'utilisation de telles amorces dans des substrats complexes ou dégradés permet la détection et si besoin l'identification des espèces dans de tels substrats. Les amorces de la présente invention permettent de détecter et identifier plus de ... taxons de l'embranchement oligochète. Les tableaux 1 et 2 donnés à la partie expérimentale représentent une partie des séquences susceptibles d'être amplifié avec les amorces de la présente invention. Selon un aspect de la présente invention, la région amplifiée par réaction de polymérisation en chaîne présente une séquence nucléotidique sélectionnée dans le groupe consistant en l'une quelconque des SEQ ID NOS. 9-54. La présente invention concerne également un mélange d'amorces pour l'amplification d'une région variable du gène mitochondrial 16S des oligochètes par réaction de polymérisation en chaîne (PCR) comprenant les amorces d'amplification ewB, ewC, ewD et ewE. Selon un autre aspect de l'invention, le kit comprend en outre une étiquette de moins de 10 nucléotides pour l'identification de l'échantillon de départ après séquençage du produit PCR. Le kit selon l'invention peut également en outre contenir de manière non limitative des réactifs additionnels, par exemple une enzyme DNA polymerase, des dNTP, du Tris-HCI, du KCI, du MgCl2 ou du Bovine Serum Albumin (BSA).
Procédés mettant en oeuvre la paire d'oliqonucléotides La présente invention concerne également un procédé d'amplification d'une région du gène mitochondrial 16S des oligochètes, comprenant les étapes suivantes : a) on dispose d'un échantillon contenant de l'ADN d'oligochètes; b) on réalise une réaction d'amplification en chaîne en utilisant une paire d'oligonucléotides selon l'invention. L'échantillon à partir duquel la réaction d'amplification est réalisée peut être collecté dans l'environnement. Dans ce cas, il peut par exemple s'agir d'un échantillon de sol, eau ou fèces. Un avantage du procédé selon l'invention utilisant les amorces ci-dessus décrites est que l'ADN contenu dans l'échantillon peut se trouver sous forme dégradée. Cela est principalement dû au fait que les amorces ont été choisies de manière à ce que la région amplifiée soit courte, par exemple de longueur inférieure à 80 paires de bases. Selon un aspect de l'invention, l'hybridation s'effectue à une température comprise entre 45 et 65°C. En fonction du fait que les paires d'oligonucléotides de l'invention comporte ou non une étiquette tel que cela est décrit précédemment, les conditions de l'amplification, en particulier la température d'hybridation, peut ou non varier. Notamment, l'hybridation peut s'effectuer à une température comprise entre 45 et 60°C lorsque les amorces ne comportent pas d'étiquette. Par exemple, on peut utiliser une température de 51-53°C. Alternativement, l'hybridation peut s'effectuer à une température comprise entre 50 et 65°C lorsque les amorces comportent une étiquette. Par exemple, on peut utiliser une température de 57-58°C. L'homme du métier sait adapter la température d'hybridation aux amorces utilisées. Le procédé d'amplification selon l'invention peut nécessiter une étape d'extraction de l'ADN avant d'effectuer l'amplification. On utilise alors par exemple pour cela un kit d'extraction disponible dans le commerce. La présente invention propose également un procédé de détection d'une espèce d'oligochètes dans un échantillon. Ce procédé de détection selon l'invention comprend les étapes suivantes : a) on dispose d'un échantillon susceptible de contenir de l'ADN d'espèces oligochètes; b) on isole l'ADN total contenu dans l'échantillon ; c) on réalise une réaction d'amplification en chaîne en utilisant une paire d'oligonucléotides selon l'invention ; et d) on détecte l'éventuelle présence d'un produit d'amplification. L'invention se rapporte aussi à un procédé de détection et d'identification d'une espèce oligochète dans un échantillon, comprenant les étapes suivantes : a) on dispose d'un échantillon susceptible de contenir de l'ADN d'espèces oligochètes; b) on isole l'ADN total contenu dans l'échantillon ; c) on réalise une réaction d'amplification en chaîne en utilisant une paire d'oligonucléotides selon l'invention ; d) on détecte la présence d'un produit d'amplification ; et e) on détermine la séquence du produit d'amplification pour identifier l'espèce de oligochètes contenue dans l'échantillon. L'étape de détermination de la séquence correspond au séquençage de celle-ci. Les méthodes et outils de séquençage sont connus de l'homme du métier et un exemple de ce qui peut être utilisé dans la présente invention est donné dans la partie expérimentale.
Utilisations La présente invention concerne également l'utilisation d'au moins une partie de la région du gène mitochondrial 16S des oligochètes correspondant aux positions 11839 à 11907 ou correspondant aux positions 11891 à 12002 du gène mitochondrial 16S de Lumbricus terrestris (U24570) pour détecter et/ou identifier des espèces oligochètes. Par exemple, la partie de ladite région correspond à la région variable correspondant aux positions 11860 à 11890 ou 11908 à 11981 du gène mitochondrial 16S de Lumbricus terrestris (U24570). Cette partie de ladite région peut notamment être sélectionnée dans le groupe consistant en SEQ ID NOS.9-54. La présente invention concerne également l'utilisation de la région variable du gène mitochondrial 16S des oligochètes correspondant aux positions 11860 à 11890 ou correspondant aux positions 11908 à 11981 du gène mitochondrial 16S de Lumbricus terrestris (U24570) pour détecter et/ou identifier des espèces oligochètes. Par exemple, cette région variable est sélectionnée dans le groupe consistant en SEQ ID NO.9-54. A partir de la séquence du gène 16S de Lumbricus terrestris (U24570) et des positions indiquées, l'homme du métier sait comment identifier les séquences correspondantes dans d'autres espèces oligochètes. Exemples
Exemple 1 - Validation in silico L'efficacité des amorces ewB/ewC amplifiant le fragment BC (voir Figure 1) et des amorces ewD/ewE amplifiant le fragment DE (voir Figure 1) ont été testées in silico en utilisant le programme ecoPCR (Ficetola et al. 2010) et la version 103 de la base de données EMBL.
Résultats pour le fragment BC 403 séquences de vers de terre (Lumbricina) ont été obtenues pour le fragment BC, dont 201 séquences uniques correspondant à 127 espèces, 28 genres, et 4 familles (Aeolosomatidae, Lumbricidae, Megascolecidae, Ocnerodrilidae). Le tableau 1 ci-dessous donne une sélection des espèces de vers de terre amplifiées parmi les 201 séquences uniques obtenues (avec le nombre de séquences dans la base de données indiquée après le nom d'espèce, et un numéro d'accession par séquence unique).
Résultats pour le fragment DE Un total de 402 séquences de vers de terre (Lumbricina) ont été obtenues pour le fragment DE, dont 235 séquences uniques correspondant à 127 espèces, 26 genres, et 3 familles (Lumbricidae, Megascolecidae, Ocnerodrilidae). Le tableau 2 ci-dessous donne une sélection des espèces de vers de terre amplifiées parmi les 235 séquences uniques.
Cette analyse in silico démontre clairement que, aussi bien pour le fragment BC que pour le fragment DE, l'identification de l'espèce est possible dans la plupart des cas (avec même de la variation intraspécifique pour plusieurs espèces). Il est probable que la grande majorité des cas ambigus (par exemple les codes 177a/177b (fragment BC) et 214a/214b (fragment DE)) correspondent à des erreurs d'identification des séquences déposées dans les bases de données publiques. 15 Tableau 1- Vers de terre Tableau élaboré à partir de la version 107 de la base de données EMBL Nom scientifique Numéro Séquence correspondant à ewB Séquence amplifiée Séquence correspondant d'accession à ewC Allolobophora chlorotica AM774359 CAAGAAGACCCTATAGAGCTT CATTTTAATATAGATATAAACTTTAATAAA GGTCGCCCCAACCGAAT (SEQ ID NO.9) Amynthascorticis AB474282 CAAGAAGACCCTATAGAGCTT AATTTTAATTATAGAACTACACTATAAAAAT GGTCGCCCCAACCGAAT (SEQ ID NO.10) Aporrectodea caliginosa AM774394 CAAGAAGACCCTATAGAGCTT TATTTTAATAAAAATATAAATTTTTAATAA GGTCGCCCCAACCGAAT (SEQ ID N0. 11) Aporrectodea caliginosa FJ967609 CAAGAAGACCCTATAGAGCTT TATTTTAATAAAAAAAAATATAAATTTTTAATAA GGTCGCCCCAACCAAAT (SEQ ID NO.12) Aporrectodealimicola FJ967636 CAAGAAGACCCTATAGAGCTT TATTTTAACAAAAATTAAAGACTTTTCTAAA GGTCGCCCCAACCGAAT (SEQ ID NO.13) A1~orrectodea longa AM774395 CAAGAAGACCCTATAGAGCTT TATTTTAATAAAATATAAAAAATTTTAGATAA GGTCGCCCCAACCGAAT (SEQ ID NO.14) Aporrectodea longa FJ967604 CAAGAAGACCCTATAGAGCTT TATTTTAATAAAATATAAAAAAATTTTAGATAA GGTCGCCCCAACCGAAT (SEQ ID NO.15) 16 Aporrectodea molleri FJ967637 CAAGAAGACCCTATAGAGCTT CATTTTAATGAAGACTAAAACTTCCCTAAA GGTCGCCCCAACCGAAT (SEQ ID NO.16) Aporrectodea nocturna FJ967629 CAAGAAGACCCTATAGAGCTT TATTTTAACAAAATCCAAAAATTTTCAATAAA GGTCGCCCCAACCGAAT (SEQ ID NO.17) Aporrectodea rosea FJ967642 CAAGAAGACCCTATAGAGCTT CATTTTAATAAAAACTAATATTTTAATAAA GGTCGCCCCAACCGAAT (SEQ ID NO.18) Aporrectodea trapezoides AB543236 CAAGAAGACCCTATAGAGCTT TATTTTAACAAAAGCCAGAAAATTTTTAATAAA GGTCGCCCCAACCGAAT ( SEQ I D NO. 19 ) Aporrectodea tuberculata FJ967643 CAAGAAGACCCTATAGAGCTT TATTTTAATAAAAATTATAAATTTTTAATAA GGTCGCCCCAACCGAAT (SEQ ID NO.20) Diplocardia caroliniana DQ533724 CAAGAAGACCCTATAGAGCTT TATTTAAAAACAAATTAACTATTGTAATAAA GGTCGCCCCAACCGAAT (SEQ ID NO.21) Eiseniafetida DQ257296 CAAGAAGACCCTATAGAGCTT TATTTAAATCACAGACCCTATCTAGTGTAATA GGTCGCCCCAACCGAAT (SEQ ID NO.22) Hormogasterelisae GQ409704 CAAGAAGACCCTATAGAGCTT TATCTAAGAAAGAATTTAATTGTTCTTTATAGG GGTCGCCCCAACCGAAT (SEQ ID NO.23) Lumbricuscastaneus AM774397 CAAGAAGACCCTATAGAGCTT AATTTAAACAAATATAAAAAAATTTACTAAA GGTCGCCCCAACCGAAT (SEQ ID NO.24) 17 Lumbricus rubellus DQ257298 CAAGAAGACCCTATAGAGCTT TATCACAATGAAAAAACAAAATATTCACTAAG GGTCGCCCCAACCGAAT (SEQ ID NO.25) Lumbricus terrestres AM774396 CAAGAAGACCCTATAGAGCTT AATTTAAATAAATATAAAAAATTTACTAAA GGTCGCCCCAACCGAAT (SEQ ID NO.26) Lumbricusterrestris U24570 CAAGAAGACCCTATAGAGCTT AATTTAAATAAATATGAAAAAATTTACTAAA GGTCGCCCCAACCGAAT (SEQ ID NO.27) Maoridrilus carnosus HQ232548 CAAGAAGACCCTATAGAGCTT TATCTTTAATATGGAACATTACCACTTCACGG GGTCGCCCCAACCGAAT (SEQ ID NO.28) Metaphireabdita EF490527 CAAGAAGACCCTATAGAGCTT AATTTAAAATATAGAACTATGCTATAGCAAT GGTCGCCCCAACCGAAT (SEQ ID NO.29) Metaphiresieboldi AB474353 CAAGAAGACCCTATAGAGCTT AATTTTAATTATAGAGCTACACTATAAGAAT GGTCGCCCCAACCGAAT (SEQ ID NO.30) Octolasion tyrtaeum DQ257299 CAAGAAGACCCTATAGAGCTT TATTTTAACAAAAACTAAAAATTTTTCAATAAA GGTCGCCCCAACCGAAT (SEQ ID NO.31) 18 Tableau 2 - Vers de terre Tableau élaboré à partir de la version 107 de la base de données EMBL Nom scientifique Numéro Séquence correspondant à ewD Séquence amplifiée Séquence correspondant d'accession à ewE Allolobophora AM774359 ATTCGGTTGGGGCGACC AGGGAAAATTAATCATCCCTTATTAAAAGATAAATAAATCTAATTA CTGTTATCCCTAAGGTAGCT chlorotica CTGACCCTTAATAAAGATCACAAGAAC T (SEQ ID NO.32) Amynthas corticis AB474282 ATTCGGTTGGGGCGACC CAGGGCTAATCAATCACCCATTTAAATAAAGATAAGTTAATCTATT CTGTTATCCCTAAGGTAGCT AAATGACCCTTTAAAGATCATAAGAAC T (SEQ ID NO.33) Aporrectodea AM774394 ATTCGGTTGGGGCGACC AGGGAAGTTACTAATCATCCCTAAATAAAAGATTAATTAATCTAAA CTGTTATCCCTAAGGTAGCT caliginosa TTCTGACCCTTATTCAAGATCAATAGATC T (SEQ ID NO.34) Aporrectodea FJ967609 ATTTGGTTGGGGCGACC AGGGAATTTATTAATCATCCCTAAATAAAAGATTAATTAATCTAAA CTGTTATCCCTAAGGTAGCT caliginosa TTCTGACCCTTATTCAAGATCAATAGATC T (SEQ ID N0.35) Aporrectodea FJ967636 ATTCGGTTGGGGCGACC TGGGAAATTACTAAACATCCCTCTACATCAGATAAATAAATCTCAC CTGTTATCCCTAAGGTAGCT limicola TTCTGACCCTTAATAAAGATCACCAAATC T (SEQ ID NO.36) Aporrectodea longa AM774395 ATTCGGTTGGGGCGACC AGGGAATATAAATCATCCCCAATAAACAGATAACTTAATCTAGATT CTGTTATCCCTAAGGTAGCT ATGACCCTTAAACAAGATCAACAAATC T (SEQ ID NO.37) Aporrectodealonga FJ967604 ATTCGGTTGGGGCGACC AGGGAATATAAATCATCCCCCATAAACAGATAACTTAATCTAGATT CTGTTATCCCTAAGGTAGCT ATGACCCTTAAACAAGATCAACAAATC T (SEQ ID NO.38) 19 Aporrectodea molleri FJ967637 ATTCGGTTGGGGCGACC GGGGAAAATTTATCATCCCTAATTAATAGATCAATTAATCAAATTT CTGTTATCCCTAAGGTAGCT TTTTGACCCTTAACAAAGATCACCAAAAT T (SEQ ID NO.39) Aporrectodea FJ967629 ATTCGGTTGGGGCGACC AGGGAATATAAATCATCCCCTATAAACAGATAACTTAATCTAAACT CTGTTATCCCTAAGGTAGCT nocturna CTGACCCTTAAATAAGATCAACAAATC T (SEQ ID NO.40) Aporrectodea rosea FJ967642 ATTCGGTTGGGGCGACC GGGGAAGACCAATCATCCCCTACAAAAAGATTAATTAATCTTCTCT CTGTTATCCCTAAGGTAGCT ATGACCCTTAATTAAGATCACCAGAAT T (SEQ ID NO.41) Aporrectodea AB543236 ATTCGGTTGGGGCGACC AGGGAATATAAATCATCCCAGATAAGTAGATAACTTAATCTAAACT CTGTTATCCCTAAGGTAGCT trapezoides ATGACCCTTAAACAAGATCAACAAATC T (SEQ ID NO.42) Aporrectodea FJ967643 ATTCGGTTGGGGCGACC AGGGAAATTATCAATCATCCCCTATAAAAAGATAAATTAATCTAAA CTGTTATCCCTAAGGTAGCT tuberculata CTCTGACCCTTAATCAAGATCAATAAATC T (SEQ ID NO.43) Diplocardia DQ533724 ATTCGGTTGGGGCGACC TAGGGAAATTAAATATCACCCTATTAAATAAAGATTTATAAATCTA CTGTTATCCCTAAGGTAACT caroliniana TTTAATGACCCTTATAAGATCATAAAATC T (SEQ ID NO.44) Eiseniafetida DQ257296 ATTCGGTTGGGGCGACC AAGGGAATAAATATCACCCTAAAACACAAAGATTAATAAATCATAA CTGTTATCCCTAAGGTAGCT AATTGACCCTTATAAGATCACAAGATC T (SEQ ID NO.45) Hormogaster elisae GQ409704 ATTCGGTTGGGGCGACC AAGGATATCTTAAATCATCCTATATTAAAAGATCTATAAATCATAA CTGTTATCCCTAAGGTAGCT CTCTGACCCTTAAATAAGAGCACAAAAAC T (SEQ ID NO.46) Lumbricus castaneus AM774397 ATTCGGTTGGGGCGACC GAGGAAATGATTATCATCCTCAGATAAAAGATAAATAAATCTAACT CTGTTATCCCTAAGGTAGCT AATGACCCTTAACTAAGATCACTAAAAC T (SEQ ID NO.47) 20 Lumbricus rubellus DQ257298 ATTCGGTTGGGGCGACC AGGGAATTTATATATCATCCCTCATAACACGATAAATTTATCAATC CTGTTATCCCTAAGGTAGCT TAAAGACCCTTAATCAAGATCTAAAAAAC T (SEQ ID NO.48) Lumbricus terrestris AM774396 ATTCGGTTGGGGCGACC AGGGAATTATCCATCATCCCTAAACAAAAGATAAATATATCAAAAT CTGTTATCCCTAAGGTAGCT ACTGACCCTTCTACAAGATCATTAAAAC T (SEQ ID NO.49) Lumbricus terrestris U24570 ATTCGGTTGGGGCGACC AGGGAATTACCCATCATCCCTAAACAAAAGATAAATGTATCAAAAC CTGTTATCCCTAAGGTAGCT ACTGACCCTTCTACAAGATCATTAAAAC T (SEQ ID NO.50) Maoridrilus carnosus HQ232548 ATTCGGTTGGGGCGACC AAGGGAAGTTATATAACACCCTGTATTATAAAGATAAATTAATCTG CTGTTATCCCTAAGGTAGCT TAAAGTGACCCTAGTAAGATCATAAAAAT T (SEQ ID NO.51) Metaphire abdita EF490527 ATTCGGTTGGGGCGACC CAGGGCTAATAAATCACCCATTAAATAAAAGATAAATTAATCCACC CTGTTATCCCTAAGGTAGCT AAATGACCCTTAAAGATCATAAGAAC T (SEQ ID NO.52) Metaphire sieboldi AB474353 ATTCGGTTGGGGCGACC CAGGGCTAATTAATCACCCAATAAATAAAAGATAAATTAATCAAGT CTGTTATCCCTAAGGTAGCT AATTGACCCCTAAAAGATCATAAGAAC T (SEQ ID NO.53) Octolasion tyrtaeum DQ257299 ATTCGGTTGGGGCGACC AGGGAAAATAAATCATCCCCCATAAGCAGATAAATATATCTAAGTT CTGTTATCCCTAAGGTAGCT CTGACCCTTAAAATAAGATCAACAAATC T (SEQ ID NO.54) Exemple 2 - Validation expérimentale Elaboration d'une base de données de référence pour la réqion Grenobloise Une partie du gène mitochondrial 16S de 70 spécimens de vers de terre a été séquencée à l'aide des amorces ewA (SEQ ID NO.55) et ewF (SEQ ID NO.56). Ces 70 spécimens de vers de terre sont présents dans la région grenobloise et appartiennent à 14 espèces différentes. Les haplotypes ont ensuite été identifiés en combinant les régions BC et DE (voir Figure 1). Toutes les espèces séquencées peuvent être identifiées jusqu'au niveau de l'espèce avec les deux fragments. La plupart des espèces dont plusieurs spécimens ont été analysés montrent de la variation intraspécifique.
Expérimentation à partir d'échantillons de sols - Sites d'étude Les sites où des échantillons de sol ont été collectés sont situés dans (i) le massif de Chartreuse près du village "les Cottaves" et de la route D57b (Coordonnées géographiques; Amont (parcelle 1) Longitude: 05°46'59" E, Latitude: 45°18'48" N - Aval (parcelle 2) Longitude: 05°46'52" E, Latitude: 45°18'45" N) et (ii) sur le Campus de Grenoble (Isère, France) (Coordonnées géographiques; Isère (parcelle 3) Longitude: 05°46'26" E, Latitude: 45°11'59" N - Vercors (parcelle 4) Longitude: 05°46'26" E , Latitude: 45°11'56" N). Le premier site est caractérisé par une hêtraie-sapinière non perturbée. Le second site correspond à une pelouse entretenue. - Echantillonnage du sol Dans chaque site d'échantillonnage (Grenoble et Chartreuse) deux parcelles d'échantillonnage ont été choisies afin de répliquer l'expérimentation dans chaque site. Dans chaque parcelle, l'échantillonnage de sol a consisté à prélever 4 carotes en surface, et 4 carotes plus profondément, à l'intérieur d'un cercle de 10 de diamètre. Des mesures très strictes ont été employées afin de limiter les risques de contamination lors de l'échantillonnage : tout le matériel (tarrière, tamis, etc.) a été préparé avec une flamme à haute température avant utilisation (induisant une destruction de tout ADN résiduel). L'échantillonnage a eu lieu en Janvier (site de Grenoble) et en Mars (site de Chartreuse). - Extraction d'ADN Pour chaque échantillon l'ADN a été extrait à partir d'environ 6 grammes de sol humide, en utilisant le kit PowerMax® Soil DNA Isolation Kit (Mo Bio Laboratories, Cambridge, UK) et en suivant les instructions du fabriquant. - Amplification d'ADN Les amplifications ont été réalisées dans un volume final de 50 pL en utilisant 4 pL d'extrait d'ADN. Le mélange d'amplification contenait 0.6 U/tube d'AMPLITAQ® GOLD DNA POLYMERASE (Applied Biosystems, Foster City, CA), 2 mM de MgCl2, 0.2 pM de chaque dNTPs, 250 pg/mL de bovine serum albumin (BSA, Roche Diagnostic, Basel, Switzerland), 0.2 pM de chaque amorce (Sigma) et finalement de l'eau UHQ pour compléter le tube au volume final. La dénaturation initiale a été réalisée à 95°C pendant 10 min pour activer la polymérase. Ensuite, la dénaturation, l'hybridation, et l'élongation ont été faites respectivement à 95°C pendant 30 s, 58°C pendant 30 s et 72°C pendant 60 s. Au total, 50 cycles ont été réalisés. Chaque échantillon a été amplifié indépendamment avec les amorces ewB/ewC et ewD/ewE (voir Figure 1). Les amorces ont été modifiées par l'addition d'une séquence spécifique du côté 5' (ou étiquette) pour permettre l'identification des échantillons après séquençage (Valentini et al. 2009). Tous les produits PCR ont donc été marqués par une séquence spécifique identique à chaque extrémité. Ces séquences spécifiques étaient composées de CC du côté 5', suivi de neuf nucléotides variables spécifique de chaque échantillon. Les neuf nucléotides variables ont été conçus à l'aide du programme oligoTag (www.prabi.grenoble.fr/trac/OBITools), avec au moins trois différences entre chaque séquence spécifique, sans homopolymères de plus de deux, et en évitant la présence d'un C en 5' (pour détecter une éventuelle délétion au niveau des séquences spécifiques). Tous les produits d'amplification ont été ensuite dosés par électrophorèse capillaire (QlAxel, QlAgen GmbH, Hilden, Germany) et ensuite mélangés en concentrations équimolaires avant le séquençage. - Séquençage Le séquençage a été effectué sur le séquenceur Illumina/Solexa Genome Analyzer Ilx (ILMN, California, USA), en utilisant les kits Paired-End Cluster Generation V4 Sequencing V4 (ILMN, California, USA), en suivant les instructions du fabriquant. Un total de 108 nucléotides ont été séquencés en partant de chaque extrémité des fragments PCR. - Analyse des séquences obtenues Les séquences obtenues ont été analysées avec les OBITools (www.prabi.grenoble.fr/trac/OBITools). Tout d'abord, les séquences sens et antisens ont été alignées et combinées en utilisant le programmme solexaPairEnd, en tenant compte des données de qualité. Ensuite, Les amorces et les séquences spécifiques de chaque échantillon ont été identifiées avec le programme ngsfilter. Seules les séquences avec une identité parfaite sur les séquences spécifiques et en tolérant deux erreurs sur les amorces ont été prises en compte. Les régions amplifiées, excluant les séquences spécifiques et les amorces ont été conservées pour la suite de l'analyse. Les séquences strictement identiques ont été rassemblées avec le programme obiuniq, en conservant les informations sur leur distribution dans les différents échantillons. Les séquences plus courte que 20 pb pour le fragment BC et que 50 pb pour le fragment DE, ou contenant des nucléotides ambigus, ou présent moins de 10 fois dans l'ensemble du jeu de données, ont été exclues avec le programme obigrep. L'assignation taxonomique a été ensuite réalisée avec le programme ecoTag (Pegard et al. 2009). EcoTag est basé sur le programme FASTA35 (Pearson & Lipman 1988) pour rechercher des séquences hautement similaires dans une base de données de référence. (http://blast.ncbi.nlm.nih.gov/). Pour terminer, le jeu de données a été revu manuellement pour éliminer les quelques séquences résultant soit d'artefacts PCR, où qui ne correspondaient à rien dans les bases de références. - Résultats Nous avons obtenu respectivement un total de 12.711.955 et 2.611.172 séquences pour les fragments BC et DE (correspondance parfaite avec les séquences spécifiques caractérisant les différents échantillons). Après les différentes étapes de filtration indiquées plus haut, nous avons obtenus les résultats présentés dans les Tableaux 3 et 4 ci-dessous. Sept espèces de vers de terre ont été identifiées avec les deux paires d'amorces: Allolobophora cupulifera, Allolobophora rosea, Aporrectodea caliginosa, Aporrectodea longa, Lumbricus terrestris, Octolasion cyaneum et Octolasion tyrtaeum. En plus, Allolobophora chlorotica et Allolobophora molleri ont été révélées par le fragment BC, tandis que Aporrectodea nocturna, Lumbricus castaneus et deux haplotypes d'Allolobophora icterica ne sont apparus qu'avec le fragment DE. Ces expérimentations démontrent clairement que des inventaires d'espèces de vers de terre peuvent être conduits à l'aide de l'approche décrite ci-dessus.
Tableau 3 - Nombre de séquences obtenues pour le fragment BC de l'ADN mitochondrial de vers de terre dans les deux sites d'échantillonnage: massif de la Chartreuse (Amont, Aval) et Grenoble (Isère, Vercors). Sites Espèce Chartreuse Grenoble Amont Aval Isère Vercors Allolobophora chlorotica 0 0 52594 43251 Allolobophora cupulifera 0 0 243498 242263 Allolobophora rosea h4 1 2107 0 0 Aporrectodea caliginosa 0 23290 0 0 Aporrectodea longa 2472 105321 255612 281068 Aporrectodea molleri 840729 650168 839674 1366875 Lumbricus terrestris h3/h4 0 0 176764 276809 Octolasion cyaneum 485126 4270 0 2 Octolasion tyrtaeum 311245 0 0 3 undefined lumbricid diversity 10735 10102 11531 19620 Tableau 4 - Nombre de séquences obtenues por le fragment DE de l'ADN mitochondrial de vers de terre dans les deux sites d'échantillonnage: massif de la Chartreuse (Amont, Aval) et Grenoble (Isère, Vercors). Sites Espèce Chartreuse Grenoble Amont Aval Isère Vercors Allolobophora cupulifera 0 0 38805 52513 Allolobophora icterica hl 227 279 8786 88092 Allolobophora icterica h2 51927 79168 12106 0 Allolobophora rosea h4 0 17017 0 0 Aporrectodea caliginosa 0 16594 0 0 Aporrectodea Tonga 0 0 9054 54233 Aporrectodea sp.
1026 1031 9 50 Lumbricus castaneus 0 1078 0 0 Lumbricus terrestris h3/h4 0 0 18806 64760 Octolasion cyaneum 30649 0 0 2 Octolasion tyrtaeum 14934 0 0 0 undefined lumbricid diversity 1243 711 1169 5508