Séquence (acide nucléique)
La séquence d'un acide nucléique — ADN ou ARN — est la succession des nucléotides qui le constituent. Cette succession contient l'information génétique portée par ces polynucléotides, de sorte qu'on la qualifie également de séquence génétique ou parfois de séquence nucléotidique[1]. Elle peut être déterminée par des méthodes de séquençage de l'ADN.
Les séquences nucléotidiques sont conventionnellement écrites dans le sens 5’ → 3’, qui est celui dans lequel sont lues et synthétisées ces biomolécules. Les nucléotides sont représentés conventionnellement par des lettres symbolisant la base nucléique qui les caractérise ; l'IUPAC a défini une nomenclature précise pour écrire les séquences d'acides nucléiques selon l'information que l'on souhaite représenter :
Symbole[2] | Description | Bases représentées | ||||
---|---|---|---|---|---|---|
A | adénine | A | 1 | |||
C | cytosine | C | ||||
G | guanine | G | ||||
T | thymine | T | ||||
U | uracile | U | ||||
W | weak | A | T | 2 | ||
S | strong | C | G | |||
M | amino | A | C | |||
K | keto | G | T | |||
R | purine | A | G | |||
Y | pyrimidine | C | T | |||
B | pas A (B vient après A) | C | G | T | 3 | |
D | pas C (D vient après C) | A | G | T | ||
H | pas G (H vient après G) | A | C | T | ||
V | pas T (V vient après T et U) | A | C | G | ||
N ou - | any base | A | C | G | T | 4 |
Dans la mesure où les acides nucléiques sont des molécules le plus souvent linéaires, leur séquence nucléotidique définit entièrement les liaisons chimiques qui les constituent, de sorte que leur séquence nucléotidique se confond avec leur structure primaire.
Notes et références
[modifier | modifier le code]- « Séquence nucléotidique : Descripteur MeSH », sur Catalogue et index des sites médicaux de langue française, CHU de Rouen (consulté le ).
- (en) Nomenclature Committee of the International Union of Biochemistry (NC-IUB), « Nomenclature for Incompletely Specified Bases in Nucleic Acid Sequences », sur IUBMB, (consulté le ).