[go: up one dir, main page]

ES2265507T3 - Categoria happy. - Google Patents

Categoria happy. Download PDF

Info

Publication number
ES2265507T3
ES2265507T3 ES02732953T ES02732953T ES2265507T3 ES 2265507 T3 ES2265507 T3 ES 2265507T3 ES 02732953 T ES02732953 T ES 02732953T ES 02732953 T ES02732953 T ES 02732953T ES 2265507 T3 ES2265507 T3 ES 2265507T3
Authority
ES
Spain
Prior art keywords
sequence
nucleic acid
fragments
probes
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES02732953T
Other languages
English (en)
Inventor
Paul H. Medical Research Council Laboratory DEAR
Madan MRC Cancer Cell Unit Hutchinson THANGAVELU
Alan Medical Research Council Laboratory BANKIER
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Medical Research Council
Original Assignee
Medical Research Council
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Medical Research Council filed Critical Medical Research Council
Application granted granted Critical
Publication of ES2265507T3 publication Critical patent/ES2265507T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Led Devices (AREA)
  • Inorganic Insulating Materials (AREA)

Abstract

Procedimiento para el análisis de ácidos nucleicos que comprende: a) preparar un panel de cartografía HAPPY que comprende una pluralidad de muestras de ácido nucleico; comprendiendo cada muestra fragmentos seleccionados al azar de ADN fraccionado del ácido nucleico que debe cartografiarse; y que totalizan en masa entre 0, 05 y 2 veces la masa de una sola copia de ácido nucleico que debe cartografiarse; b) escindir el ácido nucleico en dichas muestras hasta la terminación en una secuencia definida en la presente memoria para producir fragmentos de ácido nucleico; c) ligar un enlazador a los extremos 5¿ y 3¿ de los fragmentos del ácido nucleico; d) ampliar globalmente el ácido nucleico utilizando cebadores específicos para el enlazador; e) proporcionar un repertorio de sondas en las que cada sonda comprende una primera secuencia que es complementaria o idéntica con la secuencia del enlazador y una segunda secuencia adyacente que es diferente en cada sonda del repertorio; y f) hibridar una o más sondas de dicho repertorio a las muestras y puntuar la presencia o ausencia de secuencias complementarias a dicha una o más sondas en la muestra.

Description

Cartografía HAPPY.
La presente invención se refiere a un procedimiento mejorado para cartografiar moléculas de ácido nucleico, basado en la cartografía HAPPY, que permite la cartografía rápida de numerosos marcadores genómicos definidos arbitrariamente. La invención es aplicable, por ejemplo, a moléculas de ácido nucleico en las que están disponibles marcadores no convencionales.
La cartografía HAPPY es un procedimiento que ha sido desarrollado para la cartografía de enlaces del genoma de cualquier organismo. Fue descrita en primer lugar utilizando un único esperma haploide como fuente de ADN por Dear et al. en 1989 (véase Dear y Cook, (1989) NAR 17:6795) y más tarde fue adoptada para utilizar múltiples células diploides como fuente de ADN, seguida de dilución de ADN y toma de alícuotas en miembros del panel de cartografía, que contenían cada uno teóricamente 0,69 equivalentes haploides, utilizando el que pueda evaluarse el enlace del marcador; la técnica se ha estudiado y empleado en varias publicaciones (por ejemplo, Dear y Cook, (1993) NAR 21:13-20; Piper et al., (1998) Genome Res. 8:1299-1307; y varias referencias citadas en la presente memoria.
Fundamentalmente, la cartografía HAPPY implica la fragmentación del ADN genómico en fragmentos que están separados físicamente para proporcionar un panel de muestras, que cada una contiene una cantidad de ADN preferentemente igual o menor a un equivalente haploide del genoma en cuestión (y teóricamente 0,69 equivalentes haploides, si se toman muestras del ADN genómico en conjunto). Se identifica a continuación la presencia de una serie de marcadores en las muestras. Los marcadores que están localizados muy juntos en el genoma se segregarán conjuntamente en mayor medida que los marcadores que están más distantes en el genoma. Mediante el análisis de una tabla de segregación conjunta obtenida con un panel marcador, puede deducirse el orden y el espaciado de los marcadores en el genoma.
Las principales aplicaciones para la cartografía HAPPY comprenden el genoma y la cartografía génica, la detección de diversas cepas, el análisis de la población, la epidemiología, la expresión génica y la demostración de relaciones filogenéticas y taxonómicas.
Una de las principales dificultades encontradas en la generación de una cartografía HAPPY es la identificación de marcadores adecuados en el genoma. Las aplicaciones de la cartografía HAPPY han implicado en primer lugar la "preampliación" de todos los marcadores simultáneamente en el panel de cartografía utilizando varias técnicas, y a continuación la identificación de las muestras preampliadas por PCR para marcadores predefinidos, utilizando cebadores específicos. En un artículo teórico inicial que describe la cartografía HAPPY (Dear y Cook, (1989) NAR 17:6795) se sugirió que múltiples productos que aparecen en la ampliación de PCR con baja severidad con cebadores cortos y arbitrarios podrían servir como marcadores, eliminando el requisito de cebadores costosos, específicos para el marcador.
Las técnicas de exploración de ácidos nucleicos basadas en la aplicación dirigidas por cebadores de oligodesoxinucleido sintéticos de secuencia arbitraria producen huellas características capaces de detectar polimorfismos de la secuencia en plantillas anónimas de ácido nucleico (estudiado en Caetano-Anollés G. (1996) Nature Biotechnology 14: 1668-1674; Caetano-Anollés G. (1998) Arbitrary oligonucleotides: primers for amplification and direct identification of nucleic acids, genes and organisms. En: Molecular Approaches to Ecology and Evolution, DeSalle R., Schierwater B. (eds.), págs. 107-123, Birkhauser Verlag, Basel). La ampliación del ADN genómico que utiliza por lo menos un cebador corto produce normalmente múltiples productos de ampliación que representan amplicones más o menos distribuidos al azar en todo un genoma (Livak K. J. et al., 1992) patente U.S. nº 5.126.239; Bassam B. J. et al. (1995) patente U.S. nº 5.413.909). Esta observación condujo a la iniciación de tres técnicas principales, ADN polimórfico ampliado al azar (RAPD) (Williams et al., (1990) Nucleic Acids 18: 6531-6535), PCR cebada arbitrariamente (AP-PCR) (Welsh J., McClelland M. (1990) Nucleic Acids Res. 18: 7213-7218) y huella de ampliación de ADN (DAF) (Caetano-Anollés G. et al., (1991) Bio/Technology 9: 553-557). Estos métodos llegaron a ser muy populares debido a su sencillez y amplia aplicación. Se ha estudiado una amplia gama de organismos y la investigación se ha publicado en miles de publicaciones. De estas técnicas, RAPD ha sido la más ampliamente utilizada, a pesar del hecho de que la mayoría de los productos de RAPD y técnicas similares son no polimórficos; los productos polimórficos que son de interés en la cartografía de enlace genético están en minoría.
Además, la utilización de amplímeros aleatorios como marcadores está obstaculizada por la extrema sensibilidad de las reacciones de ampliación no severa con variaciones en las condiciones.
Una forma alternativa de amplímero arbitrario se ha utilizado como marcador en cartografía de combinaciones genéticas: el ADN que debe ser analizado se digiere en primer lugar con una enzima de restricción; los enlazadores se ligan a continuación a los fragmentos y a los productos ampliados utilizando cebadores complementarios a la secuencia enlazadora. Si los cebadores contienen bases adicionales en sus extremos 3' ("cebadores enlazadores selectivos") entonces solamente se ampliará un subconjunto de fragmentos ligados. Si se utilizan suficientes bases adicionales, entonces el número de productos ampliados es bastante pequeño para ser resuelto por electroforesis en gel. Por consiguiente, pueden utilizarse diferentes enlazadores selectivos individualmente o en combinación para ampliar diferentes subconjuntos de fragmentos genómicos, cada uno de los cuales pueden servir como marcadores. Este método es más reproducible que el método RAPD, ya que los cebadores selectivos se utilizan a alta severidad.
Hasta la fecha, este método se ha aplicado únicamente al análisis de combinaciones genéticas, en el que los polimorfismos en el genoma se reflejan en diferencias en una minoría de los productos ampliados ("fragmento arbitrario-polimorfismos largos"; AFLP). El método AFLP no puede aplicarse al híbrido de radiación (RH) o a la cartografía de clones, porque no hay manera de distinguir los amplímeros que aparecen en el genoma del "donante" de los que aparecen en el "huésped"; por consiguiente, no pueden cartografiarse los marcadores monomórficos.
Sumario de la invención
Los solicitantes desarrollan actualmente una metodología de cartografiado HAPPY que hace uso de marcadores de amplímero aleatorios y solventa muchos de los inconvenientes innatos de dichos marcadores. El nuevo método combina las ventajas de la cartografía HAPPY con la ampliación que utiliza el cebado específico basado en el enlazador ligado y el cebado interno selectivo para generar subconjuntos de fragmentos ampliados que pueden ser cartografiados por electroforesis en gel u otras técnicas convencionales. Dado que se basa en equivalentes genómicos aploides, ampliados por polimerasa utilizando cebado basado en el enlazador, los solicitantes han denominado a este método cartografía HAPPIER.
En un primer aspecto, por consiguiente, la invención proporciona un procedimiento para el análisis de ácidos nucleicos que comprende:
a) preparar un panel de cartografía HAPPY que comprende diversas muestras de ácido nucleico procedentes del ácido nucleico que debe cartografiarse, conteniendo cada miembro de dicho panel un muestreo de fragmentos de ADN que representan una cantidad igual por masa a 0,05 a 2 copias o menos del ácido nucleico que debe cartografiarse;
b) escindir el ácido nucleico en dichas muestras hasta la terminación en una secuencia definida en la presente memoria para producir fragmentos de ácido nucleico;
c) ligar los enlazadores a uno de los dos extremos de los fragmentos del ácido nucleico;
d) ampliar globalmente el ácido nucleico utilizando cebadores específicos para el enlazador;
e) proporcionar un repertorio de sondas en las que cada sonda comprende una primera secuencia que es complementaria o idéntica con la secuencia del enlazador y con esta parte de la secuencia de restricción, si existe, que está retenida en los terminales de los fragmentos producidos por digestión con restricción y una segunda secuencia adyacente que es diferente en cada sonda del repertorio;
f) hibridar una o más sondas de dicho repertorio con las muestras y puntuar la presencia o ausencia de secuencias complementarias a dicha una o más sondas en la muestra.
La invención puede realizarse como un procedimiento de un solo paso o puede incorporar etapas iterativas de selección sucesiva de fragmentos diana que comprenden los marcadores deseados. De este modo, en una forma de realización preferida, la etapa f) comprende las etapas siguientes:
i)
ampliar diversos fragmentos de ácido nucleico específicos de cada muestra;
ii)
subdividir los fragmentos ampliados en i) en submuestras;
iii)
hibridar una o más sondas con especificidad mayor que las sondas utilizadas en i) con la submuestra;
iv)
opcionalmente, repetir las etapas i) e ii) de forma iterativa; y
v)
puntuar la presencia o ausencia de secuencias complementarias con dicha una o más sondas en la muestra.
Preferentemente, se utilizan una o más sondas en la etapa g) para ampliar fragmentos de ácido nucleico específico de las muestras, permitiendo la detección de ácidos nucleicos ampliados por medios convencionales, por ejemplo como los descritos a continuación.
Cada muestra del panel de cartografía comprende un genoma haploide equivalente, que puede proceder de células haploides individuales o por dilución del ácido nucleico en conjunto procedente de células somáticas (diploides), como se describió anteriormente. Tal como se utiliza en la presente memoria, un "equivalente genómico haploide" debe entenderse como 0,05 a 2 equivalentes, en masa, del ácido nucleico que debe cartografiarse; teóricamente, es aproximadamente 0,69 equivalentes del genoma. Los ácidos nucleicos se fraccionan en fragmentos grandes, en los que el enlace se mantiene en gran medida, para permitir la toma de alícuotas en las muestras para formar un panel de cartografía. Esta primera fragmentación normalmente es por radiación o cizallamiento para asegurar la aleatoriedad y es en fragmentos relativamente grandes (varios kb a Mb). Es esta fragmentación la que determina la finura de la cartografía (aunque no la complejidad de la señal, ya que la alícuota "haploide" contendrá aproximadamente la misma cantidad de ADN independientemente del tamaño de los fragmentos).
\newpage
Las muestras del panel de cartografía se escinden a continuación utilizando una endonucleasa de restricción. El tamaño de los fragmentos generados se determinará por la frecuencia de corte de la endonucleasa; cuanto más frecuente sea el corte, mayor será la complejidad de la señal que se necesitará desplegar. Se utiliza de forma ventajosa una endonucleasa de restricción que genera extremos adhesivos en la secuencia de escisión, a fin de facilitar la ligadura del enlazador.
Esta segunda fragmentación es en fragmentos pequeños (típicamente menos de 2 kb) para ligadura y ampliación. Ella proporciona una herramienta para permitir la ampliación global y selectiva del ADN en la muestra. Dado que los marcadores ya han sido segregados en miembros del panel de cartografía antes de esta segunda escisión típicamente no influyen en la finura de la cartografía resultante.
El ácido nucleico de manera ventajosa es el ADN.
El enlazador, de manera ventajosa, está comprendido entre 7 y 40 nucleótidos de longitud, preferentemente entre 15 y 25 nucleótidos de longitud. El propio enlazador, más una o más bases adyacentes en la propia secuencia del fragmento, forman la única secuencia a la que es capaz de hibridarse una sonda del repertorio de sondas, dependiendo de la longitud de la sonda seleccionada. La secuencia del enlazador puede ser cualquier secuencia deseada; a fin de minimizar el riesgo de que la secuencia se produzca de forma natural en el genoma que se está cartografiando, dicha secuencia se selecciona de manera ventajosa a partir de fuentes alternativas, tales como enlazadores procedentes de un género diferente o se identifica para determinar qué hibridación no se produce.
Además de la secuencia constante correspondiente al enlazador, cada sonda comprende una o más bases 3' adyacentes a éste. Cualquier número de bases adyacentes puede confiarse; el experto en la materia reconocerá que es necesario equilibrar los requisitos de especificidad de hibridación con los inconvenientes del coste y manipulación de utilizar sondas muy largas. De manera ventajosa, la segunda secuencia adyacente en la sonda consta de entre 2 y 20 bases; preferentemente 2, 3, 4, 5, 6, 7, 8, 9 ó 10 bases.
La invención permite la cartografía rápida de marcadores monomorfos, que son generados al azar por la subdivisión del equivalente del genoma haploide en muestras y la utilización de una o más sondas específicas procedentes del repertorio de la sonda. En cada muestra, se ampliarán los únicos fragmentos de ácido nucleico específicos que poseen terminales complementarios o idénticos a la sonda específica utilizada. El análisis de la segregación conjunta de fragmentos ampliados en la población de la muestra determinará el enlace del marcador y de este modo el mapa del genoma haploide.
En una forma de realización ventajosa, la utilización de una o más sondas procedentes de un repertorio de sondas se sustituye por la utilización de una sonda específica de la secuencia completa para ampliar un solo fragmento de cada muestra. Esto permite puntuar los marcadores STS convencionales (secuencia desencadenada por la secuencia).
En un aspecto adicional, la invención se refiere a un método para codificar el contenido de una placa de microvaloración de modo que puede ser rastreado por procedimientos y manipulaciones adicionales. El método de la invención permite seguir la pista a los contenidos de la placa de microvaloración incluso si son transferidos o combinados con muestras en otra placa o cargados en un gel.
En una primera forma de realización de este aspecto de la invención, se añade un marcador en fase sólida tales como microesferas fluorescentes inertes (p. ej., A3703 de Molecular Probes) a alguno de los pocillos en la placa; el modelo de pocillos etiquetados de este modo representa una "firma" única de los contenidos de la placa. Por ejemplo, la posición de los marcadores puede codificar un número binario.
En una forma de realización preferida, se añaden microesferas a una placa de microvaloración destinada a PCR; las partículas no interfieren con la reacción y se cargan en el gel cuando se analizan las muestras posteriormente. El "código" de la placa de microvaloración se transfiere al gel, los pocillos que contienen las partículas fluorescentes emiten luz cuando el gel se fotografía bajo la luz UV. Las partículas no migran en el gel durante la electroforesis. Esto resuelve un problema general en el traceado de muestras en la electroforesis, es decir que es fácil de imprimir un código de barras o similar en una placa de microvaloración, pero difícil de transferir la codificación a un gel. En una forma de realización alternativa, el ADN se carga en alguno de los pocillos inutilizados del gel para codificar un número binario; sin embargo, esto requiere que el usuario lea el número sobre la placa de microvaloración y a continuación ordene por el mismo número que debe ser codificado en el gel. Con el sistema según la invención, el robot que opera las PCR puede también añadir las partículas fluorescentes y el "código" se transfiere al gel en la carga, sin ninguna intervención adicional ni oportunidad de error.
La invención es además aplicable a más formas de realización. Por ejemplo, cuando se preparan reacciones tomando una serie de reactivos de una placa (p. ej. una serie de plantillas de PCR) y otra serie de otra placa (p. ej. una serie de cebadores de PCR) cada placa de la fuente puede ser codificada inutilizando determinados pocillos con partículas. De forma conveniente, la codificación puede ocupar la primera fila de pocillos en una placa y la última fila en la otra placa. La placa de reacción (que contiene los contenidos de las dos placas con la fuente) lleva entonces ambos conjuntos de marcadores de codificación; identificando por imagen la placa bajo iluminación con UV pueden observarse y verificarse los códigos. Como alternativa, los códigos se observarán cuando las muestras se analicen por electroforesis en gel.
Pueden utilizarse múltiples colores para proporcionar códigos más complejos o para permitir que dos o más códigos se superpongan en el mismo conjunto de pocillos.
Descripción detallada de la invención
Aunque las técnicas generales mencionadas en la presente memoria son bien conocidas en la materia, se hace referencia en particular a Sambrook et al., Molecular Cloning, A Laboratory Manual (1989) y Ausubel et al., Short Protocols in Molecular Biology (1999) 4ª ed., John Wiley & Sons, Inc. (así como a la versión completa de Current Protocols in Molecular Biology).
1. Definiciones
Un "panel de cartografía" tal como se denomina en la presente memoria es un panel de fragmentos de ácido nucleico que se han separado en muestras o elementos independientes. Cada elemento del panel puede consistir en alguna fracción (típicamente 1/2 ó 1/3) del ADN fragmentado aislado de una sola célula haploide, como en Dear & Cook (1989). Más generalmente, cada elemento puede consistir en una muestra de ADN fragmentado preparado a partir de dos o más células haploides o a partir de una o más células diploides, y que contiene teóricamente una cantidad de ADN igual en masa a 0,69 genomas (es decir, 0,69 equivalentes haploides); esta cantidad asegura que, suponiendo una distribución de Poisson de secuencias muestreadas en un ADN completo, aproximadamente la mitad de todos los marcadores están representados en cada muestra. Sin embargo, cantidades de ADN comprendidas entre aproximadamente 0,05 y 2 están dentro del intervalo aceptable.
El panel de cartografía utilizado en la invención puede ser cualquier panel de cartografía que contenga fragmentos de ADN procedentes del ADN genómico o de cualquier otra fuente que se desee cartografiar. De manera ventajosa, comprende por lo menos dos elementos, y de manera ventajosa aproximadamente 4, 8, 16, 32, 64, 96, 100, 110, 128, 256 o más elementos. La utilización de 96 elementos es conveniente. Más elementos pueden estar presentes como muestras de referencia.
"Escisión en una secuencia definida" se pretende que indique que el equivalente del genoma está sometido a la escisión específica para la secuencia, por ejemplo mediante enzimas de escisión tales como endonucleasas de restricción, para producir fragmentos de ácido nucleico. La escisión produce "extremos" escindidos del ácido nucleico con una secuencia definida. No se contempla la utilización de enzimas de restricción de tipo III, que escinden lejos de la secuencia de reconocimiento o las enzimas de tipo I que escinden al azar. Sin embargo, las enzimas de escisión pueden ser naturales o artificiales. Las enzimas de escisión artificiales pueden ser, por ejemplo, ribozimas o polipéptidos localizadores de cinc modificados de manera adecuada (véase, por ejemplo, la solicitud de patente internacional WO 00/20622).
Escisión "hasta la terminación" indica que sustancialmente todas las secuencias que poseen secuencia escindible se han escindido; esto garantiza que los fragmentos con la misma secuencia se presentan de manera uniforme a través de múltiples muestras.
"Ampliación" se refiere a cualquier proceso para multiplicar las cadenas de ácido nucleico in vitro. Preferentemente, el proceso es enzimático y puede ser de carácter lineal o exponencial. Un ejemplo de técnica es la PCR, que amplía exponencialmente las moléculas de ácido nucleico. Las técnicas de ampliación alternativas comprenden la PCR con transcriptasa inversa, que se utiliza para ampliar dianas de ARN (Wang et al., (1989), Proc. Natl. Acad. Sci. USA 86 (24), 9717-21). En este proceso, se utiliza la enzima transcriptasa inversa para transformar el ARN en ADN complementario (ADNc), que puede ampliarse a continuación utilizando PCR. Este método es particularmente útil cuando se desea cartografiar muestras de ácido ribonucleico, tal como los genomas de los virus con ARN.
La replicación de la secuencia autosoportada (3SR o NASBA) implica la ampliación isotérmica de una plantilla de ácido nucleico mediante rondas sucesivas de actividades de transcriptasa inversa (RT), polimerasa y nucleasa que están mediadas por una mezcla enzimática y cebadores de oligonucleótido apropiados (Guatelli, et al., (1990) Proc. Natl. Acad. Sci. USA 87(5), 1874-8). Se utiliza la degradación enzimática del ARN del ARN/ADN heterodoble en lugar de la desnaturalización térmica. RNasa H y todas las demás enzimas se añaden a la reacción y todas las etapas tienen lugar a la misma temperatura y sin adiciones de reactivo adicionales. Siguiendo este proceso, se han conseguido ampliaciones de 10^{6} a 10^{9} en una hora a 42ºC.
La reacción en cadena con ligasa o el sistema de ampliación con ligadura utiliza ADN ligasa y cuatro oligonucleótidos, dos por cadena diana (Wu, D. Y. & Wallace, R. B. (1989) Genomics 4(4), 560-9). Los oligonucleótidos se hibridan a secuencias adyacentes en el ADN diana y son unidos por la ligasa. La reacción se desnaturaliza térmicamente y se repite el ciclo.
La invención comprende además la utilización de cualquier técnica de ampliación que esté disponible para los expertos en la materia. Dichas técnicas comprenden, pero no se limitan a, la ampliación en ciclo cerrado (Lizardi, et al., (1998) Natural. Genet. 19(3), 225-32) y la ampliación por desplazamiento de cadena (SDA; Walker, et al. (1992), Proc. Natl. Acad. Sci. USA 89(1), 392-6).
\newpage
Un "marcador" es una secuencia de ácido nucleico que puede ser identificada en estudios de enlace, por ejemplo por PCR o análisis de hibridación. De forma ventajosa es sustancialmente única en el genoma en análisis, de modo que la identificación de la misma es inequívoca.
Ampliación "global" se refiere a la ampliación de los ácidos nucleicos irrespectivos de la secuencia. El procedimiento es conocido en la materia en otros contextos y puede referirse a ampliación de "genoma completo" o "PCR con genoma completo". De manera ventajosa, cada ácido nucleico en una población que está ampliada globalmente se amplía en la misma medida, para producir una población ampliada en la que cada miembro está completamente representado. En algunos casos, sin embargo, la PCR con genoma completo puede no producir la ampliación de todas las secuencias, sino la ampliación de un subconjunto definido de éstas.
Un "repertorio" de sondas es un conjunto de moléculas de ácido nucleico que se diferencian una de cada una de las demás en la secuencia. En el contexto de la presente invención, las sondas comprenden una secuencia de ácido nucleico constante, complementaria o idéntica al enlazador y una zona variable adyacente (3') a ésta. La zona variable puede ser total o parcialmente al azar, o diseñada para tener una o más secuencias específicas.
Dependiendo de dónde escinda la enzima de restricción dentro de su secuencia de reconocimiento, se dejarán una o más bases de la secuencia en todos los terminales del fragmento. En este caso, la parte "constante" de la sonda incluirá generalmente no solo la secuencia enlazadora (o su complemento) sino también el fragmento de la secuencia de reconocimiento que se deja sobre la cadena pertinente de los terminales del fragmento.
"Resolver" los fragmentos ampliados se refiere a la resolución de los mismos, por ejemplo basándose en la longitud, de modo que cada fragmento sea identificable individualmente en cada muestra.
2. Cartografía HAPPY
Las técnicas generales para la cartografía HAPPY son muy conocidas en la materia y han sido descritas ampliamente en la bibliografía. Los siguientes descubrimientos, que comprenden descripciones detalladas de la cartografía HAPPY, se incorporan en la presente memoria como referencia en su totalidad: Konfortov et al., Genome Res. nov. de 2000;10(11):1737-42; Williams y Firtel, Genome Res. nov. de 2000;10(11):1658-9; Piper et al., Genome Res. dic. de 1998;8(12):1299-307; Lynch et al., Genomics. 15 de ago. de 1998;52(1):17-26; Dear et al., Genomics. 1 de mar. de 1998;48(2):232-41; Walter et al., Nucleic Acids Res. 25 de sep. de 1993;21(19):4524-9; Dear y Cook, Nucleic Acids Res. 11 de ene. de 1993;21(1):13-20; Dear y Cook, Nucleic Acids Res. 12 de sep. de 1989;17(17):6795-807. La presente invención se basa en la cartografía HAPPY, con varias diferencias claves.
Una primera diferencia consiste en que el ácido nucleico está fragmentado por escisión específica para la secuencia, posterior a la fragmentación por radiación u otros medios físicos y a la separación en alícuotas independientes. Las técnicas para la selección y utilización de endonucleasas de restricción, que son las enzimas preferidas para su utilización en la presente invención, son conocidas en la materia, por ejemplo en Sambrook et al. (Op. Cit.).
Pueden utilizarse técnicas alternativas para la escisión del ácido nucleico, con tal que se generen terminales 5' y 3' específicos para la secuencia. Éstas comprenden PCR con cebadores de secuencia definida, en la que el ácido nucleico que debe analizarse se amplía utilizando uno o más cebadores en una reacción de ampliación. El cebador o cebadores son capaces de hibridarse de manera sustancialmente específica para la secuencia con el ácido nucleico que debe analizarse y para formar un híbrido en el cual la cadena del cebador es capaz de ampliación de la cadena enzimática. Dependiendo del número de secuencias con las que se hibrida el cebador, se generan numerosos fragmentos que corresponden a la secuencia genómica. Dado que el ácido nucleico normalmente será de doble cadena, debería desnaturalizarse antes de que puedan hibridarse los cebadores.
La invención implica preferentemente la escisión en una única secuencia. Sin embargo, es posible, la escisión en múltiples secuencias, por ejemplo utilizando más de una enzima de restricción. Cuando se efectúa la escisión en múltiples secuencias, pueden añadirse enlazadores a una o ambas secuencias de los "extremos" dejados por la escisión; si solamente se utiliza una especificidad del enlazador, únicamente se ampliarán los fragmentos que presentan dos extremos escindidos en la misma secuencia complementaria con esta secuencia enlazadora.
Además, la presente invención emplea ligadura enlazadora como medio para permitir la ampliación del fragmento específico. De nuevo, muchos métodos son conocidos por los expertos en la materia. El enlazador (o los cebadores definidos en otra parte de la presente memoria) se compone de unidades que son nucleótidos o análogos de nucleótido. Generalmente hablando, un análogo de nucleótido es un compuesto que es capaz de incorporarse a una cadena de restos de nucleótido y que es capaz de hibridarse de manera específica para la base con una base de la cadena complementaria de ácido nucleico. Los análogos útiles en la presente invención son además sustratos para las enzimas que amplían la cadena.
Un análogo de nucleótido puede ser un nucleótido modificado en el que la base está modificada, por ejemplo de modo que afecta a las propiedades de emparejamiento de bases; y/o en el que el azúcar o el resto del eje central está modificado, por ejemplo como en los ejes centrales unidos a la amida del PNA; y/o en el que el resto fosfato está modificado.
Los ácidos nucleicos modificados en el eje central comprenden metilfosfonatos, fosforotioatos y fosforoditioatos, en los que ambos oxígenos que no forman puente están sustituidos por azufre; fosforoamiditas; fosfotriésteres de alquilo y fosfatos de boro; los derivados de fosfato aquirales comprenden 3'-O'-5'-S-fosforotioato, 3'-S-5'-O-fosforotioato, 3'-CH_{2}-5'-O-fosfonato y 3'-NH-5'-O-fosforoamidato. Los ácidos nucleicos peptídicos sustituyen el eje central del fosfodiéster completo por un enlace peptídico.
Se utilizan asimismo modificaciones de azúcar para aumentar la estabilidad y la afinidad. Puede utilizarse el \alpha-anómero de la desoxirribosa, cuando la base esté invertida con respecto al \beta-anómero natural. El 2'-OH del azúcar ribosa puede alterarse para formar los azúcares 2'-O-metilo o 2'-O-alilo, que proporcionan resistencia a la degradación sin poner en peligro la afinidad.
La modificación de las bases heterocíclicas mantiene preferentemente el emparejamiento de bases apropiado. Algunas sustituciones útiles comprenden la desoxiuridina por la desoxitimidina; 5-metil-2'-desoxicitidina y 5-bromo-2'-desoxicitidina por desoxicitidina. Se ha demostrado que la 5-propinil-2'-desoxiuridina y la 5-propinil-2'-desoxicitidina aumentan la afinidad y actividad biológica cuando se sustituyen por desoxitimidina y desoxicitidina, respectivamente.
El enlazador tiene preferentemente 7 a 40 restos de longitud total. Normalmente se utiliza un enlazador corto con 15 a 25 residuos, pero los cebadores con hasta 30 o hasta 40 restos, o 10 o menos residuos, también sirven. Después de la ampliación, todos los amplímeros tendrán la misma secuencia en ambos extremos, dependiendo la longitud de esta secuencia del cebador. Después de fraccionar el ADN genómico, se toman alícuotas de ácidos nucleicos en las muestras, se escinden mediante digestión con endonucleasa de restricción, se ligan a los enlazadores y se amplían utilizando una secuencia específica del enlazador. Dado que todos los fragmentos de ácido nucleico incorporan el enlazador en cada extremo, se amplían todos los fragmentos.
El procedimiento de hibridación según la invención comporta de manera ventajosa la ligadura únicamente al extremo 5' de cada cadena en los fragmentos de restricción de doble cadena. Sin embargo, las variantes de la presente invención comprendidas en el alcance de las reivindicaciones pueden realizarse utilizando patrones alternativos de ligadura, en los que los enlazadores están unidos a los extremos 3' de las cadenas de ácido nucleico o a una mezcla de ambos extremos 5' y 3'.
Después de la etapa de amplificación global, se amplifica un subconjunto de fragmentos de ácido nucleico en cada muestra utilizando cebadores o sondas específicas. En estas circunstancias, la extensión de la cadena únicamente tiene lugar cuando los restos de nucleótido en el extremo 3' del cebador igualan exactamente a los del ácido nucleico de la muestra. Los extremos 5' no necesitan hibridarse perfectamente, a condición de que el resto del cebador esté hibridado con suficiente fuerza para impedir la disociación. De forma ventajosa, los cebadores son el 100% complementarios con el ácido nucleico diana del enlazador/muestra.
Los cebadores pueden incorporar una base análoga que estimula la unión degenerada, teniendo la capacidad para los pares de bases con dos o tres de las bases naturales, o universales, formando pares de bases con cada una de las bases naturales sin discriminación. Dichos análogos pueden utilizarse, juntamente con técnicas de aleatorización convencionales, para la preparación de las sondas. Sin embargo, es preferible que las sondas sean muy específicas para la secuencia en su unión y no se hibriden con las secuencias degeneradas.
Los nucleótidos o los análogos de nucleótido para la adición durante la etapa de ampliación de la cadena pueden estar marcados para facilidad de la detección. Ejemplos de marcadores adecuados comprenden los radioisótopos, restos fluorescentes, haptenos y componentes de sistemas enzimáticos cromógenos o quimioluminiscentes.
Además, o de forma alternativa, los cebadores de secuencia definida pueden estar marcados utilizando etiquetas específicas que les permiten ser identificados fácilmente. Los ejemplos comprenden etiquetas con masas diferentes, que se pueden separar por espectrometría de masas; códigos de barras moleculares que pueden ser "leídos" utilizando instrumentos de detección apropiados; combinaciones de etiquetas fluorescentes, que generan una emisión con firma específica; y similares.
La naturaleza del marcado determinará el mejor método para la detección de los marcadores presentes en cada muestra. Si los fragmentos no están marcados, o marcados de forma similar, los fragmentos ampliados son detectados de manera ventajosa por electroforesis en gel, como en la cartografía HAPPY convencional.
Sin embargo, la utilización de marcadores específicos permite a los fragmentos ser acortados de otro modo, tal como por FACS o espectrometría de masas. Véase, por ejemplo, Griffin et al., (1997) Nature Biotechnology 15:1368. Cuando puedan prepararse marcadores específicos para cada cebador, las alícuotas individuales de la muestra pueden acortarse para la presencia de fragmentos específicos sin necesidad de ampliación.
3. Escisión del ácido nucleico
La escisión de ácidos nucleicos de manera específica para la secuencia puede realizarse por cualquier método adecuado, comprendiendo la digestión con endonucleasa de restricción como se indicó anteriormente. Los métodos alternativos comprenden la escisión específica para la secuencia del ADN de doble hélice mediante la formación de triple hélice (véase H. E. Moser y P. B. Dervan (1985) Science 238, 645-650), la utilización de nucleótidos radioactivos (p. ej. Karamychev et al., J. Nucl. Med. 2000; 41:1093-1101); las enzimas de restricción sintéticas como las descritas en la patente U.S. nº 6.018.058; las moléculas a base de CAP y Fos (http://www.cryst.bbk.ac.uk/PPS2/projects/hastic/dso.htm); y la utilización de polipéptidos señaladores de cinc, descritos en el documento WO 00/20622.
4. Utilizaciones
Las técnicas de cartografía HAPPY mejoradas de la invención pueden aplicarse en cualquier proyecto de cartografía. Por lo tanto, la cartografía de genomas o de ADN genómico, tal como los cromosomas, se ha demostrado ya que es susceptible a la aplicación de técnicas cartográficas HAPPY y es susceptible a la aplicación de métodos mejorados descritos en la presente memoria. Utilizaciones adicionales de la invención pueden llegar a ser obvias para un experto en la materia basándose en esta descripción.
Las aplicaciones preferidas para la presente tecnología, o de hecho cualquier tecnología, de cartografía HAPPY se indican a continuación.
A. Haplotipado
Tal como se describió anteriormente, el método de cartografía HAPPY se basa en la fragmentación aleatoria y la toma de muestras aleatoria del ADN genómico para producir una serie (panel) de muestras que contienen cantidades de ADN (típicamente) subgenómicas. Las secuencias (marcadores) que se encuentran con frecuencia juntas en los mismos miembros del panel (es decir, que se segregan conjuntamente) puede deducirse que se encuentran muy juntos en el genoma, en comparación con las dimensiones medias de los fragmentos. La cartografía híbrida de radiación comparte algunas propiedades con la cartografía HAPPY, pero la fragmentación se consigue por irradiación de las células vivas del "donante" seguida de fusión por las células "huésped" no irradiadas de una especie diferente; algunos fragmentos de cromosoma del donante se retienen en los híbridos resultantes, en los cuales se analiza a continuación su contenido de marcadores del donante.
En la utilización normal, los marcadores analizados por ambos métodos son monomórficos o, si son polimórficos, el polimorfismo es despreciable (puntuándose ambos alelos de un marcador como uno). Sin embargo, si los alelos de un marcador polimórfico se distinguen y se puntúan independientemente en el panel de cartografía, esta información del haplotipo (es decir, la fase de enlace entre los alelos de dos o más marcadores en el genoma diploide) puede determinarse.
La información del haplotipo es de considerable interés, particularmente en el genoma humano, donde la información del haplotipo de SNP es valiosa para numerosas aplicaciones, comprendiendo pero sin limitarse a la asociación entre polimorfismos (particularmente los polimorfismos de un solo nucleótido, SNP) y la sensibilidad a la enfermedad o a las reacciones desfavorables a los fármacos, que actualmente se está investigando extensamente; la asociación de haplotipos de SNP con rasgos variables "normales" a través de una población; y la utilización de haplotipos de SNP para seguir los movimientos de población humana.
La cartografía HAPPY puede aplicarse al haplotipado de la forma siguiente. Se prepara un panel cartográfico de la manera habitual, pero la detección y puntuación del marcador se realiza de tal manera que se discrimine entre los alelos de marcadores polimórficos (los dos alelos de un marcador se indican aquí mediante el caso superior e inferior, por ejemplo A, a) y los resultados para cada alelo se registran independientemente. Si dos o más marcadores polimórficos se puntúan de este modo, entonces la proximidad entre los alelos de cada uno puede determinarse. Por ejemplo, si el genoma paterno contiene haplotipos AB y ab, y si el marcador A/a se encuentra suficientemente próximo al marcador B/b, entonces la cosegregación (y por consiguiente el enlace) se observará entre A y B y entre a y b, pero no entre A y b o entre a y B. Por consiguiente pueden determinarse los haplotipos paternos. La distancia a través de la cual puede obtenerse información del haplotipo está determinada por el tamaño de los fragmentos utilizados para preparar el panel cartográfico.
Existen muchos métodos para la puntuación y discriminación necesarias entre los alelos, dependiendo de la naturaleza del polimorfismo. Cualquiera de estos métodos puede ser aplicado en este contexto.
En muchos casos, la posición de los marcadores en el genoma se habrá determinado ya y solamente se requiere la fase de enlace. En estos casos, se necesita analizar menos miembros del panel que los que serían necesarios para determinar el orden y espaciado de los marcadores a priori. Asimismo, cuando exista ya información de la cartografía, la resolución del panel cartográfico se hará casi irrelevante; por consiguiente, el panel puede prepararse a partir de fragmentos de ADN tan grandes como sea posible para maximizar el intervalo sobre el que los haplotipos pueden determinarse. En un caso extremo, el ADN genómico puede permanecer íntegro, siendo segregadas las moléculas del ADN cromosómico completo entre los miembros del panel; en este caso, los resultados no podrán determinar el orden de espaciado de los marcadores a lo largo de un cromosoma, pero proporcionarán los datos del haplotipo sobre las distancias cromosómicas. Teóricamente, los paneles HAPPY preparados para su utilización en el haplotipado deberían contener aproximadamente dos veces como mucho ADN como los utilizados para la cartografía de rutina, ya que cada alelo se considera un marcador independiente. Sin embargo, el intervalo aceptable de concentraciones de ADN para los paneles de HAPPY normales es lo suficiente amplio para adaptar el haplotipado.
\newpage
En principio, puede utilizarse el mismo método para obtener los datos del haplotipo de los paneles híbridos de radiación, aunque la dificultad relativa de preparar paneles RH puede hacerles menos atractivos si se requieren haplotipos de gran número de individuos.
B. Cartografía con cromosomas
Como se ha mencionado anteriormente, puede presentar ventajas cartografiar o desviar la información del haplotipo, utilizando cromosomas completos en lugar de ácido nucleico roto. Sin embargo, la utilización de fragmentos de ADN mayores permite la cartografía HAPPY, útil normalmente en un medio de alta resolución, que deber ser ampliado para proporcionar cartografías de baja resolución.
En la cartografía HAPPY, el ADN se aísla en primer lugar convencionalmente en forma relativamente pura (en solución o en una matriz de gel protectora) antes de la fragmentación por medios mecánicos u otros. Sin embargo, la naturaleza frágil de las moléculas largas de ADN hace difícil de manipular los fragmentos de más de unos pocos millones de pares de bases (Mb) de longitud. Por consiguiente, el enlace entre los marcadores solamente puede determinarse con facilidad a distancias de hasta unos pocos Mb.
La presente invención describe varias aplicaciones basadas en la toma de muestras y análisis (a dilución limitativa) no de fragmentos de ADN "expuestos" sino de cromosomas completos, fragmentos de cromosomas o cromatina. El empaquetamiento natural del ADN en estas formas hace posible aislarlo y manipular fragmentos mayores que cuando se manipula ADN expuesto, comprendiendo los cromosomas completos.
El ADN se libera de las células en forma de cromatina o de cromosomas en metafase. En ambas formas, el ADN se estabiliza y se compacta por asociación con histonas y otras proteínas (y puede, opcionalmente, estabilizarse más mediante otros tratamientos, tales como las técnicas de fijación parcial utilizadas cuando se preparan cromosomas en metafase para la hibridación in situ o la clasificación por flujo). La fragmentación mecánica se utiliza a continuación para romper la cromatina/cromosomas en fragmentos, una solución de la cual se diluye y se distribuye en un panel de muestras, conteniendo cada una aproximadamente 0,05 a 2 equivalentes genómicos de ADN (pero preferentemente cantidades similares de ADN en cada miembro del panel); los intervalos entre aproximadamente 0,2 y aproximadamente 1,5 se consideran generalmente útiles. La utilización de más de 2 copias presenta inconvenientes, pero no existe un límite inferior rígido para el número de copias que pueden utilizarse. El principio de la invención puede aplicarse con cantidades arbitrariamente bajas de ADN por alícuota, con la condición de que se analicen miembros del panel suficientes para asegurar que cada secuencia de marcador está representada por lo menos en un (y preferentemente más de uno) miembro. Las muestras se analizan a continuación de la manera ya descrita para el análisis de los paneles de la cartografía HAPPY; el pretratamiento con proteinasa-K u otros procedimientos pueden necesitarse en algunos casos para asegurar que el ADN será adecuado para la ampliación por PCR.
Dado que los cromosomas intactos de la metafase se preparan y se manipulan en solución de forma rutinaria es evidente que los fragmentos que se segregan en los miembros del panel pueden ser de cualquier tamaño, hasta e comprendiendo los cromosomas completos. (Obsérvese que, una vez se termina la segregación en las muestras, más fragmentación de ADN no tiene consecuencias siempre que se mantenga el contenido de su marcador). Las distancias por encima de las que puede detectarse el enlace por cartografía HAPPY son típicamente hasta de 0,5 a 0,7 veces la longitud media de los fragmentos de ADN utilizados. Por consiguiente, un panel preparado de fragmentos de cromosomas rotos de forma grosera puede utilizarse para preparar cartografías escasamente pobladas en las que la distancia media entre los marcadores es de varias Mb o más. Esto es útil en aquellos genomas cuyo tamaño haga impracticables o costosos de preparar las cartografías muy densas producidas por cartografía HAPPY convencional.
Los fragmentos de cromosomas de la metafase pueden clasificarse también por flujo (de hecho, los cromosomas fragmentados se observan normalmente como un "fondo" cuando son cromosomas de clasificación por flujo y aparecen por degradación y cizallamiento indeseables de los cromosomas intactos deseados). Por consiguiente puede utilizarse la clasificación por flujo (en lugar de la dilución y de la toma de muestras aleatoria) como un método para segregar en número y tamaño requeridos de los fragmentos en los miembros del panel de cartografía. Dicho método presenta las ventajas de que (a) la cantidad total de ADN en cada miembro del panel puede ser controlada de manera fina y (b) el intervalo de tamaño de los fragmentos puede seleccionarse estrechamente; dicha selección ajustada permite la puesta a punto fina del alcance y la resolución del panel para estudiar el problema de la cartografía manualmente y mejora la calidad de los datos de la cartografía excluyendo los fragmentos que son demasiado pequeños para reflejar el enlace entre algunos marcadores o son demasiado grandes para contener ninguna información de cartografía útil.
Los cromosomas de la metafase intactos pueden segregarse en los miembros del panel de cartografía, ya sea por dilución limitativa de una solución de dichos cromosomas o por clasificación por flujos. En este caso, el panel no proporcionará ninguna información sobre el orden y espaciado de los marcadores dentro de un cromosoma, pero permitirá que sean localizados los marcadores conjuntamente en grupos en sus respectivos cromosomas. Es de particular valor para los marcadores que se asignan cromosómicamente en aquellas especies en las que los cromosomas no pueden distinguirse por citometría de flujo. Por ejemplo, los cromosomas 9, 10, 11 y 12 del hombre pueden distinguirse por citometría de flujo; si se preparó el panel de cartografía clasificando por flujo uno o dos cromosomas (tomadas las muestras al azar del grupo Chr9-12) en cada miembro del panel, a continuación el tipado de los marcadores en el panel permitiría asignar rápidamente los marcadores a los grupos de enlace cromosómico.
Todos los métodos anteriores pueden aplicarse también a la determinación de haplotipo (la fase de enlace entre los locus polimórficos). En dichos casos, solamente es necesario puntuar los dos alelos de cada marcador independientemente (utilizando técnicas establecidas para discriminar entre alelos); a continuación, cada alelo puede tratarse como un marcador independientemente, y (por ejemplo) se observará el enlace entre A y B y entre a y b, poniendo de manifiesto los haplotipos AB y ab. La utilización de fragmentos de cromatina/cromosoma o de cromosomas intactos para la preparación de paneles de cartografía permite determinar los haplotipos a distancias considerables (o cromosómicas).
La invención se describirá a continuación con más detalle, a título únicamente ilustrativo, en el ejemplo siguiente.
Ejemplo
Generación y preampliación del panel de cartografía
Se aislaron núcleos de células de hoja de cebada (Hordeum vulgare, variedad "Optic") y se impregnaron en cadenas de agarosa (agarosa de bajo punto de fusión p/v al 0,5%, \sim4.000 núcleos por microlitro). Las cadenas se sumergieron en solución de lisis (EDTA 0,5 M, pH 9,0, sal sódica de lauril sarcosina al 1%, 0,1 mg ml^{-1} de proteinasa K) y se incubaron a 45ºC durante 48 h. con mezclado suave; a continuación en EDTA 0,5 M, pH 9,0 durante 1 h. a 45ºC; a continuación en EDTA 0,05 M, pH 8,0 durante 1 h. en hielo; y se almacenaron en EDTA 0,05 M, pH 8,0 a 4ºC hasta que se necesitaron. Durante esta manipulación, la solución de lisis se difunde en la agarosa, lisando los núcleos y eliminando o degradando las proteínas y otro material nuclear que se difunde durante las etapas de lavado dejando el ADN sustancialmente puro ocluido dentro de la agarosa. La agarosa sirve para proteger el ADN de la rotura mecánica indeseable, ya que es muy importante que esté controlada la frecuencia elevada de roturas.
Los cortes se introducen mezclando una sección corta de la cadena en 5 ml de tampón de PCR exento de magnesio [esto se utiliza con preferencia al agua, para reducir el riesgo de desnaturalizar el ADN] a 68ºC e invirtiendo el tubo varias veces para dispersar el ADN y cizallarlo en fragmentos de alrededor de 50 a 100 kb. Se deja enfriar la solución y se diluye con agua a una concentración de aproximadamente 0,1 equivalentes por microlitro de genoma haploide, utilizando puntas de pipeta con orificio amplio para impedir más cizallamiento mecánico del ADN. Muestras de 5 \mul de esta solución se dispersan en 88 pocillos de una placa de microvaloración de 96 pocillos y 5 \mul de agua en cada uno de los 8 pocillos restantes. Las muestras se empapan cada una con una gota (\sim30 \mul) de aceite mineral ligero para impedir la evaporación.
Se prepara una mezcla madre de digestión que comprende, por cada 2 \mul de volumen: 0,7 \mul de tampón One-Phor-All (Pharmacia; tampón universal adecuado para numerosas reacciones), 4,2 unidades de enzima de restricción DpnII (New England Biolabs) y agua. Se suministran 2 \mul de esta mezcla a cada pocillo de la placa de microvaloración. La placa se centrifuga brevemente (\sim500 g durante 5 segundos) para asegurar que todas las unidades con componentes acuosos por debajo del aceite están recubiertas en cada pocillo. La placa de microvaloración se incuba a 37ºC durante diez minutos. La enzima de restricción se inactiva a continuación calentando a 65ºC durante 30 minutos. DpnII se escinde en la secuencia de reconocimiento GATC y se seleccionan las condiciones de modo que la escisión proceda hasta su terminación.
Se prepara una mezcla madre de ligadura que comprende, para un volumen de 6 \mul: 1,5 \mul de solución 100 \muM de oligo LIB1, 1,5 \mul de solución 100 \muM de oligo dd-Sau3A, 0,8 \mul de tampón One-Phor-All, 0,26 \mul de NaCl 1 M y agua. Se añaden 6 \mul de esta mezcla madre a cada pocillo de la placa de microvaloración, que se centrifuga brevemente como anteriormente. La placa se incuba a 85ºC durante 20 minutos y a continuación se enfría a 1ºC por minuto a una temperatura de 15ºC. Los oligonucleótidos son:
100
en la que C* indica un didesoxinucleótido.
Se prepara una mezcla madre de ligasa que comprende, para un volumen de 2 \mul: 1 \mul de T4 ADN ligasa (5 unidades; Boehringer-Mannheim) y 1 \mul de rATP 15 mM (tamponado en Tris-HCl a pH 7,4). Se añaden 2 \mul de esta solución a cada pocillo y la placa se centrifuga otra vez brevemente para amalgamar los componentes acuosos bajo la capa de aceite. La placa se incuba a continuación a 16ºC durante la noche (\sim16 horas).
Los oligonucleótidos están ordenados de la forma siguiente:
101
Cursiva=LIB1, subrayado=ddSau3A, normal=fragmento de restricción (X,Y=cualquier base; longitud típicamente de 100 a 500 bp). NOTA - la ligadura solamente se produce entre LIB1 y el fragmento de restricción (indicado por doble subrayado) y NO entre ddSau3A y el fragmento (ya que los grupos fosfato necesarios no están presentes). Por la misma razón, puede que no exista ligadura entre los oligos ddSau3A y LIB1, que interferiría con las ampliaciones posteriores ("dímero enlazador").
Se prepara una mezcla de ampliación del genoma completo que comprende, para un volumen de 37 \mul: 5 \mul de tampón 10 PCR nº 1 (Boehringer Mannheim), 0,8 \mul de solución dNTP 25 mM (es decir, cada uno de dATP, dCTP, dGTP, dTTP de 25 mM), 1,4 \mul de polimerasa de gran ampliación (Boehringer Mannheim) y agua. Se distribuyen 37 \mul de esta solución en cada pocillo de la placa de microvaloración. La ampliación de todos los fragmentos de restricción [teóricamente, determinados fragmentos puede que no se amplíen, debido por ejemplo a que son demasiado grandes, encontrándose en una zona de la secuencia con secuencias de reconocimiento muy espaciadas para DpnII] se consigue a continuación por termociclación de la forma siguiente:
1) 68ºC \times 4 min. (durante esta etapa, se desnaturaliza el oligo ddSau3A y tiene lugar la extensión del extremo 3' de cada cadena de cada fragmento de restricción para sintetizar una zona complementaria al oligo LIB1; después de esta etapa, por consiguiente, todos los fragmentos de restricción llevan la secuencia LIB1 y su complemento en cada extremo).
2) 14 ciclos de: 94ºC \times 40 s., 57ºC \times 30 s. y 68ºC \times 75 s.
3) 34 ciclos como anteriormente, pero de 68ºC durante 105 s. en lugar de 75 s.
4) 1 ciclo como anteriormente, pero de 68ºC durante 300 s. en lugar de 75 s.
(Durante las etapas 2, 3 y 4, tiene lugar la ampliación exponencial de los fragmentos de restricción ligados, cebados por oligo LIB1 en exceso).
A continuación las reacciones se diluyen en serie a 1:8.000 en agua y se almacenan a -20ºC hasta que se necesite para la detección del marcador arbitraria o específica (a continuación).
Detección de marcadores específicos
Para la detección de marcadores específicos (es decir, de secuencias predeterminadas que utilizan cebadores específicos), se amplían 5 \mul de cada uno de los productos diluidos de los anteriores en una reacción que comprende (además):
1\times tampón de PCR "Gold" (Perkin Elmer)
0,25 U de ADN polimerasa "Gold"
MgCl_{2} 1,5 mM
1 \muM de cada uno de los oligonucleótidos transcritos e inversos específicos (véanse ejemplos más adelante)
200 \muM de cada dATP, dCTP, dGTP y dTTP
Volumen total 10 \mul
Las reacciones se producen en placas de microvaloración de 96 pocillos y bien se recubren con aceite mineral (\pm30 \mul por pocillo) o se sellan utilizando una película de sellado apropiada. El termociclado se realiza de la forma siguiente:
93ºC \times 5 min.
38 ciclos de: 94ºC \times 20 s., 55ºC \times 30 s., 72ºC \times 60 s.
(La temperatura de hibridación, 55ºC en el ejemplo anterior, puede ajustarse según las temperaturas de fusión de los cebadores de oligonucleótido).
Los productos se enriquecen con un tampón de carga adecuado (8 \mul de Ficoll 400 al 15% p/v, 0,15 mg/ml de azul de bromofenol, 4\timesSyBr verde, en 1 \times tampón TBE) y muestras de 10 \mul de la mezcla se analizan por electroforesis (gel de poliacrilamida al 6% en 0,5\times tampón TBE).
Por ejemplo, el procedimiento anterior se realizó sucesivamente para tres secuencias específicas ("marcadores") cuya posición en el genoma de cebada es ya conocida (y que podría servir por consiguiente como una prueba del sistema). Las secuencias de cebador específicas son:
14-4:
transcrita =
GTCACTTGTCATCATTTGTCC
inversa =
GCACCATGAATACAATCATCC
14-5:
transcrita =
CAACGATGAGATGGTAACCG
inversa =
CTCGCAGTCTGTTCGTTGG
1-16B:
transcrita =
CTGTGCAAACAACATGACC,
inversa =
CTGTTTGACCAGTTGTTTGC
Cada par de cebadores amplía un segmento corto (pocos centenares de pares de bases) de la secuencia de ADN conocida; se sabe en cada caso que los segmentos no contienen en su interior una secuencia de restricción para DpnII. Se sabe que los marcadores 14-4 y 14-5 se encuentran muy próximos el uno del otro (<2 kb), mientras que 1-16B se sabe que se encuentra a gran distancia (>100 kb) de estos dos.
El análisis de los resultados demuestra que existió fuerte segregación conjunta entre 14-4 y 14-5, estando presentes cada uno de los dos marcadores en el \pm60% de los 88 miembros del panel de cartografía (excluyendo los 8 controles negativos, que no contenían ningún marcador) y con gran similitud en la distribución de estos dos marcadores en todo el panel. La puntuación Lod de 14,2 se calcula entre estos dos marcadores, siendo ésta muy indicadora del enlace. El marcador 1-16B está también presente en \pm60% de los miembros de referencia no negativa del panel de cartografía, pero su distribución presenta correlación no obvia con la de los otros dos marcadores; puntuaciones Lod entre 1-16B y 14-4 y entre 1-16B y 14-5, son 0,4 y 0,7 respectivamente, siendo estos valores no significativos.
Es evidente que el producto diluido de la PCR mediada por ligadura es suficiente para tipificar de esta manera aproximadamente 80.000 marcadores específicos. Sin embargo, también es evidente que este producto es susceptible de más ampliación no selectiva utilizando el cebador LIB1, que proporciona cantidades esencialmente ilimitadas de material.
Detección de marcadores arbitrarios
Se toma una fracción de 5 \mul de cada uno de los productos de preampliación diluidos y se enriquece con reactivos para dar un volumen de reacción total de 10 \mul que contiene (además de los productos diluidos), 0,25 unidades de ADN polimerasa termoestable (Taq Gold, Perkin Elmer), 1\times tampón "Gold" de PCR (recomendado por el suministrador de la polimerasa), cloruro de magnesio 1,5 mM, 200 \muM de cada dNTP y 1 \muM del cebador LIBSEL-A (5' CCT GCT GTC AGG GAT CGT CC 3').
(Las primeras 12 bases son idénticas a las doce bases 3' de LIB1; las siguientes cuatro son idénticas a la secuencia de reconocimiento de DpnII, que es común a todos los fragmentos; las últimas cuatro bases son selectivas, teniendo contrapartidas solamente en \sim1/256º del fragmento terminal). La mezcla se recubre con aceite mineral para restringir la evaporación y se somete a termociclado (93ºC \times 9 min.; a continuación 33 ciclos de 94ºC \times 20 s., 64ºC \times 30 s. y 72ºC \times 60 s.). Los productos de cada reacción se analizan por electroforesis en gel utilizando protocolos normalizados, capaces de resolver fragmentos con tamaños de entre 100 y 500 bases.
Cada una de dichas reacciones (correspondiente a cada miembro del panel de cartografía) proporciona un número de productos, siendo en cada caso los productos un subconjunto de aquellas pocas decenas de fragmentos DpnII del genoma que llevan los cuatro nucleótidos selectivos apropiados internamente a la secuencia de restricción en cada extremo. En cada reacción se puntúa la presencia o ausencia de cada uno de los fragmentos resolubles y los fragmentos cartografiados en comparación entre sí observando con qué frecuencia se segregan conjuntamente en las 96 alícuotas. Cada fragmento puede considerarse por consiguiente un marcador, definido por una combinación de su tamaño (determinado por electroforesis), la enzima de restricción utilizada para generarlo (DpnII) y el cebador selectivo (LIBSEL-A) utilizado para ampliarlo. Algunos marcadores no pueden cartografiarse, bien debido a que las ampliaciones (global o selectiva) fallan por alguna de las diversas razones o porque el marcador no es una única secuencia de la copia (se aprecia fácilmente anotando el número de positivos en las 96 alícuotas) o porque es de un tamaño demasiado similar a otro marcador y por consiguiente no puede resolverse durante la electroforesis.
La mayoría de los marcadores, sin embargo, pueden detectarse en una proporción de las muestras y cartografiarse por tabulación y cálculo de frecuencias de enlace.

Claims (11)

1. Procedimiento para el análisis de ácidos nucleicos que comprende:
a) preparar un panel de cartografía HAPPY que comprende una pluralidad de muestras de ácido nucleico; comprendiendo cada muestra fragmentos seleccionados al azar de ADN fraccionado del ácido nucleico que debe cartografiarse; y que totalizan en masa entre 0,05 y 2 veces la masa de una sola copia de ácido nucleico que debe cartografiarse;
b) escindir el ácido nucleico en dichas muestras hasta la terminación en una secuencia definida en la presente memoria para producir fragmentos de ácido nucleico;
c) ligar un enlazador a los extremos 5' y 3' de los fragmentos del ácido nucleico;
d) ampliar globalmente el ácido nucleico utilizando cebadores específicos para el enlazador;
e) proporcionar un repertorio de sondas en las que cada sonda comprende una primera secuencia que es complementaria o idéntica con la secuencia del enlazador y una segunda secuencia adyacente que es diferente en cada sonda del repertorio; y
f) hibridar una o más sondas de dicho repertorio a las muestras y puntuar la presencia o ausencia de secuencias complementarias a dicha una o más sondas en la muestra.
2. Procedimiento según la reivindicación 1, en el que la etapa d) comprende las etapas siguientes:
i) ampliar diversos fragmentos de ácido nucleico específicos de cada muestra;
ii) subdividir los fragmentos ampliados en i) en submuestras;
iii) hibridar una o más sondas con especificidad mayor que las sondas utilizadas en i) con la submuestra;
iv) opcionalmente, repetir las etapas i) e ii) de forma iterativa; y
v) puntuar la presencia o ausencia de secuencias complementarias con dicha una o más sondas en la muestra.
3. Procedimiento según la reivindicación 1 ó 2, en el que se utilizan una o más sondas en la etapa e) para ampliar los fragmentos específicos de ácido nucleico de las muestras.
4. Procedimiento según cualquiera de las reivindicaciones anteriores, en el que dos o más muestras del panel de cartografía proceden de una única célula haploide.
5. Procedimiento según la reivindicación 1 a 3, en el que las muestras del panel de cartografía proceden de una o más células diploides o de dos o más células diploides por dilución.
6. Procedimiento según cualquiera de las reivindicaciones anteriores, en el que el panel de muestras de cartografía se escinde utilizando una o más enzimas endonucleasa de restricción.
7. Procedimiento según cualquiera de las reivindicaciones anteriores, en el que el enlazador está comprendido entre 7 y 40 nucleótidos de longitud.
8. Procedimiento según cualquiera de las reivindicaciones anteriores, en el que cada sonda en el repertorio de sodas comprende la secuencia enlazadora o una secuencia complementaria a ésta y una secuencia más comprendida entre 2 y 20 nucleótidos.
9. Procedimiento según la reivindicación 8, en el que dicha secuencia además es por lo menos una secuencia generada parcialmente al azar.
10. Procedimiento según la reivindicación 8, en el que cada sonda es de secuencia conocida.
11. Procedimiento según cualquiera de las reivindicaciones anteriores, en el que la presencia o ausencia de cualquier fragmento de ácido nucleico en cada muestra se puntúa por electroforesis en gel.
ES02732953T 2001-06-18 2002-06-18 Categoria happy. Expired - Lifetime ES2265507T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB0114853.5A GB0114853D0 (en) 2001-06-18 2001-06-18 Happier Mapping
GB0114853 2001-06-18

Publications (1)

Publication Number Publication Date
ES2265507T3 true ES2265507T3 (es) 2007-02-16

Family

ID=9916836

Family Applications (1)

Application Number Title Priority Date Filing Date
ES02732953T Expired - Lifetime ES2265507T3 (es) 2001-06-18 2002-06-18 Categoria happy.

Country Status (11)

Country Link
US (1) US20040248153A1 (es)
EP (1) EP1399590B1 (es)
JP (1) JP2004532047A (es)
AT (1) ATE335852T1 (es)
CA (1) CA2449366A1 (es)
DE (1) DE60213803T2 (es)
DK (1) DK1399590T3 (es)
ES (1) ES2265507T3 (es)
GB (1) GB0114853D0 (es)
PT (1) PT1399590E (es)
WO (1) WO2002103046A2 (es)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0114852D0 (en) * 2001-06-18 2001-08-08 Medical Res Council Happiar mapping
EP1907571B1 (en) * 2005-06-15 2017-04-26 Complete Genomics Inc. Nucleic acid analysis by random mixtures of non-overlapping fragments
US8592150B2 (en) 2007-12-05 2013-11-26 Complete Genomics, Inc. Methods and compositions for long fragment read sequencing
EP2334802A4 (en) * 2008-09-09 2012-01-25 Life Technologies Corp METHODS OF GENERATING SPECIFIC LIBRARIES OF GENES
US9524369B2 (en) 2009-06-15 2016-12-20 Complete Genomics, Inc. Processing and analysis of complex nucleic acid sequence data
WO2011053987A1 (en) * 2009-11-02 2011-05-05 Nugen Technologies, Inc. Compositions and methods for targeted nucleic acid sequence selection and amplification
WO2012008831A1 (en) 2010-07-13 2012-01-19 Keygene N.V. Simplified de novo physical map generation from clone libraries
US9249460B2 (en) 2011-09-09 2016-02-02 The Board Of Trustees Of The Leland Stanford Junior University Methods for obtaining a sequence
EP2769007B1 (en) 2011-10-19 2016-12-07 Nugen Technologies, Inc. Compositions and methods for directional nucleic acid amplification and sequencing
WO2013112923A1 (en) 2012-01-26 2013-08-01 Nugen Technologies, Inc. Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
WO2013191775A2 (en) 2012-06-18 2013-12-27 Nugen Technologies, Inc. Compositions and methods for negative selection of non-desired nucleic acid sequences
US20150011396A1 (en) 2012-07-09 2015-01-08 Benjamin G. Schroeder Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing
US9411930B2 (en) 2013-02-01 2016-08-09 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
CA3209385A1 (en) 2013-02-01 2014-08-07 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
WO2014144092A1 (en) 2013-03-15 2014-09-18 Nugen Technologies, Inc. Sequential sequencing
WO2015073711A1 (en) 2013-11-13 2015-05-21 Nugen Technologies, Inc. Compositions and methods for identification of a duplicate sequencing read
WO2015131107A1 (en) 2014-02-28 2015-09-03 Nugen Technologies, Inc. Reduced representation bisulfite sequencing with diversity adaptors
WO2016019360A1 (en) 2014-08-01 2016-02-04 Dovetail Genomics Llc Tagging nucleic acids for sequence assembly
EP4030437A1 (en) 2015-02-17 2022-07-20 Dovetail Genomics, LLC Nucleic acid sequence assembly
GB2554572B (en) 2015-03-26 2021-06-23 Dovetail Genomics Llc Physical linkage preservation in DNA storage
EP3365445B1 (en) 2015-10-19 2023-05-31 Dovetail Genomics, LLC Methods for genome assembly, haplotype phasing, and target independent nucleic acid detection
US10975417B2 (en) 2016-02-23 2021-04-13 Dovetail Genomics, Llc Generation of phased read-sets for genome assembly and haplotype phasing
EP3455356B1 (en) 2016-05-13 2021-08-04 Dovetail Genomics LLC Recovering long-range linkage information from preserved samples
US12492430B2 (en) 2017-04-11 2025-12-09 Tecan Genomics, Inc. Library quantitation and qualification
US11099202B2 (en) 2017-10-20 2021-08-24 Tecan Genomics, Inc. Reagent delivery system
US12378592B2 (en) 2018-01-31 2025-08-05 Dovetail Genomics, Llc. Sample prep for DNA linkage recovery
CN113275053A (zh) 2020-02-03 2021-08-20 帝肯基因组学公司 试剂存储系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HU223760B1 (hu) * 1991-09-24 2005-01-28 Keygene N.V. Szelektív restrikciós fragmentumsokszorosítás, általános módszer DNS-fingerprint analízisére
US6218119B1 (en) * 1996-01-16 2001-04-17 Keygene, N. V. Amplification of simple sequence repeats
CA2286864A1 (en) * 1997-01-10 1998-07-16 Pioneer Hi-Bred International, Inc. Hybridization-based genetic amplification and analysis
US6238868B1 (en) * 1999-04-12 2001-05-29 Nanogen/Becton Dickinson Partnership Multiplex amplification and separation of nucleic acid sequences using ligation-dependant strand displacement amplification and bioelectronic chip technology
US7482443B2 (en) * 2000-03-09 2009-01-27 Genetag Technology, Inc. Systems and methods to quantify and amplify both signaling probes for cDNA chips and genes expression microarrays

Also Published As

Publication number Publication date
PT1399590E (pt) 2006-10-31
JP2004532047A (ja) 2004-10-21
EP1399590B1 (en) 2006-08-09
EP1399590A2 (en) 2004-03-24
CA2449366A1 (en) 2002-12-27
ATE335852T1 (de) 2006-09-15
WO2002103046A3 (en) 2003-11-27
US20040248153A1 (en) 2004-12-09
DK1399590T3 (da) 2006-09-18
DE60213803T2 (de) 2006-12-07
DE60213803D1 (en) 2006-09-21
WO2002103046A2 (en) 2002-12-27
GB0114853D0 (en) 2001-08-08

Similar Documents

Publication Publication Date Title
ES2265507T3 (es) Categoria happy.
ES2990227T3 (es) Composiciones y procedimientos de análisis de ácido nucleico de secuencia única
CN111356795B (zh) 核酸的多重末端标记扩增
ES2181822T5 (es) Procedimiento para el analisis de la expresion de genes.
US6300070B1 (en) Solid phase methods for amplifying multiple nucleic acids
US20040209298A1 (en) Amplification and analysis of whole genome and whole transcriptome libraries generated by a DNA polymerization process
JP2019528059A (ja) バーコード化ゲノムdna断片のデノボアセンブリの方法
US20090087834A1 (en) Method for characterising polynucleotides
WO1990010064A1 (en) Improved methods for in vitro dna amplification and genomic cloning and mapping
CN111295443B (zh) 基于转座酶的基因组分析
CN111492068B (zh) 与寡核苷酸相关联的颗粒
CN111527205B (zh) 使用寡核苷酸的多样性文库合成多核苷酸的新方法
US12435355B2 (en) Whole transcriptome analysis in single cells
CN102741409A (zh) 等位基因梯基因座
AU2005333512A1 (en) Nucleic acid detection method involving the direct generation of a measurable signal
US20210317517A1 (en) Methods for asymmetric dna library generation and optionally integrated duplex sequencing
AU2002304443A1 (en) Happier mapping
US20040224324A1 (en) Happiar mapping
US20050003379A1 (en) Real happy mapping
CN109312397A (zh) Penta E基因座多态性人体鉴定
EP3798319A1 (en) An improved diagnostic and/or sequencing method and kit
US20030044827A1 (en) Method for immobilizing DNA
CN118647729A (zh) 用于高通量标记细胞核酸分子的方法和试剂盒
KR20230028450A (ko) 앰플리콘 포괄적 풍부화
AU2002302835A1 (en) Genomic mapping method