[go: up one dir, main page]

ES2393318T3 - Estrategias para la identificación y detección de alto rendimiento de polimorfismos - Google Patents

Estrategias para la identificación y detección de alto rendimiento de polimorfismos Download PDF

Info

Publication number
ES2393318T3
ES2393318T3 ES10075564T ES10075564T ES2393318T3 ES 2393318 T3 ES2393318 T3 ES 2393318T3 ES 10075564 T ES10075564 T ES 10075564T ES 10075564 T ES10075564 T ES 10075564T ES 2393318 T3 ES2393318 T3 ES 2393318T3
Authority
ES
Spain
Prior art keywords
dna
fragments
sample
sequence
aflp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES10075564T
Other languages
English (en)
Inventor
Henricus Johannes Adam Van Der Poel
Michael Josephus Theresia Van Eijk
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Keygene NV
Original Assignee
Keygene NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Keygene NV filed Critical Keygene NV
Application granted granted Critical
Publication of ES2393318T3 publication Critical patent/ES2393318T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • C40B30/04Methods of screening libraries by measuring the ability to specifically bind a target molecule, e.g. antibody-antigen binding, receptor-ligand binding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • C40B30/10Methods of screening libraries by measuring physical properties, e.g. mass

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Utilización en un método de reducción de la complejidad, de un adaptador que porta un extremoprotuberante 3' de T en la reducción del etiquetado mixto de una muestra de ADN amplificado y/o en lareducción o prevención de la formación de concatámeros de fragmentos de ADN de una muestra de ADNque comprende fragmentos de restricción amplificados que portan un extremo protuberante 3' de Aobtenido de una reducción de complejidad.

Description

Estrategias para la identificación y detección de alto rendimiento de polimorfismos.
Campo técnico
La presente invención se refiere a los campos de la biología molecular y de la genética. La invención se refiere a la rápida identificación de múltiples polimorfismos en una muestra de ácidos nucleicos. Los polimorfismos identificados pueden utilizarse para el desarrollo de sistemas de cribado de alto rendimiento para polimorfismos en muestras de ensayo.
Antecedentes de la invención
La exploración del ADN genómico ha sido el deseo de la comunidad científica, en particular de la comunidad médica, desde hace mucho tiempo. El ADN genómico es la clave para la identificación, diagnóstico y tratamiento de enfermedades tales como el cáncer y la enfermedad de Alzheimer. Además de la identificación y tratamiento de enfermedades, la exploración del ADN genómico podría proporcionar ventajas significativas en esfuerzos de cría vegetal y animal, proporcionando respuestas a problemas de alimentación y nutrición en todo el mundo.
Es conocido que muchas enfermedades se asocian a componentes genéticos específicos, en particular a polimorfismos en genes específicos. La identificación de polimorfismos en muestras grandes, tales como genomas, en la actualidad es una tarea laboriosa y que requiere mucho tiempo. Sin embargo, esta identificación resulta de gran valor para áreas tales como la investigación biomédica, el desarrollo de productos farmacéuticos, el tipado de tejidos, el genotipado y los estudios poblacionales.
Descripción resumida de la invención
La presente invención proporciona un método para identificar eficientemente y para detectar fiablemente polimorfismos en una muestra compleja, por ejemplo de gran tamaño, de ácidos nucleicos (por ejemplo ADN o ARN) de un modo rápido y económico utilizando una combinación de métodos de alto rendimiento.
Dicha integración de métodos de alto rendimiento conjuntamente proporcionan una plataforma que resulta particularmente adecuada para la identificación y detección rápidas y fiables de polimorfismos en muestras de ácidos nucleicos altamente complejas, en las que la identificación y mapeado convencionales de polimorfismos resultaría laboriosa y requeriría mucho tiempo.
Una de la cosas que han encontrado los presentes inventores es una solución para identificar polimorfismos, preferiblemente polimorfismos de un solo nucleótido, aunque de manera similar (micro)satélites y/o indels, en particular en genomas grandes. El método es único en su aplicabilidad a genomas tanto grandes como pequeños, aunque proporciona ventajas particulares en genomas grandes, en particular en especies poliploides.
Para identificar los SNP (y posteriormente detectar los SNP identificados) se dispone de varias posibilidades en la técnica. En una primera opción, puede secuenciarse el genoma completo, y ello puede llevarse a cabo en varios individuos. Es un ejercicio en gran parte teórico, al ser engorroso y caro y, a pesar del rápido desarrollo de la tecnología, simplemente no resulta factible su aplicación a cada organismo, especialmente a los que presentan genomas más grandes. La segunda opción es utilizar la información de secuencia disponible (fragmentada), tal como las bibliotecas EST. Esto permite la generación de cebadores de PCR, la resecuenciación y la comparación entre individuos. Nuevamente lo anterior requiere información inicial de secuencia que no se encuentra disponible o que se encuentra disponible sólo en una cantidad limitada. Además, deben desarrollarse ensayos de PCR separados para cada región, lo que supone una adición enorme a los costes y tiempo de desarrollo.
La tercera opción es limitarse a parte del genoma de cada individuo. La dificultad reside en que la parte proporcionada del genoma debe ser igual en diferentes individuos con el fin de proporcionar un resultado comparable para la identificación con éxito de los SNP. Los presentes inventores ahora han resuelto este dilema mediante la integración de métodos altamente reproducibles para seleccionar parte del genoma mediante secuenciación de alto rendimiento para la identificación de los polimorfismos integrada con la preparación de muestras y plataformas de identificación de alto rendimiento. La presente invención acelera el procedimiento de identificación de polimorfismos y utiliza los mismos elementos en el procedimiento posterior para explotar los polimorfismos descubiertos, permitiendo un genotipado de alto rendimiento efectivo y fiable.
Entre las aplicaciones adicionalmente contempladas en la presente invención se incluyen las bibliotecas de microsatélites enriquecidas mediante cribado, la realización de AFLP-ADNc de perfilado de transcritos (northern digital), la secuenciación de genomas complejos, la secuenciación de bibliotecas de EST (en ADNc completo o en AFLP-ADNc), la exploración de microARN (secuenciación de bibliotecas de inserciones de pequeño tamaño), la secuenciación de cromosoma artificial bacteriano (BAC) (contig), AFLP/AFLP-ADNc en un enfoque de análisis de segregantes agrupados, la detección rutinaria de fragmentos de la AFLP, por ejemplo para retrocruzamientos asistidos por un marcador (MABC), etc.
Definiciones
En la descripción y ejemplos posteriormente se utiliza una serie de expresiones. Con el fin de proporcionar una comprensión clara y consistente de la memoria y reivindicaciones, incluyendo el alcance que debe proporcionarse a dichas expresiones, se proporcionan las definiciones siguientes. A menos que se defina de otra manera en la presente memoria, todas las expresiones técnicas y científicas utilizadas presentan los mismos significados comúnmente entendidos por el experto ordinario en la materia a la que pertenece la presente invención.
Polimorfismo: los polimorfismos se refieren a la presencia de dos o más variantes de una secuencia de nucleótidos en una población. Un polimorfismo puede comprender uno o más cambios de bases, una inserción, una repetición, o una deleción. Un polimorfismo incluye, por ejemplo una repetición de secuencia simple (SSR) y un polimorfismo de un único nucleótidos (SNP), que es una variación que se produce en el caso de que se altere un único nucleótido: adenina (A), timina (T), citosina (C) o guanina (G). Debe producirse generalmente una variación en por lo menos 1% de la población para que se considere un SNP. Los SNP constituyen 90% de todas las variaciones genéticas humanas y se producen cada 100 a 300 bases a lo largo del genoma humano. Dos de cada tres SNP sustituyen la citosina (C) por la timina (T). Las variaciones en las secuencias de ADN de, por ejemplo, seres humanos o plantas, pueden afectar a cómo se enfrentan a enfermedades, bacterias, virus, compuestos químicos, fármacos, etc.
Ácido nucleico: un ácido nucleico según la presente invención puede incluir cualquier polímero u oligómero de base pirimidina o purina, preferiblemente citosina, timina y guanina, respectivamente (ver Albert L. Lehninger, Principles of Biochemistry, páginas 793 a 800, Worth Publ. 1982). La presente invención contempla cualquier componente desoxirribonucleótido, ribonucleótido o péptido-ácido nucleico, y cualesquiera variantes químicas de los mismos, tales como formas metiladas, hidroximetiladas o glucosiladas de dichas bases, y similares. Los polímeros u oligómeros pueden ser de composición heterogénea u homogénea, y pueden aislarse a partir de fuentes naturales o producirse artificial o sintéticamente. Además, los ácidos nucleicos pueden ser de ADN o ARN, o una mezcla de los mismos, y pueden existir permanente o transitoriamente en forma de una cadena o de doble cadena, incluyendo estados de homodúplex, heterodúplex e híbridos.
Reducción de complejidad: la expresión "reducción de la complejidad" se utiliza para referirse a un método en el que la complejidad de una muestra de ácidos nucleicos, tal como ADN genómico, se reduce mediante la generación de un subconjunto de la muestra. Este subconjunto puede ser representativo de la muestra completa (es decir de la muestra compleja) y preferentemente es un subconjunto reproducible. El término "reproducible" se refiere en el presente contexto a que, al reducir la complejidad de la misma muestra utilizando el mismo método, se obtiene el mismo subconjunto o por lo menos uno comparable. El método utilizado para la reducción de la complejidad puede ser cualquier método de reducción de la complejidad conocido de la técnica. Entre los ejemplos de métodos de reducción de la complejidad se incluyen, por ejemplo, AFLP® (Keygene N.V., Países Bajos; ver, por ejemplo, la patente EP nº 0 534 858), los métodos descritos por Dong (ver, por ejemplo, las patentes WO nº 03/012118 y nº 00/24939), la unión indexada (Unrau et al., ver posteriormente), etc. Los métodos de reducción de la complejidad utilizados en la presente invención presentan en común que son reproducibles. Se utiliza el término reproducible en el sentido de que se reduce la complejidad de la misma muestra del mismo modo, se obtiene el mismo subconjunto de la muestra, y no en el sentido de una reducción más aleatoria de la complejidad, tal como la microdisección o la utilización de ARNm (ADNc), el cual representa una parte del genoma transcrito en un tejido seleccionado y su reproducibilidad depende de la selección del tejido, del momento del aislamiento, etc.
Etiquetado: el término "etiquetado" se refiere a la adición de una etiqueta a una muestra de ácidos nucleicos con el fin de distinguirla de una segunda o posteriores muestras de ácidos nucleicos. El etiquetado puede llevarse a cabo, por ejemplo, mediante la adición de un identificador de secuencia durante la reducción de complejidad o mediante cualquier otro medio conocido de la técnica.Dicho identificador de secuencia puede ser, por ejemplo, una única secuencia de bases de longitud variable aunque definida, utilizada únicamente para identificar una muestra específica de ácidos nucleicos. Son ejemplos típicos de la misma, por ejemplo, las secuencias ZIP. Mediante la utilización de dicha etiqueta, puede determinarse el origen de una muestra tras el procesamiento adicional. En el caso de que se combinen productos procesados que se originan de diferentes muestras de ácidos nucleicos, deben identificarse las muestras de ácidos nucleicos diferentes utilizando etiquetas diferentes.
Biblioteca etiquetada: el término "etiquetada" se refiere a una biblioteca de ácidos nucleicos etiquetados.
Secuenciación: el término "secuenciación" se refiere a determinar el orden de los nucleótidos (secuencias de bases) en una muestra de ácidos nucleicos, por ejemplo ADN o ARN.
Alinear y alineación: el término "alinear" y "alineación" se refiere a la comparación entre dos o más secuencias de nucleótidos basada en la presencia de segmentos cortos o largos de nucleótidos idénticos o similares. Son conocidos de la técnica varios métodos para alinear secuencias de nucleótidos, tal como se explica adicionalmente después.
Sondas de detección: la expresión "sondas de detección" se utiliza para referirse a sondas diseñadas para detectar una secuencia específica de nucleótidos, en particular secuencias que contienen uno o más polimorfismos.
Cribado de alto rendimiento: el cribado de alto rendimiento, con frecuencia abreviado HTS, es un método para la experimentación científica especialmente relevante para los campos de la biología y la química. Mediante una combinación de robótica moderna y otros equipos de laboratorio especializados, permite al investigador cribar eficazmente grandes cantidades de muestras simultáneamente.
Ácidos nucleicos de muestra de ensayo: la expresión "ácidos nucleicos de muestra de ensayo" se utiliza para indicar una muestra de ácidos nucleicos que se investiga para polimorfismos utilizando el método de la presente invención.
Endonucleasa de restricción: una endonucleasa de restricción o enzima de restricción es un enzima que reconoce una secuencia específica de nucleótidos (sitio diana) en una molécula de ADN de doble cadena, y corta ambas cadenas de la molécula de ADN en todos los sitios diana.
Fragmentos de restricción: las moléculas de ADN producidas mediante digestión con una endonucleasa de restricción se denominan fragmentos de restricción. Se digiere cualquier genoma dado (o ácido nucleico, con independencia de su origen) mediante una endonucleasa de restricción particular en un conjunto discreto de fragmentos de restricción. Los fragmentos de DAN que resultan del corte con endonucleasa de restricción pueden utilizarse adicionalmente en una diversidad de técnicas y pueden detectarse mediante, por ejemplo, electroforesis en gel.
Electroforesis en gel: con el fin de detectar fragmentos de restricción, puede resultar necesario un método analítico para fraccionar moléculas de ADN de doble cadena basándose en el tamaño. La técnica utilizada más comúnmente para conseguir dicho fraccionamiento es la electroforesis (capilar) en gel. La tasa a la que se desplazan los fragmentos de ADN en dichos geles depende de su peso molecular; de esta manera, se reducen las distancias recorridas a medida que se incrementa la longitud del fragmento. Los fragmentos de ADN fraccionados mediante electroforesis en gel pueden visualizarse directamente mediante un procedimiento de tinción, por ejemplo tinción con plata o tinción utilizando bromuro de etidio, en el caso de que el número de fragmentos incluido en el patrón sea suficientemente reducido. Alternativamente, el tratamiento adicional de los fragmentos de ADN puede incorporar marcajes detectables en los fragmentos, tales como fluoróforos o marcajes radioactivos.
Ligación: la reacción enzimática catalizada por un enzima ligasa en el que se unen covalentemente entre sí dos moléculas de ADN de doble cadena se denomina ligación. En general, ambas cadenas de ADN se unen covalentemente entre sí, aunque también resulta posible evitar la ligación de una de las dos cadenas mediante modificación química o enzimática de uno de los extremos de las cadenas. En este caso, se producirá la unión covalente en únicamente una de las dos cadenas de ADN.
Oligonucleótido sintético: las moléculas de ADN de una cadena que presentan preferentemente entre aproximadamente 10 y aproximadamente 50 bases, que pueden sintetizarse químicamente se denominan oligonucleótidos sintéticos. En general, estas moléculas de ADN sintético se diseñan para que presenten una secuencia de nucleótidos única o deseada, aunque resulta posible sintetizar familias de moléculas que presenten secuencias relacionadas y que presenten composiciones de nucleótidos diferentes en posiciones específicas dentro de la secuencia de nucleótidos. La expresión oligonucleótido sintético se utiliza para referirse a moléculas de ADN que presentan una secuencia de nucleótidos diseñada o deseada.
Adaptadores: moléculas cortas de ADN de doble cadena con un número limitado de pares de bases, por ejemplo una longitud de entre aproximadamente 10 y aproximadamente 30 pares de bases, que se diseñan de manera que puedan ligarse a los extremos de fragmentos de restricción. Los adaptadores están compuestos generalmente de dos oligonucleótidos sintéticos que presentan secuencias de nucleótidos que son parcialmente complementarias entre sí. Al mezclar los dos oligonucleótidos sintéticos en solución bajo condiciones apropiadas, se aparean entre sí formando una estructura de doble cadena. Tras la hibridación, un extremo de la molécula adaptadora se diseña de manera que sea compatible con el extremo de un fragmento de restricción y pueda ligarse al mismo; el otro extremo del adaptador puede diseñarse de manera que no pueda ligarse, aunque éste no es necesariamente el caso (adaptadores doblemente ligados).
Fragmentos de restricción ligados a adaptador: fragmentos de restricción a los que se han añadido caperuzas de adaptadores.
Cebadores: en general, el término cebadores se refiere a una cadena de ADN que puede cebar la síntesis del ADN. La ADN polimerasa no puede sintetizar ADN de novo sin cebadores: únicamente puede extender una cadena de ADN existente en una reacción en la que la cadena complementaria se utiliza como molde para dirigir el orden de nucleótidos que deben ensamblarse. Se hace referencia a las moléculas oligonucleótidas sintéticas que se utilizan en una reacción en cadena de la polimerasa (PCR) como cebadores.
Amplificación de ADN: la expresión "amplificación de ADN" típicamente se utiliza para referirse a la síntesis in vitro de moléculas de ADN de doble cadena utilizando la PCR. Se indica que existen otros métodos de amplificación y que pueden utilizarse en la presente invención sin apartarse de la esencia de la misma.
Descripción detallada de la invención
La presente invención proporciona un método para identificar uno o más polimorfismos, comprendiendo dicho
método las etapas de:
a) proporcionar una primera muestra de ácidos nucleicos de interés,
b) llevar a cabo una reducción de complejidad de la primera muestra de ácidos nucleicos de interés,
proporcionando una primera biblioteca de la primera muestra de ácidos nucleicos,
c) llevar a cabo consecutiva o simultáneamente las etapas a) y b) con una segunda o posterior muestra de
ácidos nucleicos de interés, obteniendo una segunda o posterior biblioteca de la segunda o posterior muestra de
ácidos nucleicos de interés,
d) secuenciar por lo menos una parte de la primera bibilioteca y de la segunda o posteriores bibliotecas,
e) alinear las secuencias obtenidas en la etapa d),
f) determinar uno o más polimorfismos entre la primera muestra de ácidos nucleicos y la segunda o posterior
muestra de ácidos nucleicos en la alineación de la etapa e),
g) utilizar el polimorfismo o polimorfismos determinados en la etapa f) para diseñar una o más sondas de
detección,
h) proporcionar una muestra de ensayo de ácidos nucleicos de interés,
i) llevar a cabo la reducción de complejidad de la etapa b) en la muestra de ensayo de ácidos nucleicos de
interés, proporcionando una biblioteca de ensayo de la muestra de ensayo de ácidos nucleicos,
j) someter la biblioteca de ensayo a cribado de alto rendimiento para identificar la presencia, ausencia o cantidad
de polimorfismos determinada en la etapa f) utilizando las sondas de detección diseñadas en la etapa g).
En la etapa a), se proporciona una primera muestra de ácidos nucleicos de interés. Dicha primera muestra de ácidos nucleicos de interés preferentemente es una muestra compleja de ácidos nucleicos, tal como ADN genómico total o una biblioteca de ADNc. Resulta preferente que la muestra compleja de ácidos nucleicos sea ADN genómico total.
En la etapa b), se lleva a cabo una reducción de la complejidad de la primera muestra de ácidos nucleicos de interés, proporcionando una primera biblioteca de la primera muestra de ácidos nucleicos.
En una realización de la invención, la etapa de reducción de la complejidad de la muestra de ácidos nucleicos comprende cortar enzimáticamente la muestra de ácidos nucleicos en fragmentos de restricción, separar los fragmentos de restricción y seleccionar un grupo particular de fragmentos de restricción. Opcionalmente, los fragmentos seleccionados seguidamente se ligan a secuencias adaptadores que contienen moldes/secuencias ligantes de cebador de PCR.
En una realización de reducción de complejidad, se utiliza una endonucleasa de tipo II para digerir la muestra de ácidos nucleicos y los fragmentos de restricción se ligan selectivamente a secuencias adaptadoras. Las secuencias adaptadoras pueden contener diversos nucleótidos en el extremo protuberante que debe ligarse y únicamente el adaptador con el conjunto correspondiente de nucleótidos en el extremo protuberante se liga con el fragmento y se amplifica posteriormente. Esta tecnología se describe en la técnica como "conectores de indexación". Pueden encontrarse ejemplos de este principio en, entre otros, Unrau P. y Deugau K.V., Gene 145:163-169, 1994.
En otra realización, el método de reducción de la complejidad utiliza dos endonucleasas de restricción que presentan diferentes sitios diana y frecuencias y dos secuencias adaptadoras diferentes.
En otra realización de la invención, la etapa de reducción de la complejidad comprende llevar a cabo una PCR arbitrariamente cebada en la muestra.
En todavía otra realización de la invención, la etapa de reducción de la complejidad comprende eliminar secuencias repetidas mediante desnaturalización y rehibridación del ADN y posterior eliminación de los dúplex de doble cadena.
En otra realización de la invención, la etapa de reducción de la complejidad comprende hibridar la muestra de ácidos nucleicos con una perla magnética que se une a una sonda oligonucleótida que contiene una secuencia deseada. Esta realización puede comprender además exponer la muestra hibridada a una ADN nucleasa de cadena sencilla para eliminar el ADN de cadena sencilla y ligar una secuencia adaptadora que contiene un enzima de restricción de clase II para liberar la perla magnética. Esta realización puede comprender o no la amplificación de la secuencia de ADN aislada. Además, la secuencia adaptadora puede utilizarse o no como molde para el cebador oligonucleótido de PCR. En esta realización, la secuencia adaptadora puede contener o no un identificador o etiqueta de secuencia.
En otra realización, el método de reducción de la complejidad comprende exponer la muestra de ADN a una proteína de unión con error de apareamiento y digerir la muestra con una exonucleasa 3' a 5' y después con una nucleasa de cadenas individuales. Esta realización puede incluir o no la utilización de una perla magnética unida a la proteína ligante con error de apareamiento. En otra realización de la presente invención, la reducción de la complejidad comprende el método CHIP tal como se describe posteriormente en la presente memoria, o el diseño de cebadores de PCR dirigidos contra motivos conservados, tales como SSRs, regiones NBS (regiones ligantes de nucleótidos), secuencias de promotores/intensificadores, secuencias de consenso de telómeros, genes de caja MADS, familias génicas de ATPasa y otras familias génicas.
En la etapa c), se llevan a cabo las etapas a) y b) consecutiva o simultáneamente con un segunda o posterior muestra de ácidos nucleicos de interés, obteniendo una segunda o posterior biblioteca de la segunda o posterior muestra de ácidos nucleicos de interés. Dicha segunda o posterior muestra de ácidos nucleicos de interés preferentemente también es una muestra compleja de ácidos nucleicos, tal como ADN genómico total. Resulta preferente que la muestra compleja de ácidos nucleicos sea ADN genómico total. También resulta preferente que dicha segunda o posterior muestra de ácidos nucleicos esté relacionada con la primera muestra de ácidos nucleicos. La primera muestra de ácidos nucleicos y el segundo o posterior ácido nucleico pueden ser, por ejemplo, diferentes líneas de una planta, tal como diferentes líneas de la planta del pimiento, o diferentes variedades. Las etapas a) y b) pueden llevarse a cabo para meramente una segunda muestra de ácidos nucleicos de interés, aunque también pueden llevarse a cabo adicionalmente para una tercera, cuarta, quinta, etc., muestra de ácidos nucleicos de interés.
Debe indicarse que el método según la presente invención resultará más útil al llevar a cabo reducción de la complejidad utilizando el mismo método y bajo condiciones sustancialmente iguales, preferentemente idénticas, para la primera muestra de ácidos nucleicos y la segunda o posterior muestras de ácidos nucleicos. Bajo dichas condiciones, se obtienen fracciones similares (comparables) de las muestras (complejas) de ácidos nucleicos.
En la etapa d), se secuencia por lo menos una parte de la primer biblioteca y de la segunda o posterior bibliotecas. Resulta preferente que la cantidad de solapamiento de los fragmentos secuenciados de la primera biblioteca y segunda o posterior bibliotecas sea de por lo menos 50%, más preferentemente de por lo menos 60%, todavía más preferentemente de por lo menos 70%, todavía más preferentemente de por lo menos 80%, todavía más preferentemente de por lo menos 90% y todavía más preferentemente de por lo menos 95%.
La secuenciación puede llevarse a cabo, en principio, por cualquier medio conocido de la técnica, tal como el método de terminación de cadena dideoxi. Sin embargo, resulta preferente que la secuenciación se lleve a cabo utilizando métodos de secuenciación de alto rendimiento, tales como los métodos dados a conocer en las patentes WO nº 03/004690, nº 03/054142, nº 2004/069849, nº 2004/070005, nº 2004/070007 y nº 2005/003375 (todas a nombre de 454 Corporation), en Seo et al., Proc. Natl. Acad. Sci. USA 101:5488-93, 2004, y las técnicas de Helios, Solexa, US Genomics, etc. Resulta más preferente que la secuenciación se lleve a cabo utilizando el aparato y/o método dado a conocer en las patentes WO nº 03/004690, nº 03/054142, nº 2004/069849, nº 2004/070005, nº 2004/070007 y nº 2005/003375 (todas a nombre de 454 Corporation). La tecnología descrita permite la secuenciación de 40 millones de bases en una única operación y es 100 veces más rápida y económica que la tecnología competidora. La tecnología de secuenciación consiste en términos generales de 4 etapas: 1) fragmentación del ADN y ligación de adaptadores específicos a una biblioteca de ADN de una cadena (ADNmc), 2) hibridación de ADNmc a perlas y emulsionación de las perlas en microrreactores de agua en aceite, 3) deposición de las perlas que portan ADN en una placa PicoTiterPlate®, y 4) secuenciación simultánea en 100.000 pocillos mediante generación de una señal lumínica del pirofosfato. El método se explica en mayor detalle posteriormente.
En la etapa e), las secuencias obtenidas en la etapa d) se alinean proporcionando una alineación. Los métodos de alineación de secuencias con fines de comparación son bien conocidos de la técnica. Se describen diversos programas y algoritmos de alineación en: Smith and Waterman (1981) Adv. Appl. Math. 2:482; Needleman y Wunsch, J. Mol. Biol. 48:443, 1970; Pearson y Lipman, Proc. Natl. Acad. Sci. USA 85:2444, 1988; Higgins y Sharp, Gene 73:237-244, 1988; Higgins y Sharp, CABIOS 5:151-153, 1989; Corpet et al., Nucl. Acids Res. 16:10881-90, 1988; Huang et al., Computer Appl. in the Biosci. 8:155-65, 1992; y Pearson et al., Meth. Mol. Biol. 24:307-31, 1994. Altschul et al., Nature Genet. 6:119-29, 1994, presentan una consideración detallada de los métodos de alineación de secuencias y los cálculos de homologías.
La herramienta Basic Local Alignment Search Tool (BLAST) del NCBI (Altschul et al., 1990) se encuentra disponible de varias fuentes, incluyendo del National Center for Biological Information (NCBI, Bethesda, Md.) y en internet, para la utilización con los programas de análisis de secuencias blastp, blastn, blastx, tblastn y tblastx. Se puede obtener acceso a los mismos en <http://www.ncbi.nlm.nih.gov/BLAST/>. Una descripcion de como determinar la identidad de secuencia utilizando dicho programa se encuentra disponible en <http: //www.ncbi.nlm.nih.gov/BLAST/blast_help.html>. Una aplicación adicional podría ser la exploración de microsatélites (ver Varshney et al., Trends in Biotechn. 23(1):48-55, 2005).
Típicamente la alineación se lleva a cabo en datos de secuencias que han sido recortados para los adaptadores/cebadores y/o identificadores, es decir, utilizando únicamente los datos de secuencia de los fragmentos que se originan de la muestra de ácidos nucleicos.
Típicamente, los datos de secuencia obtenidos se utilizan para identificar el origen del fragmento (es decir, la muestra de procedencia), se eliminan de los datos las secuencias derivadas de adaptador y/o identificador y se lleva a cabo la alineación en este conjunto recortado.
En la etapa f), se determina uno o más polimorfismos entre la primera muestra de ácidos nucleicos y la segunda o posterior muestra de ácidos nucleicos en la alineación. La alineación puede realizarse de manera que las secuencias derivadas de la primera muestra de ácidos nucleicos y la segunda o posterior muestras de ácidos nucleicos puedan compararse. A continuación, pueden identificarse las diferencias que reflejen polimorfismos.
En la etapa g), el polimorfismo o polimorfismos determinados en la etapa g) se utilizan para diseñar sondas de detección, por ejemplo para la detección mediante hibridación en chips de ADN o en una plataforma de detección basada en perlas. Las sondas de detección se diseñan de manera que se refleje un polimorfismo en las mismas. En el caso de los polimorfismos de un solo nucleótido (SNPs), las sondas de detección típicamente contienen los alelos variantes de SNPs en la posición central de manera que se maximice la discriminación de alelos. Dichas sondas pueden utilizarse ventajosamente para cribar muestras de ensayo que presentan un determinado polimorfismo. Las sondas pueden sintetizarse utilizando cualquier método conocido de la técnica. Las sondas típicamente se diseñan de manera que resulten adecuadas para métodos de cribado de alto rendimiento.
En la etapa h), se proporciona una muestra de ensayo de ácidos nucleicos de interés. La muestra de ensayo de ácidos nucleicos puede ser cualquier muestra, aunque preferentemente es otra línea o variedad que debe mapearse para identificar polimorfismos. Comúnmente se utiliza una colección de muestras de ensayo que representa el plasma germinal de los organismos estudiados con el fin de validar experimentalmente que el polimorfismo (SN) es genuino y detectable, y para calcular las frecuencias alélicas de los alelos observados. Opcionalmente se incluyen muestras de una población de mapeado genético en la etapa de validación con el fin de determinar también la posición en el mapa genético del polimorfismo.
En la etapa i), se lleva a cabo la reducción de complejidad de la etapa b) en la muestra de ensayo de ácidos nucleicos de interés, proporcionando una biblioteca de ensayo de la muestra de ensayo de ácidos nucleicos. Resulta altamente preferente que durante todo el método según la presente invención, se utilice el mismo método para la reducción de complejidad, utilizando condiciones sustancialmente iguales, preferentemente idénticas, cubriendo de esta manera una fracción similar de la muestra. Sin embargo, no resulta necesario obtener una biblioteca de ensayo etiquetada, aunque puede encontrarse presente una etiqueta en los fragmentos en la biblioteca de ensayo.
En la etapa j), la biblioteca de ensayo se somete a cribado de alto rendimiento para identificar la presencia, ausencia
o cantidad de los polimorfismos determinados en la etapa f) utilizando las sondas de detección diseñadas en la etapa g). El experto en la materia conoce varios métodos para el cribado de alto rendimiento utilizando sondas. Resulta preferente que una o más sondas diseñadas utilizando la información obtenida en la etapa g) se inmovilicen en una matriz, tal como un chip de ADN, y que dicha matriz posteriormente se ponga en contacto con la biblioteca de ensayo bajo condiciones de hibridación. Los fragmentos de ADN en la biblioteca de ensayo que sean complementarios a una o más sondas en la matriz se hibridarán bajo dichas condiciones con dichas sondas, y podrán detectarse de esta manera. También se encuentran contemplados otros métodos de cribado de alto rendimiento dentro del alcance de la presente invención, tales como la inmovilización de la biblioteca de ensayo obtenida en la etapa j) y la puesta en contacto de dicha biblioteca de ensayo inmovilizada con las sondas diseñadas en la etapa h) bajo condiciones de hibridación.
Affymetrix, entre otros, proporciona otra técnica de cribado mediante secuenciación de alto rendimiento que utiliza la detección basada en un chip de los SNP y en la tecnología de perlas proporcionada por Illumina.
En una realización ventajosa, la etapa b) en el método según la presente invención comprende además la etapa de etiquetar la biblioteca para obtener una biblioteca etiquetada, y dicho método comprende además la etapa c1) de combinar la primera biblioteca etiquetada y una segunda o posteriores bibliotecas etiquetadas para obtener una biblioteca combinada.
Resulta preferido que el etiquetado se lleve a cabo durante la etapa de reducción de la complejidad para reducir el número de etapas requerido para obtener la primera biblioteca etiquetada de la primera muestra de ácidos nucleicos. Dicho etiquetado simultáneo puede conseguirse mediante, por ejemplo, AFLP, utilizando adaptadores que comprenden un identificador (nucleótido) único para cada muestra.
El etiquetado pretende distinguir entre muestras de origen diferente, por ejemplo obtenidas de diferentes líneas vegetales, en el caso de que se combinen bibliotecas de dos o más muestras de ácidos nucleicos para obtener una biblioteca de combinación. De esta manera, preferentemente se utilizan etiquetas diferentes para preparar las bibliotecas etiquetadas de la primera muestra de ácidos nucleicos y la segunda o posteriores muestras de ácidos nucleicos. En el caso de que se utilicen, por ejemplo, cinco muestras de ácidos nucleicos, se pretenden obtener cinco bibliotecas etiquetadas diferentemente, indicando las cinco etiquetas diferentes las muestras originales respectivas.
La etiqueta puede ser cualquier etiqueta conocida de la técnica para distinguir muestras de ácidos nucleicos, aunque preferentemente es una secuencia identificadora corta. Dicha secuencia identificadora puede ser, por ejemplo, una secuencia de bases única de longitud variable utilizada para indicar el origen de la biblioteca obtenida mediante reducción de complejidad.
En una realización preferente, el etiquetado de la primera biblioteca y de la segunda o posteriores bibliotecas se lleva a cabo utilizando etiquetas diferentes. Tal como se ha comentado anteriormente, resulta preferente que cada biblioteca de una muestra de ácidos nucleicos se identifique con su propia etiqueta. La muestra de ensayo de ácidos nucleicos no requiere ser etiquetada.
En una realización preferente de la invención, se lleva a cabo la reducción de la complejidad por medio de AFLP® (Keygene N.V., Países Bajos, ver, por ejemplo, la patente EP nº 0 534 858 y Vos et al., (1995). AFLP: a new technique for DNA fingerprinting, Nucleic Acids Research 23(21):4407-4414, 1995).
La AFLP es un método para la amplificación selectiva de fragmentos de restricción. La AFLP no requiere información de secuencia previa y puede llevarse a cabo en cualquier ADN de partida. En general, la AFLP comprende las etapas de:
(a)
digestión de un ácido nucleico, en particular un ADN o ADNc, con una o más endonucleasas de restricción específicas, para fragmentar el ADN en una serie correspondiente de fragmentos de restricción,
(b)
ligación de los fragmentos de restricción obtenidos de esta manera con un adaptador oligonucleótido sintético de doble cadena, un extremo del cual es compatible con uno o ambos extremos de los fragmentos de restricción, produciendo de esta manera fragmentos de restricción ligados con adaptadores, preferentemente etiquetados, del ADN de partida,
(c)
puesta en contacto de los fragmentos de restricción ligados con adapta dor, preferentemente etiquetados, bajo condiciones de hibridación con por lo menos un cebador oligonucleótido que contenga por lo menos un nucleótido selectivo en su extremo 3',
(d)
amplificación de los fragmentos de restricción ligados con adaptadores, preferentemente etiquetados, hibridados con los cebadores mediante PCR o una técnica similar de manera que se provoca el alargamiento adicional de los cebadores hibridados a lo largo de los fragmentos de restricción del ADN de partida con el que se hibridaron los cebadores, y (e) detectar, identificar o recuperar el fragmento de ADN amplificado o alargado obtenido de esta manera.
La AFLP proporciona de esta manera un subconjunto reproducible de fragmentos ligados con adaptadores. Otros métodos adecuados para la reducción de la complejidad son la inmunoprecipitación de la cromatina (ChiP). Lo anterior se refiere al aislamiento del ADN nuclear, mientras que las proteínas tales como factores de transcripción se unen al ADN. Con ChiP en primer lugar se utiliza un anticuerpo contra la proteína, resultando en un complejo de proteína Ab-ADN. Mediante la purificación de este complejo y su precipitación, se selecciona el ADN al que se une dicha proteína. A continuación, el ADN puede utilizarse para la construcción de bibliotecas y la secuenciación. Es decir, es un método para llevar a cabo una reducción de la complejidad de una manera no aleatoria dirigida a áreas funcionales; en el presente ejemplo, factores de transcripción específicos.
Una variante útil de la tecnología AFLP utiliza nucleótidos no selectivos (es decir, cebadores +0/+0) y en ocasiones se denomina PCR de conectores. También proporciona una reducción de complejidad muy adecuada.
Para una descripción adicional de la AFLP, sus ventajas, realizaciones, así como las técnicas, enzimas, adaptadores, cebadores y compuestos adicionales y herramientas utilizados en las mismas, se hace referencia a las patentes US nº 6.045.994, EP nº B-0 534 858, EP nº 976835 y EP nº 974672, WO nº 01/88189, y Vos et al., Nucleic Acids Research 23:4407-4414, 1995.
De esta manera, en una realización preferente del método de la presente invención, se lleva a cabo la reducción de la complejidad mediante:
-
digestión de la muestra de ácidos nucleicos con por lo menos una endonucleasa de restricción para fragmentarla
en fragmentos de restricción, -ligación de los fragmentos de restricción obtenidos con por lo menos un adaptador oligonucleótido sintético de
doble cadena que presenta un extremo compatible con uno o ambos extremos de los fragmentos de restricción
para producir fragmentos de restricción ligados con adaptadores, -poner en contacto dichos fragmentos de restricción ligados a adaptadores con uno o más cebadores
oligonucleótidos bajo condiciones de hibridación, y -amplificación de dichos fragmentos de restricción ligados con adaptadores mediante alargamiento de uno o más
de los cebadores oligonucleótidos, en la que por lo menos uno de entre el cebador o cebadores oligonucleótidos incluye una secuencia de nucleótidos que presenta la misma secuencia de nucleótidos que las partes terminales de las cadenas en los extremos de dichos fragmentos de restricción ligados con adaptadores, incluyendo los nucleótidos implicados en la formación de la secuencia diana para dicha endonucleasa de restricción, e incluyendo por lo menos parte de los nucleótidos presentes en los adaptadores, en el que, opcionalmente, por lo menos uno de dichos cebadores incluye en su extremo 3' una secuencia seleccionada que comprende por lo menos un nucleótido situado inmediatamente contiguo a los nucleótidos implicados en la formación de la secuencia diana para dicha endonucleasa de restricción.
La AFLP es un método altamente reproducible para la reducción de la complejidad y por lo tanto resulta particularmente adecuado para el método según la presente invención.
En una realización preferente del método según la presente invención, el adaptador o el cebador comprende unaetiqueta. Éste es particularmente el caso para la identificación de los polimorfismos, en donde resulta importante distinguir entre secuencias derivadas de bibliotecas separadas. La incorporación de una etiqueta oligonucleótida en un adaptador o cebador resulta muy conveniente debido a que no resultan necesarias etapas adicionales para etiquetar una biblioteca.
En otra realización, la etiqueta es una secuencia identificadora. Tal como se ha comentado anteriormente, dicha secuencia identificadora puede ser de longitud variable dependiendo del número de muestras de ácidos nucleicos que debe compararse. Resulta suficiente una longitud de aproximadamente 4 bases (44=256 secuencias de etiqueta diferentes posibles) para distinguir entre el origen de un número limitado de muestras (como máximo 256), aunque resulta preferente que las secuencias de etiqueta difieran en no más de una base entre las muestras que deben distinguirse. Según resulte necesario, puede ajustarse la longitud de las secuencias de etiqueta.
En una realización, la secuenciación se lleva a cabo en un soporte sólido, tal como una perla (ver, por ejemplo, las patentes WO nº 03/004690, nº 03/054142, nº 2004/069849, nº 2004/070005, nº 2004/070007 y nº 2005/003375 (todas a nombre de 454 Corporation). Dicho método de secuenciación resulta particularmente adecuado para la secuenciación económica y eficiente de muchas muestras simultáneamente.
En una realización preferente, la secuenciación comprende las etapas de:
-
unir con perlas fragmentos ligados con adaptadores, estando unida cada perla a un único fragmento ligado con
adaptador, -emulsionar las perlas en microrreactores de agua en aceite, comprendiendo cada microrreactor de agua en
aceite una única perla, -cargar las perlas en pocillos, comprendiendo cada pocillo una única perla, y -generar una señal pirofosfato.
En la primera etapa, se ligan adaptadores de secuenciación a fragmentos dentro de la biblioteca de combinación. Dicho adaptador de secuenciación incluye por lo menos una región "clave" para la unión a una perla, una región cebadora de secuenciación y una región cebadora de PCR. De eta manera se obtienen fragmentos ligados a adaptadores.
En una etapa adicional, se unen fragmentos ligados con adaptadores a perlas, uniéndose cada perla a un único fragmento ligado a adaptador. Al grupo de fragmentos ligados con adaptadores se añaden perlas en exceso para garantizar la unión de un solo fragmento ligado a adaptador por perla para la mayoría de las perlas (distribución de Poisson).
En la etapa siguiente, se emulsionan las perlas en microrreactores de agua en aceite, comprendiendo cada microrreactor de agua en aceite una única perla. Los reactivos de PCR presentes en los microrreactores de agua en aceite permiten que tenga lugar una reacción de PCR en los microrreactores. A continuación, se rompen los microrreactores y se enriquece para las perlas que comprenden ADN (perlas positivas para ADN).
En una etapa posterior, se cargan las perlas en pocillos, comprendiendo cada pocillo una única perla. Los pocillos preferentemente son parte de una placa PicoTiterTM que permite la secuenciación simultánea de una gran cantidad de fragmentos.
Tras la adición de perlas que portan enzima, se determina la secuencia de los fragmentos mediante pirosecuenciación. En etapas sucesivas, la placa picotiter y las perlas, así como las perlas con enzima en la misma se someten a diferentes desoxirribonucleótidos en presencia de reactivos de secuenciación convencionales, y tras la incorporación de un desoxirribonucleótido, se genera una señal lumínica que se registra. La incorporación del nucleótido correcto genera una señal de pirosecuenciación que puede detectarse.
La pirosecuenciación misma es conocida de la técnica y se describe, en otros, en www.biotagebio.com,
www.pyrosequencing.com/tab technology. La tecnología se aplica además en, por ejemplo, las patentes WO nº 03/004690, nº 03/054142, nº 2004/069849, nº 2004/070005, nº 2004/070007 y nº 2005/003375 (todas a nombre de 454 Corporation).
El cribado de alto rendimiento de la etapa k) preferentemente se lleva a cabo mediante inmovilización de las sondas diseñadas en la etapa h) en una matriz, seguido de la puesta en contacto de la matriz que comprende las sondas con una biblioteca de ensayo bajo condiciones de hibridación. Preferentemente, la etapa de puesta en contacto se lleva a cabo bajo condiciones de hibridación astringentes (ver Kennedy et al., Nat. Biotech., publicado en internet el 7 de septiembre de 2003, páginas 1 a 5). El experto en la materia es consciente de la existencia de métodos adecuados para la inmovilización de sondas en una matriz y de métodos de puesta en contacto bajo condiciones de hibridación. La tecnología típica que resulta adecuada para este fin se revisa en Kennedy et al., Nat. Biotech., publicado en internet el 7 de septiembre de 2003, páginas 1 a 5). 1-5.
Una aplicación ventajosa particular es el cultivo de especies poliploides. Mediante la secuenciación de cultivos poliploides con una elevada cobertura, la identificación de SNPs y los diversos alelos, y el desarrollo de sondas para la amplificación específica de alelo, pueden realizarse avances significativos en el cultivo de especies poliploides.
Como parte de la invención, se ha encontrado que la combinación de generar subconjuntos seleccionados aleatoriamente mediante amplificación selectiva para una pluralidad de muestras y la tecnología de secuenciación de alto rendimiento presenta ciertos problemas complejos que debían resolverse para mejorar adicionalmente el método descrito en la presente memoria para la identificación eficiente y de alto rendimiento de los polimorfismos. Más en detalle, se ha encontrado que al combinar múltiples muestras (es decir la primera y la segunda o posteriores) en un grupo tras realizar una reducción de complejidad, se produce el problema de que muchos fragmentos aparentemente proceden de dos muestras o, en otras palabras, se identificaron muchos fragmentos que no podían asignarse únicamente a una muestra y que de esta manera no pudieron utilizarse en el procedimiento de identificación de polimorfismos. Ello condujo a una reducción de la fiabilidad del método y a polimorfismos (SNPs, indels, SSRs) que no pudieron identificarse adecuadamente.
Tras el análisis cuidadoso y detallado de la secuencia de nucleótidos completa de los fragmentos que no pudieron localizarse, se encontró que aquellos fragmentos contenían dos adaptadores diferentes que comprendían etiquetas y que probablemente se formaban entre la generación de las muestras de complejidad reducida y la ligación de los adaptadores de secuenciación. El fenómeno se describe como "etiquetado mixto". El fenómeno descrito como "etiquetado mixto", tal como se utiliza en la presente memoria, se refiere de esta manera a fragmentos que contienen una etiqueta que relaciona el fragmento con una muestra por un lado, mientras que el lado opuesto del fragmento contiene una etiqueta que relaciona el fragmento con otra muestra. De esta manera, un fragmento aparentemente se deriva de dos muestras (quod non). Esto conduce a una identificación errónea de polimorfismos y por lo tanto no resulta deseable.
Se ha teorizado con que la formación de fragmentos heterodúplex entre dos muestras se encuentra en la raíz de dicha anomalía.
Se ha encontrado la solución a dicho problema en un rediseño de la estrategia para la conversión de muestras de las que se ha reducido la complejidad en fragmentos unidos a perlas que pueden amplificarse antes de la secuenciación de alto rendimiento. En la presente realización, cada muestra se somete a reducción de complejidad y purificación opcional. A continuación, se generan extremos romos en cada muestra (pulido de extremos) seguido de ligación del adaptador de secuenciación que es capaz de unirse a la perla. Los fragmentos ligados a adaptadores de secuenciación de las muestras seguidamente se combinan y se ligan a las perlas para la polimerización en emulsión y la posterior secuenciación de alto rendimiento.
A modo de parte adicional de la presente invención, se ha encontrado que la formación de concatámeros dificulta la identificación correcta de polimorfismos. Se han identificado concatámeros como fragmentos que se forman tras "formar extremos romos" o "pulir" los productos de reducción de complejidad, por ejemplo con la ADN polimerasa de T4, y en lugar de ligarlos a los adaptadores que permiten la unión a las perlas, se ligan entre sí, creando de esta manera concatámeros, es decir, un concatámero es el resultado de la dimerización de fragmentos de extremos romos.
La solución a este problema se encontró en la utilización de determinados adaptadores modificados específicamente. Los fragmentos amplificados obtenidos de la reducción de complejidad típicamente contienen un extremo protuberante 3'-A debido a las características de determinadas polimerasas preferentes, que no presentan actividad correctora de errores de exonucleasas 3'-5'. La presencia de dicho extremo protuberante 3'-A también es el motivo de que se formen extremos romos en los fragmentos antes de la ligación de adaptadores. Al proporcionar un adaptador que podía unirse a una perla en el que el adaptador contiene un extremo protuberante 3'-T, se encontró que podía resolverse en una etapa tanto el problema de las "etiquetas mixtas" como el de los concatámeros. Una ventaja adicional de utilizar dichos adaptadores modificados es que la etapa convencional de "formación de extremos romos" y la etapa de fosforilación posteriores podían omitirse.
De esta manera, en una realización preferente adicional, tras la etapa de reducción de complejidad de cada muestra, se lleva a cabo una etapa en los fragmentos de restricción amplificados ligados con adaptadores que se han obtenido de la etapa de reducción de complejidad, de manera que a estos fragmentos se ligan adaptadores de secuenciación, los cuales contienen un extremo protuberante 3'-T y son capaces de unirse a las perlas.
Se ha encontrado además que, al fosforilar los cebadores utilizados en la etapa de reducción de complejidad, la etapa de pulido de extremos (formación de extremos romos) y la fosforilación de intermediarios previa a la ligación pueden evitarse.
De esta manera, en una realización altamente preferente de la invención, la invención se refiere a un método para identificar uno o más polimorfismos, comprendiendo dicho método las etapas de:
a) proporcionar una pluralidad de muestras de ácidos nucleicos de interés, b) llevar a cabo una reducción de complejidad de cada una de las muestras, proporcionando una pluralidad de bibliotecas de las muestras de ácidos nucleicos, en la que la reducción de complejidad se lleva a cabo mediante: -digestión de cada muestra de ácidos nucleicos con por lo menos una endonucleasa de restricción para
fragmentarla en fragmentos de restricción,
-
ligación de los fragmentos de restricción obtenidos con por lo menos un adaptador oligonucleótido sintético de doble cadena que presenta un extremo compatible con uno o ambos extremos de los fragmentos de restricción para producir fragmentos de restricción ligados con adaptadores,
-
puesta en contacto de dichos fragmentos de restricción ligados con adaptadores, con uno o más cebadores oligonucleótidos fosforilados bajo condiciones de hibridación, y
-
amplificación de dichos fragmentos de restricción ligados con adaptadores mediante alargamiento de uno o más cebadores oligonucleótidos, en la que por lo menos uno de entre uno o más cebadores oligonucleótidos incluye una secuencia de nucleótidos que presenta la misma secuencia de nucleótidos que las partes terminales de las cadenas en los extremos de dichos fragmentos de restricción ligados con adaptadores, incluyendo los nucleótidos implicados en la formación de la secuencia diana de dicha endonucleasa de restricción, e incluyendo por lo menos parte de los nucleótidos presentes en los adaptadores, en la que, opcionalmente, por lo menos uno de dichos cebadores incluye en su extremo 3' una secuencia seleccionada que comprende por lo menos un nucleótido situado inmediatamente contiguo a los nucleótidos implicados en la formación de la secuencia diana de dicha endonucleasa de restricción y en la que el adaptador y/o el cebador contienen una etiqueta,
c) combinación de dichas bibliotecas para formar una biblioteca combinada, d) ligar los adaptadores de secuenciación capaces de unirse a perlas, con los fragmentos con caperuza adaptadora amplificados en la biblioteca combinada, utilizando un adaptador de secuenciación que porta un extremo protuberante 3'-T, y someter los fragmentos unidos a perla a polimerización en emulsión, e) secuenciar por lo menos una parte de la biblioteca combinada, f) alinear las secuencias de cada muestra obtenida en la etapa e), g) determinar uno o más polimorfismos entre la pluralidad de muestras de ácidos nucleicos en la alineación de la etapa f), h) utilizar el polimorfismo o polimorfismos determinados en la etapa g) para diseñar sondas de detección, i) proporcionar un ácido nucleico de muestra de ensayo de interés, j) llevar a cabo la reducción de complejidad de la etapa b) en el ácido nucleico de la muestra de ensayo de interés para proporcionar una biblioteca de ensayo del ácido nucleico de la muestra de ensayo, k) someter la biblioteca de ensayo a cribado de alto rendimiento para identificar la presencia, ausencia o cantidad de polimorfismos determinados en la etapa g) utilizando las sondas de detección diseñadas en la etapa h).
Breve descripción de los dibujos
La figura 1A muestra un fragmento según la presente invención unido a una perla ("perla de 454") y la secuencia del cebador utilizado para la preamplificación de las dos líneas de planta del pimiento. La expresión "fragmento de ADN" se refiere al fragmento obtenido tras la digestión con una endonucleasa de restricción, "adaptador Keygene" se refiere a un adaptador que proporciona un sitio de unión para los cebadores oligonucleótidos (fosforilados) utilizados para generar una biblioteca, "KRS" se refiere a una secuencia identificadora (etiqueta), "adaptador SEC. de 454" se refiere a un adaptador de secuenciación, y "adaptador de PCR de 454" se refiere a un adaptador que permite la amplificación en emulsión del fragmento de ADN. El adaptador de PCR permite la unión a la perla y la amplificación, y puede contener un extremo protuberante 3'-T.
La figura 1B muestra un cebador esquemático utilizado en la etapa de reducción de la complejidad. Dicho cebador generalmente comprende una región de sitio de reconocimiento indicado como (2), una región constante que puede incluir una sección de etiqueta indicada como (1) y uno o más nucleótidos selectivos en una región selectiva indicada como (3) en el extremo 3' de los mismos).
La figura 2 muestra la estimación de concentración de ADN utilizando electroforesis en gel de agarosa al 2%. S1 se refiere a PSP11; S2 se refiere a PI201234. 50, 100, 250 y 500 ng se refieren, respectivamente, a 50 ng, 100 ng, 250 ng y 500 ng para estimar las cantidades de ADN de S1 y de S2. Las figs. 2C y 2D muestran la determinación de la concentración de ADN utilizando espectrofotometría NanoDrop.
La figura 3 muestra los resultados de las evaluaciones de calidad de intermediarios del Ejemplo 3.
La figura 4 muestra gráficos de flujo del procesamiento de datos de secuencia, es decir, las etapas entre la generación de los datos de secuenciación y la identificación de los SNPs, SSRs e indels putativos, mediante etapas de eliminación de información de secuencia conocida en recorte y etiquetado, resultando en datos de secuencia ajustados que se agrupan y se ensamblan para proporcionar contigs y singletons (fragmentos que no pueden ensamblarse para formar un contig), después de lo cual pueden identificarse y evaluarse polimorfismos putativos. La figura 4B proporciona detalles adicionales del procedimiento de exploración de polimorfismos.
La figura 5 se refiere al problema de las etiquetas mixtas y proporciona en el panel 1 un ejemplo de una etiqueta mixta que incluye etiquetas asociadas a la muestra 1 (MS1) y a la muestra 2 (MS2). El panel 2 proporciona una explicación esquemática del fenómeno. Los fragmentos de restricción de la AFLP derivados de la muestra 1 (S1) y de la muestra 2 (S2) se ligan utilizando adaptadores ("adaptador de Keygene") en ambos extremos que portan eti quetas específicas de las muestras S1 y S2. Tras la amplificación y secuenciación, los fragmentos esperados presentan las etiquetas S1-S2 y las etiquetas S2-S2. Además, inesperadamente se observaron fragmentos que portaban etiquetas S1-S2 ó S2-S1. El panel 3 explica la causa hipotética de que se generasen etiquetas mixtas, por la que se forman productos heterodúplex a partir de fragmentos de las muestras 1 y 2. Los heterodúplex posteriormente se liberan, debido a la actividad exonucleasa 3'-5' de la ADN polimerasa de T4 o Klenow, respecto de los extremos 3'-protuberantes. Durante la polimerización, se rellenan los huecos con nucleótidos y se introduce la eti queta incorrecta. Esto funciona para heterodúplex de aproximadamente la misma longitud (panel superior), aunque también para heterodúplex de longitud más variable. El panel 4 proporciona en la parte derecha el protocolo convencional que conduce a la formación de etiquetas mixtas y, en la parte derecha, el protocolo modificado.
La figura 6 se refiere al problema de la formación de concatámeros, en la que en el panel 1 se proporciona un ejemplo típico de concatámero, en el que las diversas secciones de adaptador y de etiqueta se encuentran subrayadas y con su origen (es decir, MS1, MS2, ES1 y ES2, correspondiendo respetivamente a un adaptador-sitio de restricción MseI de la muestra 1, adaptador-sitio de restricción MseI de la muestra 2, adaptador-sitio de restricción EcoRI de la muestra 1, adaptador-sitio de restricción EcoRI de la muestra 2). El panel 2 muestra los fragmentos esperados que portan las etiquetas S1-S1 y S2-S2 y el observado aunque inesperado S1-S1-S2-S2, que es un concatámero de fragmentos de las muestras 1 y 2. El panel 3 proporciona la solución para evitar la generación de concatámeros, así como de etiquetas mixtas, mediante la introducción de un extremo protuberante en los adaptadores de AFLP, adaptadores de secuenciación modificados y la omisión de la etapa de pulido de extremos al ligar los adaptadores de secuenciación. No se observó formación de concatámeros debido a que los fragmentos de ALP no pueden ligarse entre sí y no se producen fragmentos mixtos debido a que se omite la etapa de pulido de extremos. El panel 4 proporciona el protocolo modificado, que utiliza adaptadores modificados para evitar la formación de concatámeros, así como de etiquetas mixtas.
Figura 7. Alineación múltiple "10037_CL989contig2" de secuencias de fragmentos de la AFLP de la planta del pimiento, que contiene un polimorfismo de un solo nucleótido (SNP) putativo. Observar que el SNP (indicado por una flecha negra) se encuentra definido por un alelo A presente en ambas lecturas de la muestra 1 (PSP11), indicadas por la presencia de la etiqueta MS1 en el nombre de las dos lecturas superiores y un alelo G presente en la muestra 2 (PI201234), indicado por la presencia de la etiqueta MS2 en el nombre de las dos lecturas de la parte inferior. Los nombres de lectura se muestran en la parte izquierda. La secuencia de consenso de esta alineación múltiple es (5'3'):
Figura 8A. Representación esquemática de la estrategia de enriquecimiento de repeticiones de secuencia simple de direccionamiento (SSR) en combinación con la secuenciación de alto rendimiento para la identificación de novo de las SSR. Figura 8B: Validación de un SNP G/A en la planta del pimiento utilizando la detección SNPWave. P1=PSP11, P2=PI201234. Se indican los ocho descendientes RIL con los números 1 a 8.
Ejemplos
Ejemplo 1
Se generó una mezcla de ligación de restricción EcoRI/MseI (1) a partir de ADN genómico de las líneas de la planta del pimiento PSP-11 y PI20234. La mezcla de ligación de restricción se diluyó 10 veces y se preamplificaron 5
microlitros de cada muestra (2) con cebadores EcoRI +1(A) y MseI +1(C) (conjunto I). Tras la amplificación, se comprobó la calidad del producto de preamplificación de las dos muestras de pimiento en un gel de agarosa al 1%. Los productos de preamplificación se diluyeron 20 veces, seguido de una preamplificación mediante AFLP con KRSEcoRI +1(A) y KRSMseI +2(CA). Los segmentos (identificadores) KRS se encuentran subrayados y los 5 nucleótidos selectivos se encuentran en negrita, en el extremo 3' de las secuencias de cebadores SEC ID 1 a 4, posteriormente. Tras la amplificación, se comprobó la calidad del producto de preamplificación de las dos muestras de pimiento en un gel de agarosa al 1% y mediante la técnica de la huella genética utilizando AFLP (4) con EcoRI +3(A) y MseI + 3(C) (3). Los productos de preamplificación de las dos líneas del pimiento se purificaron separadamente en una columna de PCR de Qiagen (5). Se midió la concentración de las muestras en el NanoDrop.
10 Se mezcló y se secuenció un total de 5.006,4 ng de PSP-11 y 5.006,4 ng de PI20234.
Conjunto I de cebadores utilizado para la preamplificación de PSP-11: E01LKRS1 5’-CGTCAGACTGCGTACCAATTCA-3’ [SEC ID 1] M15KKRS1 5’-TGGTGATGAGTCCTGAGTAACA-3’ [SEC ID 2]
15 Conjunto II de cebadores utilizado para la preamplificación de PI20234: E01LKRS2 5’-CAAGAGACTGCGTACCAATTCA-3’ [SEC ID 3] M15KKRS2 5’-AGCCGATGAGTCCTGAGTAACA-3’ [SEC ID 4]
20 (1) Mezcla de ligación de restricción EcoRI/MseI
Mezcla de restricción (40 µl/muestra) ADN 6 µl (±300 ng) ECoRI (5U) 0,1 11 MseI(2U) 0,05 11 5xRL 8 11 MQ 25,85 11 Total 40 11 Incubación durante 1 h a 37°C Adición de: Mezcla de ligación (10 µl/muestra): ATP 10 mM 1 µl ADN ligasa de T4 1 µl Mezcla de ligación (10 µl/muestra) Adaptador EcoRI (5 pmoles/µl) 1 µl Adaptador MseI (50 pmol/µl) 1 µl 5xRL 2 µl MQ 4 µl Total 10 µl Incubación durante 3 horas a 37ºC Adaptador EcoRI 91M35/91M36: *-CTCGTAGACTGCGTACC :91M35 [SEC ID 5] ± bio CATCTGACGCATGGTTAA :91M36 [SEC ID 6] Adaptador MseI 92A18/92A19: 5-GACGATGAGTCCTGAG-3 :92A18 [SEC ID 7]
3-TACTCAGGACTCAT-5 :92A19 [SEC ID 8]
25 (2) Preamplificación
Preamplificación (A/C): mezcla RL (10x) 5 µl EcoRI-pr E01L(50 ng/µl) 0,6 µl MseI-pr M02K(50ng/ul) 0,6 µl dNTP (25mM) 0,16 µl pol. Taq. (5U) 0,08 µl 10X PCR 2,0 µl MQ 11,56 µl Total 20 µl/reacción Perfil térmico de preamplificación
Se realizó la preamplificación selectiva en un volumen de reacción de 50 µl. Se llevó a cabo la PCR en un sistema GeneAmp 9700 de PE y un perfil de 20 ciclos que se inició con una etapa de desnaturalización a 94ºC durante 30 30 segundos, seguido de una etapa de hibridación a 56ºC durante 60 segundos y una etapa de extensión a 72ºC durante 60 segundos.
EcoRI +1(A)1 E01 L 92R11: 5-AGACTGCGTACCAATTCA-3 [SEC ID 9] MseI +1(C)1
5 M02k 93E42: 5-GATGAGTCCTGAGTAAC-3 [SEC ID 10]
Preamplificación A/CA: Mezcla PA+1/+1 (20x) :5 µl EcoRI-pr. :1,5 µl MseI-pr. :1,5 µl dNTP (25 mM) :0,4 µl Pol. Taq. (5 U) :0,2 µl 10X PCR :5 µl MQ :36,3 µl Total :50 µl
Se realizó una preamplificación selectiva en un volumen de reacción de 50 µl. Se llevó a cabo la PCR en un sistema GeneAmp 9700 de PE y un perfil de 30 ciclos que se inició con una etapa de desnaturalización a 94ºC durante 30
10 segundos, seguido de una etapa de hibridación a 56ºC durante 60 segundos y una etapa de extensión a 72ºC durante 60 segundos.
(3) KRSEcoRI +1(A) y KRSMsel + 2(CA)2
05F212 E01LKRS1 CGTCAGACTGCGTACCAATTCA -3’ [SEC ID 11]
05F213 E01LKRS2 CAAGAGACTGCGTACCAATTCA -3’ [SEC ID 12] 05F214 M15KKRS1 TGGTGATGAGTCCTGAGTAACA -3’ [SEC ID 13] 05F215 M15KKRS2 AGCCGATGAGTCCTGAGTAACA -3’ [SEC ID 14]
15 nucleótidos selectivos en negrita y etiquetas (KRS) subrayadas Muestra PSP11 : E01LKRS1/M15KKRS1 Muestra PI120234 : E01LKRS2/M15KKRS2
(4) Protocolo de AFLP
20 Se realizó una amplificación selectiva en un volumen de reacción de 20 µl. Se llevó a cabo una PCR en un sistema de PCR GeneAmp 9700 de PE. Se inició un perfil de 13 ciclos con una etapa de desnaturalización de 94ºC durante 30 segundos, seguido de una etapa de hibridación a 65ºC durante 30 segundos, con una etapa de reducción en la que se redujo la temperatura de hibridación en 0,7ºC en cada ciclo, y una etapa de extensión a 72ºC durante 60
25 segundos. A este perfil siguió un perfil de 23 ciclos con una etapa de desnaturalización de 94ºC durante 30 segundos, seguido de una etapa de hibridación a 56ºC durante 30 segundos y una etapa de extensión a 72ºC durante 60 segundos.
EcoRI +3(AAC) y MseI +3(CAG)
30 E32 92S02: 5-GACTGCGTACCAATTCAAC-3 [SEC ID 15] M49 92G23: 5-GATGAGTCCTGAGTAACAG-3 [SEC ID 16]
(5) Columna de Qiagen
35 Se llevó a cabo una purificación Qiagen siguiendo las instrucciones del fabricante: Manual QIAquick® Spin (http://wwwl.qiagen.com/literature/handbooks/PDF/DNACleanupAndConcentration/QQ Spin/1021422 HBQQSpin 072002WW.pdf)
Ejemplo 2: pimiento
40 El ADN de las líneas de pimiento PSP-11 y PI20234 se utilizó para generar el producto AFLP mediante la utilización de cebadores específicos de sitio de reconocimiento de AFLP de Keygene. (Estos cebadores de AFLP son esencialmente iguales a los cebadores de AFLP convencionales, por ejemplo los descritos en la patente EP nº 0 534 858, y generalmente contienen una región de sitio de reconocimiento, una región constante y uno o más nucleótidos
45 selectivos en una región selectiva). Procedentes de las líneas del pimiento PSP-11 ó PI20234 se digirieron 150 ng de ADN con las endonucleasas de restricción EcoRI (5 U/reacción) y MseI (2 U/reacción) durante 1 hora a 37ºC, seguido de la inactivación durante 10 minutos a 80ºC. Los fragmentos de restricción obtenidos se ligaron con adaptador oligonucleótido sintético de doble cadena, un extremo del cual era compatible con uno o ambos extremos de los fragmentos de restricción EcoRI y/o MseI. Se llevaron a cabo reacciones de preamplificación de AFLP (20
50 µl/reacción) con los cebadores de AFLP +1/+1 en mezcla de restricción-dilución diluida 10 veces. Perfil de PCR: 20*(30 segundos a 94ºC + 60 segundos a 56ºC + 120 segundos a 72ºC). Se llevaron a cabo reacciones de AFLP adicionales (50 µl/reacción) con diferentes cebadores de sitio de reconocimiento de Keygene +1 EcoRI y +2 MseI (ver Tabla, posteriormente; las etiquetas se muestran en negrita, los nucleótidos selectivos se han subrayado) en producto de preamplificación de AFLP EcoRI/MseI +1/+1 diluido 20 veces. Perfil de PCR: Perfil de PCR: 30*(30 segundos a 94ºC + 60 segundos a 56ºC + 120 segundos a 72ºC). El producto AFLP se purificó mediante la
5 utilización del kit de purificación por PCR QIAquick (QIAGEN) según el manual QIAquick® Spin 07/2002, página 18, y se midió la concentración con un espectrofotómetro ND-1000 NanoDrop®. Se reunió un total de 5 µg de producto AFLP PSP-11 +1/+2 y 5 µg de producto AFLP PI20234 +1/+2 y se resolvió en 23,3 µl de TE. Finalmente, se obtuvo una mezcla con una concentración de 430 ng/µl de producto de AFLP +1/+2.
10 Tabla
SEC ID
Cebador de PCR Cebador -3' Pimiento Reacción de AFLP
[SEC ID 17]
05F21 CGTCAGACTGCGTACCAATTCA PSP 1
[SEC ID 18]
05F21 TGGTGATGAGTCCTGAGTAACA PSP 1
[SEC ID 19]
05F21 CAAGAGACTGCGTACCAATTCA PI2023 2
[SEC ID 20]
05F21 AGCCGATGAGTCCTGAGTAACA PI2023 2
Ejemplo 3: maíz
El ADN de las líneas de maíz B73 y M017 se utilizó para generar el producto AFLP mediante la utilización de
15 cebadores específicos de sitio de reconocimiento de AFLP de Keygene. (Estos cebadores de AFLP son esencialmente iguales a los cebadores de AFLP convencionales, por ejemplo los descritos en la patente EP nº 0 534 858, y generalmente contienen una región de sitio de reconocimiento, una región constante y uno o más nucleótidos selectivos en el extremo 3' de la misma). Se digirió ADN de las líneas de pimiento B73 o M017 con las endonucleasas de restricción TaqI (5 U/reacción) durante 1 hora a 65ºC y MseI (2 U/reacción) durante 1 hora a
20 37ºC, seguido de la inactivación durante 10 minutos a 80ºC. Los fragmentos de restricción obtenidos se ligaron con adaptador oligonucleótido sintético de doble cadena, un extremo del cual es compatible con uno o ambos extremos de los fragmentos de restricción TaqI y/o MseI. Se llevaron a cabo reacciones de preamplificación de AFLP (20 µl/reacción) con los cebadores de AFLP +1/+1 en mezcla de restricción-ligación diluida 10 veces. Perfil de PCR: 20*(30 segundos a 94ºC + 60 segundos a 56ºC + 120 segundos a 72ºC). Se llevaron a cabo reacciones de AFLP
25 adicionales (50 µl/reacción) con diferentes cebadores de sitio de reconocimiento de Keygene para FLP TaqI y MseI +2 (Tabla posteriormente; las etiquetas se muestran en negrita, los nucleótidos selectivos se han subrayado) en producto de preamplificación de AFLP TaqI/MseI +1/+1 diluido 20 veces. Perfil de PCR: Perfil de PCR: 30*(30 segundos a 94ºC + 60 segundos a 56ºC + 120 segundos a 72ºC). El producto AFLP se purificó mediante la utilización del kit de purificación por PCR QIAquick (QIAGEN) según el manual QIAquick® Spin 07/2002, página 18, y
30 se midió la concentración con un espectrofotómetro ND-1000 NanoDrop®. Se reunió un total de 1,25 µg de cada producto AFLP +2/+2 B73 diferente y 1,25 µg de cada producto AFLP +2/+2 M017 diferente y se resolvió en 30 µl de TE. Finalmente, se obtuvo una mezcla con una concentración de 333 ng/µl de producto AFLP +2/+2.
Tabla
SEC ID
Cebador de PCR Secuencia de cebador Maíz Reacción de AFLP
[SEC ID 21]
05G360 ACGTGTAGACTGCGTACCGAAA B73 1
[SEC ID 22]
05G368 ACGTGATGAGTCCTGAGTAACA B73 1
[SEC ID 23]
05G362 CGTAGTAGACTGCGTACCGAAC B73 2
[SEC ID 24]
05G370 CGTAGATGAGTCCTGAGTAACA B73 2
[SEC ID 25]
05G364 GTACGTAGACTGCGTACCGAAG B73 3
[SEC ID 26]
05G372 GTACGATGAGTCCTGAGTAACA B73 3
[SEC ID 27]
05G366 TACGGTAGACTGCGTACCGAAT B73 4
[SEC ID 28]
05G374 TACGGATGAGTCCTGAGTAACA B73 4
[SEC ID 29]
05G361 AGTCGTAGACTGCGTACCGAAA M017 5
[SEC ID 30]
05G369 AGTCGATGAGTCCTGAGTAACA M017 5
[SEC ID 31]
05G363 CATGGTAGACTGCGTACCGAAC M017 6
[SEC ID 32]
05G371 CATGGATGAGTCCTGAGTAACA M017 6
[SEC ID 33]
05G365 GAGCGTAGACTGCGTACCGAAG M017 7
[SEC ID 34]
05G373 GAGCGATGAGTCCTGAGTAACA M017 7
[SEC ID 35]
05G367 TGATGTAGACTGCGTACCGAAT M017 8
[SEC ID 36]
05G375 TGATGATGAGTCCTGAGTAACA M017 8
Finalmente, se agruparon y se concentraron las 4 muestras P1 y las 4 muestras P2. Se obtuvo una cantidad total de 25 µl de producto de ADN y una concentración final de 400 ng/µl (total de 10 µg). Se proporcionan las evaluaciones de calidad de intermediarios en la figura 3.
5 SECUENCIACIÓN POR 454
Unas muestras de fragmento de AFLP de pimiento y de maíz tal como se ha descrito anteriormente en la presente memoria fueron procesadas por 454 Life Sciences tal como se encuentra descrito (Margulies et al., Genome sequencing in microfabricated high-density picolitre reactors, Nature 435(7057):376-80, publicado electrónicamente
10 el 31 de julio de 2005).
PROCESAMIENTO DE LOS DATOS
Línea de procesamiento: Datos de entrada
Se recibieron los datos crudos de secuencias para cada análisis: -200,000 a 400,000 resultados de secuencias
20 -puntuaciones de calidad de la lectura automática de nucleótidos
Recorte y etiquetado
Estos datos de secuencias se analizaron para la presencia de sitios de reconocimiento de Keygene (KRS) al inicio y
25 final de la lectura. Estas secuencias KRS consisten de secuencias de adaptador de AFLP y de marcaje de muestra y son específicas de una determinada combinación de cebadores de AFLP en una muestra determinada. Las secuencias de KRS fueron identificadas por BLAST y recortadas, y se restituyeron los sitios de restricción. Las lecturas se marcaron con una etiqueta para la identificación del origen de KRS. Las secuencias recortadas se seleccionaron a partir de la longitud (mínimo de 33 nt) para participar en el procesamiento posterior.
Agrupamiento y ensamblaje
Se llevó a cabo un análisis MegaBlast de todas las lecturas recortadas y seleccionadas según tamaño para obtener agrupaciones de secuencias homólogas. Consecutivamente se ensamblaron todos los grupos con CAP3, resultando
35 en contigs ensamblados. Tras ambas etapas se habían identificado lecturas de secuencia única que no se correspondían con ninguna otra lectura. Estas lecturas se señalan como singletons. La línea de procesamiento seguida para llevar a cabo las etapas descritas en la presente memoria se muestra en la figura 4A.
Exploración de polimorfismos y evaluación de la calidad
40 Los contigs resultantes del análisis de ensamblaje forman la base para la detección de polimorfismos. Cada "apareamiento incorrecto" en la alineación de cada agrupación es un polimorfismo potencial. Se definieron criterios de selección para obtener una puntuación de calidad:
-número de lecturas en cada contig -frecuencia de "alelos" en cada muestra -aparición de secuencia de homopolímero -aparición de polimorfismos contiguos
45 Los SNP e indels con una puntuación de calidad superior al umbral se identifican como polimorfismos putativos. Para la exploración de las SSR se utilizó la herramienta MISA (identificación de microsatélites) (http://pgrc.ipkgatersleben.de/misa). Esta herramienta identifica los motivos dinucleótido, trinucleótido, tetranucleótido y motivos SSR del compuesto aplicando criterios predefinidos y resumen las apariciones de estos SSR. El procedimiento de
50 exploración de polimorfismos y asignación de calidad se muestra en la figura 4B.
RESULTADOS
La Tabla a continuación resume los resultados del análisis combinado de secuencias obtenido a partir de 2 análisis de secuenciación de 454 para las muestras combinadas de pimiento y 2 análisis para las muestras combinadas de maíz.
Pimiento
Maíz
Número total de resultados de secuencias
457178 492145
Número de secuencias recortadas Número de singletones
399623 105253 411008 313280
Número de contigs
31863 14588
Número de secuencias en contigs Número total de secuencias que contienen SSR
294370 611 97728 202
Número de secuencias diferentes que contienen SSR
104 65
Número de diferentes motivos SSR (di, tri, tetra y compuesto)
49 40
Número de SNP con puntuación Q �0,3 *
1636 782
Número de indels *
4090 943
* tanto con selección frente a SNP vecinos, secuencia flanqueante de por lo menos 12 pb y no presentes en secuencias de homopolímero mayores de 3 nucleótidos.
Ejemplo 4. Identificación de polimorfismos de un nucleótido (SNP) en el pimiento
Aislamiento del ADN
10 Se aisló el ADN genómico de las dos líneas parentales de una población recombinante consaguínea (RIL) de pimiento y 10 descendientes de RIL. Las líneas parentales eran PSP11 y PI201234. Se aisló ADN genómico a partir de material foliar de plántulas individuales utilizando un procedimiento CTAB modificado descrito por Stuart y Via (Stuart C.N. Jr. y Via L.E., A rapid CTAB DNA isolation technique useful for RAPD fingerprinting and other PCR
15 applications, Biotechniques, 14, 748-750, 1993). Se diluyeron las muestras de ADN hasta una concentración de 100 ng/µl en TE (Tris-HCl 10 mM, pH 8,0, EDTA 1 mM) y se almacenaron a -20ºC.
Preparación de molde para AFLP utilizando cebadores de AFLP etiquetados
20 Se prepararon moldes de AFLP de las líneas parentales de pimiento PSP11 y PI201234 utilizando la combinación de endonucleasas de restricción EcoRI/MseI tal como se describe en Zabeau y Vos, Selective restriction fragment amplification; a general method for DNA fingerprinting, patente EP nº 0534858-A1, B1, 1993; patente US nº
6.045.994 y en Vos et al. (Vos P., Hogers R., Bleeker M., Reijans M., van de Lee T., Hornes M., Frijters A., Pot J.,
Peleman J., Kuiper M. et al., AFLP: a new technique for DNA fingerprinting, Nucleic Acids Research 23(21):440725 4414, 1995).
Específicamente, se llevó a cabo la restricción del ADN genómico con EcoRI y MseI de la manera siguiente:
Restricción del ADN
30 ADN 100 a 500 ng EcoRI 5 unidades MseI 2 unidades 5x tampon RL 8 µl Agua MilliQ hasta 40 µl
La incubación se realizó durante 1 hora a 37ºC. Tras la restricción enzimática, los enzimas se inactivaron mediante incubación durante 10 minutos a 80ºC.
35 Ligación de adaptadores
ATP 10 mM 1 µl ADN ligasa de T4 1 µl Adaptador EcoRI (50 pmoles/µl) 1 µl Adaptador MseI (5 pmoles/µl) 1 µl 5x tampón RL. 2 µl Agua MilliQ hasta 40 µl La incubación se realizó durante 3 horas a 37ºC.
Amplificación selectiva de AFLP
5 Tras la restricción-ligación, la reacción de restricción/ligación se diluyó 10 veces con T10E0,1 y se utilizaron 5 µl de mezcla diluida como molde en una etapa de amplificación selectiva. Observar que debido a que se pretendía una amplificación selectiva +1/+2, en primer lugar se llevó a cabo una etapa de preamplificación selectiva +1/+1 (con cebadores de AFLP estándares). Las condiciones de reacción de la amplificación +1/+1 (+A/+C) fueron las siguientes.
10 Mezcla de restricción-ligación (diluida 10 veces) 5 µl Cebador EcoRI +1 (50 ng/µl) 0,6 µl Cebador MseI +1 (50 ng/µl) 0,6 µl dNTP (20 mM) 0,2 µl Polimerasa Taq (5 U/µl Amplitaq, PE) 0,08 µl 10x tampón de PCR 2,0 µl Agua MilliQ hasta 20 µl
Las secuencias de los cebadores eran:
EcoRI+1: 5’-AGACTGCGTACCAATTCA -3’ [SEC ID 9] y 15 MseI+1: 5’-GATGAGTCCTGAGTAAC -3’ [SEC ID 10]
Las amplificaciones mediante PCR se llevaron a cabo utilizando un PE9700 con un bloque de oro o plata utilizando las condiciones siguientes: 20 veces (30 segundos a 94ºC + 60 segundos a 56ºC + 120 segundos a 72ºC).
20 Se comprobó la calidad de los productos de preamplificación +1/+1 generados en un gel de agarosa al 1% utilizando una escalera de 100 pares de bases y una escalera de 1 Kb para comprobar la distribución de las longitudes de los fragmentos. Tras la amplificación selectiva +1/+1, la reacción se diluyó 20 veces con T10E0,1 y se utilizaron 5 µl de mezcla diluida como molde en la etapa de amplificación selectiva +1/+2 utilizando cebadores de AFLP etiquetados.
25 Finalmente, se llevaron a cabo amplificaciones selectivas mediante AFLP +1/+2 (A/+CA): producto de amplificación selectiva +1/+1 (diluido 20 veces): 5,0 µl.
KRS EcoRI-cebador +A (50 ng/µl) 1,5 µl KRS MseI-cebador + CA (50 ng/µl) 1,5 µl dNTP (20 mM) 0,5 µl polimerasa Taq (5 U/µl Amplitaq, Perkin Elmer) 0,2 µl 10X tampón de PCR 5,0 µl MQ hasta 50 µl
Las secuencias de los cebadores de AFLP etiquetados eran:
30 PSP11: 05F212: EcoRI+1: 5’-CGTCAGACTGCGTACCAATTCA-3’ [SEC ID 1] y 05F214: MseI+2: 5’-TGGTGATGAGTCCTGAGTAACA-3’ [SEC ID 2]
PI201234: 35 05F213: EcoRI+1: 5’-CAAGAGACTGCGTACCAATTCA-3’ [SEC ID 3] y 05F215: MseI+1: 5’-AGCCGATGAGTCCTGAGTAACA-3’[SEC ID 4]
Observar que dichos cebadores contienen etiquetas de 4 pb (subrayadas anteriormente) en sus extremos 5 prima para distinguir los productos de amplificación originados de las líneas de pimiento respectivas al final del
40 procedimiento de secuenciación. Representación esquemática de los productos de amplificación del pimiento de
Se llevaron a cabo amplificaciones de PCR (24 por muestra) utilizando un PE7900 con un bloque de oro o de plata bajo las condiciones siguientes: 30 veces (30 segundos a 94ºC + 60 segundos a 56ºC + 120 segundos a 72ºC).
Se comprobó la calidad de los productos de amplificación generados en un gel de agarosa al 1% utilizando una escalera de 100 pares de bases y una escalera de 1 Kb para comprobar la distribución de las longitudes de los fragmentos.
Purificación y cuantificación de la reacción de AFLP
Tras agrupar dos reacciones de AFLP selectiva +1/+2 de 50 microlitros por cada muestra de pimiento, los 12 productos resultantes de 100 µl de reacción de AFLP se purificaron utilizando el kit de purificación por PCR QIAquick (QIAGEN) siguiendo el manual de QIAquick® Spin (página 18). En cada columna se cargó un máximo de 100 µl de producto. Los productos amplificados se eluyeron en T10E0,1. Se comprobó la calidad de los productos purificados en un gel de agarosa al 1% y se midieron las concentraciones en el NanoDrop (figura 2).
Se utilizaron las mediciones de concentración en NanoDrop para ajustar la concentración final de cada producto de PCR purificado a 300 nanogramos por microlitro. Se mezclaron cinco microgramos de producto amplificado purificado de PSP11 y 5 microgramos de PI201234 para generar 10 microgramos de material de molde para la preparación de la biblioteca de secuenciación de 454.
Preparación de biblioteca de secuencias y secuenciación de alto rendimiento
Los productos de amplificación mixtos procedentes de ambas líneas de pimiento se sometieron a secuenciación de alto rendimiento utilizando la tecnología de secuenciación de 454 Life Sciences, tal como se describe en Margulies et al. (Margulies et al., Nature 437:376-380 y Online Supplements). Específicamente, en primer lugar se pulieron los extremos de los productos de PCR AFLP y después se ligaron con adaptadores para facilitar la amplificación por PCR en emulsión y posterior secuenciación de los fragmentos tal como describen Margulies y colaboradores.
Las secuencias de adaptadores de 454, los cebadores de PCR en emulsión, los cebadores de secuencia y las condiciones operativas de la secuenciación fueron todas las indicadas por Margulies y colaboradores. El orden lineal de elementos funcionales en un fragmento de PCR en emulsión amplificado sobre perlas de sefarosa en el procedimiento de secuenciación de 454 fue el siguiente, tal como se ejemplifica en la figura 1A:
Adaptador de PCR de 454 -adaptador de secuencia de 454 -etiqueta 1 de 4 pb de cebador de AFLP -secuencia
1 de cebador de AFLP que incluye el nucleótido o nucleótidos selectivos -secuencia interna de fragmento de
AFLP -secuencia 2 de cebador de AFLP que incluye uno o más nucleótidos selectivos, etiqueta 2 de 4 pb de
cebadores de AFLP -adaptador de secuencia de 454 -adaptador de PCR de 454 -perla de sefarosa.
Se llevaron a cabo dos análisis de secuenciación de 454 de alto rendimiento por parte de 454 Life Sciences
(Branford, CT; Estados Unidos).
Procesamiento de datos de operación de secuenciación de 454
Los datos de secuencia resultantes de 2 análisis de secuenciación de 454 se procesaron utilizando un procedimiento bioinformático (Keygene N.V.). Específicamente, se convirtieron en formato FASTA lecturas de secuencia no procesadas con asignación de bases obtenidas de 454 y se inspeccionaron para la presencia de secuencias adaptadoras de AFLP etiquetadas utilizando un algoritmo de BLAST. Tras las correspondencias de alta confianza con las secuencias de cebador de AFLP etiquetadas conocidas, las secuencias se recortaron, se restituyeron los sitios de endonucleasa de restricción y se asignaron las etiquetas apropiadas (muestra 1 EcoRI (ES1), muestra 1 MseI (MS1), muestra 2 EcoRI (ES2) o muestra 2 MseI (MS2), respectivamente). A continuación, todas las secuencias recortadas mayores de 33 bases se agruparon utilizando un procedimiento megaBLAST basado en homologías globales de secuencia. A continuación, se ensamblaron las agrupaciones en uno o más contigs y/o singletons por agrupación utilizando un algoritmo CAP3 de alineación múltiple. Los contigs que contenían más de una secuencia se inspeccionaron para apareamientos incorrectos de secuencias, representativos de polimorfismos putativos. Se asignaron puntuaciones de calidad a los apareamientos incorrectos de secuencia basándose en los criterios siguientes:
*
número de lecturas en un contig
*
la distribución observada de alelos
Los dos criterios anteriormente indicados forman la base para la denominada puntuación Q asignada a cada SNP/indel putativo. Las puntuaciones Q se encuentran comprendidas entre 0 y 1; una puntuación Q de 0,3 sólo puede alcanzarse en el caso de ambos alelos se observen por lo menos dos veces.
*
localización en homopolímeros de una determinada longitud (ajustable; valor por defecto para evitar polimorfismos localizados en homopolímeros de 3 bases o más largos).
*
número de contigs en una agrupación.
*
distancia hasta los desapareamientos de secuencia vecina más próximos (ajustable; importante para determinados tipos de ensayos de genotipado que sondean secuencias flanqueantes)* nivel de asociación de los alelos observados con la muestra 1 ó con la muestra 2; en el caso de una asociación perfecta consistente entre los alelos de un polimorfismo putativo y las muestras 1 y 2, el polimorfismo (SNP) se indica en forma de putativo
polimorfismo (SNP) "de elite". Se considera que un polimorfismo de élite presenta una elevada probabilidad de encontrarse localizado en una secuencia genómica única o de bajo número de copia, en el caso de que se hayan utilizado dos líneas homocigóticas en el procedimiento de exploración. A la inversa, una asociación débil de un polimorfismo con el origen de la muestra presenta un riesgo elevado de que se hayan descubierto polimorfismos
5 falsos surgidos de la alineación de secuencias no alélicas en un contig.
Las secuencias que contenían motivos de SSR se identificaron utilizando la herramienta de búsqueda MISA (herramienta de identificación de microsatélites; disponible en http://pgrc.ipk-gatersleben.de/misa/).
10 Se muestran las estadísticas globales de la operación en la Tabla a continuación.
Tabla. Estadísticas globales de un análisis de secuenciación de 454 para la identificación de los SNP en el pimiento.
Combinación enzimática
Análisis
Recorte
Todas las secuencias
254.308
Erróneas
5.293 (2 %)
Correctas
249.015 (98%)
Concatámeros
2.156 (8,5 %)
Etiquetas mixtas
1.120 (0,4 %)
Secuencias correctas Un extremo recortado
240.817 (97%)
Ambos extremos recortados
8.198 (3 %)
Número de secuencias muestra 1
136.990 (55%)
Número de secuencias muestra 2
112.025 (45 %)
Agrupado
Número de contigs
21.918
Secuencias en contigs
190.861
Número medio de secuencias en cada contig
8,7
Exploración de SNP
SNP con puntuación Q �0,3 *
1.483
Indel con puntuación Q �0,3 *
3.300
Exploración de SNP
Exploración de SSR
Número total de motivos SSR identificados
359
Número de secuencias que contienen uno o más motivos SSR
353
Número de motivos SSR con tamaño unitario 1
0
(homopolímero) Número de motivos SSR con tamaño unitario 2
102
Número de motivos SSR con tamaño unitario 3 Número de motivos SSR con tamaño unitario 4
240 17
* Los criterios de exploración de SNP / indel fueron los siguientes:
15 No se encontraron polimorfismos contiguos con una puntuación Q superior a 0,1 a menos de 12 bases en cada lado, no presentes en homopolímeros de 3 ó más bases. Los criterios de exploración no consideraron la asociación consistente con las muestras 1 y 2, es decir, los SNP e indels no son necesariamente SNP/indels putativos de élite.
En la figura 7 se muestra un ejemplo de una alineación múltiple que contiene un polimorfismo putativo de único 20 nucleótido de élite.
Ejemplo 5. Validación de SNP mediante amplificación por PCR y secuenciación de Sanger
Con el fin de validar el SNP A/G putativo que se identifica en el Ejemplo 1, se diseñó un ensayo de sitio de 25 secuencia etiquetada (STS) para este SNP utilizando cebadores de PCR flanqueantes. Las secuencias de los cebadores de PCR eran las siguientes:
Cebador_1.2f: 5’-AAACCCAAACTCCCCCAATC-3’, [SEC ID 37] y cebador_1.2r: 5’-AGCGGATAACAATTTCACACAGGACATCAGTAGTCACACTGGTA CAAAAATAGAG30 CAAAACAGTAGTG -3’ [SEQ ID 38]
Observar que el cebador 1.2r contenía un sitio de unión de cebador de secuencia de M13 y un fragmento de relleno en su extremo 5 prima. Se llevó a cabo la amplificación por PCR utilizando los productos de amplificación por AFLP +A/+CA de PSP11 y PI210234 preparados tal como se describe en el Ejemplo 4 a modo de molde. Las condiciones
de PCR fueron las siguientes: para 1 reacción de PCR se mezclaron los componentes siguientes: 5 µl mezcla de AFLP diluida 1/10 (aprox. 10 ng/µl) 5 µl 1 pmol/µl de cebador 1.2f (diluido directamente a partir de solución madre 500 µM) 5 µl 1 pmol/µl cebador 1.2r (diluido directamente a partir de una solución madre 500 µM)
5 µl de mezcla de PCR -2 µl 10x tampón de PCR -1 µl 5 mM dNTP -1,5 µl Mgcl2 25 mM -0,5 µl de H2O
10 5 µl de mezcla enzimática -0,5 µl 10x tampón de PCR (Applied Biosystems) -0,1 µl 5 U/µl ADN polimerasa AmpliTaq (Applied Biosystems) -4,4 µl de H2O
15 Se utilizó el perfil de PCR siguiente:
Ciclo 1 2’: 94°C Ciclo 2-34 20": 94° C
30": 56°C 2’30": 72°C
Ciclo 35 7’: 72°C
0: 4°C
Los productos de PCR se clonaron en el vector pCR2.1 (kit de clonación TA, Invitrogen) utilizando el método de clonación TA y se transformaron en células E. coli competentes INVaF'. Los transformantes sesometieron a cribado azul/blanco. Se seleccionaron tres transformantes blancos independientes de cada uno de PSP11 y PI-201234 y se
20 cultivaron O/N en medio selectivo líquido para el aislamiento de plásmidos.
Los plásmidos se aislaron utilizando el kit miniprep QIAprep Spin (QIAGEN). A continuación, se secuenciaron las inserciones de estos plásmidos siguiendo el protocolo indicado posteriormente y se resolvieron en el MegaBACE 1000 (Amersham). Las secuencias obtenidas se inspeccionaron en presencia del alelo SNP. Dos plásmidos
25 independientes que contenían la inserción PI-201234 y 1 plásmido que contenía la inserción PSP11 contenían la secuencia de consenso esperada flanqueantes del SNP. La secuencia derivada del fragmento de PSP11 contenía el alelo A esperado (subrayado) y la secuencia derivada del fragmento PI-201234 contenía el alelo G esperado (doble subrayado):
Este resultado indica que el putativo SNP A/G del pimiento representa un polimorfismo genético verdadero detectable utilizando el ensayo STS diseñado.
Ejemplo 6: validación de SNPs mediante detección con SNPWave
40 Con el fin de validar el putativo SNP A/G identificado en el Ejemplo 1, se definieron conjuntos de sondas de ligación SNPWave para ambos alelos de dicho SNP utilizando la secuencia de consenso. Las secuencias de las sondas de ligación eran las siguientes:
45 Secuencias de sonda SNPWave (5'-3'):
06A162 GATGAGTCCTGAGTAACCCAATCGATTTCAAACCTAGAACAA (42 bases) [SEC ID 42] 06A163 GATGAGTCCTGAGTAACCACCAATCGATTTCAAACCTAGAACAG (44 bases) [SEC ID 43] 06A164 Fosfato-TGTTGGTTTTGGTGCTAACTTCAACCAACATCTGGAATTGGTACGCAGTC (52 bases) [SEC ID 44]
Observar que las sondas específicas de alelo 06A162 y 06A163 para los alelos A y G, respectivamente, difieren en tamaño en 2 bases, de manera que, tras la ligación a la sonda común específica de locus 06A164, resultan tamaños de producto de ligación de 94 (42+54) y 96 (44+52) bases.
Las reacciones de ligación SNPWave y de PCR se llevaron a cabo tal como describen Van Eijk y colaboradores
(M.J.T van Eijk, J.L.N. Broekhof, H.J.A. van der Poel, R.C.J. Hogers, H. Schneiders, J. Kamerbeek, E. Verstege, J.W. van Aart, H. Geerlings, J.B. Buntjer, A.J. van Oeveren y P. Vos, SNPWaveTM: SNPWave™: una tecnología de genotipado de SNP multiplex flexible. Nucleic Acids Research 32: e47) utilizando 100 ng de ADN genómico de las líneas del pimiento PSP11 y PI201234 y 8 descendientes de RIL como material de partida. Las secuencias de los cebadores de PCR eran:
93L01FAM (EOOk): 5-GACTGCGTACCAATTC-3’ [SEC ID 45] 93E40 (MOOk): 5-GATGAGTCCTGAGTAA-3’ [SEC ID 46]
Tras la amplificación por PCR, la purificación y detección del producto de PCR en el MegaBACE1000 fue tal como ha sido descrita por van Eijk y colaboradores (ver anteriormente). En la figura 8B se muestra una pseudoimagen en gel de los productos de amplificación obtenidos de PSP11, PI201234 y de 8 descendientes RIL.
Los resultados del SNPWave demuestran claramente que el SNP A/G se detecta mediante el ensayo SNPWave, resultando en productos de 92 pb (=genotipo homocigótico AA) para P1 (PSP11) y los descendientes RIL 1, 2, 3, 4, 6 y 7) y en productos de 94 pb (genotipo homocigótico GG) para P2 (PI201233) y los descendientes RIL 5 y 8.
Ejemplo 7: estrategias para el enriquecimiento de bibliotecas de fragmentos de AFLP en secuencias de bajo número de copia.
El presente ejemplo describe varios métodos de enriquecimiento centrados en secuencias genómicas únicas o de bajo número de copia con el fin de incrementar el rendimiento de polimorfismos de elite tal como se describe en el Ejemplo 4. Los métodos pueden clasificarse en cuatro categorías:
1) Métodos destinados a preparar ADN genómico de alta calidad, excluyendo secuencias de cloroplastos.
Se propone preparar ADN nuclear en lugar de ADN genómico total tal como se describe en el Ejemplo 4, para excluir el coaislamiento de abundante ADN de cloroplastos, lo que podría resultar en un número reducido de secuencias de ADN genómico de la planta, dependiendo de las endonucleasas de restricción y los cebadores de AFLP selectivos utilizados durante el procedimiento de preparación de la biblioteca de fragmentos. Un protocolo para el aislamiento de ADN nuclear del tomate altamente puro ha sido descrito por Peterson D.G., Boehm K.S. y Stack S.M., Isolation of Milligram Quantities of Nuclear DNA From Tomato (Lycopersicon esculentum), A Plant Containing High Levels of Polyphenolic Compounds. Plant Molecular Biology Reporter 15 (2):148-153, 1997.
2) Métodos destinados a utilizar endonucleasas de restricción durante el procedimiento de preparación de moldes para AFLP que se espera que rindan niveles elevados de secuencias de bajo número de copia.
Se propone utilizar determinadas endonucleasas de restricción durante el procedimiento de preparación de moldes para AFLP, que se espera que presenten diana en secuencias genómicas de bajo número de copia o únicas, resultando en bibliotecas de fragmentos enriquecidas en polimorfismos con una capacidad incrementada de ser convertibles en ensayos de genotipado. Un ejemplo de una endonucleasa de restricción con diana en una secuencia de bajo número de copia en genomas vegetales es PstI. Otras endonucleasas de restricción sensibles a la metilación también pueden presentar diana preferentemente en secuencias genómicas de bajo número de copia o únicas.
3) Métodos destinados a eliminar selectivamente secuencias altamente duplicadas basándose en cinética de reapareamiento de secuencias repetidas frente a secuencias de bajo número de copia.
Se propone eliminar selectivamente secuencias altamente duplicadas (repetidas) de la muestra de ADN genómico total o del material de molde de AFLP (ADNc) antes de la amplificación selectiva.
3a) La preparación de ADN de alta C0t es una técnica comúnmente utilizada para el enriquecimiento en secuencias de bajo número de copia de apareamiento lento procedentes de una mezcla compleja de ADN genómico vegetal (Yuan et al., High-Cot sequence analysis of the maize genome. Plant J. 34: 249-255, 2003). Se sugiere utilizar ADN de C0t elevado en lugar de ADN genómico total para el enriquecimiento en polimorfismos situados en secuencias de bajo número de copia. 3b) A modo de alternativa a la laboriosa preparación de alta C0t puede incubarse ADNdc desnaturalizado y en reapareamiento con una nueva nucleasa de cangrejo de Kamchatka, que corta dúplex de ADN cortos perfectamente correspondientes a una tasa más alta que los dúplex de ADN no perfectamente correspondientes, tal como describen Zhulidov y colaboradores (Simple cDNA normalization using Kamchatka crab duplex-specific nuclease. Nucleic Acids Research 32:e37, 2004) y Shagin y colaboradores (A novel method for SNP detection using a new duplex-specific nuclease from crab hepatopancreas, Genome Research 12: 1935-1942, 2004). Específicamente, se propone incubar las mezclas de restricción/ligación de AFLP con dicha endonucleasa para
5 empobrecer la mezcla en secuencias altamente duplicadas, seguido de la amplificación mediante AFLP selectiva de las secuencias genómicas remanentes de bajo número de copia o únicas. 3c) La filtración de metilos es un método para enriquecer en fragmentos de ADN genómico hipometilado utilizando la endonucleasa de restricción McrBC, que corta el ADN metilado en la secuencia [A/G]C, en la que C se encuentra metilado (ver Pablo D. Rabinowicz, Robert Citek, Muhammad A. Budiman, Andrew Nunberg,
10 Joseph A. Bedell, Nathan Lakey, Andrew L. O'Shaughnessy, Lidia U. Nascimento, W. Richard McCombie y Robert A. Martienssen, Differential methylation of genes and repeats in land plants, Genome Research 15:14311440, 2005). Puede utilizarse la McrBC para enriquecer en la fracción de secuencias de bajo número de copia de un genoma, que se utilizará como material de partida para la exploración para polimorfismos.
15 4) Utilización de ADNc y no ADN genómico para el reconocimiento de secuencias génicas.
Finalmente, se propone utilizar ADNc cebado con oligo-dT y no ADN genómico como material de partida para la exploración de polimorfismos, opcionalmente en combinación con la utilización de nucleasa específica de dúplex de cangrejo indicada en 3b, anteriormente, para la normalización. Observar que la utilización de ADNc cebado con
20 oligo-dT también excluye las secuencias de cloroplastos. Alternativamente, se utilizan moldes de ADNc-AFLP en lugar de ADNc cebado con oligo-dT para facilitar la amplificación de las secuencias remanentes de bajo número de copia análogamente a AFLP (ver también 3b, anteriormente).
Ejemplo 8: Estrategia para el enriquecimiento en repeticiones de secuencias simples.
25 El presente ejemplo describe la estrategia propuesta de descubrimiento de secuencias repetidas de secuencias simples análogamente a la identificación de SNP descrita en el Ejemplo 4.
Específicamente, se lleva a cabo la restricción-ligación de ADN genómico de dos o más muestras, por ejemplo
30 utilizando las endonucleasas de restricción PstI/MseI. La amplificación mediante AFLP selectiva se lleva a cabo tal como se describe en el Ejemplo 4. A continuación, se enriquece en fragmentos que contienen los motivos SSR seleccionados mediante uno de los dos métodos siguientes:
1) hibridación de transferencia southern sobre filtros que contienen oligonucleótidos correspondientes a los motivos
35 SSR deseados (por ejemplo (CA)15 en el caso del enriquecimiento para repeticiones CA/GT), seguido de la amplificación de los fragmentos unidos de un modo similar al descrito por Armour y colaboradores (Armour J., Sismani C., Patsalis P. y Cross G., Measurement of locus copy number by hybridization with amplifiable probes. Nucleic Acids Research 28(2): 605-609) o mediante 2) el enriquecimiento utilizando sondas de hibridación de oligonucleótidos de captura biotinilados para capturar fragmentos (de AFLP) en solución tal como describen Kijas y
40 colaboradores (Kijas J.M., Fowler J.C., Garbett C.A. y Thomas, M.R., Enrichment of microsatellites from the citrus genome using biotinylated oligonucleotide sequences bound to streptavidin-coated magnetic particles. Biotechniques, 16: 656-662, 1994).
A continuación, los fragmentos de AFLP enriquecidos en motivo SSR se amplifican utilizando los mismos cebadores
45 de AFLP utilizados en la etapa de preamplificación, con el fin de generar una biblioteca de secuencias. Una alícuota de los fragmentos amplificados se clonan T/A y 96 clones se secuencian para estimar la fracción de clones positivos (clones que contienen el motivo SSR deseado, por ejemplo motivos CA/GT de más de 5 unidades repetidas. Se detecta otra alícuota de la mezcla enriquecida en fragmentos de AFLP mediante electroforesis en gel de poliacrilamida (PAGE), opcionalmente tras la amplificación selectiva adicional para obtener una huella genética
50 legible, con el fin de inspeccionar visualmente si se ha realizado el enriquecimiento en fragmentos que contienen SSR. Tras completar con éxito dichas etapas de control, las bibliotecas de secuencias se someten a secuenciación de alto rendimiento de 454.
La estrategia anteriormente indicada para la identificación de novo de las SSR se ilustra esquemáticamente en la
55 figura 8A, y puede adaptarse para otros motivos de secuencia mediante la sustitución correspondiente de las secuencias oligonucleótidas de captura.
Ejemplo 9. Estrategia para evitar las etiquetas mixtas.
Las etiquetas mixtas se refieren a la observación de que, aparte de la combinación de cebadores de AFLP etiquetados esperada en cada muestra, se observa una fracción reducida de secuencias que contiene una etiqueta de la muestra 1 en un extremo y una etiqueta de la muestra 2 en el otro extremo (ver también la Tabla 1 en el Ejemplo 4). Esquemáticamente se ilustra la configuración de las secuencias que contienen etiquetas mixtas a continuación.
Representación esquemática de las combinaciones esperadas de etiquetas de muestra.
Representación esquemática de las etiquetas mixtas.
La observación de etiquetas mixtas impide la asignación correcta de las secuencias a PSP11 ó PI-201234.
5 Se muestra en la figura 5A un ejemplo de una secuencia de etiqueta mixta observada en el análisis de la secuencia del pimiento descrito en el Ejemplo 4. En el panel 2 de la figura 5A se muestra una vista general de la configuración de los fragmentos observados que contienen etiquetas esperadas y etiquetas mixtas.
10 La explicación molecular propuesta para las etiquetas mixtas es que durante la etapa de preparación de la biblioteca de secuencias, la ADN polimerasa de T4 o el enzima Klenow generan extremos romos en los fragmentos de ADN al eliminar los extremos protuberantes 3 prima antes de la ligación de adaptadores (Margulies et al., 2005). Aunque lo anterior puede funcionar bien en el caso de que se procese una única muestra de ADN, al procesar una mezcla de dos o más muestras de ADN etiquetadas diferentemente, el rellenado por parte de la polimerasa resulta en la
15 incorporación de una secuencia de etiqueta incorrecta en el caso de que se haya formado un heterodúplex entre las cadenas complementarias derivadas de muestras diferentes (figura 5B, panel 3, etiquetas mixtas). La solución encontrada es agrupar las muestras tras la etapa de purificación posterior a la ligación de adaptadores durante la etapa de construcción de la biblioteca de fragmentos de 454, tal como se muestra en la figura 5C, panel 4.
20 Ejemplo 10. Estrategia para evitar etiquetas mixtas y concatámeros utilizando un diseño mejorado de preparación de biblioteca de secuencias de 454.
Aparte de la observación de frecuencias bajas de resultados de secuencias que contienen etiquetas mixtas tal como se describe en el Ejemplo 9, se ha observado una frecuencia baja de resultados de secuencias de fragmentos de
25 AFLP concatenados.
Un ejemplo de un resultado de secuencia derivada de un concatámero se muestra en la figura 6A, panel 1. Esquemáticamente, se muestra en la figura 6A, panel 2, la configuración de secuencias que contienen etiquetas esperadas y concatámeros.
30 La explicación molecular propuesta para la presencia de fragmentos de AFLP concatenados es que, durante la etapa de preparación de la biblioteca de secuencias de 454, se generan extremos romos en los fragmentos de ADN al eliminar la ADN polimerasa de T4 o el enzima Klenow los extremos protuberantes 3 prima antes de la ligación de adaptadores (Margulies et al., 2005). En consecuencia, los fragmentos de ADN de extremos romos de la muestra
35 compiten con los adaptadores durante la etapa de ligación y podrían ligarse entre sí antes de ligarse a los adaptadores. Este fenómeno de hecho es independiente de si se incluye una única muestra de ADN o una mezcla de múltiples muestras (etiquetadas) en la etapa de preparación de la biblioteca, y por lo tanto también podría producirse durante la secuenciación convencional tal como describen Margulies y colaboradores. En el caso de que se utilicen muestras con múltiples etiquetas, tal como se describe en el Ejemplo 4, los concatámeros complican la
40 asignación correcta de lecturas de secuencia a las muestras basada en la información de etiquetas y por lo tanto deben evitarse.
La solución propuesta a la formación de concatámeros (y etiquetas mixtas) es sustituir la ligación de adaptadores de extremos romos por la ligación de adaptadores que contienen un extremo protuberante 3 prima de T, análogamente a la clonación T/A de productos de PCR, tal como se muestra en la figura 6B, panel 3. Convenientemente, se propone que estos adaptadores modificados que contienen una T en el extremo protuberante 3' contengan una C en el extremo protuberante 3' opuesto (que no se ligará al fragmento de ADN de muestra, para evitar la formación de concatámeros entre extremos romos de secuencias adaptadoras (ver la figura 6B, panel 3)). El flujo de operaciones adaptado que resulta para el procedimiento de construcción de una biblioteca de secuencias al utilizar el enfoque de adaptadores modificados se muestra esquemáticamente en la figura 6C, panel 4.
LISTADO DE SECUENCIAS
<110> Keygene NV
<120> Estrategias para la identificación y detección de alto rendimiento de polimorfismos
<130> P27819EP01
<160> 46
<170> PatentIn versión 3.3
<210> 1
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 1
<210> 2
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 2
<210> 3
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 3
<210> 4
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 4
<210> 5
<211> 17
<212> ADN
<213> Artificial
<220>
<223> adaptador
<400> 5
<210> 6
<211> 18
<212> ADN
<213> Artificial
<220>
<223> adaptador
<400> 6
<210> 7
<211> 16
<212> ADN
<213> Artificial
<220>
<223> adaptador
<400> 7
<210> 8
<211> 14
<212> ADN
<213> Artificial
<220>
<223> adaptador
<400> 8
<210> 9
<211> 18
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 9
<210> 10
<211> 17
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 10 <210> 11
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 11
<210> 12
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 12
<210> 13
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 13
<210> 14
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 14
<210> 15
<211> 19
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 15
<210> 16 <211> 19
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 16
<210> 17
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 17
<210> 18
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 18
<210> 19
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 19
<210> 20
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 20
<210> 21
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 21
<210> 22
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 22
<210> 23
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 23
<210> 24
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 24
<210> 25
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 25
<210> 26
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 26
<210> 27
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 27
<210> 28
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 28
<210> 29
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 29
<210> 30
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 30
<210> 31
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 31
<210> 32
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 32
<210> 33
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 33
<210> 34
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 34
<210> 35
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 35
<210> 36
<211> 22
<212> ADN
<213> Artificial
<220>
<223> Cebador
<400> 36
<210> 37
<211> 20
<212> ADN
<213> artificial
<220>
<223> Cebador
<400> 37
<210> 38
<211> 68
<212> ADN
<213> artificial
<220>
<223> Cebador
<400> 38
<210> 39
<211> 91
<212> ADN
<213> artificial
<220>
<223> sonda
<400> 39
<210> 40
<211> 90
<212> ADN
<213> artificial
<220>
<223> secuencia que contiene el SNP PI-201234
<400> 40 <210> 41
<211> 90
<212> ADN 5 <213> artificial
<220>
<223> SNP PI-201234
10 <400> 41
<210> 42
<211> 42
<212> ADN
<213> artificial
<220>
<223> Sonda SNPWave
<400> 42
<210> 43
<211> 44
<212> ADN
<213> artificial
<220>
<223> Sonda SNPWave
<400> 43
<210> 44
<211> 50
<212> ADN 20 <213> artificial
<220>
<223> sonda snpwave
25 <400> 44
<210> 45 30 <211> 16
<212> ADN
<213> artificial
<220>
<223> Cebador
<400> 45
10
<210> 46
<211> 16
<212> ADN
<213> artificial
15
<220> 5
<223> Cebador
<400> 46
20

Claims (6)

  1. REIVINDICACIONES
    1.
    Utilización en un método de reducción de la complejidad, de un adaptador que porta un extremo protuberante 3' de T en la reducción del etiquetado mixto de una muestra de ADN amplificado y/o en la reducción o prevención de la formación de concatámeros de fragmentos de ADN de una muestra de ADN que comprende fragmentos de restricción amplificados que portan un extremo protuberante 3' de A obtenido de una reducción de complejidad.
  2. 2.
    Utilización según la reivindicación 1, en la que el método para la reducción del etiquetado mixto del ADN
    amplificado comprende las etapas de: -proporcionar una muestra de ADN, -amplificar la muestra de ADN con cebadores de amplificación etiquetados con el fin de generar amplicones etiquetados, -opcionalmente proporcionar extremo protuberantes 3' de A en los extremos de los amplicones etiquetados, -ligar adaptadores que portan un extremo protuberante 3' de T a los amplicones etiquetados.
  3. 3.
    Utilización según la reivindicación 1, en la que el método para la reducción o prevención de la formación de
    concatámeros de los fragmentos de ADN de una muestra de ADN comprende las etapas de: -proporcionar fragmentos de ADN a partir de una muestra de ADN, -opcionalmente, pulir los fragmentos de ADN para proporcionar fragmentos de ADN de extremos romos, -opcionalmente, proporcionar extremos protuberantes 3' de A a los extremos de los fragmentos de ADN de extremos romos, -ligar adaptadores a los fragmentos de ADN en los que el adaptador contiene un extremo protuberante 3' de T en el extremo que se liga al fragmento.
  4. 4.
    Utilización según la reivindicación 2 ó 3, en la que la muestra de ADN es una muestra de ADN de complejidad reducida y/o los fragmentos de ADN son fragmentos de ADN de complejidad reducida.
  5. 5.
    Utilización según la reivindicación 3 ó 4, en la que los fragmentos se amplifican con cebadores de amplificación (etiquetados) para generar amplicones.
  6. 6.
    Utilización según las reivindicaciones 2 a 5, en la que los fragmentos o amplicones ligados con adaptador se someten a secuenciación sobre un soporte sólido.
ES10075564T 2005-06-23 2006-06-23 Estrategias para la identificación y detección de alto rendimiento de polimorfismos Active ES2393318T3 (es)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US69305305P 2005-06-23 2005-06-23
US693053P 2005-06-23
EP06075104 2006-01-16
EP06075104 2006-01-16
US75903406P 2006-01-17 2006-01-17
US759034P 2006-01-17

Publications (1)

Publication Number Publication Date
ES2393318T3 true ES2393318T3 (es) 2012-12-20

Family

ID=36940150

Family Applications (2)

Application Number Title Priority Date Filing Date
ES10075564T Active ES2393318T3 (es) 2005-06-23 2006-06-23 Estrategias para la identificación y detección de alto rendimiento de polimorfismos
ES10184351T Active ES2387878T3 (es) 2005-06-23 2006-06-23 Estrategias para la identificación de alto rendimiento y la detección de polimorfismos

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES10184351T Active ES2387878T3 (es) 2005-06-23 2006-06-23 Estrategias para la identificación de alto rendimiento y la detección de polimorfismos

Country Status (9)

Country Link
US (15) US8785353B2 (es)
EP (3) EP2302070B1 (es)
JP (2) JP5220597B2 (es)
CN (3) CN105039313B (es)
AT (2) ATE557105T1 (es)
DE (1) DE602006018744D1 (es)
DK (2) DK2302070T3 (es)
ES (2) ES2393318T3 (es)
WO (1) WO2006137733A1 (es)

Families Citing this family (150)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9365893B2 (en) 2005-05-10 2016-06-14 State Of Oregon Acting By And Through The State Board Of Higher Education On Behalf Of The University Of Oregon Methods of mapping polymorphisms and polymorphism microarrays
WO2006137733A1 (en) 2005-06-23 2006-12-28 Keygene N.V. Strategies for high throughput identification and detection of polymorphisms
AU2006295556B2 (en) 2005-09-29 2012-07-05 Keygene N.V. High throughput screening of mutagenized populations
US10316364B2 (en) 2005-09-29 2019-06-11 Keygene N.V. Method for identifying the source of an amplicon
DK3404114T3 (da) * 2005-12-22 2021-06-28 Keygene Nv Fremgangsmåde til detektering af AFLP-baseret polymorfisme med højt gennemløb
CN101365803B (zh) * 2005-12-22 2013-03-20 关键基因股份有限公司 采用高通量测序技术的改进的转录谱描述策略
US7932029B1 (en) * 2006-01-04 2011-04-26 Si Lok Methods for nucleic acid mapping and identification of fine-structural-variations in nucleic acids and utilities
WO2007114693A2 (en) * 2006-04-04 2007-10-11 Keygene N.V. High throughput detection of molecular markers based on aflp and high throughput sequencing
WO2008027558A2 (en) 2006-08-31 2008-03-06 Codon Devices, Inc. Iterative nucleic acid assembly using activation of vector-encoded traits
AR066922A1 (es) 2007-06-08 2009-09-23 Monsanto Technology Llc Metodos de mejoramiento molecular del germoplasma de una planta por secuenciamiento dirigido
US8124336B2 (en) 2007-09-26 2012-02-28 Population Genetics Technologies Ltd Methods and compositions for reducing the complexity of a nucleic acid sample
EP2367937B1 (en) * 2008-12-04 2013-04-17 Keygene N.V. Method for the reduction of repetitive sequences in adapter-ligated restriction fragments
US9085798B2 (en) 2009-04-30 2015-07-21 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
JP5799484B2 (ja) 2009-12-14 2015-10-28 トヨタ自動車株式会社 Dnaマイクロアレイにおけるプローブ設計方法、当該方法により設計されたプローブを有するdnaマイクロアレイ
US20190300945A1 (en) 2010-04-05 2019-10-03 Prognosys Biosciences, Inc. Spatially Encoded Biological Assays
US10787701B2 (en) 2010-04-05 2020-09-29 Prognosys Biosciences, Inc. Spatially encoded biological assays
PT2556171E (pt) 2010-04-05 2015-12-21 Prognosys Biosciences Inc Ensaios biológicos codificados espacialmente
FI3425062T3 (fi) 2010-06-09 2023-09-01 Keygene Nv Kombinatorisia sekvenssiviivakoodeja suuren suorituskyvyn seulontaa varten
CA2804450C (en) * 2010-07-09 2022-10-11 Max Jan van Min 3-d genomic region of interest sequencing strategies
CN102409048B (zh) * 2010-09-21 2013-10-23 深圳华大基因科技服务有限公司 一种基于高通量测序的dna标签文库构建方法
CN102409046B (zh) * 2010-09-21 2013-09-18 深圳华大基因科技服务有限公司 小分子rna标签
GB201016484D0 (en) 2010-09-30 2010-11-17 Geneseque As Method
EP2637780B1 (en) 2010-11-12 2022-02-09 Gen9, Inc. Protein arrays and methods of using and making the same
AU2011338841B2 (en) 2010-11-12 2017-02-16 Gen9, Inc. Methods and devices for nucleic acids synthesis
EP2663655B1 (en) * 2011-01-14 2015-09-02 Keygene N.V. Paired end random sequence based genotyping
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
EP2723906A4 (en) 2011-06-27 2015-02-25 Univ Florida METHOD FOR REDUCING THE COMPLEXITY OF A GENOM AND FOR DETECTING POLYMORPHISMS
AU2012300401B2 (en) 2011-08-26 2018-02-08 Ginkgo Bioworks, Inc. Compositions and methods for high fidelity assembly of nucleic acids
CN102567652A (zh) * 2011-12-13 2012-07-11 上海大学 一种面向snp数据的筛选方法
WO2013106737A1 (en) 2012-01-13 2013-07-18 Data2Bio Genotyping by next-generation sequencing
EP2814959B1 (en) 2012-02-17 2018-01-17 Fred Hutchinson Cancer Research Center Compositions and methods for accurately identifying mutations
EP4234713A3 (en) 2012-03-20 2024-02-14 University Of Washington Through Its Center For Commercialization Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing
US9150853B2 (en) 2012-03-21 2015-10-06 Gen9, Inc. Methods for screening proteins using DNA encoded chemical libraries as templates for enzyme catalysis
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
US20130281308A1 (en) * 2012-04-24 2013-10-24 Gen9, Inc. Methods for sorting nucleic acids and preparative in vitro cloning
EP2841601B1 (en) 2012-04-24 2019-03-06 Gen9, Inc. Methods for sorting nucleic acids and multiplexed preparative in vitro cloning
KR101890140B1 (ko) 2012-05-07 2018-09-28 삼성전자주식회사 카메라 장치를 이용하여 디스플레이 장치를 제어하는 방법 및 이를 적용한 모바일 장치, 디스플레이 장치, 그리고 시스템
WO2013177220A1 (en) 2012-05-21 2013-11-28 The Scripps Research Institute Methods of sample preparation
US20150191719A1 (en) 2012-06-25 2015-07-09 Gen9, Inc. Methods for Nucleic Acid Assembly and High Throughput Sequencing
US20150011396A1 (en) 2012-07-09 2015-01-08 Benjamin G. Schroeder Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
GB201217888D0 (en) 2012-10-05 2012-11-21 Univ Leuven Kath High-throughput genotyping by sequencing of single cell
DK3511423T4 (da) 2012-10-17 2024-07-29 Spatial Transcriptomics Ab Fremgangsmåder og produkt til optimering af lokaliseret eller rumlig detektion af genekspression i en vævsprøve
EP2946345B1 (en) 2013-01-17 2024-04-03 Personalis, Inc. Methods and systems for genetic analysis
WO2014144092A1 (en) 2013-03-15 2014-09-18 Nugen Technologies, Inc. Sequential sequencing
EP4234716A3 (en) 2013-06-25 2023-12-06 Prognosys Biosciences, Inc. Methods for determining spatial patterns of biological targets in a sample
EP4567682A3 (en) 2013-08-30 2025-09-03 Personalis, Inc. Methods for genomic analysis
JP6422193B2 (ja) * 2013-09-30 2018-11-14 キアゲン ゲーエムベーハー Dnaライブラリーの調製のためのdnaアダプター分子およびその生成法および使用
GB2535066A (en) 2013-10-03 2016-08-10 Personalis Inc Methods for analyzing genotypes
GB201319779D0 (en) * 2013-11-08 2013-12-25 Cartagenia N V Genetic analysis method
WO2015073711A1 (en) 2013-11-13 2015-05-21 Nugen Technologies, Inc. Compositions and methods for identification of a duplicate sequencing read
GB201413929D0 (en) 2014-08-06 2014-09-17 Geneseque As Method
EP3913066A1 (en) * 2014-09-09 2021-11-24 Igenomx International Genomics Corporation Compositions for rapid nucleic acid library preparation
EP4026913A1 (en) 2014-10-30 2022-07-13 Personalis, Inc. Methods for using mosaicism in nucleic acids sampled distal to their origin
CN104450697B (zh) * 2014-12-02 2017-01-11 中国科学院海洋研究所 一种与牡蛎抗病毒特性相关的snp标记及其应用
EP4119677B1 (en) 2015-04-10 2023-06-28 Spatial Transcriptomics AB Spatially distinguished, multiplex nucleic acid analysis of biological specimens
US10344336B2 (en) 2015-06-09 2019-07-09 Life Technologies Corporation Methods, systems, compositions, kits, apparatus and computer-readable media for molecular tagging
WO2017100441A1 (en) 2015-12-08 2017-06-15 Twinstrand Biosciences, Inc. Improved adapters, methods, and compositions for duplex sequencing
CN105420363A (zh) * 2015-12-15 2016-03-23 江苏省中国科学院植物研究所 一种适用于狗牙根基因差异表达研究的cDNA-AFLP方法
ES2914396T3 (es) 2016-03-22 2022-06-10 Vib Vzw Medios y métodos de amplificación de secuencias de nucleótidos
EP4488686A3 (en) 2016-04-14 2025-04-30 Guardant Health, Inc. Methods for early detection of cancer
US11384382B2 (en) 2016-04-14 2022-07-12 Guardant Health, Inc. Methods of attaching adapters to sample nucleic acids
US11299783B2 (en) 2016-05-27 2022-04-12 Personalis, Inc. Methods and systems for genetic analysis
CN106480191A (zh) * 2016-10-20 2017-03-08 南昌大学 一种河蛏蚌f型线粒体基因组全序列扩增的方法
CN110167951A (zh) * 2016-11-15 2019-08-23 奎斯特诊断投资有限责任公司 使用mitra尖端提取检测dna突变的方法
JP2020501601A (ja) * 2016-11-15 2020-01-23 クエスト ダイアグノスティックス インヴェストメンツ エルエルシー Mitraチップ抽出を使用して嚢胞性線維症の変異を検出するための方法
WO2018183942A1 (en) 2017-03-31 2018-10-04 Grail, Inc. Improved library preparation and use thereof for sequencing-based error correction and/or variant identification
US12492430B2 (en) 2017-04-11 2025-12-09 Tecan Genomics, Inc. Library quantitation and qualification
US10995369B2 (en) * 2017-04-23 2021-05-04 Illumina, Inc. Compositions and methods for improving sample identification in indexed nucleic acid libraries
JP7056012B2 (ja) * 2017-05-19 2022-04-19 トヨタ自動車株式会社 ランダムプライマーセット、及びこれを用いたdnaライブラリーの作製方法
WO2019060716A1 (en) 2017-09-25 2019-03-28 Freenome Holdings, Inc. SAMPLE EXTRACTION METHODS AND SYSTEMS
US11099202B2 (en) 2017-10-20 2021-08-24 Tecan Genomics, Inc. Reagent delivery system
CN107589193B (zh) * 2017-10-25 2020-05-05 南京工业大学 一种利用微反应装置筛选蛋白抑制剂的方法
SG11202003885UA (en) 2017-11-08 2020-05-28 Twinstrand Biosciences Inc Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters
WO2019121603A1 (en) 2017-12-18 2019-06-27 Keygene N.V. Chemical mutagenesis of cassava
JP7047373B2 (ja) 2017-12-25 2022-04-05 トヨタ自動車株式会社 次世代シーケンサー用プライマー並びにその製造方法、次世代シーケンサー用プライマーを用いたdnaライブラリー並びにその製造方法、及びdnaライブラリーを用いたゲノムdna解析方法
WO2019164885A1 (en) * 2018-02-20 2019-08-29 William Marsh Rice University Systems and methods for allele enrichment using multiplexed blocker displacement amplification
US10801064B2 (en) 2018-05-31 2020-10-13 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
US11814750B2 (en) 2018-05-31 2023-11-14 Personalis, Inc. Compositions, methods and systems for processing or analyzing multi-species nucleic acid samples
SG11202100141SA (en) 2018-07-12 2021-02-25 Twinstrand Biosciences Inc Methods and reagents for characterizing genomic editing, clonal expansion, and associated applications
JP7418402B2 (ja) 2018-07-26 2024-01-19 レクセント バイオ, インコーポレイテッド 単一のフローセルを使用した多重シークエンシング
US11519033B2 (en) 2018-08-28 2022-12-06 10X Genomics, Inc. Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample
US20220033879A1 (en) 2018-11-28 2022-02-03 Keygene N.V. Targeted enrichment by endonuclease protection
US12385083B2 (en) 2018-12-10 2025-08-12 10X Genomics, Inc. Methods of using master / copy arrays for spatial detection
EP3899028A1 (en) * 2018-12-17 2021-10-27 Illumina, Inc. Methods and means for preparing a library for sequencing
CN111378557B (zh) 2018-12-26 2023-06-06 财团法人工业技术研究院 用于产生液珠的管状结构及液珠产生方法
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
WO2020169830A1 (en) 2019-02-21 2020-08-27 Keygene N.V. Genotyping of polyploids
EP3976820A1 (en) 2019-05-30 2022-04-06 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
NZ773619A (en) 2019-05-31 2025-07-25 Freenome Holdings Inc Methods and systems for high-depth sequencing of methylated nucleic acid
US10927409B1 (en) 2019-10-14 2021-02-23 Pioneer Hi-Bred International, Inc. Detection of sequences uniquely associated with a dna target region
EP4055610A4 (en) 2019-11-05 2023-11-29 Personalis, Inc. ESTIMATION OF TUMOR PURITY FROM SINGLE SAMPLES
EP4025711A2 (en) 2019-11-08 2022-07-13 10X Genomics, Inc. Enhancing specificity of analyte binding
JP2023505712A (ja) 2019-12-12 2023-02-10 キージーン ナムローゼ フェンノートシャップ 半固体状態での核酸操作
WO2021123062A1 (en) 2019-12-20 2021-06-24 Keygene N.V. Ngs library preparation using covalently closed nucleic acid molecule ends
WO2021133849A1 (en) 2019-12-23 2021-07-01 10X Genomics, Inc. Methods for spatial analysis using rna-templated ligation
WO2021133842A1 (en) 2019-12-23 2021-07-01 10X Genomics, Inc. Compositions and methods for using fixed biological samples in partition-based assays
US12365942B2 (en) 2020-01-13 2025-07-22 10X Genomics, Inc. Methods of decreasing background on a spatial array
US12405264B2 (en) 2020-01-17 2025-09-02 10X Genomics, Inc. Electrophoretic system and method for analyte capture
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US20210230681A1 (en) 2020-01-24 2021-07-29 10X Genomics, Inc. Methods for spatial analysis using proximity ligation
US11821035B1 (en) 2020-01-29 2023-11-21 10X Genomics, Inc. Compositions and methods of making gene expression libraries
US12076701B2 (en) 2020-01-31 2024-09-03 10X Genomics, Inc. Capturing oligonucleotides in spatial transcriptomics
US12110541B2 (en) 2020-02-03 2024-10-08 10X Genomics, Inc. Methods for preparing high-resolution spatial arrays
CN113275053A (zh) 2020-02-03 2021-08-20 帝肯基因组学公司 试剂存储系统
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
US12129516B2 (en) 2020-02-07 2024-10-29 10X Genomics, Inc. Quantitative and automated permeabilization performance evaluation for spatial transcriptomics
US12281357B1 (en) 2020-02-14 2025-04-22 10X Genomics, Inc. In situ spatial barcoding
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
US11891654B2 (en) 2020-02-24 2024-02-06 10X Genomics, Inc. Methods of making gene expression libraries
CA3178302A1 (en) 2020-03-31 2021-10-07 Freenome Holdings, Inc. Methods and systems for detecting colorectal cancer via nucleic acid methylation analysis
EP4549582A3 (en) 2020-04-22 2025-06-18 10x Genomics, Inc. Methods for spatial analysis using targeted rna depletion
EP4553168A3 (en) 2020-05-22 2025-08-27 10x Genomics, Inc. Spatial analysis to detect sequence variants
WO2021236929A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
WO2021242834A1 (en) 2020-05-26 2021-12-02 10X Genomics, Inc. Method for resetting an array
EP4025692A2 (en) 2020-06-02 2022-07-13 10X Genomics, Inc. Nucleic acid library methods
WO2021247568A1 (en) 2020-06-02 2021-12-09 10X Genomics, Inc. Spatial trancriptomics for antigen-receptors
US12031177B1 (en) 2020-06-04 2024-07-09 10X Genomics, Inc. Methods of enhancing spatial resolution of transcripts
ES2981265T3 (es) 2020-06-08 2024-10-08 10X Genomics Inc Métodos para determinar un margen quirúrgico y métodos de uso del mismo
WO2021252591A1 (en) 2020-06-10 2021-12-16 10X Genomics, Inc. Methods for determining a location of an analyte in a biological sample
EP4450639B1 (en) 2020-06-25 2025-10-15 10X Genomics, Inc. Spatial analysis of dna methylation
US12209280B1 (en) 2020-07-06 2025-01-28 10X Genomics, Inc. Methods of identifying abundance and location of an analyte in a biological sample using second strand synthesis
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US11981960B1 (en) 2020-07-06 2024-05-14 10X Genomics, Inc. Spatial analysis utilizing degradable hydrogels
US20220017956A1 (en) * 2020-07-14 2022-01-20 Accugenomics, Inc. Endogenous complexity calibration ladder target
US11981958B1 (en) 2020-08-20 2024-05-14 10X Genomics, Inc. Methods for spatial analysis using DNA capture
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
WO2022076237A1 (en) 2020-10-05 2022-04-14 Freenome Holdings, Inc. Markers for the early detection of colon cell proliferative disorders
JP2023543602A (ja) 2020-10-06 2023-10-17 キージーン ナムローゼ フェンノートシャップ 標的化された配列付加
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
WO2022112316A1 (en) 2020-11-24 2022-06-02 Keygene N.V. Targeted enrichment using nanopore selective sequencing
EP4251750A1 (en) 2020-11-25 2023-10-04 Koninklijke Nederlandse Akademie van Wetenschappen Ribosomal profiling in single cells
CA3202255A1 (en) 2020-12-21 2022-06-30 Hayley WARSINSKE Markers for the early detection of colon cell proliferative disorders
EP4121555A1 (en) 2020-12-21 2023-01-25 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
CN112695125B (zh) * 2021-01-29 2021-08-27 广东省农业科学院环境园艺研究所 一种卡特兰属ssr分子标记引物组合物及其应用
WO2022221425A1 (en) 2021-04-14 2022-10-20 10X Genomics, Inc. Methods of measuring mislocalization of an analyte
WO2022236054A1 (en) 2021-05-06 2022-11-10 10X Genomics, Inc. Methods for increasing resolution of spatial analysis
EP4582555A3 (en) 2021-06-03 2025-10-22 10X Genomics, Inc. Methods, compositions, kits, and systems for enhancing analyte capture for spatial analysis
EP4196605B1 (en) 2021-09-01 2024-12-04 10X Genomics, Inc. Methods for blocking a capture probe on a spatial array
CN113832250B (zh) * 2021-09-29 2024-06-07 石家庄博瑞迪生物技术有限公司 一种基于mSNP技术检测玉米种子纯度的混样检测方法
EP4413580A4 (en) 2021-10-05 2025-08-13 Personalis Inc PERSONALIZED TESTS FOR PERSONALIZED CANCER MONITORING
EP4419707A1 (en) 2021-11-10 2024-08-28 10X Genomics, Inc. Methods, compositions, and kits for determining the location of an analyte in a biological sample
WO2023102118A2 (en) 2021-12-01 2023-06-08 10X Genomics, Inc. Methods, compositions, and systems for improved in situ detection of analytes and spatial analysis
WO2024121354A1 (en) 2022-12-08 2024-06-13 Keygene N.V. Duplex sequencing with covalently closed dna ends
WO2024209000A1 (en) 2023-04-04 2024-10-10 Keygene N.V. Linkers for duplex sequencing

Family Cites Families (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US24939A (en) 1859-08-02 Improvement in sewing-machines
EP0124990B1 (en) 1983-04-28 1987-08-19 Flexible Steel Lacing Company Method and apparatus for riveting fasteners to a belt
WO1990008821A1 (en) 1989-01-31 1990-08-09 University Of Miami Microdissection and amplification of chromosomal dna
HU223760B1 (hu) 1991-09-24 2005-01-28 Keygene N.V. Szelektív restrikciós fragmentumsokszorosítás, általános módszer DNS-fingerprint analízisére
US20100267023A1 (en) 1992-09-24 2010-10-21 Keygene N.V. Selective restriction fragment amplification: fingerprinting
WO1995019697A1 (en) 1994-01-21 1995-07-27 North Carolina State University Methods for within family selection in woody perennials using genetic markers
EG23907A (en) * 1994-08-01 2007-12-30 Delta & Pine Land Co Control of plant gene expression
US6013445A (en) 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
EP0804618B1 (en) 1994-11-28 1999-01-27 E.I. Du Pont De Nemours And Company Compound microsatellite primers for the detection of genetic polymorphisms
US5565340A (en) 1995-01-27 1996-10-15 Clontech Laboratories, Inc. Method for suppressing DNA fragment amplification during PCR
CA2286864A1 (en) 1997-01-10 1998-07-16 Pioneer Hi-Bred International, Inc. Hybridization-based genetic amplification and analysis
US6090556A (en) 1997-04-07 2000-07-18 Japan Science & Technology Corporation Method for quantitatively determining the expression of a gene
JP2001515362A (ja) 1997-05-13 2001-09-18 ディスプレイ・システムズ・バイオテック・アクティーゼルスカブ mRNAをクローニングする方法および差次的に発現された転写物のディスプレイ(DODET)
ES2290979T3 (es) 1997-12-15 2008-02-16 Csl Behring Gmbh Cebador marcado para uso en la deteccion de acidos nucleicos diana.
CA2273616A1 (en) * 1998-06-08 1999-12-08 The Board Of Trustees Of The Leland Stanford Junior University Method for parallel screening of allelic variation
US6124201A (en) 1998-06-12 2000-09-26 Advanced Micro Devices, Inc. Method for manufacturing semiconductors with self-aligning vias
ATE236997T1 (de) 1998-07-21 2003-04-15 Keygene Nv Verbesserte primer zur aflp amplifizierung
DE69816286T2 (de) * 1998-07-29 2004-05-27 Keygene N.V. Verfahren zur Erkennung von Nukleinsäuremethylierungen durch AFLP
US6232067B1 (en) * 1998-08-17 2001-05-15 The Perkin-Elmer Corporation Adapter directed expression analysis
US6703228B1 (en) 1998-09-25 2004-03-09 Massachusetts Institute Of Technology Methods and products related to genotyping and DNA analysis
EP1001037A3 (en) 1998-09-28 2003-10-01 Whitehead Institute For Biomedical Research Pre-selection and isolation of single nucleotide polymorphisms
WO2000024939A1 (en) 1998-10-27 2000-05-04 Affymetrix, Inc. Complexity management and analysis of genomic dna
US6480791B1 (en) 1998-10-28 2002-11-12 Michael P. Strathmann Parallel methods for genomic analysis
WO2000040755A2 (en) 1999-01-06 2000-07-13 Cornell Research Foundation, Inc. Method for accelerating identification of single nucleotide polymorphisms and alignment of clones in genomic sequencing
US20040029155A1 (en) 1999-01-08 2004-02-12 Curagen Corporation Method for identifying a biomolecule
ATE247465T1 (de) 1999-01-12 2003-09-15 Quanam Medical Corp Arzneimittel und verfahren zur verabreichung von wasserunlöslichen paclitaxelderivaten
DE19911130A1 (de) 1999-03-12 2000-09-21 Hager Joerg Verfahren zur Identifikation chromosomaler Regionen und Gene
AU778438B2 (en) 1999-04-06 2004-12-02 Yale University Fixed address analysis of sequence tags
CA2366365A1 (en) 1999-04-09 2000-10-19 Keygene N.V. Method for the analysis of aflp reaction mixtures using primer exte nsion techniques
US20040031072A1 (en) 1999-05-06 2004-02-12 La Rosa Thomas J. Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement
US20020119448A1 (en) * 1999-06-23 2002-08-29 Joseph A. Sorge Methods of enriching for and identifying polymorphisms
US20030204075A9 (en) 1999-08-09 2003-10-30 The Snp Consortium Identification and mapping of single nucleotide polymorphisms in the human genome
AU7712400A (en) 1999-09-23 2001-04-24 Gene Logic, Inc. Indexing populations
US6287778B1 (en) 1999-10-19 2001-09-11 Affymetrix, Inc. Allele detection using primer extension with sequence-coded identity tags
US6958225B2 (en) 1999-10-27 2005-10-25 Affymetrix, Inc. Complexity management of genomic DNA
WO2001038572A1 (fr) 1999-11-19 2001-05-31 Takara Bio Inc. Methode d'amplification d'acides nucleiques
AU2001253063A1 (en) 2000-03-31 2001-10-15 Fred Hutchinson Cancer Research Center Reverse genetic strategy for identifying functional mutations in genes of known sequence
US20110131679A2 (en) 2000-04-19 2011-06-02 Thomas La Rosa Rice Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
WO2001088189A2 (en) 2000-05-15 2001-11-22 Keygene N.V. Microsatellite-aflp®
US7300751B2 (en) 2000-06-30 2007-11-27 Syngenta Participations Ag Method for identification of genetic markers
GB0016742D0 (en) 2000-07-10 2000-08-30 Simeg Limited Diagnostic method
US6858412B2 (en) 2000-10-24 2005-02-22 The Board Of Trustees Of The Leland Stanford Junior University Direct multiplex characterization of genomic DNA
CN100351393C (zh) * 2001-02-15 2007-11-28 宝生物工程株式会社 核苷酸多态性的检测方法
US7141364B1 (en) 2001-03-29 2006-11-28 Council Of Scientific And Industrial Research Universal primers for wildlife identification
US20040053236A1 (en) 2001-03-30 2004-03-18 Mccallum Claire M. Reverse genetic strategy for identifying functional mutations in genes of known sequences
WO2002083911A1 (en) 2001-04-12 2002-10-24 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Production of plants with increased tolerance to drought stress or with increased transpiration
EP1386005A1 (en) 2001-04-20 2004-02-04 Karolinska Innovations AB Methods for high throughput genome analysis using restriction site tagged microarrays
JP2005520484A (ja) 2001-07-06 2005-07-14 454 コーポレイション 多孔性フィルターを使用し、独立した並行する化学的微量反応を隔離するための方法
AU2002323509A1 (en) 2001-08-30 2003-03-18 Purdue Research Foundation Methods to produce transgenic plants resistant to osmotic stress
EP1288301A1 (en) 2001-08-31 2003-03-05 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Berlin Plant-derived resistance gene
US6902921B2 (en) 2001-10-30 2005-06-07 454 Corporation Sulfurylase-luciferase fusion proteins and thermostable sulfurylase
US7504222B2 (en) * 2001-10-31 2009-03-17 Millennium Pharmaceuticals, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of breast cancer
CA2498668C (en) 2002-03-27 2012-05-08 Agrinomics Llc Generation of plants with improved drought tolerance
US6815167B2 (en) 2002-04-25 2004-11-09 Geneohm Sciences Amplification of DNA to produce single-stranded product of defined sequence and length
US20070065816A1 (en) 2002-05-17 2007-03-22 Affymetrix, Inc. Methods for genotyping
US7108976B2 (en) 2002-06-17 2006-09-19 Affymetrix, Inc. Complexity management of genomic DNA by locus specific amplification
AU2003243720A1 (en) 2002-06-21 2004-01-06 Bayer Bioscience N.V. Method for detecting foreign dna in a host genome
AU2003260790A1 (en) * 2002-09-05 2004-03-29 Plant Bioscience Limited Genome partitioning
US20040157238A1 (en) 2002-09-20 2004-08-12 Quinn John J. Method for detection of multiple nucleic acid sequence variations
AU2003297541A1 (en) 2002-12-18 2004-07-14 Third Wave Technologies, Inc. Detection of small nucleic acids
JP2004208586A (ja) 2002-12-27 2004-07-29 Wakunaga Pharmaceut Co Ltd Hlaの検出
WO2004063323A2 (en) 2003-01-10 2004-07-29 Keygene N.V. Aflp-based method for integrating physical and genetic maps
US7575865B2 (en) * 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
CA2513535C (en) 2003-01-29 2012-06-12 454 Corporation Bead emulsion nucleic acid amplification
JP4691014B2 (ja) 2003-02-26 2011-06-01 カリダ ゲノミクス,インコーポレーテッド ハイブリダイゼーションによるランダムアレイdna分析
JP4888876B2 (ja) 2003-06-13 2012-02-29 田平 武 アルツハイマー病の治療のための組換えアデノ随伴ウィルスベクター
DE602004032374D1 (de) 2003-06-24 2011-06-01 Agrigenetics Inc Erzeugung von pflanzen mit verbesserter toleranz gegenüber trockenheit
US7754945B2 (en) 2003-06-24 2010-07-13 Agrigenetics Inc. Generation of plants with improved drought tolerance
US7051935B2 (en) 2003-07-28 2006-05-30 Imageid Ltd. Color calibration for color bar codes
WO2005026686A2 (en) 2003-09-09 2005-03-24 Compass Genetics, Llc Multiplexed analytical platform
EP2302062A1 (en) 2003-10-20 2011-03-30 CropDesign N.V. Identification of E2F target genes and uses thereof
CA2543786A1 (en) 2003-10-24 2005-05-06 Mmi Genomics, Inc. Methods and systems for inferring traits to manage non-beef livestock
JP2007525571A (ja) 2004-01-07 2007-09-06 ソレクサ リミテッド 修飾分子アレイ
US20050233354A1 (en) 2004-01-22 2005-10-20 Affymetrix, Inc. Genotyping degraded or mitochandrial DNA samples
EP1713936B1 (en) 2004-02-12 2009-12-09 Population Genetics Technologies Ltd Corporation of Great Britain Genetic analysis by sequence-specific sorting
EP1721014B1 (en) 2004-02-18 2013-07-17 Trustees Of Boston University Method for detecting and quantifying rare mutations/polymorphisms
EP1574585A1 (en) * 2004-03-12 2005-09-14 Plant Research International B.V. Method for selective amplification of DNA fragments for genetic fingerprinting
US20090042183A1 (en) * 2004-07-28 2009-02-12 Hirsch Ann M Use of pcr-based techniques to analyze compositions of botanicals
JP4809594B2 (ja) 2004-08-02 2011-11-09 東京エレクトロン株式会社 検査装置
FR2876479B1 (fr) 2004-10-11 2006-12-15 Parkeon Machine a pieces a receptacle de pieces de monnaie amovible
US7220549B2 (en) 2004-12-30 2007-05-22 Helicos Biosciences Corporation Stabilizing a nucleic acid for nucleic acid sequencing
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
US7407757B2 (en) 2005-02-10 2008-08-05 Population Genetics Technologies Genetic analysis by sequence-specific sorting
US9365893B2 (en) 2005-05-10 2016-06-14 State Of Oregon Acting By And Through The State Board Of Higher Education On Behalf Of The University Of Oregon Methods of mapping polymorphisms and polymorphism microarrays
EP1907571B1 (en) 2005-06-15 2017-04-26 Complete Genomics Inc. Nucleic acid analysis by random mixtures of non-overlapping fragments
WO2006137733A1 (en) 2005-06-23 2006-12-28 Keygene N.V. Strategies for high throughput identification and detection of polymorphisms
CA2613248A1 (en) 2005-06-23 2006-12-28 Keygene N.V. Improved strategies for sequencing complex genomes using high throughput sequencing technologies
US20070020640A1 (en) 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
AU2006295556B2 (en) 2005-09-29 2012-07-05 Keygene N.V. High throughput screening of mutagenized populations
US10316364B2 (en) 2005-09-29 2019-06-11 Keygene N.V. Method for identifying the source of an amplicon
US8071310B2 (en) 2005-11-14 2011-12-06 Keygene Nv Method for the high throughput screening of transposon tagging populations and massive parallel sequence identification of insertion sites
DK3404114T3 (da) * 2005-12-22 2021-06-28 Keygene Nv Fremgangsmåde til detektering af AFLP-baseret polymorfisme med højt gennemløb
US7537897B2 (en) 2006-01-23 2009-05-26 Population Genetics Technologies, Ltd. Molecular counting
WO2007114693A2 (en) 2006-04-04 2007-10-11 Keygene N.V. High throughput detection of molecular markers based on aflp and high throughput sequencing
US8362325B2 (en) 2007-10-03 2013-01-29 Ceres, Inc. Nucleotide sequences and corresponding polypeptides conferring modulated plant characteristics
US20090124758A1 (en) 2007-11-09 2009-05-14 Bridgestone Sports Co., Ltd. Golf ball
US20140051585A1 (en) * 2012-08-15 2014-02-20 Natera, Inc. Methods and compositions for reducing genetic library contamination
WO2014196863A1 (en) 2013-06-07 2014-12-11 Keygene N.V. Method for targeted sequencing

Also Published As

Publication number Publication date
US9023768B2 (en) 2015-05-05
US9447459B2 (en) 2016-09-20
CN105039313B (zh) 2018-10-23
ES2387878T3 (es) 2012-10-03
US10095832B2 (en) 2018-10-09
ATE491045T1 (de) 2010-12-15
US9898576B2 (en) 2018-02-20
EP1910562A1 (en) 2008-04-16
US20090036323A1 (en) 2009-02-05
US20180247017A1 (en) 2018-08-30
US20140274744A1 (en) 2014-09-18
CN102925561A (zh) 2013-02-13
CN101641449A (zh) 2010-02-03
US20170206314A1 (en) 2017-07-20
ATE557105T1 (de) 2012-05-15
US20170137872A1 (en) 2017-05-18
DK2292788T3 (da) 2012-07-23
CN102925561B (zh) 2015-09-09
US20140213462A1 (en) 2014-07-31
DE602006018744D1 (de) 2011-01-20
US9493820B2 (en) 2016-11-15
US20150232924A1 (en) 2015-08-20
US20180137241A1 (en) 2018-05-17
US10978175B2 (en) 2021-04-13
EP2302070B1 (en) 2012-08-22
US20120316073A1 (en) 2012-12-13
WO2006137733A1 (en) 2006-12-28
US9453256B2 (en) 2016-09-27
EP2292788B1 (en) 2012-05-09
US10235494B2 (en) 2019-03-19
US8685889B2 (en) 2014-04-01
JP2008546404A (ja) 2008-12-25
US9376716B2 (en) 2016-06-28
US20180025111A1 (en) 2018-01-25
CN101641449B (zh) 2014-01-29
EP1910562B1 (en) 2010-12-08
US20200185056A1 (en) 2020-06-11
US20210202035A1 (en) 2021-07-01
EP2292788A1 (en) 2011-03-09
JP5823994B2 (ja) 2015-11-25
US9898577B2 (en) 2018-02-20
JP2013063095A (ja) 2013-04-11
JP5220597B2 (ja) 2013-06-26
EP2302070A2 (en) 2011-03-30
EP2302070A3 (en) 2011-06-22
US8785353B2 (en) 2014-07-22
DK2302070T3 (da) 2012-11-26
US9896721B2 (en) 2018-02-20
CN105039313A (zh) 2015-11-11
US20160060686A1 (en) 2016-03-03
US20190147977A1 (en) 2019-05-16
US20160145689A1 (en) 2016-05-26

Similar Documents

Publication Publication Date Title
ES2393318T3 (es) Estrategias para la identificación y detección de alto rendimiento de polimorfismos
ES2357549T3 (es) Estrategias para la identificación y detección de alto rendimiento de polimorfismos.
ES2882401T3 (es) Método de detección de polimorfismos basado en AFLP de alto rendimiento
HK1200497B (en) Method for high-throughput aflp-based polymorphism detection