ES2738176A1 - Metodo para el estudio de mutaciones en embriones en procesos de reproduccion in vitro - Google Patents
Metodo para el estudio de mutaciones en embriones en procesos de reproduccion in vitro Download PDFInfo
- Publication number
- ES2738176A1 ES2738176A1 ES201830731A ES201830731A ES2738176A1 ES 2738176 A1 ES2738176 A1 ES 2738176A1 ES 201830731 A ES201830731 A ES 201830731A ES 201830731 A ES201830731 A ES 201830731A ES 2738176 A1 ES2738176 A1 ES 2738176A1
- Authority
- ES
- Spain
- Prior art keywords
- snps
- snp
- study
- embryos
- dgp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 106
- 230000008569 process Effects 0.000 title claims abstract description 34
- 230000035772 mutation Effects 0.000 title claims abstract description 33
- 238000000338 in vitro Methods 0.000 title claims abstract description 11
- 210000001161 mammalian embryo Anatomy 0.000 title claims description 23
- 210000002257 embryonic structure Anatomy 0.000 claims abstract description 52
- 208000036878 aneuploidy Diseases 0.000 claims abstract description 14
- 231100001075 aneuploidy Toxicity 0.000 claims abstract description 13
- 238000001514 detection method Methods 0.000 claims abstract description 12
- 208000024556 Mendelian disease Diseases 0.000 claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims abstract description 10
- 230000002759 chromosomal effect Effects 0.000 claims abstract description 9
- 238000010200 validation analysis Methods 0.000 claims abstract description 9
- 108700028369 Alleles Proteins 0.000 claims description 38
- 239000002773 nucleotide Substances 0.000 claims description 6
- 125000003729 nucleotide group Chemical group 0.000 claims description 6
- 102000054766 genetic haplotypes Human genes 0.000 claims description 5
- 108090000623 proteins and genes Proteins 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 claims description 2
- 239000000377 silicon dioxide Substances 0.000 claims description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 34
- 238000004458 analytical method Methods 0.000 description 29
- 238000012163 sequencing technique Methods 0.000 description 21
- 230000003321 amplification Effects 0.000 description 11
- 238000003199 nucleic acid amplification method Methods 0.000 description 11
- 238000001574 biopsy Methods 0.000 description 10
- 230000004075 alteration Effects 0.000 description 9
- 210000000349 chromosome Anatomy 0.000 description 9
- 208000026487 Triploidy Diseases 0.000 description 8
- 238000013461 design Methods 0.000 description 7
- 238000003745 diagnosis Methods 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 238000005215 recombination Methods 0.000 description 7
- 230000006798 recombination Effects 0.000 description 7
- 238000002493 microarray Methods 0.000 description 5
- 238000003752 polymerase chain reaction Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000005945 translocation Effects 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000004720 fertilization Effects 0.000 description 3
- 230000001717 pathogenic effect Effects 0.000 description 3
- 230000001575 pathological effect Effects 0.000 description 3
- 230000007170 pathology Effects 0.000 description 3
- 208000037280 Trisomy Diseases 0.000 description 2
- 238000007622 bioinformatic analysis Methods 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000000126 in silico method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 210000000287 oocyte Anatomy 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000005204 segregation Methods 0.000 description 2
- 208000011580 syndromic disease Diseases 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 101150078156 Cep290 gene Proteins 0.000 description 1
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 1
- 208000031404 Chromosome Aberrations Diseases 0.000 description 1
- 101000690100 Homo sapiens U1 small nuclear ribonucleoprotein 70 kDa Proteins 0.000 description 1
- 201000008643 Meckel syndrome Diseases 0.000 description 1
- 108091092878 Microsatellite Proteins 0.000 description 1
- 206010068052 Mosaicism Diseases 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 101100029173 Phaeosphaeria nodorum (strain SN15 / ATCC MYA-4574 / FGSC 10173) SNP2 gene Proteins 0.000 description 1
- 102100030852 Run domain Beclin-1-interacting and cysteine-rich domain-containing protein Human genes 0.000 description 1
- 101710179516 Run domain Beclin-1-interacting and cysteine-rich domain-containing protein Proteins 0.000 description 1
- 101150081851 SMN1 gene Proteins 0.000 description 1
- 101100094821 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SMX2 gene Proteins 0.000 description 1
- 102100024121 U1 small nuclear ribonucleoprotein 70 kDa Human genes 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 206010000210 abortion Diseases 0.000 description 1
- 231100000176 abortion Toxicity 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000003322 aneuploid effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000002459 blastocyst Anatomy 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 210000003754 fetus Anatomy 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000021121 meiosis Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000000394 mitotic effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 102200089581 rs5030804 Human genes 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 210000003765 sex chromosome Anatomy 0.000 description 1
- 208000000995 spontaneous abortion Diseases 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 230000002747 voluntary effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1072—Differential gene expression library synthesis, e.g. subtracted libraries, differential screening
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Método para el estudio de mutaciones en embriones en procesos de reproducción in vitro con la particularidad de que combina las técnicas de detección de Aneuploidía (DPG-A) y el estudio de enfermedades monogénicas en embriones (DGP-M) y que se comprende, un proceso de selección de SNPs donde se toma como entrada los valores de unos n SNPs candidatos (t1 ... tk) de cada individuo x, en una región cromosómica de interés y específicamente extraídos para una población objeto de estudio; un proceso de selección se SNPs se evalúan todas las combinaciones de SNPs para obtener un set t mínimo de tagSNPs a partir de la matriz M obtenida en el primer proceso de selección se SNPs; y un proceso de validación in-sílico del panel de tagSNPs obtenido en el segundo proceso.
Description
DESCRIPCIÓN
MÉTODO PARA EL ESTUDIO DE MUTACIONES EN EMBRIONES EN PROCESOS DE
REPRODUCCIÓN IN VITRO
El objeto de la presente invención es un método para el estudio de mutaciones en embriones en procesos de reproducción in vitro con la particularidad de que combina las técnicas de detección de Aneuploidía (DPG-A) y el estudio de enfermedades monogénicas en embriones (DGP-M) de acuerdo con la reivindicación 1.
CAMPO DE LA TÉCNICA
La presente invención está referida a un método para el estudio de mutaciones en embriones de parejas sometidas a ciclos de reproducción in vitro mediante análisis de SNP (polimorfismos de nucleótido único) por secuenciación masiva que combine la detección de Aneuploidías (DGP-A Diagnóstico Genético Preimplantacional de Aneuploidías) y el estudio de enfermedades monogénicas en embriones (DGP-M, Diagnóstico Genético Preimplantacional para enfermedades Monogénicas) con una única biopsia.
ESTADO DE LA TÉCNICA ANTERIOR
Un polimorfismo de nucleótido único o SNP es una variación en la secuencia de ADN que afecta a una sola base (adenina (A), timina (T), citosina (C) o guanina (G)) de una secuencia del genoma.
El diagnóstico genético preimplantacional (DGP) se desarrolló en la década de los 80 del siglo XX como una opción para aquellas parejas que estaban en riesgo de tener un hijo afectado por una enfermedad monogénica o una alteración cromosómica determinada y que querían evitar la posibilidad de requerir una terminación voluntaria del embarazo.
El DGP consiste en la realización de una biopsia de una o más células de los embriones generados durante un ciclo de fecundación in vitro cuando los embriones tienen entre 3 y 5 días, para utilizar dicho material en la elaboración de un diagnóstico genético. Así pues, sólo aquellos embriones diagnosticados como no afectados por una determinada alteración genética son transferidos para poder engendrar un niño sano.
Cabe destacar que el DGP tiene dos características que lo diferencian del diagnóstico genético aplicado a cualquier otro ámbito. En primer lugar, el tiempo de respuesta debe ser mucho menor, dado que, en muchas ocasiones, es necesario obtener resultados en menos de 24 horas para permitir la transferencia de embriones en el mismo ciclo. Así, por ejemplo, un embrión biopsiado en el día 3 debe ser transferido o vitrificado en el día 5 ó 6. Por otro lado, normalmente, cada pareja produce una media de 6 a 10 embriones, por lo que el coste del análisis debe ser bajo para poder analizar todos los embriones y que esto no suponga un incremento sustancial de lo que ya cuesta de por sí un ciclo de reproducción in vitro.
Debido a lo anterior, el DGP se realiza utilizando múltiples y variadas técnicas, dependiendo de la naturaleza de la alteración estudiada. Tradicionalmente, para las enfermedades monogénicas se utilizaban métodos basados en la reacción en cadena de la polimerasa (PCR) y análisis de fragmentos y, más recientemente, sistemas como el Karyomapping basado en la utilización de microarrays aplicados a la detección de SNP (por ejemplo, como se describe en el documento ES2360085T3). Aunque se trata de métodos muy diversos, todos ellos tienen características en común:
En primer lugar, requieren de una amplificación previa. En este caso se trabaja con muy poco material genético de partida -en muchas ocasiones, procedente de una única célula- por lo que es necesario amplificarlo. Para ello, tradicionalmente, se utiliza un método conocido como MDA (Múltiple Displacement Amplification) que amplifica el material genético gracias a la polimerasa Phi29 a temperatura constante. Este método produce fragmentos de ADN largos con una baja tasa de error.
En segundo lugar, tienen una alta tasa de Allele-Drop-Out (ADO). El ADO es un artefacto frecuente en este tipo de análisis -sobre un 5% de los análisis lo tienen- que consiste en la amplificación preferencial de uno de los alelos. Por este motivo, si al realizar un análisis no se detecta mutación, cabe la posibilidad de que se deba a que el alelo mutado no se ha amplificado.
En tercer lugar, se realiza un análisis indirecto. Como consecuencia de lo anterior, siempre se hace un análisis indirecto de la mutación. Este análisis consiste en estudiar una serie de polimorfismos alrededor de la mutación -generalmente STR o Short Tandem Repeats- y determinar si los polimorfismos presentes en el embrión son los asociados al alelo patológico o al alelo sano, es decir, se realiza un análisis de ligamiento.
En cuarto lugar, requieren de un estudio de informatividad previo. Para poder determinar qué polimorfismos segregan con el alelo sano y cuáles con el patológico, es necesario realizar un estudio de informatividad previo. Este estudio consiste en analizar de 5 a 10 STR cercanos a la mutación -situados a ambos lados- en la pareja y en otros miembros de la familia. Idealmente, un hijo en común con la mutación, o bien padres y madres de la pareja. Así, por ejemplo, si se puede asociar que un número determinado de repeticiones de un STR concreto esté siempre presente en familiares con la mutación patogénica, se podrá asociar dicho polimorfismo al alelo patológico y descartar aquellos embriones que lo posean.
Finalmente, el análisis directo de la mutación no siempre es posible. Siempre que sea posible, se realiza el análisis directo de la mutación de los embriones, generalmente, mediante mini secuenciación. Sin embargo, esto sólo es posible si se trata de una mutación puntual. Con este tipo de técnicas, no es posible detectar otro tipo de alteraciones, como deleciones. Por su parte, Karyomapping no es capaz de detectar la mutación directa en ningún caso.
Recientemente, la secuenciación masiva (NGS) se ha incorporado como técnica al DGP -como se describe en los documentos US20140274741, WO2014082032, US20150038337 o EP2947156-. No obstante, en el estado de la técnica sólo se describe su aplicación a la detección de aneuploidías (DGP-A).
Si bien la tecnología ha ido evolucionando en el perfeccionamiento de estas técnicas de DGP, existen actualmente ciertas limitaciones en la técnica de análisis. Las principales técnicas y sus limitaciones en DGP son:
Microarray CGH (Hibridación Genómica Comparativa). Esta técnica se utiliza para la detección de aneuploidías (DGP-A) y de alteraciones desbalanceadas cuando uno de los padres es portador de una alteración balanceada. Las principales limitaciones de la técnica son:
Se trata de una técnica cara, de forma que muchas de las parejas que realmente se beneficiarían de ella -por ejemplo, madres de edad avanzada, dado que un número alto de sus ovocitos serán aneuploides- no pueden optar a ellas.
Se utiliza un método de amplificación basado en PCR, que tiene un porcentaje de ADO mucho mayor que los métodos basados en MDA, lo que dificulta la integración con técnicas para el estudio de enfermedades monogénicas, como se ha indicado anteriormente.
Requiere un equipamiento específico, tal como un escáner de microarrays.
No permite el análisis de mutaciones, por lo que no puede ser utilizado para seleccionar embriones libres de patología genética, cuando los padres son portadores.
No permite distinguir entre embriones normales y aquellos que portan una translocación balanceada.
No permite identificar aquellos embriones que portan anomalías numéricas en mosaico.
Mini secuenciación. Se utiliza para la detección directa de una mutación específica en el estudio de enfermedades monogénicas en embriones (DGP-M). Las principales limitaciones son:
Requiere el diseño de oligos específicos en una región muy concreta, lo que puede dificultar el análisis.
Requiere amplificación previa mediante MDA, por lo que no es fácilmente combinable con técnicas para el cribado de aneuploidías.
Se necesita conocimiento previo de la mutación a analizar, y de un proceso largo de puesta a punto.
Requiere de un secuenciador capilar.
No permite detectar anomalías estructurales de ningún tipo.
Sólo es útil en el caso de mutaciones puntuales.
Análisis de fragmentos. Se usa sólo o en conjunto con el anterior, para hacer el estudio indirecto de las patologías, por lo que las limitaciones son las mismas que en el caso de la mini-secuenciación, además de:
Requiere el diseño de oligos específicos marcados fluorescentemente para diseñar el estudio de informatividad previo.
En ocasiones, el estudio de informatividad se puede alargar debido a la dificultad de encontrar STRs informativos.
Karyomapping. Es una técnica que analiza mediante microarray miles de polimorfismos, aunando el análisis de aneuploidías y el estudio de enfermedades monogénicas. La gran ventaja, es que el mismo microarray sirve para analizar distintas patologías. Sus limitaciones son las siguientes:
Aunque detecta aneuploidías, no es capaz de detectar errores mitóticos, lo que supone que no es capaz de determinar la presencia de mosaicismo.
Requiere de muestras en trío (padre, madre y niño previo afecto) para determinar la segregación de los alelos. Esto es debido a que únicamente hace estudio indirecto.
No es posible detectar la mutación en sí misma en ningún caso, con lo que el riesgo de recombinación nunca queda excluido.
Es cara.
El protocolo es largo, no pudiéndose utilizar para ciclos con transferencia en fresco.
El documento ES2360085T3 describe que el análisis cromosómico por cariotipado molecular (por ejemplo, para la detección de trisomía) se puede llevar a cabo usando un análisis de marcadores bialélicos del genoma completo (p. ej., polimorfismos de nucleótido único (SNP) bialélicos) que están distribuidos por el genoma, y que se pueden detectar fácilmente usando tecnologías existentes. Este descubrimiento es inesperado por varias razones, principalmente porque a priori se supondría que un marcador bialélico (que proporciona solo
información binaria en una posición dada en el cromosoma) no podría identificar positivamente la presencia de tres o más cromosomas diferentes.
No obstante, este documento realiza un análisis de alta densidad de SNP adyacentes cercanos es capaz de identificar positivamente, entre otros, la presencia de dos cromosomas derivados de un progenitor y que basado en suposiciones bien establecidas sobre la frecuencia y espaciado de sucesos de recombinación entre cromosomas parentales durante la meiosis, esto permitirá la detección precisa de trisomía. Además, se identifica en cada caso el origen parental del error, lo cual no es posible mediante algunos procedimientos de cariotipado.
Sin embargo, todavía no se ha podido establecer con éxito un método rápido, eficaz y económico que permita combinar DGP-A y DGP-M con una única biopsia. Por tanto, el avance de la técnica va en el sentido del perfeccionamiento de las herramientas DGP-A y DGP-M con una única biopsia mediante secuenciación masiva, línea principal en el desarrollo del presente proyecto.
EXPLICACIÓN DE LA INVENCIÓN
Es un objeto de la presente invención un método que combine técnicas DGP-A y DGP-M con una única biopsia mediante secuenciación masiva. Este objeto se alcanza con el método de la reivindicación 1. En las reivindicaciones dependientes se muestran realizaciones particulares del método de la invención. En otros aspectos se reivindica el kit que incluye un dispositivo electrónico que ejecuta el método de la invención así como el producto de software que contiene las instrucciones ejecutables para llevar a cabo el método de la presente invención.
Para la combinación de ambas técnicas, primero se realiza la preparación de una librería para DGP-A. En la preparación de esta librería se puede utilizar cualquier kit comercial disponible. como, por ejemplo, Ion Reproseq (ThermoFisher), PicoPlex (Rubicon Genomics), Veríseq (Illumina) y Repli-G (Qiagen).
Posteriormente, se toma una alícuota de ese ADN amplificado, y se aplica un método para enriquecer los SNPs que sean interesantes. Preferentemente, este método está basado en amplificación multiplex, pero también se pueden utilizar métodos de captura, PCR simple, o cualquier otro. Tras la amplificación de las regiones de interés, se procede a la preparación
de librerías, añadiendo los adaptadores y códigos de barras necesarios. Así, se tendrá la librería para DGP-M.
Finalmente, tras la cuantificación de ambas librerías, se combinan en unas proporciones determinadas, y se prosigue con el protocolo estándar de secuenciación para la plataforma elegida. Como se utilizan métodos de preparación de librerías diferentes para ambos procesos, cada uno de ellos con su código de barras, el secuenciador arroja los resultados de DGP-A y DGP-M por separado. Así, el análisis se realiza de manera independiente para DGP-A, utilizando la solución apropiada según el método de preparación de librería y secuenciador seleccionado, mientras que el análisis de DGP-M se realiza haciendo un fasado de SNPs, como se describe posteriormente.
Este protocolo, es más rápido que otras tecnologías como Karyomapping (ES2360085T3) porque sólo añade cuatro horas (tiempo de preparación de la librería de DGP-M) al proceso global de DGP-A mediante secuenciación masiva. De esta manera, si se emplea, por ejemplo, la combinación de Ion Rerproseq para DGP-A junto con el método de la invención, el proceso completo se puede realizar en menos de doce horas, siendo, por tanto, un método ideal para realizar biopsia en D-3 y transferencia en D-5, pero también para biopsia en D-5 y transferencia en D-6 y, obviamente, para ciclos con transferencia en diferido debido a que en el protocolo existen múltiples pasos donde se puede parar.
Este método es también más económico que los métodos basados en cariotipado o cariomapeado (ES2360085T3) porque el precio depende del coste de la preparación de librería para DGP-A. Además, es adaptable al número de muestras que se tenga para analizar, mientras que en el cariomapeado se utiliza un slide de 12 arrays, por lo que el número de muestras debe ser múltiplo de 12 para maximizar resultados.
Por ejemplo, se puede preparar una librería para DGP-A utilizando Ion Reproseq. Si la pareja tiene, por ejemplo, 8 embriones, se habrán preparado 8 librerías diferentes con los códigos de barras correspondientes, del 1 al 8. Tras esta librería, se toma una alícuota y se amplifican los polimorfismos correspondientes. Si la pareja es portadora, por ejemplo, de mutaciones en el gen SMN1, se utilizará un kit que amplifica determinados polimorfismos alrededor de esa mutación. Tras la amplificación, se preparará la librería utilizando el método correspondiente. Un método podría ser amplificación mediante PCR multiplex utilizando Ampliseq, con su correspondiente kit de preparación de librería, y añadiendo unos códigos de barras distintos a los anteriores (por ejemplo, del 9 al 16). Se cuantifican ambas
librerías, y se mezclan en una proporción 3:1, es decir, tres veces más librería DGP-A que librería DGP-M. Tras la cuantificación, si el método de secuenciación seleccionado es, por ejemplo, Ion PGM, se procede a la preparación de la secuenciación y a la secuenciación en sí misma, utilizando el protocolo estándar del fabricante del equipo. Una vez finalizada la secuenciación, el secuenciador nos arrojará 16 ficheros, 8 para la librería DGP-A y 8 para DGP-M. Los ficheros para DGP-A se analizarán utilizando el software del fabricante del equipo, o cualquier otra solución. Para el análisis DGP-M se realizará el fasado de SNPs utilizando el software que se propone en la presente invención. La FIG. 1 muestra un esquema de todo el proceso.
Gracias al método así descrito es posible la combinación de técnicas DGP-A y DGP-M mediante secuenciación masiva. Además, es considerablemente más rápido que las tecnologías basadas en cariotipado o cariomapeado (Karyomapping) además de resultar más económico.
A lo largo de la descripción y de las reivindicaciones, la palabra «comprende» y sus variantes no pretenden excluir otras características técnicas, aditivos, componentes o pasos. Para los expertos en la materia, otros objetos, ventajas y características de la invención se desprenderán en parte de la invención y en parte de la práctica de la invención. Los siguientes ejemplos y dibujos se proporcionan a modo de ilustración y no se pretende que restrinjan la presente invención. Además, la invención cubre todas las posibles combinaciones de realizaciones particulares y preferidas aquí indicadas.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
A continuación, se pasa a describir de manera muy breve una serie de dibujos que ayudan a comprender mejor la invención y que se relacionan expresamente con una realización de dicha invención, que se ilustra como un ejemplo no limitativo de ésta.
La FIG.1 muestra un esquema del método objeto de la presente invención. En primer lugar, se analiza el gen con la mutación a descartar en los embriones y se selecciona una región alrededor (típicamente, de 4 Mb). Se seleccionan aquellos polimorfismos que no cumplen ningún criterio de exclusión, y se buscan aquellos con mayor probabilidad de ser informativos. Por otro lado, se identifican aquellos polimorfismos que pueden ser tag mediante análisis de correlación y desequilibrio de ligamiento. Con ambas cosas, se realiza
un diseño final de panel, y se hace una validación in silico simulando entrecruzamientos entre multitud de individuos cuyos genomas se encuentran depositados en bases de datos públicas.
La FIG.2 muestra un esquema de todo el proceso, incluyendo el método de la invención, para un primer ejemplo de uso, empezando por el diseño y síntesis del panel que luego se utilizará para la amplificación de la librería para DGP-M. Por un lado, los pacientes y otros familiares son analizados para determinar la distribución de los polimorfismos en los distintos alelos. En cuanto a las muestras de los embriones, tras la biopsia, se prepara la librería para DGP-A, y con una alícuota de esta se prepara la librería para DGP-M. Se cuantifican y mezclan todas las librerías, y se procede a la secuenciación. Finalmente, se realiza el análisis bioinformático de aneuploidías y de la enfermedad monogénica, de manera independiente.
La FIG.3 muestra un ejemplo de fasado de SNPs, en el caso de un trío formado por la pareja y un hijo afecto. Se muestran los SNPs antes y después de fasar, con la distribución de los mismos en los alelos. Además, se señala cuáles son informativos (dan información sobre la fase) y cuáles no.
La FIG.4 muestra un ejemplo de fasado de SNPs con análisis de resultados en embriones. Para simplificar, se muestran sólo aquellos SNPs que son informativos. En este caso, la pareja es portadora de mutaciones en heterocigosis en el gen CEP290, que provoca síndrome de Meckel. Este síndrome es letal prenatal, por lo que para el fasado se utilizó ADN de un feto anterior. En este caso, el panel se diseñó incluyendo el análisis directo de la mutación, que aparece sombreada.
La FIG.5 muestra el resultado del fasado de SNPs en un embrión, donde aparecen distintos problemas y artefactos, junto con la descripción de estos. El algoritmo de fasado desarrollado permite detectar estos errores.
La FIG.6 muestra un ejemplo de una pareja con una translocación balanceada, y los embriones que como consecuencia se pueden generar. El 50% de estos embriones pueden heredar una alteración desbalanceada con graves consecuencias (desde abortos de repetición hasta niños con retraso metal y rasgos dismórficos). El 25% de los embriones serán normales, y el otro 25% tendrán la alteración balanceada como uno de los progenitores.
EXPLICACIÓN DE UN MODO DETALLADO DE REALIZACIÓN DE LA INVENCIÓN
El método para el estudio de mutaciones en embriones en procesos de reproducción in vitro,
objeto de la presente invención puede dividirse, a su vez, en tres procesos secuenciales y diferenciados. El método de la invención combina varias técnicas de selección de tagSNPs,
pues calcula las correlaciones de desequilibrio de ligamiento para el bloque de interés (por defecto, 4 Mb alrededor de la mutación, 1 Mb es igual a un millón de nucleótidos). Los SNPs
de esa región, a su vez, serán considerados como en un enfoque libre de bloques, de
manera que todas las correlaciones entre SNPs son calculadas y tenidas en cuenta en la selección de los tagSNPs. De esta forma la presente invención selecciona polimorfismos
con alta probabilidad de ser informativos, considerando las frecuencias alélicas de los
mismos dentro de la población objetivo y si forman parte o no de un mismo haploboque
(conjunto de SNPs que se heredan juntos). Un tagSNP es aquel SNP que se considera representativo para todo el haplobloque, es decir, que si el tagSNP está en heterocigosis,
por ejemplo, todo los SNPs pertenecientes a ese mismo haplobloque estarán en heterocigosis. Un tagSNP evita tener que analizar todos los polimorfismos porque conociendo cómo se comporta, se puede deducir cómo lo hace el resto de polimorfimos del haplobloque.
Por lo tanto, el objetivo del método de la invención (FIG.1) se centra en la obtención de un
panel mínimo de tagSNPs con máxima capacidad informativa, simplificando el posterior
análisis e interpretación de los resultados de un análisis de informatividad.
Más concretamente, el método de la invención comprende se divide en dos procesos
básicos y un tercer proceso de validación. Los dos primeros procesos no tienen porqué ser, necesariamente, en este orden:
(i) Un primer proceso de selección de SNPs:
a. En este proceso se toma como entrada los valores de los n SNPs candidat (t1 ... tk) de cada individuo x, en una región cromosómica de interés y específicamente extraídos para la población objeto de estudio. Se seleccionan aquellos SNPS que son bialélicos, por lo que los individuos pueden ser representados como haplotipos de longitud m formados por cadenas binarias {1,0}, siendo 1|0 y 0|1 los valores para SNPs heterocigotos y 0|0 y 1|1 los valores para los homocigotos. Esto se realiza en toda la región cromosómica de interés que queda definida como toda posición que se
encuentre 2 Mb (es un valor por defecto que es posible modificar) aguas arriba y 2 Mb aguas abajo del gen/mutación que se desee estudiar. b. Tras la obtención, se analizan los n SNPs candidatos de la región y se excluyen aquellos que cumplan alguna de las siguientes condiciones: i. SNPs con más de un alelo alternativo (SNPs no bialélicos) ii. SNPs cuyos alelos sean diferentes al cambio de un nucleótido simple (indels, cambios de patrón de polinucleótidos, entre otros)
iii. SNPs que se encuentren en homocigosis en al menos el 99% de la población de interés
iv. SNPs no comunes, es decir, cuya frecuencia alélica menor sea inferior al 1% c. El siguiente punto trata de maximizar la situación en que uno de los parentales presente el valor de un SNP en estado heterocigoto, mientras en el otro parental se presente como homocigoto, es decir, sea informativo. Esto se consigue a través de la maximización del valor de dos funciones por encima de cierto valor umbral:
MaxP: p-(3p2) (4p3) -(2p4)
HET rate: 2pq
siendo p y q respectivamente las frecuencias alélicas de los alelos referencia y alternativo para cada SNP. Estas son las ecuaciones del equilibrio de Hardy-Weinberg y su derivada.
d. La salida de este algoritmo será un panel de z SNPs optimizados para ambos valores en forma de matriz M cuyas columnas corresponden a los individuos de la población y las filas a los valores de cada SNP para cada individuo.
(ii) Un segundo proceso de selección de SNPs:
a. Mediante una búsqueda exhaustiva, se evalúan todas las combinaciones de SNPs para obtener un set t mínimo de tagSNPs a partir de la matriz M obtenida en el punto (i).
b. En primer lugar los SNPs de la matriz M del block-región se organizan en grupos de alta correlación en base al criterio del pairwise r2. Para ello se calcula el valor de pairwise r2 a partir de la frecuencia alélica calculada para la matriz M. De esta manera SNPs de diferentes grupos presentarán baja correlación, por lo que dos SNPs pertenecerán a un mismo grupo tan solo cuando el r2 pairwise entre ellos supere cierto valor umbral (fijado por el
usuario).
c. Tras esto se realiza la selección de tagSNPs dentro de cada grupo en base al criterio de LD, empezando por k=1 SNPs y estudiando todas las kcombinaciones posibles, organizando los SNPs dentro de cada grupo. d. Suponiendo dos SNPs cuyas frecuencias sean p (alelo de mayor frecuencia) y q=1-p. Se emplean las ecuaciones:
D<0 ^ Dmax=max-pApB, -papb
Siendo pA y pB la probabilidad observada del alelo p para el SNP1 y el SNP2 respectivamente y pa y pb la probabilidad para el alelo menor. Finalmente, pAB es la probabilidad combinada del par pq. Mediante el uso de estas ecuaciones se considerarán tagSNPs aquellos SNPs cuyos rangos funcionales superen cierto valor umbral.
La organización de los SNPs dentro de cada grupo en base al criterio de LD permite realizar una selección en base al rango funcional, asegurando que la primera solución encontrada es una solución óptima y permitiendo reducir considerablemente el tiempo de computación.
Finalmente, si un SNP no supera los umbrales de r2 o LD será considerado en un grupo sólo y tomado como tagSNP por sí mismo.
(iii) Un tercer proceso de validación que consiste en una validación in-sílico del panel de tagSNPs obtenido Para ello y empleando la base de datos 1000Genomes db [1], se escogen aleatoriamente individuos para realizar múltiples cruces. Tras esto se contabiliza el número de tagSNPS que resultaron informativos de cada cruce y se aporta el promedio a modo de dato informativo de la potencia informativa del panel.
Como se ha indicado, la FIG.2 muestra un esquema del método de la invención, en donde en primer lugar, se analiza el gen con la mutación a descartar en los embriones y se selecciona una región alrededor (típicamente, de 4 Mb). Se seleccionan aquellos polimorfismos que no cumplen ningún criterio de exclusión, y se buscan aquellos con mayor
probabilidad de ser informativos. Por otro lado, se identifican aquellos polimorfismos que pueden ser tag mediante análisis de correlación y desequilibrio de ligamiento. Con ambas cosas, se realiza un diseño final de panel, y se hace una validación in silico simulando entrecruzamientos entre multitud de individuos cuyos genomas se encuentran depositados en bases de datos públicas.
Ejemplo 1. Diagnóstico de aneuploidías
En la FIG.2 se muestra el esquema completo para el uso en el diagnóstico de aneuploidías. Se considera una pareja de población europea donde un miembro de la pareja es portador de la variante patogénica autosómica dominante VHL:c.233A>G p.(Asn78Ser) (posición cromosómica chr13:10183764) causante de una afección conocida como síndrome de Von Hippel-Lindau, que tiene un modo de herencia autosómico dominante.
El input del software serán los 69473 SNPs que contiene el block-region chr13:9181319-11681319. El output de este algoritmo será una matriz M de 1625 SNPs candidatos, los cuales actuarán como input para el algoritmo de selección de SNPs, cuyo output estará formado por un panel de 283 tagSNPs. En la fase de validación se obtuvo que el 49% de tagSNPs del panel resultaba informativo en promedio.
Parte de laboratorio húmedo. Una vez seleccionados los polimorfismos que queremos secuenciar, se introducen las posiciones en la plataforma correspondiente de enriquecimiento. Preferiblemente, Ion Ampliseq. Esta plataforma diseña los oligos necesarios para la captura de las regiones. En el laboratorio de IVF se generan los embriones que se biopsian cuando llegan a la etapa de blastocisto. La biopsia se mete en un tubo de PCR y se envía al laboratorio. En el laboratorio, se amplifica el ADN utilizando, por ejemplo, Ion Reproseq, de manera que, además de la amplificación, se hace la librería para DGP-A. Siguiendo el protocolo adecuado, se amplifican todas las regiones diseñadas con Ampliseq en el material previamente amplificado, y se produce la librería para DGP-M. Posteriormente, hacemos la secuenciación masiva. Hay que tener en cuenta que para poder secuenciar de manera simultánea múltiples muestras, es necesario marcar las muestras con un código de barras molecular. Se debe tener especial precaución en que los códigos de barras no coincidan entre las muestras.
Análisis de datos. Una vez finalizada la secuenciación, se obtienen una serie de ficheros con lecturas para todo el embrión (DGP-A) y otros ficheros con los polimorfismos detectados
(DGP-M). Con estos ficheros, se debe hacer un análisis bioinformático. Con los primeros, se determinan las aneuplodías utilizando el software más apropiado según la plataforma. Con los segundos, se determina el patrón de segregación de cada polimorfismo para el análisis de DGP-M. En primer lugar, las lecturas obtenidas se alienan al genoma de referencia, y se identifican los polimorfismos en todas y cada una de las muestras, incluidas pacientes, familiares utilizados como referencia y embriones. En el caso de los familiares, la situación más sencilla es aquella en la que disponemos de la pareja y de un hijo afecto. Para el fasado de SNPs, debemos determinar qué polimorfismos se comparten en el trío y de esta manera averiguar cuáles segregan con el alelo sano y cuáles con el patogénico. Como se han seleccionado SNPs bialélicos, cada una de las muestras puede ser 0/0, 0/1, 1/1 si son homocigotas para el SNP silvestre, heterocigotas u homocigotas para el SNP alternativo, respectivamente. El número 0 está indicando que se trata del SNP de referencia (sea cual fuere) mientras que el 1 indica que se trata del SNP alternativo. Esto es así para todos los cromosomas, excepto los sexuales, en los cuales las mujeres pueden ser homocigotas u heterocigotas, mientras que los hombres son siempre hemizogotos (0 ó 1). Con estos datos, se procede a realizar el fasado de SNPs. Para ello, se analizan aquellos SNPs que son informativos en la pareja. Los SNPs informativos son aquellos en los cuales uno de los pacientes es heterocigoto (0/1) y el otro homocigoto (0/0 o 1/1). El polimorfismo que se utiliza para casar es aquel que es distinto en el individuo heterocigoto. Por ejemplo, si tenemos un individuo 0/1 y el otro 1/1, el polimorfismo que utilizaremos para fasar es el 0. Por comparación con uno o más individuos en la familia, se determina arbitrariamente a qué alelo pertenece cada uno. Un ejemplo de fasado de SNPs sería el siguiente:
Se considera que la situación en la que tenemos una pareja con un hijo, cada uno con sus alelos. Consideramos que el padre tiene los alelos P1 y P2, la madre M1 y M2. Lógicamente, el hijo habrá heredado un alelo de cada uno, por ejemplo, P1 del padre y M1 de la madre. Si al analizar unos polimorfismos, se obtienen que el padre es 0/1, la madre 1/1 y el hijo 0/1, determinaremos que el polimorfismo 0 pertenece al alelo P1, que es el compartido entre el padre y el hijo, dado que ambos presentan dicho polimorfismo. En otro caso, podemos tener el padre 0/1, la madre 1/1 y el hijo 1/1. En ese caso, el polimorfismo 0 debe necesariamente pertenecer al alelo P2 del padre, puesto que no es compartido entre padre e hijo. De manera análoga, se procede con todos los polimorfismos que sean informativos para la madre.
Una vez determinados los haplotipos de los padres, se procede al análisis de los embriones. Para ello, se trata de identificar el SNP informativo en cada uno de los
embriones. Por ejemplo, si el polimorfismo 0 pertenece al alelo P1, si un embrión presenta dicho polimorfismo, significa que tiene dicho haplotipo. En definitiva, se trata de identificar los SNPs informativos en los distintos embriones y así determinar el haplotipo de cada uno de ellos.
Un ejemplo del proceso de fasado de SNPs se muestra en la FIG.3, donde se especifica, además, si los SNPs son informativos, no informativos o semiinformativo. Un SNP informativo es aquel que cumple lo anteriormente dicho, es decir, que sea heterocitogo en uno de los progenitores, y homocigoto en el otro; un SNP no informativo puede darse cuando ambos progenitores sean homocigotos, o que ambos sean heterocigotos y el hijo también lo sea; un SNP semiinformativo se da cuando ambos progenitores son heterocigotos y el hijo es homocigoto. Esta clasificación se puede extender a otras combinaciones familiares.
Una vez hecho el fasado de SNP con familiares, se debe comparar el patrón de polimorfismos con los embriones secuenciados, y de esta manera determinaremos que embriones son portadores y cuáles son normales. En la FIG.4 se muestra un ejemplo de fasado de SNPs que incluye el análisis de los embriones.
El algoritmo de fasado de SNPs es, además, capaz de identificar las distintas posibles fuentes de error y poner sobre alerta al analista para que las pueda sopesar y analizar. Estas fuentes de error son diversas. En la FIG.5 se muestra el resultado para un embrión similar a la FIG.4, pero donde se identifican y describen las distintas fuentes de error:
Por ejemplo, podemos tener un fenómeno de allele-drop-out. Este fenómeno implica que, en un embrión, sólo se amplifica uno de los alelos. De manera que, al secuenciar, podemos interpretar que un embrión es homocigoto para un polimorfismo, cuando en realidad es heterocigoto. Por ejemplo, un embrión puede ser 0/1 pero haber sufrido un fenómeno de ADO durante la amplificación y mostrarse como 1/1 en la secuenciación. Este fallo puede dar lugar a una mala interpretación de los resultados, asignando equívocamente el alelo de los embriones. A fin de evitarlo, es necesario distinguir aquellos polimorfismos que, además de ser informativos, son clave. Los polimorfismos clave son aquello que además de ser informativos son heterocigotas en el embrión. Por ejemplo, si tenemos un padre 0/1 y una madre 1/1, y el embrión en 0/1, el polimorfismo 0 será clave porque es informativo y heterocigoto. Por el contrario, si el embrión es 1/1, el polimorfismo sólo
será informativo. En este último caso no podemos determinar si el embrión es realmente 1/1, o si hemos sufrido un allele-drop-out y sólo estamos viendo uno de los alelos 1.
Otra fuente de error se debe a lo que se llama No Call. Se produce cuando no se obtienen señal para ninguno de los alelos para un polimorfismo determinado, así que no podemos saber ni siquiera uno de ellos.
Finalmente, otra fuente que puede dar lugar a confusión es se produzca una recombinación. Una recombinación es cuando los alelos en uno de los padres se intercambian, y esto se ve reflejado en el embrión. Por ejemplo, si analizamos 100 polimorfismos en un embrión, puede suceder que parte de ellos (por ejemplo, 60) pertenezcan al alelo P1 y el resto al alelo P2. Para poder identificar la recombinación, debe suceder que el cambio de alelo P1 al P2 sea de manera secuencial. Es decir, por ejemplo, que los primeros 60 polimorfismos pertenezcan al alelo P1 y los siguientes al P2. Si el intercambio de polimorfismos se produjera de manera más o menos aleatoria, eso significaría que se trata de un error de la secuenciación, porque estadísticamente no puede suceder que un embrión tenga más de dos recombinaciones en un espacio tan pequeño como el fragmento analizado (4 Mb).
También puede suceder que haya errores de secuenciación o artefactos. Estos artefactos se pueden identificar fácilmente porque parecen recombinaciones o alleledrop-outs, pero suceden de manera esporádica en una o muy pocas posiciones.
Finalmente, para poder realizar la asignación de alelos de manera inequívoca, se requiere que haya al menos tres polimorfismos informativos y que sean además clave a cada lado de la mutación, de manera consecutiva, además de al menos otros 3 polimorfismos más no clave.
Ejemplo 2. identificación de embriones triploides
Los embriones triploides son un problema importante en cualquier ciclo de IVF. Estos suponen un 15% de los abortos espontáneos por anomalías cromosómicas. Los embriones triploides deben descartarse siempre de cualquier ciclo de fecundación in vito, pero es difícil identificarlos porque no se observan diferencias en cuanto a calidad embrionaria con respecto a embriones normales. En ocasiones, es posible distinguirlos porque en D+1 se
observan tres pronúcleos, pero no siempre es posible. Los embriones triploides pueden ser de origen dispérmico (en casos de FIV) o bien originarse por un fallo del ovocito al no realizar la extrusión del segundo corpúsculo polar.
Los embriones triploides no se pueden identificar mediante técnicas corrientes de DGP-A, a pesar de tratarse de una anomalía numérica. En ocasiones, mediante inspección visual, es posible detectar embriones 46,XXY al observar una distribución anormal de las lecturas de los cromosomas sexuales, pero no siempre es posible y requiere de personal entrenado.
El método aquí descrito se puede utilizar para identificar este tipo de embriones. Se pueden seleccionar polimorfismos informativos a lo largo del genoma y determinar si son triploides analizando los polimorfismos presentes y la frecuencia de los mismos. Normalmente, un polimorfismo en heterocigosis se debe encontrar en una proporción alrededor de 0,5, debido a que la mitad de las lecturas se corresponderán a un alelo y la mitad a otro. Un embrión triploide tiene tres alelos, por lo que esta proporción se verá desviada. Así, el resultado puede ser de tres polimorfismos para la misma posición (si son multialélicos) o bien dos polimorfimos pero uno de ellos con frecuencia sobre el 33% y el otro sobre el 66%. Si todos los polimorfismos con suficientes lecturas siguen este patrón a lo largo de todo el genoma, eso significa que el embrión es triploide.
Ejemplo 3. identificación de embriones con traslocaciones balanceadas
En ocasiones, algunas parejas deciden acudir a ciclos de fecundación in vitro porque uno de ellos es portador de una translocación balanceada. En estos casos, estos padres tienen un riesgo reproductivo elevado, porque el 50% de sus embriones tendrán una translocación desbalanceada como consecuencia de heredar uno de los cromosomas alterados. Además, tendrá un 25% de posibilidades de generar embriones completamente normales, y un 25% de generar embriones con la alteración balanceada. En la FIG.6 se muestra un esquema de los posibles embriones generados. Las técnicas actuales permiten distinguir aquellos embriones con alteraciones desbalanceadas, la mayoría de las veces utilizando simplemente DGP-A. Sin embargo, no es posible diferenciar aquellos embriones con la alteración balanceada de aquellos completamente normales, dado que no se producen cambios de número de copia. Mediante el presente desarrollo, es posible mapear todo el cromosoma mediante distintos polimorfismos y, estudiando la distribución de esos polimorfismos en los embriones desbalanceados, determinar cuáles están presentes en el cromosoma alterado y cuáles en el normal. De esta manera, podremos saber si los
embriones sin cambios de número de copia han recibido de su progenitor el cromosoma normal o el alterado. Este estudio es posible gracias a la combinación de DGP-A y DGP-M.
Claims (12)
1. - Un método para el estudio de mutaciones en embriones en procesos de reproducción in vitro con la particularidad de que combina las técnicas de detección de Aneuploidía (DPG-A) y el estudio de enfermedades monogénicas en embriones (DGP-M) y que se caracteriza por que comprende, a su vez los procesos de:
un proceso de selección de SNPs donde se toma como entrada los valores de unos
n SNPs candidatos (t1... tk) de cada individuo x, en una región cromosómica de interés y específicamente extraídos para una población objeto de estudio;
y donde este proceso está configurado para maximizar la situación en que uno de los parentales presente el valor de un SNP en estado heterocigoto, mientras en el otro parental se presente como homocigoto y obtener un panel de z SNPs optimizados para ambos valores maximizados en forma de matriz
M cuyas columnas corresponden a los individuos de la población y las filas a los valores de cada SNP para cada individuo;
un proceso de selección se SNPs se evalúan todas las combinaciones de SNPs para obtener un set t mínimo de tagSNPs a partir de la matriz M obtenida en el primer proceso de selección se SNPs; y
un proceso de validación in-sílico del panel de tagSNPs obtenido en el segundo proceso.
2. - El método de acuerdo con la reivindicación 1 donde el primer proceso de selección de SNPs comprende la selección de aquellos SNPS que son bialélicos, por lo que los individuos pueden ser representados como haplotipos de longitud m formados por cadenas binarias {1,0}, siendo 1|0 y 0|1 los valores para SNPs heterocigotos y 0|0 y 1|1 los valores para los homocigotos; realizándose esta selección en toda la región cromosómica de interés.
3. - El método de acuerdo con la reivindicación 2 donde la región cromosómica de interés queda definida como toda posición que se encuentre dos megabases por encima y dos megabases por debajo del gen o mutación objeto de estudio.
4. - El método de acuerdo con una cualquiera de las reivindicaciones 1 a 3 donde el primer proceso comprende una etapa de analizar los n SNPs candidatos de la región y excluir aquellos que cumplan alguna de las siguientes condiciones: SNPs con más de un alelo alternativo (SNPs no bialélicos); SNPs cuyos alelos sean diferentes al cambio de un nucleótido
simple; SNPs que se encuentren en homocigosis en al menos el 99% de la población de interés; y SNPs no comunes, es decir, cuya frecuencia alélica menor sea inferior al 1%.
5. - El método de acuerdo con una cualquiera de las reivindicaciones 1 a 4 donde el primer proceso comprende una etapa de maximizar la situación en que uno de los parentales presente el valor de un SNP en estado heterocigoto, mientras en el otro parental
se presente como homocigoto, es decir, que sea informativo a través de la maximización del
valor de dos funciones por encima de cierto valor umbral:
MaxP: p-(3p2) (4p3) -(2p4)
HET rate: 2pq
siendo p y q respectivamente las frecuencias alélicas de los alelos referencia y alternativo
para cada SNP.
6. método de acuerdo con una cualquiera de las reivindicaciones 1 a 5 donde el segundo proceso de selección de SNPs que comprende, en primer lugar, que los SNPs de
la matriz M del block-región se organicen en grupos de alta correlación en base al criterio del pairwise r2; de tal forma que se calcula el valor de pairwise r2 a partir de la frecuencia alélica calculada para la matriz M.
8. - El método de acuerdo con una cualquiera de las reivindicaciones 1 a 7 donde la selección de tagSNPs dentro de cada grupo se realiza en base al criterio de límite de la detección (LD), empezando por k=1 SNPs y estudiando todas las k-combinaciones posibles, organizando los SNPs dentro de cada grupo.
10. l método de acuerdo con una cualquiera de las reivindicaciones 1 a 9 donde en el tercer proceso de validación se emplea una base de datos genómica donde se escogen aleatoriamente individuos para realizar 300 cruces, tras lo cual se se contabiliza el número de tagSNPs que resultaron informativos de cada cruce y se aporta el promedio a modo de dato informativo de la potencia informativa.
11. - Un kit para el estudio de mutaciones en embriones en procesos de reproducción in vitro que se caracteriza porque comprende, al menos, un dispositivo electrónico con un procesador o procesadores y una memoria, donde la memoria almacena instrucciones que cuando son ejecutadas por el procesador o procesadores hacen que el dispositivo electrónico ejecute el método de acuerdo con una cualquiera de las reivindicaciones 1 a 10.
Priority Applications (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| ES201830731A ES2738176B2 (es) | 2018-07-20 | 2018-07-20 | Metodo para el estudio de mutaciones en embriones en procesos de reproduccion in vitro |
| EP19758787.6A EP3825414B1 (en) | 2018-07-20 | 2019-07-19 | Method for the study of embryo mutations in vitro reproduction processes |
| PCT/ES2019/070506 WO2020016477A1 (es) | 2018-07-20 | 2019-07-19 | Método para el estudio de mutaciones en embriones en procesos de reproducción in vitro |
| US17/262,009 US20210343365A1 (en) | 2018-07-20 | 2019-07-19 | Method for the Study of Embryo Mutations in IN VITRO Reproduction Processes |
| PL19758787.6T PL3825414T3 (pl) | 2018-07-20 | 2019-07-19 | Sposób badania mutacji zarodków w procesach reprodukcji in vitro |
| ES19758787T ES2992250T3 (es) | 2018-07-20 | 2019-07-19 | Método para el estudio de mutaciones en embriones en procesos de reproducción in vitro |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| ES201830731A ES2738176B2 (es) | 2018-07-20 | 2018-07-20 | Metodo para el estudio de mutaciones en embriones en procesos de reproduccion in vitro |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| ES2738176A1 true ES2738176A1 (es) | 2020-01-20 |
| ES2738176B2 ES2738176B2 (es) | 2021-01-11 |
Family
ID=67742452
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES201830731A Active ES2738176B2 (es) | 2018-07-20 | 2018-07-20 | Metodo para el estudio de mutaciones en embriones en procesos de reproduccion in vitro |
| ES19758787T Active ES2992250T3 (es) | 2018-07-20 | 2019-07-19 | Método para el estudio de mutaciones en embriones en procesos de reproducción in vitro |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES19758787T Active ES2992250T3 (es) | 2018-07-20 | 2019-07-19 | Método para el estudio de mutaciones en embriones en procesos de reproducción in vitro |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US20210343365A1 (es) |
| EP (1) | EP3825414B1 (es) |
| ES (2) | ES2738176B2 (es) |
| PL (1) | PL3825414T3 (es) |
| WO (1) | WO2020016477A1 (es) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20230162814A1 (en) * | 2020-03-12 | 2023-05-25 | Vrije Universiteit Brussel | Method for the analysis of genetic material |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20130210644A1 (en) * | 2006-06-14 | 2013-08-15 | Roland Stoughton | Fetal aneuploidy detection by sequencing |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB0523276D0 (en) | 2005-11-15 | 2005-12-21 | London Bridge Fertility | Chromosomal analysis by molecular karyotyping |
| WO2012078792A2 (en) * | 2010-12-07 | 2012-06-14 | Stanford University | Non-invasive determination of fetal inheritance of parental haplotypes at the genome-wide scale |
| LT3567124T (lt) * | 2011-04-12 | 2022-04-11 | Verinata Health, Inc. | Genominių frakcijų paskirstymas, naudojant polimorfizmo skaičiavimo rezultatus |
| WO2014082032A1 (en) | 2012-11-26 | 2014-05-30 | The University Of Toledo | Methods for standardized sequencing of nucleic acids and uses thereof |
| US20140274741A1 (en) | 2013-03-15 | 2014-09-18 | The Translational Genomics Research Institute | Methods to capture and sequence large fragments of dna and diagnostic methods for neuromuscular disease |
| US9506053B2 (en) | 2013-08-01 | 2016-11-29 | Abbvie Inc. | Methods of selecting biologic-producing cell lines by next generation sequencing |
| EP2947156A1 (en) | 2014-05-22 | 2015-11-25 | Qiagen GmbH | Optimization of sequencing reactions |
-
2018
- 2018-07-20 ES ES201830731A patent/ES2738176B2/es active Active
-
2019
- 2019-07-19 ES ES19758787T patent/ES2992250T3/es active Active
- 2019-07-19 US US17/262,009 patent/US20210343365A1/en active Pending
- 2019-07-19 PL PL19758787.6T patent/PL3825414T3/pl unknown
- 2019-07-19 EP EP19758787.6A patent/EP3825414B1/en active Active
- 2019-07-19 WO PCT/ES2019/070506 patent/WO2020016477A1/es not_active Ceased
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20130210644A1 (en) * | 2006-06-14 | 2013-08-15 | Roland Stoughton | Fetal aneuploidy detection by sequencing |
Non-Patent Citations (3)
| Title |
|---|
| GONZALEZ-REIG S ET AL. New all-in-one protocol for 24-chromosome aneuploidies and monogenic diseases detection by next- generation sequencing: First-year experience. Reproductive BioMedicine Online 20180301 Elsevier Ltd nld. , 01/03/2018, Vol. 36, Páginas e34 - e35 ISSN 1472-6491 (print), página e34, columna derecha. * |
| TREFF NATHAN R ET AL. Evaluation of targeted next-generation sequencing-based preimplantation genetic diagnosis of monogenic disease. FERTILITY AND STERILITY, 20130109 ELSEVIER SCIENCE INC, NEW YORK, NY, USA. , 09/01/2013, Vol. 99, Páginas 1377 ISSN 0015-0282, (DOI: doi:10.1016/j.fertnstert.2012.12.018) página 1377; página 1382, columna izquierda; segundo párrafo; página 1383. * |
| YAN LIYING ET AL. Live births after simultaneous avoidance of monogenic diseases and chromosome abnormality by next-generation sequencing with linkage analyses. Proceedings of the National Academy of Sciences of the United States of America DEC 29 2015. , 30/11/2015, Vol. 112, Páginas 15964-15969 ISSN 0027-8424, (DOI: doi:10.1073/pnas.1523297113) página 15964, columna izquierda, primer párrafo; página 15965, columna izquierda, primer y segundo párrafos; página 15965, columna derecha, segundo y tercer párrafos; página 15968, columna derecha, segundo párrafo. * |
Also Published As
| Publication number | Publication date |
|---|---|
| EP3825414B1 (en) | 2024-08-28 |
| WO2020016477A1 (es) | 2020-01-23 |
| US20210343365A1 (en) | 2021-11-04 |
| PL3825414T3 (pl) | 2025-01-13 |
| ES2992250T3 (es) | 2024-12-11 |
| EP3825414A1 (en) | 2021-05-26 |
| ES2738176B2 (es) | 2021-01-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Werling et al. | An analytical framework for whole-genome sequence association studies and its implications for autism spectrum disorder | |
| Kockum et al. | Overview of genotyping technologies and methods | |
| Suchan et al. | Hybridization capture using RAD probes (hyRAD), a new tool for performing genomic analyses on collection specimens | |
| Lindblad-Toh et al. | Genome sequence, comparative analysis and haplotype structure of the domestic dog | |
| Gajecka | Unrevealed mosaicism in the next-generation sequencing era | |
| Helgason et al. | The Y-chromosome point mutation rate in humans | |
| Porubsky et al. | Human de novo mutation rates from a four-generation pedigree reference | |
| Zhao et al. | Power and precision of alternate methods for linkage disequilibrium mapping of quantitative trait loci | |
| US20060211001A1 (en) | Microdissection-based methods for determining genomic features of single chromosomes | |
| Calaway et al. | Genetic architecture of skewed X inactivation in the laboratory mouse | |
| CA2731991A1 (en) | Methods for allele calling and ploidy calling | |
| Kim et al. | SNP linkage analysis and whole exome sequencing identify a novel POU4F3 mutation in autosomal dominant late-onset nonsyndromic hearing loss (DFNA15) | |
| Porubsky et al. | A familial, telomere-to-telomere reference for human de novo mutation and recombination from a four-generation pedigree | |
| LInderoth | Identifying population histories, adaptive genes, and genetic duplication from population-scale next generation sequencing | |
| Shi et al. | A SNP based high-density linkage map of Apis cerana reveals a high recombination rate similar to Apis mellifera | |
| Lyu et al. | Personalized genome structure via single gamete sequencing | |
| ES2992250T3 (es) | Método para el estudio de mutaciones en embriones en procesos de reproducción in vitro | |
| Graham et al. | Genomic mosaicism of the brain: origin, impact, and utility | |
| Fukutani et al. | Population genetic structure and hybrid zone analyses for species delimitation in the Japanese toad (Bufo japonicus) | |
| Mackintosh et al. | Do chromosome rearrangements fix by genetic drift or natural selection? A test in Brenthis butterflies | |
| Bradley et al. | 19. The evolutionary genetics and molecular ecology of chimpanzees and bonobos | |
| Gao et al. | The generation of the first chromosome-level de-novo genome assembly and the development and validation of a 50K SNP array for North American Atlantic salmon | |
| Pfenninger et al. | Spontaneous rate of clonal mutations in Daphnia galeata | |
| Alyousfi | Development and application of methods for resolving molecular diagnoses from patient sequence data for monogenic diseases | |
| Ransom et al. | MuVEH and mitoMuVEH improve discovery of genetic variation from single cells |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| BA2A | Patent application published |
Ref document number: 2738176 Country of ref document: ES Kind code of ref document: A1 Effective date: 20200120 |
|
| FG2A | Definitive protection |
Ref document number: 2738176 Country of ref document: ES Kind code of ref document: B2 Effective date: 20210111 |
|
| PC2A | Transfer of patent |
Owner name: JOURNEY GENOMICS, S.L. Effective date: 20220909 |