[go: up one dir, main page]

ES2764501T3 - Método y sistema para estimar el género del feto de una hembra embarazada - Google Patents

Método y sistema para estimar el género del feto de una hembra embarazada Download PDF

Info

Publication number
ES2764501T3
ES2764501T3 ES16738770T ES16738770T ES2764501T3 ES 2764501 T3 ES2764501 T3 ES 2764501T3 ES 16738770 T ES16738770 T ES 16738770T ES 16738770 T ES16738770 T ES 16738770T ES 2764501 T3 ES2764501 T3 ES 2764501T3
Authority
ES
Spain
Prior art keywords
fraction
gender
allelic
presences
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16738770T
Other languages
English (en)
Inventor
Paul Vauterin
Michaël Vyverman
Schrijver Joachim De
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Multiplicom NV
Original Assignee
Multiplicom NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Multiplicom NV filed Critical Multiplicom NV
Application granted granted Critical
Publication of ES2764501T3 publication Critical patent/ES2764501T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6879Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for sex determination
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/689Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to pregnancy or the gonads
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/16Assays for determining copy number or wherein the copy number is of special importance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Hematology (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Urology & Nephrology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Cell Biology (AREA)
  • Reproductive Health (AREA)
  • Pregnancy & Childbirth (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)

Abstract

Un método para estimar el género de un feto de una hembra embarazada, comprendiendo dicho método: - medir presencias alélicas (DX) para una primera pluralidad de marcadores genéticos del cromosoma X y presencias alélicas (DR) para una segunda pluralidad de marcadores genéticos de al menos un cromosoma de referencia, diferente de los cromosomas X e Y, en una muestra de ADN libre de células de una hembra embarazada; representando cada presencia alélica la presencia en un marcador genético de al menos uno de: un alelo de referencia de origen materno o fetal, y un alelo alternativo de origen materno o fetal; - en base a dichas presencias alélicas medidas para dicha primera pluralidad, determinar una primera fracción (FX) de las mismas que se asocia a marcadores genéticos puramente homocigotos; - en base a dicha medida de las presencias alélicas para dicha segunda pluralidad, determinar una segunda fracción (FR) de las mismas que se asocia a marcadores genéticos puramente homocigotos; y - estimar el género de dicho feto en base a dicha primera y segunda fracción, en donde una primera fracción más alta en comparación con la segunda fracción es indicativa de un feto del género masculino y donde una primera fracción aproximadamente igual en comparación con la segunda fracción es indicativa de un feto del género femenino

Description

DESCRIPCIÓN
Método y sistema para estimar el género del feto de una hembra embarazada
Campo de la invención
El campo de la invención se refiere a la estimación del género de un feto de una hembra embarazada. Las realizaciones específicas de las invenciones se refieren a métodos, sistemas, programas informáticos y productos de programas informáticos para estimar el género del feto de una hembra embarazada.
Antecedentes
El documento WO 2013/057568 en nombre del solicitante divulga métodos de detección prenatal que utilizan técnicas no invasivas. En particular, se refiere al diagnóstico prenatal de una aneuploidía cromosómica fetal mediante la detección de ácidos nucleicos fetales y maternos en una muestra biológica materna. Más específicamente, el documento WO 2013/057568 emplea la PCR múltiple para amplificar fracciones seleccionadas de los respectivos cromosomas de los cromosomas maternos y fetales. Las respectivas cantidades de las regiones cromosómicas con sospecha de aneuploidía y los cromosomas de referencia se determinan a partir de un análisis de secuenciación masiva seguido de un análisis estadístico para detectar una aneuploidía en particular. El documento WO2011/091063 se refiere a métodos de detección de la aneuploidía o del sexo en un feto mediante el análisis del ADN extraído de la sangre de una hembra embarazada.
Aunque existen varios métodos de detección prenatal, se necesita un método preciso para estimar el género del feto de una hembra embarazada.
Sumario
El objetivo de las realizaciones de la invención es proporcionar un método, sistema y programa informático para estimar el género del feto de una hembra embarazada.
De acuerdo con un primer aspecto de la invención, se proporciona un método para estimar el género de un feto de una hembra embarazada. El método comprende el paso de medir las presencias alélicas para una primera pluralidad de marcadores genéticos del cromosoma X y las presencias alélicas para una segunda pluralidad de marcadores genéticos de al menos un cromosoma de referencia, diferente de los cromosomas X e Y, en una muestra de ADN libre de células de una hembra embarazada. Cada presencia alélica representa la presencia en un marcador genético de al menos uno de: un alelo de referencia de origen materno o fetal y un alelo alternativo de origen materno o fetal. En aras de la exhaustividad, debe tenerse en cuenta que esto no implica que se pueda hacer una distinción entre un alelo de origen materno y un alelo de origen fetal, sino simplemente que puede medirse un alelo de cualquier origen. El método comprende además: en base a las presencias alélicas medidas para dicha primera pluralidad, determinar una primera fracción (Fx ) de la misma que se asocia a marcadores genéticos puramente homocigotos, en base a dichas presencias alélicas medidas para dicha segunda pluralidad, determinar una segunda fracción (Fr) de la misma que se asocia a marcadores genéticos puramente homocigóticos y estimar el género de dicho feto a partir de dicha primera y segunda fracción. El término "marcador genético puramente homocigoto" se refiere a un marcador genético que es a la vez homocigoto en el ADN de origen materno y en el ADN de origen fetal. Las realizaciones de la invención se basan, entre otras cosas, en el conocimiento inventivo de que la primera fracción esperada en el cromosoma X debe ser mayor en el caso de un feto del género masculino en comparación con un feto del género femenino. Para un feto del género femenino, se espera que esta primera fracción sea idéntica a la segunda fracción obtenida de los cromosomas no X/Y. Para un feto del género masculino, se espera que la primera fracción sea más alta que la segunda fracción obtenida de al menos un cromosoma de referencia diferente de los cromosomas X e Y. El género se puede estimar con precisión utilizando esta primera y segunda fracción. Estimar el género de un feto de acuerdo con las realizaciones de la invención permite verificar el género como se estima en métodos de estimación conocidos. Esta verificación mejorará la precisión de una estimación del género de un feto en comparación con los métodos de estimación conocidos.
En el contexto de esta memoria descriptiva, un "marcador genético" es una posición en el genoma que se sabe que adquiere varios estados posibles en los individuos de una población.
En una realización preferida, la determinación de la primera fracción comprende: en base a dicha medida de las presencias alélicas para la primera pluralidad de marcadores genéticos, calcular un número correspondiente de frecuencias alélicas para dicha primera pluralidad; y determinar como la primera fracción a la fracción de dichas presencias alélicas medidas para las cuales la frecuencia alélica es 0 o 1 dentro de un margen de error predeterminado. Un experto en la materia entenderá que la tasa de error de un dispositivo de secuenciación es un estándar industrial, y será de sobra conocido para un fabricante o instrumento específico, pero en una realización específica, el margen de error predeterminado es <0,02. En particular, puede ser <0,015, <0,01 o <0,005. De igual manera la determinación de la segunda fracción puede comprender: en base a dicha medida de la presencia alélica para la segunda pluralidad de marcadores genéticos, calcular un número correspondiente de frecuencias alélicas para dicha segunda pluralidad; y determinar como segunda fracción a la fracción de dichas presencias alélicas medidas para las cuales la frecuencia alélica es 0 o 1 dentro de un margen de error predeterminado. Un experto en la materia entenderá que la tasa de error de un dispositivo de secuenciación es un estándar industrial, y será de sobra conocido para un fabricante o instrumento específico, pero en una realización específica, el margen de error predeterminado es <0,02. En particular, puede ser <0,015, <0,01 o <0,005. Las presencias alélicas se representan típicamente como recuentos de lecturas en función de la frecuencia alélica, y la primera/segunda fracción corresponde a los recuentos de lecturas de los puntos de datos de las variables concentrados alrededor de la frecuencia alélica 0 y alrededor de la frecuencia alélica 1.
En una realización preferida, la estimación comprende estimar un primer estimador de género utilizando una proporción entre la primera fracción (Fx) y la segunda fracción (Fr). El valor umbral para determinar los niveles umbral apropiados para la proporción para estimar un feto de género masculino o femenino debe calcularse empíricamente para cada realización. Un experto en la materia será capaz de calcular dichos umbrales utilizando los métodos descritos en el presente documento teniendo en cuenta los niveles de ruido y la heterocigosidad de las muestras como se describe en el presente documento. En realizaciones específicas, cuando la proporción entre Fxy Fr es inferior a 1,1, se estima que el feto es de género femenino, En particular, la proporción es inferior a 1,05, inferior a 1,03, inferior a 1,01 o inferior a 1,00. En una realización particular donde la proporción es aproximadamente 1, se estima que el feto es de género femenino. En realizaciones específicas, cuando la proporción entre Fxy Fr es superior a 1,1, se estima que el feto es de género masculino, en particular, la proporción es superior a 1,15, superior a 1,17, superior a 1,18, superior a 1,19 o superior a 1,20. En una realización particular, cuando la proporción es significativamente superior a 1, se estima que el feto es de género masculino.
En una realización preferida los pasos de medición y determinación se realizan para un lote que comprende una pluralidad de muestras; en donde para cada muestra del lote, se calculan la primera y la segunda fracción; y en donde el paso de estimación del género se basa además en dicha primera y segunda fracción de cada muestra. De esta manera, la precisión del resultado de la estimación puede mejorarse aún más.
En otra realización desarrollada, el paso de estimación de un género comprende: determinar un primer estimador de género (Em) para cada muestra en base a dicha primera y segunda fracción para dicha muestra; para cada muestra para la cual el primer estimador de género indica que el género del feto es femenino, determinar una proporción (N) entre las presencias alélicas medidas para la primera pluralidad y las presencias alélicas medidas para la segunda pluralidad de marcadores genéticos, y determinar los parámetros de distribución estadística de dicha pluralidad de proporciones para dichas muestras asociadas a un primer estimador de género que indica que el feto es de género femenino; y utilizar dicha distribución estadística para determinar un segundo estimador de género. De esta manera, la información estadística de un lote de muestras se utiliza para mejorar la estimación de género para una única muestra del lote. En el caso de que el número de muestras del lote de análisis para el cual el primer estimador de género indica que el género del feto es femenino sea demasiado pequeño para obtener una estimación fiable de la distribución, este conjunto puede aumentarse utilizando muestras para las cuales el primer estimador de género indica que el género del feto es masculino, utilizando un factor de corrección.
El paso de estimación de un género puede entonces comprender de manera adicional: determinar un estimador de género combinado utilizando dicho primer y segundo estimador de género.
De acuerdo con otro aspecto de la invención, se proporciona un sistema para estimar el género del feto de una hembra embarazada. El sistema comprende un dispositivo de medición, un módulo de determinación y un módulo de estimación. El dispositivo de medición está configurado para medir las presencias alélicas (Dx) para una primera pluralidad de marcadores genéticos del cromosoma X y las presencias alélicas (Dr) para una segunda pluralidad de marcadores genéticos de al menos un cromosoma de referencia, diferente de los cromosomas X e Y, en una muestra de ADN libre de células de una hembra embarazada. Puede tratarse de cualquier dispositivo de medición disponible en el mercado que sea adecuado para realizar tales mediciones. El módulo de determinación está configurado para determinar una primera fracción (Fx) de dichas presencias alélicas medidas para dicha primera pluralidad que se asocia a marcadores genéticos puramente homocigotos, y una segunda fracción (Fr) de dichas presencias alélicas medidas para dicha segunda pluralidad que se asocia a marcadores genéticos puramente homocigotos. El módulo de estimación está configurado para estimar el género de dicho feto a partir de dicha primera y segunda fracción. En una realización característica, el módulo de determinación y el módulo de estimación se implementan como software.
En una realización preferida el módulo de determinación se configura para, en base a dicha medida de las presencias alélicas para la primera pluralidad de marcadores genéticos, calcular un número correspondiente de frecuencias alélicas para dicha primera pluralidad; y para determinar como la primera fracción la fracción de dichas presencias alélicas medidas para las cuales la frecuencia alélica es 0 o 1 dentro de un margen de error predeterminado. De manera similar, el módulo de determinación puede configurarse para, en base a dicha medida de la presencia alélica para la segunda pluralidad de marcadores genéticos, calcular un número correspondiente de frecuencias alélicas para dicha segunda pluralidad; y determinar como segunda fracción a la fracción de dichas presencias alélicas medidas para las cuales la frecuencia alélica es 0 o 1 dentro de un margen de error predeterminado. Un experto en la materia entenderá que la tasa de error de un dispositivo de secuenciación es un estándar industrial, y será de sobra conocido para un fabricante o instrumento específico, pero en una realización específica, el margen de error predeterminado es <0,02. En particular, puede ser <0,015, <0,01 o <0,005.
En una realización preferida, el módulo de estimación se configura para estimar un primer estimador de género utilizando una proporción entre la primera fracción (Fx ) y la segunda fracción (Fr). El valor umbral para determinar los niveles umbral apropiados para la proporción para estimar un feto de género masculino o femenino debe calcularse empíricamente para cada realización. Un experto en la materia será capaz de calcular dichos umbrales utilizando los métodos descritos en el presente documento teniendo en cuenta los niveles de ruido y la heterocigosidad de las muestras como se describe en el presente documento. En realizaciones específicas, cuando la proporción entre Fx y Fr es inferior a 1,1, se estima que el feto es de género femenino, En particular, la proporción es inferior a 1,05, inferior a 1,03, inferior a 1,01, inferior a 1,00. En una realización particular donde la proporción es aproximadamente 1, se estima que el feto es de género femenino. En realizaciones específicas, cuando la proporción entre Fxy Fr es superior a 1,1, se estima que el feto es de género masculino, en particular, la proporción es superior a 1,15, superior a 1,17, superior a 1,18, superior a 1,19 o superior a 1,20. En una realización particular, cuando la proporción es significativamente superior a 1, se estima que el feto es de género masculino.
En una realización preferida, el dispositivo de medición y el módulo de determinación se configuran para realizar la medición y determinación para un lote que comprende una pluralidad de muestras, en donde para cada muestra del lote, se calculan la primera y la segunda fracción; y en donde el módulo de estimación se configura para estimar el género en base a dicha primera y segunda fracción de cada muestra.
En una realización preferida, el módulo de estimación se configura para estimar el género de una manera tal y como se describe en cualquiera de las realizaciones ejemplares del método.
En una realización preferida, el módulo de medición se configura para medir las presencias alélicas utilizando al menos uno de los siguientes: reacción en cadena de la polimerasa (PCR), reacción en cadena de la ligasa, amplificación basada en la secuencia de ácidos nucleicos (NASBA) y métodos de ADN ramificado; y, preferentemente, PCR.
En realizaciones ejemplares de la invención, la medición de las presencias alélicas puede comprender la medición de las presencias alélicas de SNP y/o la medición de las presencias alélicas para inserciones y/o deleciones cortas. Las realizaciones preferidas del método y el sistema de la invención se divulgan en las reivindicaciones dependientes adjuntas.
De acuerdo con un aspecto adicional de la invención, se proporciona un programa de ordenador que comprende instrucciones ejecutables por ordenador para su realización, cuando el programa se ejecuta en un ordenador, uno o más pasos y, en particular, el paso de estimación de las realizaciones del método descrito anteriormente. De acuerdo con un aspecto adicional de la invención, se proporciona un dispositivo informatizado u otro dispositivo de hardware programado para realizar uno o más pasos y, en particular, el paso de estimación de una cualquiera de las realizaciones del método divulgado anteriormente. De acuerdo con otro aspecto, se proporciona un dispositivo de almacenamiento de datos que codifica un programa legible por una máquina y ejecutable por una máquina para realizar uno o más pasos de una cualquiera de las realizaciones del método divulgado anteriormente. La referencia a las instrucciones/formas ejecutables por ordenador tiene que interpretarse de forma que comprenda tanto el código ejecutable por una máquina, el código que debe ser compilado para ser ejecutado, como el código que es interpretado en lugar de ejecutado per se.
Breve descripción de las figuras
Los dibujos adjuntos se utilizan para ilustrar las realizaciones ejemplares no limitativas preferidas actualmente de un método y de un sistema de la presente invención. Las ventajas anteriores y otras ventajas de las características y los objetivos de la invención se harán más evidentes y la invención se entenderá mejor a partir de la siguiente descripción detallada cuando se lea junto con los dibujos adjuntos, en los cuales:
la figura 1 es un gráfico que muestra la cobertura total de SNP frente a la frecuencia alélica en el cromosoma X para la muestra M;
la figura 2 es un gráfico que muestra la cobertura total de SNP frente a la frecuencia alélica en el cromosoma X para la muestra F;
la figura 3 es un gráfico que muestra, para un conjunto de muestras, el estimador de género Eh1 en el eje X frente a la fracción fetal en el eje Y;
la figura 4 es un gráfico que representa, para el conjunto de muestras de la figura 3, la proporción Nen el eje X frente a la fracción fetal en el eje Y;
la figura 5 es un gráfico que representa, para el conjunto de muestras de la figura 3, la proporción Npara las muestras clasificadas como femeninas (de acuerdo con Em ), y N'para las muestras clasificadas como masculinas (de acuerdo con Eh i) en el eje X frente a la fracción fetal en el eje Y;
la figura 6 es un gráfico que representa, para el conjunto de muestras de la figura 3, el valor-z Zen el eje X frente a la fracción fetal en el eje Y;
la figura 7 es un gráfico que representa, para el conjunto de muestras de la figura 3, el segundo estimador de género Eh2 en el eje X frente a la fracción fetal en el eje Y;
la figura 8 es un gráfico que representa el primer estimador de género Eh1 en el eje X frente al segundo estimador de género Eh2 en el eje Y para el conjunto de muestras de la figura 3;
la figura 9 es un gráfico que representa, para el conjunto de muestras de la figura 3, el estimador de género combinado Eh en el eje X frente a la fracción fetal en el eje Y; y
la figura 10 es un dibujo esquemático de la realización de un sistema.
Descripción detallada de realizaciones ejemplares
En una prueba prenatal no invasiva (NIPT), conocida en la técnica anterior, el ADN libre de células (ADNcf) en una muestra de suero o plasma materno de una hembra embarazada se secuencia para detectar la presencia de aneuploidías cromosómicas en el feto, tales como la trisomía del cromosoma 21. De acuerdo con las realizaciones ejemplares de la invención, se proporciona un método para estimar el género del feto.
En una realización característica, se obtiene una muestra de suero o plasma de la sangre materna. Esta puede ser una pequeña cantidad de suero o plasma, por ejemplo, de 1 a 20 ml. Dependiendo de la precisión deseada, puede preferirse utilizar volúmenes más grandes. La preparación del suero o del plasma a partir de la muestra de sangre materna puede llevarse a cabo utilizando técnicas estándar. Entre las técnicas adecuadas se encuentran la centrifugación y/o las técnicas basadas en matriz. En posibles realizaciones, se puede utilizar un método de enriquecimiento basado en secuencias en el suero o plasma maternos para enriquecer específicamente las muestras en secuencias de ácido nucleico fetal.
Las realizaciones del método de la invención pueden realizarse para una muestra que contiene ADN fetal en una concentración de fracción fetal de la cantidad total de ADN por encima de un umbral predeterminado. En realizaciones preferidas, se lleva a cabo una amplificación de las secuencias de ADN fetal en la muestra. Se puede utilizar cualquier método de amplificación conocido por el experto, tal como un método de PCR.
En una realización preferida se utilizan datos de la prueba de Clarigo del solicitante que no implica la detección de alelos de SNP (o polimorfismo de un solo nucleótido), es decir, un marcador genético que comprende un único nucleótido variable) en el ADN fetal que no están presentes en el ADN de la hembra embarazada. La prueba de Clarigo consiste en la secuenciación dirigida de una serie de regiones del genoma humano (en otras palabras, se dirige a marcadores genéticos específicos), utilizando los SNP conocidos (polimorfismos de un solo nucleótido) con una alta prevalencia poblacional (por ejemplo, mayor del 1%, preferentemente mayor del 10%) y dos posibles alelos (sc. un alelo de referencia, también conocido como REF; y un alelo alternativo, también conocido como ALT). Se pueden encontrar más detalles sobre la prueba de Clarigo en Internet en http://www.multiplicom.com/product/clarigo, y en el documento WO 2013/057568 en nombre del solicitante.
Ahora se discutirá en detalle una realización ejemplar de un método para estimar el género del feto de una hembra embarazada. En un primer paso de medición, se miden las presencias alélicas para una primera pluralidad (Dx ) de marcadores genéticos del cromosoma X y para una segunda pluralidad (Dr) de marcadores genéticos de al menos un cromosoma de referencia, diferente del cromosoma X e Y, en una muestra de ADN libre de células de una hembra embarazada. Cada presencia alélica representa la presencia en un marcador genético de al menos uno de los siguientes: un alelo de referencia de origen materno o fetal y un alelo alternativo de origen materno o fetal. En un segundo paso de cálculo, en base a las presencias alélicas medidas para dicha primera pluralidad, se determina una primera fracción (Fx ) de la misma que se asocia a marcadores genéticos puramente homocigotos, y se basa en las presencias alélicas medidas para dicha segunda pluralidad, y se determina una segunda fracción (Fr) de la misma que se asocia a marcadores genéticos puramente homocigotos. En un tercer paso se estima el género del feto en base a dicha primera y segunda fracción. En la realización ejemplar expuesta a continuación, el paso de estimación comprende el cálculo de un primer estimador de género para una muestra específica, el cálculo de un segundo estimador de género utilizando también datos de otras muestras y el cálculo de un estimador de género combinado para la muestra específica en base al primer y segundo estimador de género.
Medición y determinación de fracciones
Una manera ventajosa de representar los resultados de la medición de presencias alélicas para un marcador genético, es asociar la siguiente información a un punto de datos de las variables para ese marcador genético. Un punto de datos de las variables (que es un punto de datos asociado con una serie de variables, tales como los alelos) se utiliza en esta memoria descriptiva como una representación conveniente para un marcador genético y, por lo tanto, representa el resultado de la medición de presencias alélicas en varios amplicones para marcadores genéticos. Un amplicón es un fragmento de ADN o a Rn que es el producto (y/o fuente) de acontecimientos de amplificación o replicación. En otras palabras, un amplicón es un fragmento biofísico de material de replicación, diseñado para contener una posición conocida de SNP con alta prevalencia poblacional. Cada punto de datos de las variables se asocia, por lo tanto, con un SNP conocido con alta prevalencia poblacional y con dos alelos posibles (sc. un alelo de referencia, también conocido como REF; y un alelo alternativo, también conocido como ALT). Para cada punto de datos de las variables A,-, se pueden determinar los siguientes números utilizando, por ejemplo, un flujo de trabajo (pipeline) de bioinformática estándar aplicado a los datos de secuenciación:
• El número de lecturas que contienen el alelo REF en la posición de SNP conocida, Cr.
• El número de lecturas que contienen el alelo ALT en la posición de SNP conocida, Caí.
• La cobertura total Cj¡ = C + C.
• La frecuencia alélica o la fracción de lecturas del alelo ALT en la cobertura total
= Caí/(Crí + Caí).
Por lo tanto, para un determinado marcador genético i, pueden medirse las presencias alélicas para el alelo REF, para el alelo ALT y para ambos alelos, midiendo los números de lecturas que contienen al alelo REF, al alelo ALT y tanto el alelo REF como el alelo ALT, respectivamente. En base a las presencias alélicas medidas, se calcula un número correspondiente de frecuencias alélicas para el número predeterminado de marcadores genéticos.
Para cada posición en el genoma (es decir, para cada locus genético), excluyendo los cromosomas X e Y y asumiendo que no hay alteraciones cromosómicas relevantes, hay cuatro copias presentes en la muestra (suponiendo que la posición no forma parte de una región de aneuploidía), que determinan el número total de lecturas: dos copias del ADN materno y dos copias del ADN fetal.
Para un punto de datos de una variable individual (es decir, para un marcador genético individual), imaginemos que A y B denotan el alelo REF y ALT para el SNP conocido en el ADN materno para ese marcador genético, y a y b los estados correspondientes para el ADN fetal. Esto significa que los puntos de datos de las variables pueden estar en los posibles estados enumerados en la Tabla 1:
T l 1
Figure imgf000006_0001
A modo de una ilustración de las presencias alélicas medidas, los diagramas de dispersión ilustrados en las figuras 1 y 2 muestran los datos de una muestra M (feto del género masculino) y una muestra F (feto del género femenino) para las que se han medido las presencias alélicas para los marcadores genéticos del cromosoma X, en donde: • Cada punto es un punto de datos de las variables (que representa el resultado de las mediciones realizadas en los amplicones) para los marcadores genéticos del cromosoma X.
• El eje horizontal muestra la fracción de las lecturas con el alelo ALT SNP (es decir, la frecuencia alélica Fi). • El eje vertical muestra la cobertura total de lectura C.
En la figura 1 se puede ver que los puntos de datos de las variables específicas están asociados con una frecuencia alélica específica. Por ejemplo, el punto de datos de las variables 101 se muestra a la izquierda y representa un marcador genético para el que se realizaron aproximadamente 3300 lecturas. Todas o casi todas las lecturas de este marcador genético han medido la presencia alélica para indicar que están presentes alelos REF (es decir, A), pero no que están presentes alelos ALT (es decir, B). Por lo tanto, el punto de datos de las variables 101 se ha representado a la izquierda en la figura 1, donde la frecuencia de los alelos es aproximadamente 0 y probablemente representa un marcador genético homocigoto AAaa. El punto de datos de las variables 102 se muestra a la derecha y representa un marcador genético para el cual se realizaron aproximadamente 2500 lecturas. Todas o casi todas las lecturas de este marcador genético han medido la presencia de alelos para indicar que no están presentes alelos REF (es decir, A), pero que están presentes alelos ALT (es decir, B). Por lo tanto, el punto de datos de las variables 102 se ha representado a la derecha en la figura 1, donde la frecuencia de los alelos es aproximadamente 1 y probablemente representa un marcador genético homocigoto BBbb.
En la figura 2, los puntos de datos de las variables 103 representan un marcador genético para el cual se realizaron aproximadamente 1800 lecturas. Las presencias alélicas medidas permiten calcular la frecuencia alélica, que es relativamente baja, pero no cero. Por lo tanto, el punto de datos de las variables 103 representa probablemente un marcador genético que es homocigoto por parte materna para el par de alelos de referencia pero tiene un par de alelos heterocigotos de origen fetal (por lo tanto es AAab), dado que la fracción de ADN materno presente en la muestra para el marcador genético es (mucho) mayor que la fracción de ADN fetal presente en la muestra para el marcador genético. El punto de datos de las variables 104 se muestra a la derecha y representa un marcador genético para el cual se realizaron aproximadamente 2250 lecturas. Por el mismo razonamiento, el punto de datos de las variables 104 representa probablemente un marcador genético que es homocigoto por parte materna para el par de alelos alternativos pero tiene un par de alelos heterocigotos de origen fetal (por lo tanto es BBab).
En la figura 1, los puntos de datos de las variables 105 representan un marcador genético para el cual se realizaron aproximadamente 2750 lecturas. Las presencias alélicas medidas permiten calcular la frecuencia alélica, que se ha observado que es de aproximadamente 0,48. Por lo tanto, el punto de datos de las variables 105 representa probablemente un marcador genético que es heterocigoto por parte materna (por lo tanto AB).
Por lo tanto, pueden distinguirse tres grupos de puntos de datos de las variables (11A y 11B, 12A y 12B, y 13): - los puntos de datos de las variables 11A y 11B que son homocigotos en el ADN materno y fetal (AAaa, BBbb); - los puntos de datos de las variables 12A y 12B que son homocigotos en el ADN materno y heterocigotos en el ADN fetal (AAab, BBab). Debe tenerse en cuenta que, en estos casos, el ADN fetal contiene un alelo que fue heredado del padre y que no está presente en el ADN materno. En otras palabras, para un feto del género masculino, este grupo de puntos de datos de las variables no estará presente para el cromosoma X, véase la figura 1;
- los puntos de datos de las variables 13 que son heterocigotos en el ADN materno (ABaa, ABab, ABbb).
Se observa que múltiples puntos de datos de las variables pueden tener la misma (o casi la misma) frecuencia alélica, especialmente cuando son parte del mismo grupo. Esto significa que se ha medido (de manera muy próxima) el mismo número de presencias de alelos para ellos, en relación al número total de lecturas.
También se observa que, en las figuras 1 y 2, Los puntos de datos de las variables con una mayor cobertura total de lectura (más cerca de la parte superior del gráfico) tienen una frecuencia alélica más precisa, simplemente porque hay más datos de medición. Esta propiedad puede tenerse en cuenta al determinar la fiabilidad estadística para un punto de datos de las variables determinado.
Estimador de género de la fracción homocigota (primer estimador de género)
Un primer estimador de género se calcula investigando la fracción de puntos de datos de las variables que son puramente homocigotos en la muestra para el cromosoma X y para al menos un cromosoma de referencia que no incluye el cromosoma X/Y. En una realización preferida se pueden utilizar todos los cromosomas de referencia. A partir de los resultados obtenidos de la medición se calculan los siguientes parámetros:
- el número total de lecturas Dx en todos los puntos de datos de las variables del cromosoma X, es decir, el número total de presencias alélicas medidas para la primera pluralidad de marcadores genéticos del cromosoma X;
- el número total de lecturas Dxh en el cromosoma X, correspondiente a puntos de datos de las variables que son puramente homocigotos, es decir, la frecuencia alélica es 0 o 1, dentro de un margen de error predeterminado, es decir, los grupos 11A y 11B de las figuras 1 y 2;
- el número total de lecturas Dr sobre todos los puntos de datos de las variables en al menos un cromosoma de referencia (estos pueden ser todos los cromosomas excepto el cromosoma X y el cromosoma Y); es decir, el número total de presencias alélicas medidas para la segunda pluralidad de marcadores genéticos de al menos un cromosoma de referencia;
- el número total de lecturas DRh en al menos un cromosoma de referencia, correspondiente a puntos de datos de las variables que son puramente homocigotos, es decir, una frecuencia alélica que es 0 o 1, dentro de un margen de error predeterminado;
Para la muestra M, el siguiente conjunto de valores se obtuvo por el método (véanse en la figura 1 los puntos de datos de las variables en el cromosoma X):
Dx = 227542 (dividido entre 390 amplicones),
Dxh = 162151 (dividido entre un subconjunto de 285 amplicones),
Dr = 883695 (dividido entre 1681 amplicones),
DRh = 491752 (dividido entre un subconjunto de 917 amplicones).
Para la muestra F, se identifica el siguiente conjunto de valores por el método (véase la figura 2 para los puntos de datos de las variables en el cromosoma X):
Dr = 942355 (dividido entre 1680 amplicones),
DRh = 541801 (dividido entre un subconjunto de 953 amplicones),
Dx = 255394 (dividido entre 391 amplicones),
DXh = 143376 (dividido entre un subconjunto de 228 amplicones).
A continuación, se calculan las siguientes fracciones:
- una primera fracción Fx de lecturas para la primera pluralidad de marcadores genéticos, que se asocia con marcadores genéticos puramente homocigotos:
F x = Dxh / D x ,
- una segunda fracción Fr de lecturas para la segunda pluralidad de marcadores genéticos, que se asocia con marcadores genéticos puramente homocigotos:
F r = DRh / D r .
Un primer estimador preliminar de género puede calcularse como:
E h 0 = F x / F r .
En el caso de un feto del género femenino, hay dos copias presentes del cromosoma X y de al menos un cromosoma de referencia. Por lo tanto, se espera que Eho sea 1. En caso de un feto del género masculino, solo hay una copia del cromosoma X, pero dos copias de todos los cromosomas de referencia. Por lo tanto, se espera que Eho sea mayor que 1. En otras palabras, el primer estimador preliminar de género permite estimar el género.
Para la realización ejemplar de la figura 1 (muestra M), las fracciones que son puramente homocigotas y el estimador preliminar del género Eho pueden calcularse como:
Fx = Dxh/Dx □ 0,71,
F r = DRh/DR □ 0,55,
E ho = F x /F r □ 1,28.
Como Eho está muy por encima de 1, se puede estimar que la muestra M es masculina.
Para la realización ejemplar de la figura 2 (muestra F), las fracciones que son puramente homocigotas y el estimador preliminar del género Eho pueden calcularse como:
F x = Dxh/Dx □ 0,56,
F r = DRh/DR □ 0,57,
E ho = F x /F r □ 0,97.
Como Eho es aproximadamente 1, se puede estimar que la muestra F es femenina.
Esto puede entenderse más como se indica a continuación. Dadas dos copias del cromosoma X, alelo REF A y alelo ALT B, hay cuatro combinaciones posibles diferentes de esos alelos para la madre que se espera que aparezcan: AA, AB, BA, BB. En base al género del feto, las combinaciones anteriores pueden dividirse aún más debido a la presencia del ADN fetal:
1. Feto del género masculino (figura 1, muestra M): el contenido de ADN del cromosoma X consiste en dos copias de la madre y una sola copia del feto heredada de la madre, en una cantidad igual a la mitad de la fracción fetal. Se pueden distinguir las siguientes combinaciones alélicas:
a. AAa, BBb: puramente homocigoto.
b. ABa, ABb, BAa, BAb: heterocigoto.
2. Feto del género femenino (figura 2, muestra F): el contenido de ADN del cromosoma X consiste en dos copias de la madre y dos copias del feto, una de las cuales se hereda de la madre y otra se hereda del padre, con una cantidad igual a la fracción fetal. Se pueden distinguir los siguientes grupos:
a. AAaa, BBbb: puramente homocigoto.
b. AAab, BBab: pares de alelos homocigotos de origen materno y pares de alelos heterocigotos de origen fetal.
c. ABaa, ABab, ABba, ABbb, BAaa, BAab, BAba, BAbb: pares de alelos heterocigotos de origen materno. A partir de lo anterior, se deduce que la primera fracción esperada de los SNP puramente homocigotos en los cromosomas X debería ser mayor en el caso de un feto del género masculino que en el de un feto del género femenino. Para un feto del género femenino, se espera que esta primera fracción sea idéntica a la segunda fracción obtenida de los cromosomas no sexuales. Para un feto del género masculino, se espera que la primera fracción sea más alta que la segunda.
El primer estimador preliminar de género Eh0 puede estandarizarse a un primer estimador de género Eh1 que se espera que sea 0 para un feto del género femenino y 1 para un feto del género masculino:
EH 1 = (Eh0 -1) / (EHe-1),
con un valor predictivo EHe para Eho en caso de un feto del género masculino.
Este valor predictivo EHe se puede obtener estimando el nivel de heterocigosidad de los SNP de la población utilizando la fracción de SNP que se observa como heterocigota en el ADN de la madre en la muestra. Esta estimación se puede hacer de la siguiente manera. Se introducen las siguientes definiciones:
- el número total DRhet de lecturas en al menos un cromosoma de referencia, correspondiente a los puntos de datos de las variables que son heterocigotos en el ADN materno. Para los puntos de datos de las variables heterocigotos, hay 8 posibilidades: ABaa, ABbb, ABab, ABba, BAaa, BAbb, BAab y BAba.
La fracción de puntos de datos de las variables heterocigotos para al menos un cromosoma de referencia puede calcularse como:
FRhet = DRhet / D r .
Esto puede entenderse más como se indica a continuación. Supongamos que en promedio, el alelo REF A puede encontrarse en una fracción F a de todas las incidencias de un SNP y el alelo ALT en una fracción F b = 1 - F a . Si se hace una generalización que establece que todos los SNP de los puntos de datos de las variables comparten la misma fracción F a del alelo REF, se pueden estimar los niveles esperados de homocigosidad y heterocigosidad. El nivel de homocigosidad, o de manera equivalente, el nivel de incidencia de las combinaciones AA, y BB se estima por:
F l F§ = F i ( 1 - Fa) 2.
El nivel de heterocigosidad, o de manera equivalente, el nivel de incidencia de las combinaciones AB, BA es FRhet = 2F a F b - 2F a (1 - F a ).
Las combinaciones AAa, BBb tienen el mismo nivel de incidencia que las combinaciones AA, BB. La aparición de las combinaciones AAaa, y BBbb es FA Fg = FA (1 — FA) 3. La incidencia de las otras combinaciones puede estimarse de manera similar.
A partir de lo anterior, se deduce que un valor predictivo para Eho en caso de un feto del género masculino puede estimarse como:
EHe = FA (1 — Fa) 2/F a (1 — Fa) 3.
El método estima el valor de F a a partir del nivel de heterocigosidad observado en al menos un cromosoma de referencia FRhet, resolviendo la siguiente ecuación de segundo grado y tomando la raíz más grande:
2F a (1 - F a ) - FRhet = 0.
Si no existe una raíz real, F a se ajusta a 0,5.
Se puede ejecutar una primera clasificación de género basada en E h1, utilizando un umbral fijo T o (<= 0,5):
E h1 < T o : género femenino,
E h1 ^ T o and E h1 ^ 1 - T o : desconocido,
E h1 > 1 - T o : género masculino.
Para la muestra M, el primer estimador de género se puede calcular de la siguiente manera. Se determina el primer DRhet: DRhet = 259134 (dividido entre 498 amplicones), y a continuación se calcula la fracción:
Figure imgf000010_0001
A partir de esta fracción se puede calcular el valor predictivo EHe:
Figure imgf000010_0002
El primer estimador de género se convierte entonces en:
Figure imgf000010_0003
En base a este valor, una primera clasificación de la muestra M es masculina.
Para la muestra F, el primer estimador de género se puede calcular de la siguiente manera. Se determina el primer DRhet: DRhet = 250259 (dividido entre 436 amplicones), y a continuación se calcula la fracción:
Figure imgf000010_0004
A partir de esta fracción se puede calcular el valor predictivo EHe:
Figure imgf000010_0005
El primer estimador de género se convierte entonces en:
Figure imgf000010_0006
En base a este valor, una primera clasificación de la muestra F es femenina.
La figura 3 ilustra un primer estimador de género Eh1 (eje X) para un lote de muestras con diferentes fracciones fetales (eje Y). Las muestras (cada punto representa una muestra) a la izquierda de la línea vertical 301 se corresponden con un primer estimador que indica un feto del género femenino, y las muestras a la derecha de la línea vertical 301 se corresponden con un primer estimador que indica un feto del género masculino.
Estimador de género de cobertura (segundo estimador de género)
Un segundo estimador de género se obtiene comparando la cobertura del cromosoma X con la cobertura de un conjunto de al menos un cromosoma de referencia diferente de los cromosomas X e Y. Este conjunto puede ser el mismo conjunto que el utilizado para determinar el primer estimador de género, o un conjunto diferente.
Los siguientes parámetros se calculan a partir de los puntos de datos de las variables de una muestra i de un lote: - el número total de lecturas Dsobre todos los puntos de datos de las variables del cromosoma X, es decir, el número total de presencias alélicas medidas para la primera pluralidad de marcadores genéticos del cromosoma X; y
- el número total de lecturas Drí en todos los puntos de datos de las variables en al menos un cromosoma de referencia, es decir, el número total de presencias alélicas medidas para la segunda pluralidad de marcadores genéticos de al menos un cromosoma de referencia.
A continuación, se calcula una proporción Nde las lecturas Dy Dde la siguiente manera para la muestra i:
Figure imgf000010_0007
La proporción Npuede calcularse para todas las muestras de un lote de análisis, por ejemplo, todas las muestras secuenciadas durante un solo ensayo. A continuación, se pueden seleccionar los valores Nxí para las muestras que se determinaron como "femeninas" utilizando la primera clasificación de género, y se pueden calcular parámetros de distribución normal para esos valores, por ejemplo, un valor medio p y una desviación estándar a.
En caso de que el número de muestras del lote de análisis que se clasificaron como "femeninas" sea demasiado pequeño para obtener una estimación fiable de la distribución, este conjunto puede aumentarse usando muestras clasificadas como "masculinas", usando un valor corregido:
N'xí = Nxí x 1 / (1 - FF/2).
con FF la fracción fetal estimada de la muestra. La fracción fetal puede estimarse usando una realización del método divulgado en la solicitud de patente BE 2015/5460 en nombre del solicitante que se incluye en el presente documento por referencia. También se pueden utilizar otros métodos existentes para estimar la fracción fetal.
Utilizando esta distribución, para todas las muestras i del lote de análisis se puede calcular un valor-z Z:
Figure imgf000011_0001
Para cada muestra, determinar Zmí, el valor esperado del valor-z bajo el supuesto de que la muestra es "masculina". Este valor se basa en la fracción fetal estimada de la muestra:
V FF
Z= —~ a x ~F 2~-Un segundo estimador de género se calcula como:
Eh2 = Z/ Z.
Se espera que este valor sea 0 para un feto del género femenino y 1 para un feto del género masculino.
Para las muestras M y F, la proporción Npuede calcularse usando las fórmulas anteriores:
Nxm = 0,1225806583663057,
Nxf = 0,12775398163696797.
A continuación, se calculan todos los valores Npara todas las muestras del lote de análisis. En la figura 4 se muestran los valores Nde todas las muestras en función de su fracción fetal FF. Las muestras clasificadas como femeninas por el primer estimador de género Eh1 se muestran en un contorno 401 y las muestras clasificadas preliminarmente como masculinas se muestran en un contorno 402.
Las muestras clasificadas como femeninas (es decir, los puntos en el contorno 401) se utilizan para determinar una distribución normal. Estas son las muestras para las cuales Eh1 < T0. Estas muestras pueden encontrarse a la izquierda de la línea de separación vertical 301 en la figura 3.
En el ejemplo de las figuras 3 y 4, hay suficientes muestras femeninas para estimar con precisión la distribución normal. Si este no fuera el caso, se pueden utilizar los valores N'para las muestras masculinas para estimar la distribución. Para la muestra M (con FF = 5,8%), esto significaría:
N'xm = Nxm x 1 / (1 - FF/2) = 0,12626348981879823.
La figura 5 muestra el efecto de la normalización de los valores Na N'para las muestras clasificadas como masculinas por el primer estimador de género.
En base a los valores N, la distribución normal se calcula con:
valor medio p = 0,12792346387904036, y
desviación estándar a =0,0011732807075874412.
Utilizando esta distribución, se calcula un valor-z Zom = -4,55 para la muestra M y Zof = -0,14 para la muestra F. El valor-z de todas las muestras del lote de análisis se muestra en la figura 6.
El valor esperado del valor-z bajo la suposición de que la muestra es "masculina" para las dos muestras de ejemplo son Zmm = -3,18 y Zmf = -2,84. Usando ambos valores-z, la segunda estimación de género de las muestras M y F son:
Muestra M:
Eh2 = Zom / Zmm = 1,43,
Muestra F:
Eh2 - Zof / Zmf - 0,05.
Los valores del segundo estimador de género para todas las muestras del lote de análisis se muestran en el eje x de la figura 7. Las muestras clasificadas como femeninas se muestran en un contorno 701 y las muestras clasificadas como masculinas se muestran en un contorno 702.
Estimador de género combinado
Tanto el primero como el segundo estimador de género pueden combinarse en un solo estimador conjunto.
En el caso de un feto del género femenino, se espera que el par de estimadores combinados tenga los siguientes valores:
(Eh1,Eh2) = (0,0).
En caso de un feto del género masculino, se espera que el par de estimadores combinados tenga los siguientes valores:
(Ehi,Eh2) = (1,1).
Para una muestra específica, se pueden calcular las distancias euclidianas entre los pares de valores observados del estimador y ambos pares de valores esperados:
Df =
Figure imgf000012_0001
Dm = V (Ehi - 1)2 (EH2 - 1)2
A partir de esto, un único estimador combinado se calcula como
fh = (Dm - Df)A^2.
Se espera que este valor sea -1 para un feto del género masculino y 1 para un feto del género femenino.
Usando el estimador de género final, una estimación final puede realizarse de la siguiente manera, usando un umbral predeterminado T (> 0):
Eh < -T : género masculino,
Eh > -T y Eh £ T : desconocido,
Eh > T : género femenino.
Los estimadores de género dieron como resultado valores (1,07, 1,43) para la muestra M y valores (-0,10, 0,05) para la muestra F. La figura 8 muestra los valores de ambos estimadores para todas las muestras del lote de análisis. Las muestras cuyos valores del estimador están centrados en torno a (0,0) se clasificarán como femeninas y se muestran en un contorno 801. Las muestras cuyos valores del estimador están centrados alrededor de (1,1) se clasificarán como masculinas y se muestran en un contorno 802.
Finalmente, se puede calcular un valor del estimador combinado para las muestras M y F:
Muestra M:
Eh - -0,95,
Muestra F:
EH - 0,94.
En base a estos valores y al umbral T-0,3, la muestra M se clasifica como masculina y la muestra F como femenina. El valor de Eh para todas las muestras del lote de análisis de ejemplo se muestra en la figura 9. Las muestras clasificadas como femeninas se muestran en el lado izquierdo de la línea vertical 901, y las muestras clasificadas como masculinas se muestran en el lado derecho de la línea vertical 902. Cualquier punto de muestra entre las líneas 901 y 902 (ninguna estaba presente en el presente ejemplo) se clasificaría como desconocido. El valor de umbral T se determinó empíricamente utilizando un gran conjunto de datos.
La figura 10 ilustra una realización de un sistema de la invención para estimar el género de un feto de una hembra embarazada. El sistema comprende un dispositivo de medición 1001, un módulo de determinación 1002 y un módulo de estimación 1003. El dispositivo de medición 1001 está configurado para medir las presencias alélicas (Dx) para una primera pluralidad de marcadores genéticos del cromosoma X y las presencias alélicas (Dr) para una segunda pluralidad de marcadores genéticos de al menos un cromosoma de referencia, diferente de los cromosomas X e Y, en una muestra de ADN libre de células de una hembra embarazada. El módulo de determinación 1002 está configurado para determinar una primera fracción (Fx ) de dicha presencia alélica medida para dicha primera pluralidad que se asocia a marcadores genéticos puramente homocigotos, y una segunda fracción (Fr) de dicha presencia alélica medida para dicha segunda pluralidad que se asocia a marcadores genéticos puramente homocigotos. El módulo de estimación 1003 está configurado para estimar el género de dicho feto a partir de dicha primera y segunda fracción. La estimación puede realizarse de acuerdo con cualquiera de las realizaciones ejemplares descritas anteriormente.
Un experto en la materia reconocería fácilmente que los pasos de varios métodos descritos anteriormente pueden realizarse por ordenadores programados. En el presente documento, se pretende que algunas realizaciones abarquen dispositivos de almacenamiento de programas, por ejemplo, medios de almacenamiento de datos digitales, que son legibles para una máquina u ordenador y codifican programas de instrucciones ejecutables por una máquina o por un ordenador, en donde dichas instrucciones realizan algunos o todos los pasos de dichos métodos descritos anteriormente. Los dispositivos de almacenamiento de programas pueden ser, por ejemplo, memorias digitales, medios de almacenamiento magnéticos tales como discos y cintas magnéticas, discos duros o medios de almacenamiento de datos digitales de lectura óptica. Se pretende que las realizaciones también abarquen ordenadores programados para realizar dichos pasos de los métodos descritos anteriormente.
Las funciones de los distintos elementos que se muestran en las figuras, incluyendo los bloques funcionales etiquetados como "módulos", pueden proporcionarse mediante el uso de hardware dedicado, así como de hardware capaz de ejecutar un software en asociación con el software apropiado. Cuando se proporcionan por un procesador, las funciones pueden proporcionarse por un solo procesador dedicado, por un solo procesador compartido o por una pluralidad de procesadores individuales, algunos de los cuales pueden ser compartidos. Además, no debe considerarse que el uso explícito del término "módulo" se refiera exclusivamente al hardware capaz de ejecutar software, y puede incluir implícitamente, sin limitación, hardware del procesador de señales digitales (DSP), procesador de red, circuito integrado de aplicación específica (ASIC), matriz de puertas lógicas programable en campo (FPGA), memoria de solo lectura (ROM) para almacenar el software, memoria de acceso aleatorio (RAM) y almacenamiento no volátil. También se puede incluir otro hardware, convencional y/o personalizado.
Aunque que los principios de la invención han sido establecidos anteriormente en conexión con realizaciones específicas, debe entenderse que esta descripción se hace simplemente a modo de ejemplo y no como una limitación del alcance de protección que se determina por las reivindicaciones adjuntas.

Claims (15)

REIVINDICACIONES
1. Un método para estimar el género de un feto de una hembra embarazada, comprendiendo dicho método:
- medir presencias alélicas (Dx) para una primera pluralidad de marcadores genéticos del cromosoma X y presencias alélicas (Dr) para una segunda pluralidad de marcadores genéticos de al menos un cromosoma de referencia, diferente de los cromosomas X e Y, en una muestra de ADN libre de células de una hembra embarazada; representando cada presencia alélica la presencia en un marcador genético de al menos uno de: un alelo de referencia de origen materno o fetal, y un alelo alternativo de origen materno o fetal;
- en base a dichas presencias alélicas medidas para dicha primera pluralidad, determinar una primera fracción (Fx ) de las mismas que se asocia a marcadores genéticos puramente homocigotos;
- en base a dicha medida de las presencias alélicas para dicha segunda pluralidad, determinar una segunda fracción (Fr) de las mismas que se asocia a marcadores genéticos puramente homocigotos; y
- estimar el género de dicho feto en base a dicha primera y segunda fracción, en donde una primera fracción más alta en comparación con la segunda fracción es indicativa de un feto del género masculino y donde una primera fracción aproximadamente igual en comparación con la segunda fracción es indicativa de un feto del género femenino.
2. El método de la reivindicación 1, en donde la determinación de la primera fracción comprende:
- en base a dichas presencias alélicas medidas en la primera pluralidad de marcadores genéticos, calcular un número correspondiente de frecuencias alélicas para dicha primera pluralidad;
- determinar como la primera fracción la fracción de dichas presencias alélicas medidas para las cuales la frecuencia alélica es 0 o 1 dentro de un margen de error predeterminado;
y/o
en donde la determinación de la segunda fracción comprende:
- en base a dichas presencias alélicas medidas para la segunda pluralidad de marcadores genéticos, calcular un número correspondiente de frecuencias alélicas para dicha segunda pluralidad;
- determinar como segunda fracción la fracción de dichas presencias alélicas medidas para las cuales la frecuencia alélica es 0 o 1 dentro de un margen de error predeterminado.
3. El método de la reivindicación 1 o 2, en donde la estimación comprende:
estimar un primer estimador de género utilizando una proporción entre la primera fracción (Fx) y la segunda fracción (Fr).
4. El método de una cualquiera de las reivindicaciones anteriores, en donde los pasos de medición y determinación se realizan para un lote que comprende una pluralidad de muestras; en donde para cada muestra del lote, se calculan la primera y la segunda fracción; y en donde el paso de estimación del género se basa además en dicha primera y segunda fracción de cada muestra.
5. El método de la reivindicación 4, en donde el paso de estimar un género comprende:
determinar un primer estimador de género (Em) para cada muestra en base a dicha primera y segunda fracción para dicha muestra; para cada muestra para la cual el primer estimador de género indica que el género del feto es femenino, determinar una proporción (N) entre las presencias alélicas medidas de la primera pluralidad y las presencias alélicas medidas de la segunda pluralidad de marcadores genéticos, y determinar los parámetros de distribución estadística de dicha pluralidad de proporciones para dichas muestras asociadas a un primer estimador de género que indica que el feto es femenino;
utilizando dicha distribución estadística para determinar un segundo estimador de género, opcionalmente en donde el paso de estimar un género comprende además: determinar un estimador de género combinado utilizando dicho primer y segundo estimador de género.
6. El método de una cualquiera de las reivindicaciones anteriores, donde el paso de estimar un género comprende el cálculo de un primer estimador de género Eh1 que se espera que sea aproximadamente 0 para un feto del género femenino y aproximadamente 1 para un feto del género masculino, como sigue:
EH1 = (Eh0 - 1) / (EHe-1),
con
Eho = Fx / Fr;
siendo Fx la primera fracción;
siendo Fr la segunda fracción; y
siendo EHe un valor predictivo para Eho en caso de un feto del género masculino,
opcionalmente, en donde el paso de estimar un género comprende el cálculo de un segundo estimador de género Eh2 para la muestra como
Eh2 - Z/ Z,
siendo Zoí un valor-z calculado para la muestra i de un lote de análisis como:
Figure imgf000015_0001
siendo Zun valor esperado de valor-z bajo la suposición de que la muestra i es "masculina":
\i FF
ZMí — — ~ a X “ T 2"
siendo FF una fracción fetal calculada de la muestra i,
siendo p un valor medio y a una desviación estándar calculada para los valores Npara una pluralidad de muestras de un lote que se determinaron "femeninas" utilizando el primer estimador de género,
siendo Nuna relación entre las presencias alélicas medidas de una primera pluralidad de marcadores genéticos del cromosoma X y las presencias alélicas medidas de una segunda pluralidad de marcadores genéticos de un cromosoma de referencia, para una muestra i.
7. El método de una cualquiera de las reivindicaciones anteriores:
a) en donde la muestra es sangre materna, plasma, orina, líquido cefalorraquídeo, suero, saliva o es fluido de lavado transcervical;
b) en donde dicha etapa de medición comprende al menos una de los siguientes: reacción en cadena de la polimerasa (PCR), reacción en cadena de la ligasa, amplificación basada en la secuencia de ácidos nucleicos (NASBA) y métodos de ADN ramificado; y preferentemente PCR; y/o
(c) comprendiendo además el suministro de la muestra in vitro.
8. Un sistema para estimar el género de un feto de una hembra embarazada, comprendiendo dicho sistema:
- un dispositivo de medición configurado para medir presencias alélicas (Dx ) para una primera pluralidad de marcadores genéticos del cromosoma X y presencias alélicas (Dr) para una segunda pluralidad de marcadores genéticos de al menos un cromosoma de referencia, diferente de los cromosomas X e Y, en una muestra de ADN libre de células de una hembra embarazada; representando cada presencia alélica la presencia en un marcador genético de al menos uno de: un alelo de referencia de origen materno o fetal, y un alelo alternativo de origen materno o fetal;
- un módulo de determinación configurado para determinar una primera fracción (Fx ) de dichas presencias alélicas medidas para dicha primera pluralidad que se asocia a marcadores genéticos puramente homocigotos, y una segunda fracción (Fr) de dichas presencias alélicas medidas para dicha segunda pluralidad que se asocia a marcadores genéticos puramente homocigotos;
- un módulo de estimación configurado para estimar el género de dicho feto a partir de dicha primera y segunda fracción, en donde una primera fracción más alta en comparación con la segunda fracción es indicativa de un feto del género masculino y en el que una primera fracción aproximadamente igual en comparación con la segunda fracción es indicativa de un feto del género femenino
9. El sistema de la reivindicación 8, en donde el módulo de determinación esta configurado para:
- en base a dichas presencias alélicas medidas en la primera pluralidad de marcadores genéticos, calcular un número correspondiente de frecuencias alélicas para dicha primera pluralidad;
- determinar como la primera fracción la fracción de dichas presencias alélicas medidas para las cuales la frecuencia alélica es 0 o 1 dentro de un margen de error predeterminado;
y/o para:
- en base a dichas presencias alélicas medidas para la segunda pluralidad de marcadores genéticos, calcular un número correspondiente de frecuencias alélicas para dicha segunda pluralidad;
- determinar como segunda fracción la fracción de dichas presencias alélicas medidas para las cuales la frecuencia alélica es 0 o 1 dentro de un margen de error predeterminado.
10. El sistema de la reivindicación 8 o 9, en donde el módulo de estimación está configurado para:
estimar un primer estimador de género utilizando una proporción entre la primera fracción (Fx) y la segunda fracción (Fr).
11. El sistema de una cualquiera de las reivindicaciones 8-10, en donde el dispositivo de medición y el módulo de determinación están configurados para realizar la medición y la determinación para un lote que comprende una pluralidad de muestras, en donde para cada muestra del lote, se calculan la primera y la segunda fracción; y en donde el módulo de estimación se configura para estimar el género en base a dicha primera y segunda fracción de cada muestra.
12. El sistema de la reivindicación 11, en donde el módulo de estimación está configurado para estimar un género mediante:
la determinación de un primer estimador de género (Em) para cada muestra en base a dicha primera y segunda fracción para dicha muestra; para cada muestra para la cual el primer estimador de género indica que el género del feto es femenino, la determinación de una proporción (Nxí) entre las presencias alélicas medidas de la primera pluralidad y las presencias alélicas medidas de la segunda pluralidad de marcadores genéticos, y la determinación de los parámetros de distribución estadística de dicha pluralidad de proporciones para dichas muestras asociadas a un primer estimador de género que indica que el feto es femenino;
utilizando dicha distribución estadística para determinar un segundo estimador de género; y, opcionalmente, la determinación de un estimador de género combinado utilizando dicho primer y segundo estimador de género.
13. El sistema de una cualquiera de las reivindicaciones 8-12, en donde el módulo de medición está configurado para medir las presencias alélicas utilizando al menos una de las siguientes: reacción en cadena de la polimerasa (PCR), reacción en cadena de la ligasa, amplificación basada en la secuencia de ácidos nucleicos (NASBA) y métodos de ADN ramificado; y, preferentemente, PCR.
14. Un programa informático que comprende instrucciones ejecutables por ordenador para realizar, cuando el programa se ejecuta en un ordenador, al menos el paso de estimar el género del método de una cualquiera de las reivindicaciones 1-7.
15. Un medio de almacenamiento de datos digitales que codifica un programa de instrucciones ejecutables por una máquina para realizar al menos el paso de estimación del género del método de una cualquiera de las reivindicaciones 1-7.
ES16738770T 2015-07-17 2016-07-13 Método y sistema para estimar el género del feto de una hembra embarazada Active ES2764501T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
BE2015/5464A BE1022789B1 (nl) 2015-07-17 2015-07-17 Werkwijze en systeem voor geslachtsinschatting van een foetus van een zwangere vrouw
PCT/EP2016/066653 WO2017012954A1 (en) 2015-07-17 2016-07-13 Method and system for estimating a gender of a foetus of a pregnant female

Publications (1)

Publication Number Publication Date
ES2764501T3 true ES2764501T3 (es) 2020-06-03

Family

ID=54292998

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16738770T Active ES2764501T3 (es) 2015-07-17 2016-07-13 Método y sistema para estimar el género del feto de una hembra embarazada

Country Status (5)

Country Link
US (1) US11155854B2 (es)
EP (1) EP3326094B1 (es)
BE (1) BE1022789B1 (es)
ES (1) ES2764501T3 (es)
WO (1) WO2017012954A1 (es)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116172535A (zh) * 2023-03-08 2023-05-30 抖音视界有限公司 胎心检测方法、装置、电子设备以及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2011207561B2 (en) * 2010-01-19 2014-02-20 Verinata Health, Inc. Partition defined detection methods
US11270781B2 (en) * 2011-01-25 2022-03-08 Ariosa Diagnostics, Inc. Statistical analysis for non-invasive sex chromosome aneuploidy determination
DK2561103T3 (da) * 2011-06-29 2014-10-20 Bgi Diagnosis Co Ltd Ikke-invasiv påvisning af føtal genetisk anomali
US9598730B2 (en) * 2011-10-18 2017-03-21 Multiplicom Nv Fetal chromosomal aneuploidy diagnosis
GB201215449D0 (en) * 2012-08-30 2012-10-17 Zoragen Biotechnologies Llp Method of detecting chromosonal abnormalities
CN104169929B (zh) * 2013-09-10 2016-12-28 深圳华大基因股份有限公司 用于确定胎儿是否存在性染色体数目异常的系统和装置

Also Published As

Publication number Publication date
EP3326094A1 (en) 2018-05-30
WO2017012954A1 (en) 2017-01-26
US11155854B2 (en) 2021-10-26
EP3326094B1 (en) 2019-12-18
US20180171390A1 (en) 2018-06-21
BE1022789B1 (nl) 2016-09-06

Similar Documents

Publication Publication Date Title
US11031100B2 (en) Size-based sequencing analysis of cell-free tumor DNA for classifying level of cancer
ES2894479T3 (es) Análisis mutacional de ADN de plasma para la detección de cáncer
US20210301343A1 (en) Method and system for estimating whether a female is pregnant based on a blood sample
ES2764501T3 (es) Método y sistema para estimar el género del feto de una hembra embarazada
HK40084570B (en) Size-based analysis of fetal dna fraction in maternal plasma
HK40041430B (en) Size-based analysis of fetal dna fraction in maternal plasma
HK1261405B (en) Size-based analysis of dna for classification of cancer
HK1200194B (en) Size-based analysis of fetal dna fraction in maternal plasma
HK1206394B (en) Size-based analysis of dna for classification of a level of cancer