ES2986639T3 - Métodos para detectar grandes reordenamientos en BRCA1/2 - Google Patents
Métodos para detectar grandes reordenamientos en BRCA1/2 Download PDFInfo
- Publication number
- ES2986639T3 ES2986639T3 ES18732543T ES18732543T ES2986639T3 ES 2986639 T3 ES2986639 T3 ES 2986639T3 ES 18732543 T ES18732543 T ES 18732543T ES 18732543 T ES18732543 T ES 18732543T ES 2986639 T3 ES2986639 T3 ES 2986639T3
- Authority
- ES
- Spain
- Prior art keywords
- exons
- brca1
- gene
- exon
- brca2
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 230000008707 rearrangement Effects 0.000 title claims abstract description 18
- 108091007743 BRCA1/2 Proteins 0.000 title description 19
- 108091093088 Amplicon Proteins 0.000 claims abstract description 162
- 108700024394 Exon Proteins 0.000 claims abstract description 112
- 108700040618 BRCA1 Genes Proteins 0.000 claims abstract description 81
- 108700010154 BRCA2 Genes Proteins 0.000 claims abstract description 78
- 102000036365 BRCA1 Human genes 0.000 claims abstract description 54
- 101150072950 BRCA1 gene Proteins 0.000 claims abstract description 54
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 48
- 101150008921 Brca2 gene Proteins 0.000 claims abstract description 47
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 44
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 44
- 238000012224 gene deletion Methods 0.000 claims abstract description 28
- 238000012217 deletion Methods 0.000 claims abstract description 18
- 230000037430 deletion Effects 0.000 claims abstract description 18
- 238000013507 mapping Methods 0.000 claims abstract description 6
- 108090000623 proteins and genes Proteins 0.000 claims description 20
- 238000012353 t test Methods 0.000 claims description 10
- 238000000692 Student's t-test Methods 0.000 claims description 9
- 230000000392 somatic effect Effects 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 abstract description 31
- 238000013519 translation Methods 0.000 abstract description 2
- 239000000523 sample Substances 0.000 description 59
- 239000013615 primer Substances 0.000 description 46
- 239000002773 nucleotide Substances 0.000 description 21
- 125000003729 nucleotide group Chemical group 0.000 description 21
- 238000006243 chemical reaction Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 18
- 238000001514 detection method Methods 0.000 description 17
- 230000015654 memory Effects 0.000 description 17
- 102000053602 DNA Human genes 0.000 description 15
- 108020004414 DNA Proteins 0.000 description 15
- 239000003153 chemical reaction reagent Substances 0.000 description 12
- 230000003321 amplification Effects 0.000 description 11
- 238000003199 nucleic acid amplification method Methods 0.000 description 11
- 108700020463 BRCA1 Proteins 0.000 description 10
- 108091034117 Oligonucleotide Proteins 0.000 description 10
- 230000000295 complement effect Effects 0.000 description 9
- 238000003556 assay Methods 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 229920002477 rna polymer Polymers 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 108700020462 BRCA2 Proteins 0.000 description 6
- 102000052609 BRCA2 Human genes 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000010348 incorporation Methods 0.000 description 5
- 150000002500 ions Chemical class 0.000 description 5
- 102000040430 polynucleotide Human genes 0.000 description 5
- 108091033319 polynucleotide Proteins 0.000 description 5
- 239000002157 polynucleotide Substances 0.000 description 5
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 238000005286 illumination Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000012384 transportation and delivery Methods 0.000 description 4
- 238000000137 annealing Methods 0.000 description 3
- 239000006227 byproduct Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 125000003835 nucleoside group Chemical group 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 239000012491 analyte Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 229920001519 homopolymer Polymers 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000007838 multiplex ligation-dependent probe amplification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 210000002307 prostate Anatomy 0.000 description 2
- 208000023958 prostate neoplasm Diseases 0.000 description 2
- 239000000376 reactant Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000007841 sequencing by ligation Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- IRLPACMLTUPBCL-KQYNXXCUSA-N 5'-adenylyl sulfate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OS(O)(=O)=O)[C@@H](O)[C@H]1O IRLPACMLTUPBCL-KQYNXXCUSA-N 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 108020001019 DNA Primers Proteins 0.000 description 1
- 230000003350 DNA copy number gain Effects 0.000 description 1
- 230000004536 DNA copy number loss Effects 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 241000586568 Diaspidiotus perniciosus Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241000094111 Parthenolecanium persicae Species 0.000 description 1
- 241001479451 Parthenolecanium pruinosum Species 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000004545 gene duplication Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 201000011045 hereditary breast ovarian cancer syndrome Diseases 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- GPRLSGONYQIRFK-UHFFFAOYSA-N hydron Chemical compound [H+] GPRLSGONYQIRFK-UHFFFAOYSA-N 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 230000000394 mitotic effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000006226 wash reagent Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6851—Quantitative amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/10—Ploidy or copy number detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/106—Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/112—Disease subtyping, staging or classification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Analytical Chemistry (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Pathology (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Un método para detectar grandes reordenamientos en los genes BRCA1 y BRCA2 incluye amplificar una muestra de ácido nucleico en presencia de un grupo de cebadores para producir amplicones, donde el grupo de cebadores incluye cebadores específicos de diana que se dirigen a regiones de exones de los genes BRCA1 y BRCA2. El método incluye además secuenciar los amplicones para generar una pluralidad de lecturas, mapear las lecturas a una secuencia de referencia, determinar un número de lecturas por amplicón para los amplicones asociados con los exones de los genes BRCA y BRCA2, determinar números de copias de exón para los exones de los genes BRCA1 y BRCA2 en función del número de lecturas por amplicón, detectar una deleción o duplicación de exón en función del número de copias de exón y detectar una deleción de gen completo del gen BRCA1 o BRCA2 en función del número de lecturas por amplicón asociado con los exones de los genes BRCA1 y BRCA2. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Métodos para detectar grandes reordenamientos en BRCA1/2
Breve resumen de la invención
Las mutaciones somáticas y germoplásmicas en los genes BRCA1 y BRCA2 están implicadas en los cánceres de mama y de ovario hereditarios y no hereditarios. Estos genes están implicados en el riesgo hereditario y la respuesta a determinadas terapias. Una prueba que detecte estas mutaciones a partir de muestras FFPE clínicamente relevantes es valiosa tanto para la investigación como para futuros fines de diagnóstico clínico. Aunque comúnmente se detectan pequeñas variantes en estos genes, los grandes reordenamientos, como las variaciones en el número de copias en los exones, son difíciles de detectar utilizando soluciones de secuenciación tradicionales. Los grandes reordenamientos representan una porción pequeña, pero importante, de las mutaciones de BRCA1/2, además de las mutaciones de nucleótido único y las inserciones/deleciones pequeñas. El tamaño de los grandes reordenamientos dificulta su detección utilizando soluciones de secuenciación tradicionales, por lo que se requieren pruebas adicionales como la amplificación de sonda dependiente de ligadura multiplexada (MLPA). Existe la necesidad de un ensayo de secuenciación avanzada (NGS) con un enfoque de análisis de datos integral que pueda detectar tanto pequeñas mutaciones como grandes reordenamientos en un único ensayo con alta sensibilidad. Es necesario que el ensayo NGS tenga la capacidad de detectar tanto pequeñas mutaciones como grandes reordenamientos en una muestra fijada con formalina e incluida en parafina (FFPE):
Hirotsu y col. 2017, Oncotarget 8(70):114463-114473, describe el uso del ensayo Oncomine.
Esta necesidad se aborda mediante la invención de la reivindicación 1. Se proporcionan realizaciones ventajosas en las reivindicaciones dependientes.
Según una realización no reivindicada, pero útil para comprender la invención, se proporciona un kit que comprende un conjunto de cebadores asociados con exones de los genes BRCA1 y BRCA2 en un panel de genes, utilizándose los cebadores en un método para detectar grandes reordenamientos en los genes BRCA1 y BRCA2, que comprende: (a) amplificar una muestra de ácido nucleico en presencia de un conjunto de cebadores para producir una pluralidad de amplicones, incluyendo el conjunto de cebadores una pluralidad de cebadores específicos de diana que se dirigen a regiones de los exones de los genes BRCA1 y BRCA2, en donde los cebadores específicos de diana para una región de un exón producen amplicones solapados que cubren el exón; (b) secuenciar los amplicones para generar una pluralidad de lecturas; (c) cartografiar las lecturas en una secuencia de referencia, en donde la secuencia de referencia incluye los genes BRCA1 y BRCA2; (d) determinar un número de lecturas por amplicón para los amplicones asociados con los exones del gen BRCA1 y un número de lecturas por amplicón para los amplicones asociados con los exones del gen BRCA2; (e) determinar los números de copias de exones para los exones de los genes BRCA1 y BRCA2 basándose en el número de lecturas por amplicón para los amplicones asociados con los exones de los genes BRCA1 y BRCA2; (f) detectar una deleción del exón o una duplicación del exón basándose en los números de copias del exón; y (g) detectar una deleción génica completa del gen BRCA1 o del gen BRCA2 basándose en el número de lecturas por amplicón para los amplicones asociados con los exones de los genes BRCA1 y BRCA2.
Breve descripción de los dibujos
En las reivindicaciones adjuntas se muestran las novedosas características de la invención. Se obtendrá una mejor comprensión de las características y ventajas de la presente invención por referencia a la siguiente descripción detallada que expone las modalidades ilustrativas, en las que se utilizan los principios de la invención, y los dibujos acompañantes de los que:
La Fig. 1 ilustra un ejemplo del uso de pares de cebadores para producir amplicones dirigidos a un exón de BRCA1/2.
La Fig. 2 ilustra un ejemplo de amplicones diseñados para cubrir un exón de BRCA1.
La Fig. 3 es un diagrama de bloques de un método ilustrativo para detectar variantes en BRCA1/2, según una realización.
La Fig. 4 es un diagrama de bloques de un método ilustrativo para detectar grandes reordenamientos, según una realización.
La Fig. 5 muestra resultados ilustrativos de las lecturas de secuencias de amplicones generadas a partir de cinco conjuntos de datos diferentes de muestras de ADN FFPE de tumores de próstata.
La Fig. 6 muestra resultados ilustrativos de las lecturas de secuencias de amplicones ordenadas según el contenido de GC.
La Fig. 7 muestra un ejemplo de un gráfico de cajas de los recuentos de lecturas normalizados por amplicón para exones de BRCA1/2 generados a partir de una muestra normal representativa.
La Fig. 8 muestra un ejemplo de un gráfico de cajas de los recuentos de lecturas normalizados por amplicón para exones de BRCA1/2, donde el gen BRCA1 tiene deleciones de exones.
La Fig. 9 muestra un ejemplo de un gráfico de cajas de los recuentos de lecturas normalizados por amplicón para exones de BRCA1/2, donde el gen BRCA2 tiene duplicaciones de exones.
La Fig. 10 muestra un ejemplo de un gráfico de cajas de los recuentos de lecturas normalizados por amplicón para exones de BRCA1/2, donde el gen BRCA1 tiene una deleción del exón.
La Fig. 11 es un diagrama de bloques de un sistema ilustrativo para la secuenciación de ácidos nucleicos, según una realización.
Descripción detallada de la invención
En diversas realizaciones, se puede hacer referencia al ADN (ácido desoxirribonucleico) como una cadena de nucleótidos que consta de 4 tipos de nucleótidos; A (adenina), T (timina), C (citosina) y G (guanina), y que el ARN (ácido ribonucleico) está compuesto por 4 tipos de nucleótidos; A, U (uracilo), G y C. Determinados pares de nucleótidos se unen específicamente entre sí de forma complementaria (lo que se denomina emparejamiento de bases complementarias). Es decir, la adenina (A) se empareja con la timina (T) (en el caso del ARN, sin embargo, la adenina (A) se empareja con el uracilo (U)), y la citosina (C) se empareja con la guanina (G). Cuando una primera hebra de ácido nucleico se une a una segunda hebra de ácido nucleico formada por nucleótidos que son complementarios a los de la primera hebra, las dos hebras se unen para formar una doble hebra. En diversas realizaciones, “ datos de secuenciación de ácidos nucleicos” , “ información de secuenciación de ácidos nucleicos” , “ secuencia de ácidos nucleicos” , “ secuencia genómica” , “ secuencia genética” o “ secuencia de fragmentos” o “ lectura de secuenciación de ácidos nucleicos” denota cualquier información o datos que son indicativos del orden de las bases de nucleótidos (por ejemplo, adenina, guanina, citosina y timina/uracilo) en una molécula (por ejemplo, genoma completo, transcriptoma completo, exoma, oligonucleótido, polinucleótido, fragmento, etc.) de ADN o ARN.
En diversas realizaciones, un “ polinucleótido” , “ácido nucleico” u “ oligonucleótido” se refiere a un polímero lineal de nucleósidos (incluidos desoxirribonucleósidos, ribonucleósidos o análogos de los mismos) unidos mediante enlaces internucleosídicos. Normalmente, un polinucleótido comprende al menos tres nucleósidos. Normalmente los oligonucleótidos varían en tamaño desde unas pocas unidades monoméricas, por ejemplo 3-4, hasta varios cientos de unidades monoméricas. Siempre que un polinucleótido tal como un oligonucleótido esté representado por una secuencia de letras, tal como “ATGCCTG” , se entenderá que los nucleótidos están en orden 5'->3' de izquierda a derecha y que “A” denota desoxiadenosina, “ C” denota desoxicitidina, “ G” denota desoxiguanosina y “T” denota timidina, a menos que se indique lo contrario. Las letras A, C, G y T pueden usarse para referirse a las propias bases, a nucleósidos o a nucleótidos que comprenden las bases, como es estándar en la técnica.
La expresión “ secuenciación avanzada” o NGS se refiere a tecnologías de secuenciación que tienen un mayor rendimiento en comparación con los enfoques tradicionales basados en electroforesis capilar y Sanger, por ejemplo, con la capacidad de generar cientos de miles de lecturas de secuencias relativamente pequeñas a la vez. Algunos ejemplos de técnicas de secuenciación avanzada incluyen, entre otros, secuenciación por síntesis, secuenciación por ligadura y secuenciación por hibridación.
Como se utiliza en la presente memoria, los términos “ adaptador” o “ adaptador y sus complementos” y sus derivados se refieren a cualquier oligonucleótido lineal que pueda ligarse a una molécula de ácido nucleico de la descripción. Opcionalmente, el adaptador incluye una secuencia de ácido nucleico que no es sustancialmente complementaria al extremo 3' o al extremo 5' de al menos una secuencia diana dentro de la muestra. En algunas realizaciones, el adaptador es sustancialmente no complementario del extremo 3' o del extremo 5' de cualquier secuencia diana presente en la muestra. En algunas realizaciones, el adaptador incluye cualquier oligonucleótido lineal monocatenario o bicatenario que no sea sustancialmente complementario a una secuencia diana amplificada. En algunas realizaciones, el adaptador es sustancialmente no complementario a al menos una, algunas o todas las moléculas de ácido nucleico de la muestra. En algunas realizaciones, las longitudes de adaptador adecuadas están en el intervalo de aproximadamente 10-100 nucleótidos, aproximadamente 12-60 nucleótidos y aproximadamente 15-50 nucleótidos de longitud. Un adaptador puede incluir cualquier combinación de nucleótidos y/o ácidos nucleicos. En algunos aspectos, el adaptador puede incluir uno o más grupos escindibles en una o más ubicaciones. En otro aspecto, el adaptador puede incluir una secuencia que sea sustancialmente idéntica, o sustancialmente complementaria, a al menos una porción de un cebador, por ejemplo un cebador universal. En algunas realizaciones, el adaptador puede incluir un código de barras o etiqueta para ayudar con la catalogación, identificación o secuenciación en la dirección 3'. En algunas realizaciones, un adaptador monocatenario puede actuar como sustrato para la amplificación cuando se liga a una secuencia diana amplificada, particularmente en presencia de una polimerasa y dNTP a temperatura y pH adecuados.
Como se utiliza en la presente memoria, “ código de barras de ADN” o “ secuencia de etiquetado de ADN” y sus derivados, se refiere a una secuencia de ácido nucleico corta única (por ejemplo, de 6-14 nucleótidos) dentro de un adaptador que puede actuar como una 'clave' para distinguir o separar una pluralidad de secuencias diana amplificadas en una muestra. Para los fines de esta descripción, se puede incorporar un código de barras de ADN o una secuencia de etiquetado de ADN a la secuencia de nucleótidos de un adaptador.
En diversas realizaciones, se pueden secuenciar ácidos nucleicos diana generados mediante la amplificación de múltiples secuencias específicas diana a partir de una población de moléculas de ácido nucleico. En algunas realizaciones, la amplificación puede incluir hibridar uno o más pares de cebadores específicos de diana con la secuencia diana, extender un primer cebador del par de cebadores, desnaturalizar el primer producto del cebador extendido de la población de moléculas de ácido nucleico, hibridar con el primer producto de cebador extendido el segundo cebador del par de cebadores, extender el segundo cebador para formar un producto bicatenario, y digerir el par de cebadores específicos de diana lejos del producto bicatenario para generar una pluralidad de secuencias diana amplificadas. En algunas realizaciones, las secuencias diana amplificadas se pueden ligar a uno o más adaptadores. En algunas realizaciones, los adaptadores pueden incluir códigos de barras de uno o más nucleótidos o secuencias de etiquetado. En algunas realizaciones, las secuencias diana amplificadas una vez ligadas a un adaptador pueden experimentar una reacción de traducción de mellado y/o amplificación adicional para generar una biblioteca de secuencias diana amplificadas ligadas a un adaptador. Se describen métodos ilustrativos de amplificación multiplexada en la publicación de solicitud de patente US-2012/0295819, publicada el 22 de noviembre de 2012.
En diversas realizaciones, el método para realizar una amplificación múltiplexada mediante la PCR incluye poner en contacto una pluralidad de pares de cebadores específicos de la diana que tienen un cebador directo e inverso, con una población de secuencias diana para formar una pluralidad de dupletes del molde/cebador; añadir una ADN polimerasa y una mezcla de dNTP a la pluralidad de dupletes del molde/cebador durante el tiempo suficiente y a una temperatura suficiente para extender cualquiera (o ambos) del cebador directo o inverso en cada par de cebadores específicos de la diana a través de una síntesis dependiente de la plantilla, generando así una pluralidad de dupletes del producto/molde de cebador extendidos; desnaturalizar los dupletes de producto/molde de cebador extendidos; hibridar con el producto del cebador extendido el cebador complementario del par de cebadores específicos de diana; y extender el cebador hibridado en presencia de una ADN polimerasa y dNTP para formar una pluralidad de moléculas de ácido nucleico bicatenario específicas de la diana.
En algunas realizaciones, los métodos de la descripción incluyen amplificar selectivamente secuencias diana en una muestra que contiene una pluralidad de moléculas de ácido nucleico y ligar las secuencias diana amplificadas a al menos un adaptador y/o código de barras. Los expertos en la técnica conocen bien los adaptadores y códigos de barras para su uso en técnicas de preparación de bibliotecas de biología molecular. Las definiciones de adaptadores y códigos de barras tal como se utilizan en la presente memoria son consistentes con los términos utilizados en la técnica. Por ejemplo, el uso de códigos de barras permite la detección y el análisis de múltiples muestras, fuentes, tejidos o poblaciones de moléculas de ácido nucleico por reacción multiplexada. Una secuencia diana amplificada y con código de barras contiene una secuencia de ácido nucleico única, normalmente una secuencia corta de 6-15 nucleótidos, que identifica y distingue una molécula de ácido nucleico amplificada de otra molécula de ácido nucleico amplificada, incluso cuando ambas moléculas de ácido nucleico menos el código de barras contienen la misma secuencia de ácido nucleico. El uso de adaptadores permite la amplificación de cada molécula de ácido nucleico amplificada de manera uniforme y ayuda a reducir el sesgo de la hebra. Los adaptadores pueden incluir adaptadores universales o adaptadores propios, los cuales pueden usarse en la dirección 3' para realizar una o más funciones distintas. Por ejemplo, las secuencias diana amplificadas preparadas mediante los métodos descritos en la presente memoria se pueden ligar a un adaptador que se puede usar en la dirección 3' como plataforma para la amplificación clonal. El adaptador puede funcionar como una hebra molde para la amplificación posterior usando un segundo conjunto de cebadores y, por lo tanto, permite la amplificación universal de la secuencia diana amplificada ligada al adaptador. En algunas realizaciones, la amplificación selectiva de ácidos nucleicos diana para generar un conjunto de amplicones puede comprender además ligar uno o más códigos de barras y/o adaptadores a una secuencia diana amplificada. La capacidad de incorporar códigos de barras mejora el rendimiento de las muestras y permite el análisis de múltiples muestras o fuentes de material simultáneamente.
En esta solicitud, “ región de confinamiento de reacción” se refiere generalmente a cualquier región en la que una reacción pueda estar confinada e incluye, por ejemplo, una “ cámara de reacción” , un “ pocillo” y un “ micropocillo” (cada uno de los cuales puede usarse indistintamente). Una región de confinamiento de reacción puede incluir una región en la que un atributo físico o químico de un sustrato sólido puede permitir la localización de una reacción de interés, y una región discreta de una superficie de un sustrato que puede unirse específicamente a un analito de interés (tal como una región discreta con oligonucleótidos o anticuerpos unidos, por ejemplo, covalentemente a dicha superficie). Las regiones de confinamiento de la reacción pueden ser huecas o tener formas y volúmenes bien definidos, que pueden fabricarse en un sustrato. Estos últimos tipos de regiones de confinamiento de reacción se denominan en la presente memoria micropocillos o cámaras de reacción, y pueden fabricarse utilizando cualquier técnica de microfabricación adecuada. Las regiones de confinamiento de la reacción también pueden ser, por ejemplo, áreas sustancialmente planas sobre un sustrato sin pocillos.
Se puede disponer una pluralidad de espacios definidos o regiones de confinamiento de reacción en una matriz, y cada espacio definido o regiones de confinamiento de reacción puede estar en comunicación eléctrica con al menos un sensor para permitir la detección o medición de uno o más parámetros o características detectables o medibles. Esta matriz se denomina en la presente memoria matriz de sensores. Los sensores pueden convertir cambios en la presencia, concentración o cantidades de subproductos de reacción (o cambios en el carácter iónico de los reactivos) en una señal de salida, que puede registrarse electrónicamente, por ejemplo, como un cambio en un nivel de voltaje o una nivel actual que, a su vez, puede procesarse para extraer información sobre una reacción química o un evento de asociación deseado, por ejemplo, un evento de incorporación de nucleótidos. Los sensores pueden incluir al menos un transistor de efecto de campo químicamente sensible (“ chemFET” ) que puede configurarse para generar al menos una señal de salida relacionada con una propiedad de una reacción química o analito diana de interés en proximidad de la misma. Dichas propiedades pueden incluir una concentración (o un cambio en la concentración) de un reactivo, producto o subproducto, o un valor de una propiedad física (o un cambio en dicho valor), tal como una concentración de iones. Una medición o consulta inicial de un pH para un espacio definido o regiones de confinamiento de reacción, por ejemplo, puede representarse como una señal eléctrica o un voltaje, que puede digitalizarse (por ejemplo, convertirse en una representación digital de la señal eléctrica o el voltaje). Cualquiera de estas mediciones y representaciones puede considerarse datos sin procesar o una señal sin procesar.
Como se utiliza en la presente memoria, una “variación somática” o “ mutación somática” puede referirse a una variación en la secuencia genética que resulta de una mutación que ocurre en una célula que no es del germoplasma. La variación puede transmitirse a las células hijas mediante división mitótica. Esto puede dar como resultado que un grupo de células tenga una diferencia genética con el resto de células de un organismo. Además, como la variación no se produce en una célula del germoplasma, es posible que los organismos descendientes no hereden la mutación.
En algunas realizaciones, el panel comprende el ensayo Oncomine BRCA Research NGS disponible en Thermo Fisher Scientific (SKU A32840 o s Ku A32841). El ensayo NGS de Oncomine BRCA Research cubre el 100 % de todos los exones de BRCA1/2 con 265 amplicones (regiones diana) utilizando pares de cebadores. El ensayo es compatible con muestras de ADN extraídas de FFPE, así como con muestras de sangre y con métodos de preparación de bibliotecas manuales y automatizados. Los métodos descritos en la presente memoria detectan variaciones en el número de copias a nivel de exón, incluidos grandes indeles, eventos de duplicación/deleción de exón/gen y pequeñas variantes en BRCA1/2 utilizando un único ensayo.
La Fig. 1 ilustra un ejemplo del uso de pares de cebadores para producir amplicones dirigidos a un exón de BRCA1/2. Los amplicones 120, 130 y 140 se solapan parcialmente entre sí y juntos cubren un exón 152 de la secuencia de referencia 150, que incluye el gen BRCA1 o BRCA2. Los pares de cebadores 122 y 124 para el amplicón 120, los pares de cebadores 132 y 134 para el amplicón 130 y los pares de cebadores 142 y 144 para el amplicón 140, se dirigen específicamente a regiones que se solapan al exón 152. El intervalo 160 es un ejemplo de la región de cobertura de exones para el grupo de amplicones 120, 130 y 140. La amplificación de las regiones diana de una muestra de ácido nucleico correspondiente a los pares de cebadores específicos diana 122 y 124, 132 y 134, 142 y 144 puede producir múltiples copias de los amplicones 120, 130 y 140, respectivamente. La amplificación de los amplicones 120, 130 y 140 en la región del exón 152 produciría una alta densidad de amplicones, proporcionando un volumen suficiente de datos para estimaciones del número de copias a nivel de exón. El ejemplo de una disposición particular de los amplicones 120, 130 y 140 con respecto al exón 152 tiene fines únicamente ilustrativos y no es limitativo.
La Fig. 2 ilustra un ejemplo de amplicones diseñados para cubrir un exón de BRCA1. En este ejemplo, se diseñan tres amplicones 202, 204 y 206 para abarcar una región que incluye un exón 208 de una secuencia de referencia de BRCA1. Este ejemplo tiene fines ilustrativos y no es limitativo.
En algunas realizaciones, un grupo de amplicones puede cubrir un exón y las regiones adyacentes al exón. El número de amplicones en un grupo de amplicones puede oscilar entre dos y más de 50. El número típico de amplicones en un grupo que cubre un exón es de tres a cinco. Es posible que uno o más amplicones de un grupo no se solapen al exón, sin embargo, cualquier amplicón se solapa al menos a otro amplicón del grupo. El grupo de amplicones juntos puede cubrir el exón y las regiones adyacentes al exón.
La Fig. 3 es un diagrama de bloques de un método ilustrativo para detectar variantes en BRCA1/2, según una realización. Las mediciones de las señales pueden proporcionarse a un procesador mediante un dispositivo de secuenciación de ácidos nucleicos. En algunas realizaciones, cada medición de señal representa una amplitud o intensidad de señal medida en respuesta a una incorporación o no incorporación de un nucleótido fluido por ácidos nucleicos de muestra en micropocillos de una matriz de sensores. Para un evento de incorporación, las amplitudes de la señal dependen del número de bases incorporadas en un flujo. Para los homopolímeros, las amplitudes de la señal aumentan al aumentar la longitud del homopolímero. El procesador puede aplicar un llamador de bases 302 para generar llamadas de bases para una secuencia leída analizando las mediciones de la señal del espacio de flujo. Las mediciones de la señal pueden ser datos de adquisición sin procesar o datos que han sido procesados, tales como, por ejemplo, mediante escalado, filtrado de fondo, normalización, corrección de la decadencia de la señal y/o corrección de errores o efectos de fase, etc. Las llamadas de base pueden realizarse analizando cualquier característica de la señal adecuada (por ejemplo, amplitud o intensidad de la señal). La estructura y/o diseño de un conjunto de sensores, procesamiento de señales y bases que requieren uso con las presentes enseñanzas pueden incluir una o más características descritas en la publicación de solicitud de patente u S-2013/0090860, 11 de abril de 2013.
Una vez que se determina la secuencia de bases para la lectura de la secuencia, las lecturas de la secuencia pueden proporcionarse al cartografiador 304. El cartografiador 304 alinea las lecturas de la secuencia con un genoma de referencia para determinar lecturas de la secuencia alineadas y los parámetros de calidad asociados a la cartografía. Los métodos para alinear lecturas de las secuencias para su uso con las presentes enseñanzas pueden incluir una o más características descritas en la publicación de solicitud de patente US-2012/0197623, publicada el 2 de agosto de 2012. Las lecturas de la secuencia alineadas pueden proporcionarse para su posterior procesamiento, por ejemplo, en un archivo BAM.
Las lecturas de la secuencia alineadas están asociadas con amplicones en ubicaciones específicas con respecto al genoma de referencia. El bloque de recuentos de lecturas 306 determina el número de lecturas por amplicón, denominado cobertura. Las lecturas de la secuencia alineadas y las lecturas por amplicón pueden proporcionarse al llamador 308 de variante pequeña y al detector 310 de gran reordenamiento.
El llamador 308 de variante pequeña puede detectar variantes pequeñas tales como polimorfismos de un único nucleótido (SNP), inserciones/deleciones (indeles) y polimorfismos de multinucleótidos (MNP). En algunas realizaciones, los métodos de detección de variantes pequeñas para usar con las presentes enseñanzas pueden incluir una o más características descritas en la publicación de solicitud de patente US-2013/0345066, publicada el 26 de diciembre de 2013, publicación de solicitud de patente US-2014/0296080, publicada el 2 de octubre de 2014, y la publicación de la solicitud de patente US-2014/0052381, publicada el 20 de febrero de 2014. En algunas realizaciones, se pueden usar otros métodos de detección de variantes. En diversas realizaciones, se puede configurar un llamador de variantes para comunicar variantes solicitadas para un genoma de muestra como un archivo de datos *vcf, *g ff o *hdf. La información de la variante solicitada se puede comunicar utilizando cualquier formato de archivo siempre que la información de la variante solicitada se pueda analizar y/o extraer para su análisis.
La Fig. 4 es un diagrama de bloques de un método ilustrativo para detectar grandes reordenamientos, según una realización. En algunas realizaciones, el llamador 402 de deleción de gen completo detecta una deleción de gen basándose en el número de lecturas por amplicón de la siguiente manera:
a. Divida el número de lecturas por amplicón para los amplicones asociados con exones del gen BRCA1 por el número total de lecturas en la muestra para formar recuentos de lectura normalizados por amplicón asociado con el gen BRCA1.
b. Calcule la media y la desviación estándar de los recuentos de lectura normalizados por amplicón asociado con el gen BRCA1.
c. Divida el número de lecturas por amplicón para los amplicones asociados con exones del gen BRCA2 por el número total de lecturas en la muestra para formar recuentos de lectura normalizados por amplicón asociado con el gen BRCA2.
d. Calcule la media y la desviación estándar de los recuentos de lectura normalizados por amplicón asociado con el gen BRCA2.
e. Aplique una prueba de la t basada en las medias y las desviaciones estándar calculadas para los genes BRCA1 y BrCa 2 para determinar una estadística de prueba y el valor p asociado.
f. Compare el valor p con un primer umbral para detectar una deleción génica completa si el valor p es menor que el primer umbral. Un valor ilustrativo para el primer valor umbral es 10-4, de modo que p < 10-4. En algunas realizaciones, el primer valor umbral se puede establecer en un valor en un intervalo de 10-5 a 10-3.
g. Calcule la puntuación PHRED en función del valor p,
PHRED score = -lOlog(p-value)
La puntuación PHRED de 40 corresponde a un umbral de valor p de 10-4.
h. Compare la (desviación estándar)/media de cada gen con un segundo umbral, si la (desviación estándar)/media es menor que el segundo umbral. Un valor ilustrativo para el segundo umbral es 0,3, de modo que (desviación estándar)/media < 0,3. En algunas realizaciones, el segundo valor umbral se puede establecer en un valor en un intervalo de 0,2 a 0,4.
i. Si se cumplen los criterios de umbral primero y segundo, entonces se puede tomar la decisión de eliminar todo el gen.
En algunas realizaciones, el llamador 402 de deleción del gen completo puede calcular estadísticas de las lecturas por amplicón asociado con cada exón. En particular, se pueden calcular estadísticas de los recuentos de lecturas normalizadas por amplicón asociados con los exones codificantes. Por ejemplo, un gráfico de cajas que representa estadísticas de recuentos de lecturas normalizados por amplicón para cada exón puede incluir el intervalo, los cuartiles superior e inferior y los valores atípicos de los exones de BRCA1 y BRCA2 en la muestra. El gráfico de cajas puede proporcionarse para su presentación 312 al usuario.
En algunas realizaciones, la muestra puede incluir un identificador de muestra (ID) de amplicones asociados con un cromosoma diferente al BRCA1 (cromosoma 17) y BRCA2 (cromosoma 13). El llamador 302 de bases y el cartografiador 304 pueden procesar los amplicones de ID de las muestras junto con los amplicones asociados con los exones de BRCA1 y BRCA2. El llamador 402 de deleción de gen completo puede dividir el número de lecturas de ID de muestra por el número total de lecturas en la muestra para formar recuentos de lecturas de ID de muestra normalizados. El llamador 402 de deleción de gen completo puede calcular estadísticas de los recuentos de lectura de ID de muestra normalizados. Por ejemplo, un elemento del gráfico de cajas que representa estadísticas de los recuentos de lecturas de ID de muestra normalizadas puede incluir el intervalo, los cuartiles superior e inferior y los valores atípicos. El elemento del gráfico de cajas de la ID de muestra puede incluirse con los elementos del gráfico de cajas para los exones de BRCA1 y BRCA2 y proporcionarse para su visualización 312 al usuario.
En algunas realizaciones, el detector 310 de grandes reordenamientos puede incluir un llamador 404 del número de copias del exón. El llamador 404 del número de copias del exón puede comparar los recuentos de lectura normalizados por amplicón con una cobertura de referencia para el exón asociado para determinar un número de copias candidato para el exón. La cobertura de referencia se puede crear a partir de una única muestra de control, sin embargo, en algunas realizaciones, la cobertura de referencia se puede crear agregando coberturas de una pluralidad de muestras de control y ajustando las coberturas según su información de ploidía conocida. Se puede calcular una diferencia mediana absoluta por pares (MAPD) para las proporciones de los recuentos de lectura normalizados por amplicón y la cobertura inicial de amplicones adyacentes para el exón. Dado que lo ideal es que los amplicones adyacentes para un exón determinado tengan el mismo número de copias, encontrar el valor de la mediana de los valores absolutos de las diferencias de los niveles del número de copias proporciona una indicación de la calidad. Los valores de MAPD para cada exón pueden proporcionar una calidad para el número de copias candidatas para el exón. Los métodos para determinar la variación del número de copias para su uso con las presentes enseñanzas pueden incluir una o más características descritas en la publicación de solicitud de patente US-2014/0256571, publicada el 11 de septiembre de 2014. En algunas realizaciones, los métodos para determinar los números de copias a nivel de gen se pueden adaptar para determinar los números de copias a nivel de exón usando identificadores de exón en lugar de identificadores de genes.
El llamador 404 del número de copias del exón puede aplicar un primer procedimiento de escalado a los números de copias candidatas a nivel de exón para amplicones generados a partir de una muestra de germoplasma de la siguiente manera:
a. Determine el valor más alto de los números de copias candidatas para los exones del gen BRCA1.
b. Determine el valor más alto de los números de copias candidatas para los exones del gen BRCA2.
c. Compare los valores más altos para el gen BRCA1 y el gen BRCA2. Seleccione el número máximo de copias candidatas y seleccione el gen.
d. Defina el límite superior en un intervalo para los números de copias candidatas como el número máximo de copias candidatas seleccionado.
e. Determine el valor de la mediana de los valores del número de copias candidatas para los exones del gen seleccionado que tienen el número máximo de copias candidatas seleccionado.
f. Establezca el valor de la mediana en un nivel de referencia.
g. Escale los números de copias candidatas de los exones de ambos genes en relación con el nivel de referencia.
El nivel de referencia puede proporcionar un punto de referencia conveniente para las variaciones en el número de copias. Por ejemplo, un nivel de referencia de dos representa un estado diploide de dos copias del exón o gen. El llamador 404 del número de copias del exón puede aplicar un segundo procedimiento de escalado a los números de copias candidatas a nivel de exón para amplicones generados a partir de una muestra somática de la siguiente manera:
a. Determine el valor de la mediana de los números de copias candidatas para los exones de BRCA1.
b. Establezca el valor de la mediana en un nivel de referencia.
c. Escale los números de copias candidatas para los exones de BRCA1 en relación con el nivel de referencia.
d. Determine el valor de la mediana de los números de copias candidatas para los exones de BRCA2.
e. Establezca el valor de la mediana al nivel de referencia.
f. Escale los números de copias candidatas para los exones de BRCA2 en relación con el nivel de referencia.
El llamador 404 del número de copias del exón puede almacenar los números de copias candidatas por exón y los valores MAPD correspondientes en uno o más archivos.
El evaluador 406 de CNV puede recibir archivos que contienen los números de copias candidatas para los exones, los valores MAPD correspondientes y la información completa de deleción del gen. En algunas realizaciones, el evaluador 406 de CNV puede aplicar reglas empíricas para calificar los números de copia candidatas y asignar cada uno a uno de los cuatro subtipos posibles: deleción del exón (BigDel), duplicación del exón (BigDup), referencia (REF) y sin llamada (NOCALL). La puntuación puede basarse en los valores de MAPD entre exones y la desviación de los números de copia candidatas de los valores enteros. El evaluador 406 de CNV puede fusionar llamadas de números de copias para exones adyacentes si los valores del número de copias candidatas están dentro de un intervalo del mismo número entero. Los intervalos de ejemplo para el intervalo pueden ser el valor entero ±0,3, el valor entero ±0,35, el valor entero ±0,2, el valor entero ±0,25.
En algunas realizaciones, las reglas para combinar llamadas de números de copias para exones adyacentes pueden incluir una o más de las siguientes:
a. Las llamadas BigDel adyacentes para exones se combinan para formar una llamada BigDel fusionada para un segmento que incluye dos o más exones adyacentes.
b. Las llamadas BigDup adyacentes para exones se combinan para formar una llamada BigDup fusionada para un segmento que incluye dos o más exones adyacentes.
c. Las llamadas REF adyacentes para exones se combinan para formar una llamada REF fusionada para un segmento que incluye dos o más exones adyacentes.
d. Los NOCALL adyacentes para exones se combinan para formar un NOCALL fusionado para un segmento que incluye dos o más exones adyacentes.
e. Las llamadas BigDel adyacentes a NOCALL adyacentes a BigDel se combinan para formar una llamada BigDel fusionada para un segmento que incluye tres exones adyacentes.
f. Las llamadas BigDup adyacentes a NOCALL adyacentes a BigDup se combinan para formar una llamada BigDup fusionada para un segmento que incluye tres exones adyacentes.
El evaluador 406 de CNV puede proporcionar la versión final de las llamadas de números de copia para los exones, llamadas fusionadas para segmentos que tienen dos o más exones e información de deleción de genes en un archivo de salida para visualizarlo 312 al usuario.
En algunas realizaciones, se pueden usar visualizaciones gráficas de recuentos de cobertura normalizados para cada exón en el panel para confirmar las llamadas y sugerir muestras que pueden requerir estudios adicionales. Se puede utilizar una visualización de la cobertura normalizada de los amplicones de ID de muestra para calibrar los eventos de ganancia o pérdida del número de copias de los genes BRCA1 y BRCA2.
La Tabla 1 muestra una comparación de un panel de investigación de BRCA1/2 anterior y el ensayo de investigación BRCA Oncomine™, que puede usarse con los métodos descritos en la presente memoria. Las mejoras incluyen la reducción a la mitad del ADN requerido, la compatibilidad con muestras fijadas con formalina e incluidas en parafina (FFPE) y la capacidad de detectar eliminaciones de exones y genes utilizando los métodos descritos en la presente memoria.
Tabla 1.
La Fig. 5 muestra resultados ilustrativos de las lecturas de secuencias de amplicones generadas a partir de cinco conjuntos de datos diferentes de muestras de ADN FFPE de tumores de próstata. El eje x es el conjunto de amplicones ordenados por el número de lecturas de secuencias de amplicones en orden ascendente y el eje y es el número de lecturas de secuencias de amplicones. Los resultados muestran que los amplicones BRCA1/2 son uniformes y funcionan bien con ADN FFPE. Para la muestra de próstata 1, se muestra la línea 0,2xMedia. La uniformidad puede indicarse mediante la fracción de lecturas de secuencias de amplicones que son mayores que 0,2 veces el número medio de lecturas de secuencias de amplicones. Los números de lecturas de secuencias de amplicones para la muestra de próstata 1 están casi todos por encima de la línea 0,2xMedia. La uniformidad puede indicarse mediante la fracción de lecturas de secuencias de amplicones que son mayores que 0,2 veces el número medio de lecturas de secuencias de amplicones.
La Fig. 6 muestra resultados ilustrativos de las lecturas de secuencias de amplicones ordenadas según el contenido de GC. El eje x proporciona el porcentaje de contenido de bases G o C en las lecturas de las secuencias de amplicones y el eje y proporciona el log 10 del número de lecturas de las secuencias de amplicones. Los resultados muestran uniformidad, donde todos los valores están por encima de la línea 0,2xMedia.
La Fig. 7 muestra un ejemplo de un gráfico de cajas de los recuentos de lecturas normalizados por amplicón para exones de BRCA1/2 generados a partir de una muestra normal representativa. El eje x enumera los designadores de exones y el eje y proporciona el log2 de los recuentos de lecturas normalizados. El nivel y=0 indica un nivel normal. Los gráficos de cajas se acercan generalmente al nivel normal. Puede haber alguna variación, que puede deberse al ruido del amplicón.
La Fig. 8 muestra un ejemplo de un gráfico de cajas de los recuentos de lecturas normalizados por amplicón para exones de BRCA1/2, donde el gen BRCA1 tiene deleciones de exones. El gráfico de cajas muestra que los exones 18-20 del gen BRCA1 están agrupados alrededor de un valor del log2 de -1, lo que indica la mitad del nivel normal de recuentos de lecturas normalizados.
La Fig. 9 muestra un ejemplo de un gráfico de cajas de los recuentos de lecturas normalizados por amplicón para exones de BRCA1/2, donde el gen BRCA2 tiene duplicaciones de exones. El gráfico de cajas muestra que los exones 4-26 del gen BRCA2 están agrupados entre 0 y 1, cerca de log2(3/2), lo que indica 3/2 del nivel normal de recuentos de lecturas normalizados.
La Fig. 10 muestra un ejemplo de un gráfico de cajas de los recuentos de lecturas normalizados por amplicón para exones de BRCA1/2, donde el gen BRCA1 tiene una deleción del exón. El gráfico de cajas muestra que el exón 2 del gen BRCA1 está cerca de un valor del log2 de -1, lo que indica la mitad del nivel normal de recuentos de lecturas normalizados.
La Tabla 2 ofrece un resumen de las métricas de rendimiento de la deleción de exones para 193 muestras analizadas y el resultado comparado con el conjunto de verdad conocida.
Tabla 2.
En la Tabla 2, TP es verdadero positivo, FP es falso positivo, FN es falso negativo, NC es sin llamada, la sensibilidad es TP/(TP+FN), la especificidad es TN/(TN+FP) y el valor predictivo positivo PPV es TP (TP+FP). Los elementos NC - Muestra, TN - Muestra y FP - Muestra indican múltiples eventos del tipo dado para una muestra. Los resultados de rendimiento muestran una alta sensibilidad de 0,944 y una alta especificidad de 0,949. El valor del PPV se ve afectado por la fusión de exones adyacentes en un segmento que se cuenta como una sola unidad. Un falso positivo tendría muy pocas posibilidades de fusionarse con un exón adyacente. El efecto de fusionar exones en segmentos más grandes para los TP y no para los FP reduce la proporción de TP a FP, lo que lleva a un PPV más bajo.
La Tabla 3 proporciona los resultados de una comparación de los resultados de los métodos de detección de grandes reordenamientos (LRD) descritos en la presente memoria con métodos que aplican un modelo oculto de Markov (HMM) y una maximización de expectativas (EM). Los resultados se compararon con los conjuntos de verdad para las muestras. El rendimiento para la detección de grandes reordenamientos (LRD) muestra el mayor número de verdaderos positivos y el menor número de falsos positivos.
Tabla 3.
Según una realización ilustrativa, se proporciona un método para detectar grandes reordenamientos en los genes BRCA1 y BRCA2, que comprende: (a) amplificar una muestra de ácido nucleico en presencia de un conjunto de cebadores para producir una pluralidad de amplicones, incluyendo el conjunto de cebadores una pluralidad de cebadores específicos de diana que se dirigen a regiones de los exones de los genes BRCA1 y BRCA2, en donde los cebadores específicos de diana para una región de un exón producen amplicones solapados que cubren el exón; (b) secuenciar los amplicones para generar una pluralidad de lecturas; (c) cartografiar las lecturas en una secuencia de referencia, en donde la secuencia de referencia incluye los genes BRCA1 y BRCA2; (d) determinar un número de lecturas por amplicón para los amplicones asociados con los exones del gen BRCA1 y un número de lecturas por amplicón para los amplicones asociados con los exones del gen BRCA2; (e) determinar los números de copias de exones para los exones de los genes BRCA1 y BRCA2 basándose en el número de lecturas por amplicón para los amplicones asociados con los exones de los genes BRCA1 y BRCA2; (f) detectar una deleción del exón o una duplicación del exón basándose en los números de copias del exón; y (g) detectar una deleción génica completa del gen BRCA1 o del gen BRCA2 basándose en el número de lecturas por amplicón para los amplicones asociados con los exones de los genes BRCA1 y BRCA2. Los exones de los genes BRCA1 y BRCA2 pueden comprender exones codificantes. El método puede comprender además dividir el número de lecturas por amplicón para los amplicones asociados con exones del gen BRCA1 por el número total de lecturas de los amplicones generados a partir de la muestra de ácido nucleico para formar recuentos de lecturas normalizados por amplicón para el gen BRCA1 y dividir el número de lecturas por amplicón para amplicones asociados con exones del gen BRCA2 por el número total de lecturas de los amplicones generados a partir de la muestra de ácido nucleico para formar recuentos de lecturas normalizados por amplicón para el gen BRCA2. La etapa de determinar los números de copias del exón puede comprender además comparar los recuentos de lectura normalizados por amplicón y una cobertura de referencia para el exón asociado para determinar un número de copias candidatas para el exón. La etapa de determinar los números de copias de exones puede comprender además aplicar un procedimiento de escalado a los números de copias candidatas para amplicones generados a partir de una muestra de germoplasma. El procedimiento de escalado puede comprender (a) seleccionar el gen BRCA1 o BRCA2 que tiene un valor máximo de número de copias candidatas; (b) determinar un valor de la mediana de los valores del número de copias candidatas para los exones del gen seleccionado; (c) fijar el valor de la mediana en un nivel de referencia; y (d) escalar los números de copias candidatas de los exones de ambos genes en relación con el nivel de referencia. La etapa de determinar los números de copias del exón puede comprender además aplicar un procedimiento de escalado a los números de copias candidatas para amplicones generados a partir de una muestra somática, en donde el procedimiento de escalado puede comprender: (a) determinar un primer valor de la mediana de los números de copias candidatas para los exones del gen BRCA1 y un segundo valor de la mediana de los números de copias candidatas para los exones del gen BRCA2; (b) fijar el primer valor de la mediana en un nivel de referencia; (c) escalar los números de copias candidatas para los exones del gen BRCA1 con respecto al nivel de referencia; (d) fijar el segundo valor de la mediana al nivel de referencia; y (e) escalar los números de copias candidatas para los exones del gen BRCA2 con respecto al nivel de referencia. La etapa de detectar una deleción del exón o una duplicación del exón puede comprender además fusionar llamadas de números de copias para exones adyacentes para formar una llamada de números de copias para un segmento de al menos dos exones. En la etapa de fusionar llamadas de números de copia, los números de copias candidatas para los exones adyacentes pueden estar dentro de un intervalo de un mismo valor entero. La etapa de detectar una deleción génica completa puede comprender además calcular una primera media y una primera desviación estándar de los recuentos de lecturas normalizadas por amplicón asociados con el gen BRCA1 y una segunda media y una segunda desviación estándar de los recuentos de lecturas normalizadas por amplicón asociados con el gen BRCA2. La etapa de detectar una deleción génica completa puede comprender además aplicar una prueba de la t a la primera media y la primera desviación estándar de los recuentos de lecturas normalizados por amplicón asociados con el gen BRCA1 y la segunda media y la segunda desviación estándar de los recuentos de lecturas normalizadas por amplicón asociados con el gen BRCA2. La etapa de aplicar una prueba de la t puede comprender además comparar un valor p con un primer umbral para formar una primera comparación. La etapa de aplicar una prueba de la t puede comprender además calcular una puntuación PHREd multiplicando (-10) por un log del valor p. La etapa de detectar una deleción génica completa puede comprender además (a) calcular una primera proporción de la primera desviación estándar con respecto a la primera media y una segunda proporción de la segunda desviación estándar con respecto a la segunda media; (b) comparar la primera relación con un segundo umbral para formar una segunda comparación; y (c) comparar la segunda relación con el segundo umbral para formar una tercera comparación. La etapa de detectar una deleción de un gen completo puede comprender además tomar una decisión sobre un evento de deleción de un gen completo utilizando los resultados de las comparaciones primera, segunda y tercera. El método puede comprender además detectar pequeñas variantes en los genes BRCA1 y BRCA2.
Según una realización ilustrativa que no forma parte de la invención, se proporciona un kit que comprende un conjunto de cebadores asociados con exones de los genes BRCA1 y BRCA2 en un panel de genes, utilizándose los cebadores en un método para detectar grandes reordenamientos en los genes BRCA1 y BRCA2, que comprende: (a) amplificar una muestra de ácido nucleico en presencia de un conjunto de cebadores para producir una pluralidad de amplicones, incluyendo el conjunto de cebadores una pluralidad de cebadores específicos de diana que se dirigen a regiones de los exones de los genes BRCA1 y BRCA2, en donde los cebadores específicos de diana para una región de un exón producen amplicones solapados que cubren el exón; (b) secuenciar los amplicones para generar una pluralidad de lecturas; (c) cartografiar las lecturas en una secuencia de referencia, en donde la secuencia de referencia incluye los genes BRCA1 y BRCA2; (d) determinar un número de lecturas por amplicón para los amplicones asociados con los exones del gen BRCA1 y un número de lecturas por amplicón para los amplicones asociados con los exones del gen BRCA2; (e) determinar los números de copias de exones para los exones de los genes BRCA1 y BRCA2 basándose en el número de lecturas por amplicón para los amplicones asociados con los exones de los genes BRCA1 y BRCA2; (f) detectar una deleción del exón o una duplicación del exón basándose en los números de copias del exón; y (g) detectar una deleción génica completa del gen BRCA1 o del gen BRCA2 basándose en el número de lecturas por amplicón para los amplicones asociados con los exones de los genes BRCA1 y BRCA2. Los exones de los genes BRCA1 y BRCA2 pueden comprender exones codificantes. El método para usar con el kit puede comprender además dividir el número de lecturas por amplicón para los amplicones asociados con exones del gen BRCA1 por un número total de lecturas de los amplicones generados a partir de la muestra de ácido nucleico para formar recuentos de lecturas normalizados por amplicón para el gen BRCA1 y dividir el número de lecturas por amplicón para los amplicones asociados con exones del gen BRCA2 por el número total de lecturas de los amplicones generados a partir de la muestra de ácido nucleico para formar recuentos de lecturas normalizados por amplicón para el gen BRCA2. La etapa de determinar los números de copias del exón puede comprender además comparar los recuentos de lectura normalizados por amplicón y una cobertura de referencia para el exón asociado para determinar un número de copias candidatas para el exón. La etapa de determinar los números de copias de exones puede comprender además aplicar un procedimiento de escalado a los números de copias candidatas para amplicones generados a partir de una muestra del germoplasma. El procedimiento de escalado puede comprender (a) seleccionar el gen BRCA1 o BRCA2 que tiene un valor máximo de número de copias candidatas; (b) determinar un valor de la mediana de los valores del número de copias candidatas para los exones del gen seleccionado; (c) fijar el valor de la mediana en un nivel de referencia; y (d) escalar los números de copias candidatas de los exones de ambos genes en relación con el nivel de referencia. La etapa de determinar los números de copias del exón puede comprender además aplicar un procedimiento de escalado a los números de copias candidatas para amplicones generados a partir de una muestra somática, en donde el procedimiento de escalado puede comprender: (a) determinar un primer valor de la mediana de los números de copias candidatas para los exones del gen BRCA1 y un segundo valor de la mediana de los números de copias candidatas para los exones del gen BRCA2; (b) fijar el primer valor de la mediana en un nivel de referencia; (c) escalar los números de copias candidatas para los exones del gen BRCA1 con respecto al nivel de referencia; (d) fijar el segundo valor de la mediana al nivel de referencia; y (e) escalar los números de copias candidatas para los exones del gen BRCA2 con respecto al nivel de referencia. La etapa de detectar una deleción del exón o una duplicación del exón puede comprender además fusionar llamadas de números de copias para exones adyacentes para formar una llamada de números de copias para un segmento de al menos dos exones. En la etapa de fusionar llamadas de números de copia, los números de copias candidatas para los exones adyacentes pueden estar dentro de un intervalo de un mismo valor entero. La etapa de detectar una deleción génica completa puede comprender además calcular una primera media y una primera desviación estándar de los recuentos de lecturas normalizadas por amplicón asociados con el gen BRCA1 y una segunda media y una segunda desviación estándar de los recuentos de lecturas normalizadas por amplicón asociados con el gen BRCA2. La etapa de detectar una deleción génica completa puede comprender además aplicar una prueba de la t a la primera media y la primera desviación estándar de los recuentos de lecturas normalizados por amplicón asociados con el gen BRCA1 y la segunda media y la segunda desviación estándar de los recuentos de lecturas normalizadas por amplicón asociados con el gen BRCA2. La etapa de aplicar una prueba de la t puede comprender además comparar un valor p con un primer umbral para formar una primera comparación. La etapa de aplicar una prueba de la t puede comprender además calcular una puntuación PHRED multiplicando (-10) por un log del valor p. La etapa de detectar una deleción génica completa puede comprender además (a) calcular una primera proporción de la primera desviación estándar con respecto a la primera media y una segunda proporción de la segunda desviación estándar con respecto a la segunda media; (b) comparar la primera relación con un segundo umbral para formar una segunda comparación; y (c) comparar la segunda relación con el segundo umbral para formar una tercera comparación. La etapa de detectar una deleción de un gen completo puede comprender además tomar una decisión sobre un evento de deleción de un gen completo utilizando los resultados de las comparaciones primera, segunda y tercera. El método para usar con el kit puede comprender además detectar pequeñas variantes en los genes BRCA1 y BRCA2.
Diversas realizaciones de plataformas de secuenciación de ácidos nucleicos, tales como un secuenciador de ácidos nucleicos, pueden incluir componentes como se muestra en el diagrama de bloques de la Fig. 11. Según diversas realizaciones, el instrumento 1200 de secuenciación puede incluir una unidad 1202 de control y suministro de fluidos, una unidad 1204 de procesamiento de muestras, una unidad 1206 de detección de señales y una unidad 1208 de adquisición, análisis y control de datos. En las publicaciones de solicitud de patente de US-2009/0127589 y US-2009/0026082 se describen diversas realizaciones de instrumentación, reactivos, bibliotecas y métodos utilizados para la secuenciación avanzada. Diversas realizaciones del instrumento 1200 pueden proporcionar una secuenciación automatizada que se puede usar para recopilar información de secuencias de una pluralidad de secuencias en paralelo, tal como sustancialmente de forma simultánea.
En diversas realizaciones, la unidad 1202 de control y administración de fluidos puede incluir un sistema de administración de reactivos. El sistema de administración de reactivos puede incluir un depósito de reactivos para el almacenamiento de diversos reactivos. Los reactivos pueden incluir cebadores basados en ARN, cebadores de ADN directos/inversos, mezclas de oligonucleótidos para secuenciación por ligadura, mezclas de nucleótidos para secuenciación por síntesis, mezclas de oligonucleótidos ECC opcionales, tampones, reactivos de lavado, reactivos de bloqueo, reactivos de extracción y similares. Además, el sistema de administración de reactivos puede incluir un sistema de pipeteo o un sistema de flujo continuo que conecta la unidad de procesamiento de muestras con el depósito de reactivo.
En diversas realizaciones, la unidad 1204 de procesamiento de muestras puede incluir una cámara de muestras, tal como una celda de flujo, un sustrato, una micromatriz, una bandeja de múltiples pocillos o similares. La unidad 1204 de procesamiento de muestras puede incluir múltiples carriles, múltiples canales, múltiples pocillos u otros medios para procesar múltiples conjuntos de muestras sustancialmente de forma simultánea. Además, la unidad de procesamiento de muestras puede incluir múltiples cámaras de muestras para permitir el procesamiento de múltiples ejecuciones de forma simultánea. En realizaciones concretas, el sistema puede realizar la detección de señales en una cámara de muestras mientras procesa sustancialmente de forma simultánea otra cámara de muestras. Además, la unidad de procesamiento de muestras puede incluir un sistema de automatización para mover o manipular la cámara de muestras.
En diversas realizaciones, la unidad 1206 de detección de señales puede incluir un sensor de detección u obtención de imágenes. Por ejemplo, el sensor de detección u obtención de imágenes puede incluir un CCD, un CMOS, un sensor químico o de iones, tal como una capa sensible a iones superpuesta a un CMOS o FET, un detector de corriente o voltaje o similares. La unidad 1206 de detección de señales puede incluir un sistema de excitación para inducir que una sonda, tal como un tinte fluorescente, emita una señal. El sistema de excitación puede incluir una fuente de iluminación, tal como una lámpara de arco, un láser, un diodo emisor de luz (LED) o similares. En realizaciones concretas, la unidad 1206 de detección de señales puede incluir ópticas para la transmisión de luz desde una fuente de iluminación a la muestra o desde la muestra al sensor de detección u obtención de imágenes. Alternativamente, la unidad 1206 de detección de señales puede proporcionar métodos de detección electrónicos o no basados en fotones y, en consecuencia, no incluir una fuente de iluminación. En diversas realizaciones, la detección de señales basada en electrónica puede ocurrir cuando se produce una señal o especie detectable durante una reacción de secuenciación. Por ejemplo, se puede producir una señal mediante la interacción de un subproducto o resto liberado, tal como un ion liberado, tal como un ion de hidrógeno, que interactúa con un ion o una capa químicamente sensible. En otras realizaciones, puede surgir una señal detectable como resultado de una cascada enzimática tal como la utilizada en la pirosecuenciación (véase, por ejemplo, la publicación de solicitud de patente US-2009/0325145) donde el pirofosfato se genera mediante la incorporación de una base mediante una polimerasa que reacciona además con la ATP sulfurilasa para generar ATP en presencia de 5' fosfosulfato de adenosina, en donde el ATP generado puede consumirse en una reacción mediada por luciferasa para generar una señal quimioluminiscente. En otro ejemplo, se pueden detectar cambios en una corriente eléctrica cuando un ácido nucleico pasa a través de un nanoporo sin necesidad de una fuente de iluminación.
En diversas realizaciones, una unidad 1208 de control y análisis de adquisición de datos puede controlar varios parámetros del sistema. Los parámetros del sistema pueden incluir la temperatura de varias partes del instrumento 1200, tales como la unidad de procesamiento de muestras o depósitos de reactivos, volúmenes de diversos reactivos, el estado de varios subcomponentes del sistema, tales como un manipulador, un motor paso a paso, una bomba o similares. o cualquier combinación de los mismos.
Un experto en la técnica apreciará que se pueden usar diversas realizaciones del instrumento 1200 para practicar una variedad de métodos de secuenciación que incluyen métodos basados en ligadura, secuenciación por síntesis, métodos de molécula única, secuenciación de nanoporos y otras técnicas de secuenciación.
En diversas realizaciones, el instrumento 1200 de secuenciación puede determinar la secuencia de un ácido nucleico, tal como un polinucleótido o un oligonucleótido. El ácido nucleico puede incluir ADN o ARN, y puede ser monocatenario, como ADNss y ARN, o bicatenario, como ADNds o un par de ARN/ADNc. En diversas realizaciones, el ácido nucleico puede incluir o derivarse de una biblioteca de fragmentos, una biblioteca de pares de parejas, un fragmento ChIP o similares. En realizaciones concretas, el instrumento 1200 de secuenciación puede obtener la información de secuencia de una única molécula de ácido nucleico o de un grupo de moléculas de ácido nucleico sustancialmente idénticas.
En diversas realizaciones, el instrumento 1200 de secuenciación puede generar datos de lectura de secuenciación de ácidos nucleicos en una variedad de tipos/formatos de archivos de datos de salida diferentes, que incluyen, entre otros: * fasta, *csfasta, *seq.txt, *qseq.txt, *fastq, *sff, *prb.txt, *sms, *srs y/o *qv.
Según diversas realizaciones ilustrativas, una o más características de una o más de las enseñanzas y/o realizaciones ilustrativas descritas anteriormente se pueden realizar o implementar usando elementos de hardware y/o software configurados y/o programados apropiadamente. La determinación de si una realización se implementa utilizando elementos de hardware y/o software puede basarse en cualquier número de factores, tales como velocidad computacional deseada, niveles de potencia, tolerancias térmicas, presupuesto del ciclo de procesamiento, velocidades de datos de entrada, velocidades de datos de salida, recursos de memoria, velocidades de los buses de datos, etc., y otras limitaciones de diseño o rendimiento.
Los ejemplos de elementos de hardware pueden incluir procesadores, microprocesadores, dispositivos (o periféricos) de entrada(s) y/o salida(s) (E/S) que están acoplados comunicativamente a través de un circuito de interfaz local, elementos de circuito (por ejemplo, transistores, resistencias, condensadores, inductores, etc.), circuitos integrados, circuitos integrados de aplicaciones específicas (ASIC), dispositivos lógicos programables (PLD), procesadores de señales digitales (DSP), conjuntos de puertas programables en campo (FPGA), puertas lógicas, registros, dispositivos semiconductores, chips, microchips, conjuntos de chips, etc. La interfaz local puede incluir, por ejemplo, uno o más buses u otras conexiones cableadas o inalámbricas, controladores, memorias intermedias (cachés), controladores, repetidores y receptores, etc., para permitir comunicaciones apropiadas entre componentes de hardware. Un procesador es un dispositivo de hardware para ejecutar software, particularmente software almacenado en la memoria. El procesador puede ser cualquier procesador hecho a medida o disponible comercialmente, una unidad central de procesamiento (CPU), un procesador auxiliar entre varios procesadores asociados con la computadora, un microprocesador basado en semiconductores (por ejemplo, en forma de un microchip o conjunto de chips), un macroprocesador, o en general cualquier dispositivo para ejecutar instrucciones de software. Un procesador también puede representar una arquitectura de procesamiento distribuido. Los dispositivos de E/S pueden incluir dispositivos de entrada, por ejemplo, un teclado, un ratón, un escáner, un micrófono, una pantalla táctil, una interfaz para diversos dispositivos médicos y/o instrumentos de laboratorio, un lector de códigos de barras, un lápiz, un lector láser, un lector de dispositivo de radiofrecuencia, etc. Además, los dispositivos de E/S también pueden incluir dispositivos de salida, por ejemplo, una impresora, una impresora de códigos de barras, una pantalla, etc. Finalmente, los dispositivos de E/S también pueden incluir dispositivos que se comunican como entradas y salidas, por ejemplo, un modulador/desmodulador (módem; para acceder a otro dispositivo, sistema o red), una radiofrecuencia (RF) u otro transceptor, una interfaz telefónica, un puente, un enrutador, etc.
Los ejemplos de software pueden incluir componentes de software, programas, aplicaciones, programas informáticos, programas de aplicación, programas de sistema, programas de máquina, software de sistema operativo, middleware, firmware, módulos de software, rutinas, subrutinas, funciones, métodos, procedimientos, interfaces de software, interfaces de programas de aplicación (API), conjuntos de instrucciones, código informático, código de ordenador, segmentos de código, segmentos de código informático, palabras, valores, símbolos o cualquier combinación de los mismos. Un software en memoria puede incluir uno o más programas separados, que pueden incluir listados ordenados de instrucciones ejecutables para implementar funciones lógicas. El software en la memoria puede incluir un sistema para identificar flujos de datos según las presentes enseñanzas y cualquier sistema operativo (O/S) hecho a la medida o disponible comercialmente, que puede controlar la ejecución de otros programas informáticos tales como el sistema, y proporciona programación, control de entrada-salida, gestión de archivos y datos, gestión de memoria, control de comunicaciones, etc.
Según diversas realizaciones ilustrativas, una o más características de una cualquiera o más de las enseñanzas y/o realizaciones ilustrativas analizadas anteriormente se pueden realizar o implementar usando un medio o artículo legible por máquina no transitorio configurado y/o programado apropiadamente que puede almacenar una instrucción o un conjunto de instrucciones que, si son ejecutadas por una máquina, pueden hacer que la máquina realice un método y/u operaciones según las realizaciones ilustrativas. Dicha máquina puede incluir, por ejemplo, cualquier plataforma de procesamiento, plataforma informática, dispositivo informático, dispositivo de procesamiento, sistema informático, sistema de procesamiento, computadora, procesador, instrumento científico o de laboratorio adecuados, etc., y puede implementarse usando cualquier combinación adecuada de hardware y/o software. El medio o artículo legible por máquina puede incluir, por ejemplo, cualquier tipo adecuado de unidad de memoria, dispositivo de memoria, artículo de memoria, medio de memoria, dispositivo de almacenamiento, artículo de almacenamiento, medio de almacenamiento y/o unidad de almacenamiento, por ejemplo, memoria, medios extraíbles o no extraíbles, medios borrables o no borrables, medios grabables o regrabables, medios digitales o analógicos, disco duro, disquete, disco compacto con memoria de sólo lectura (CD-ROM), disco compacto grabable (CD-R), disco compacto regrabable (CD-RW), disco óptico, soporte magnético, soporte magnetoóptico, tarjetas o discos de memoria extraíbles, diversos tipos de disco versátil digital (DVD), una cinta, un casete, etc., incluido cualquier medio adecuado para usar en un ordenador. La memoria puede incluir uno cualquiera o una combinación de elementos de memoria volátil (por ejemplo, memoria de acceso aleatorio (RAM, tal como DRAM, SRAM, SDRAM, etc.) y elementos de memoria no volátil (por ejemplo, ROM, EPROM, EEROM, memoria Flash, unidad de disco duro, cinta, CDROM, etc.). Además, la memoria puede incorporar medios de almacenamiento electrónicos, magnéticos, ópticos y/u otros tipos. La memoria puede tener una arquitectura distribuida donde varios componentes están situados alejados unos de otros, pero el procesador aún accede a ellos. Las instrucciones pueden incluir cualquier tipo adecuado de código, tal como código fuente, código compilado, código interpretado, código ejecutable, código estático, código dinámico, código cifrado, etc., implementado usando cualquier lenguaje de programación adecuado de alto nivel, bajo nivel, orientado a objetos, visual, compilado y/o interpretado.
Según diversas realizaciones ilustrativas, una o más características de una o más de las enseñanzas y/o realizaciones ilustrativas descritas anteriormente se pueden realizar o implementar al menos parcialmente utilizando un recurso informático distribuido, agrupado, remoto o en la nube.
Según diversas realizaciones ilustrativas, una o más características de una cualquiera o más de las enseñanzas y/o realizaciones ilustrativas descritas anteriormente se pueden realizar o implementar usando un programa fuente, programa ejecutable (código objeto), script o cualquier otra entidad que comprenda un conjunto de instrucciones a realizar. Cuando se trata de un programa fuente, el programa se puede traducir a través de un compilador, ensamblador, intérprete, etc., que puede o no estar incluido en la memoria, para que funcione correctamente en conexión con el sistema operativo (O/S). Las instrucciones pueden escribirse usando (a) un lenguaje de programación orientado a objetos, que tiene clases de datos y métodos, o (b) un lenguaje de programación procedimental, que tiene rutinas, subrutinas y/o funciones, que pueden incluir, por ejemplo, C, C++, R, Pascal, Basic, Fortran, Cobol, Perl, Java y Ada.
Según diversas realizaciones ilustrativas, una o más de las realizaciones ilustrativas descritas anteriormente pueden incluir transmitir, mostrar, almacenar, imprimir o enviar a un dispositivo de interfaz de usuario, un medio de almacenamiento legible por ordenador, un sistema informático local o un sistema informático remoto, información relacionados con cualquier información, señal, datos y/o resultados intermedios o finales que puedan haber sido generados, accedidos o utilizados por dichas realizaciones ilustrativas. Dicha información transmitida, visualizada, almacenada, impresa o emitida puede tomar la forma de listas de ejecuciones e informes que se pueden buscar y/o filtrar, imágenes, tablas, cuadros, gráficos, hojas de cálculo, correlaciones, secuencias y combinaciones de los mismos, por ejemplo.
Aunque las realizaciones preferidas de la presente invención se han mostrado y descrito en la presente memoria, será obvio para los expertos en la técnica que tales realizaciones se proporcionan sólo a modo de ejemplo. Numerosas variaciones, cambios, y sustituciones se les ocurrirán ahora a los expertos en la técnica sin apartarse de la invención. Debe entenderse que pueden emplearse diversas alternativas a las realizaciones de la invención descritas en la presente memoria en la práctica de la invención.
Claims (12)
1. Un método para detectar grandes reordenamientos en los genes BRCA1 y BRCA2, que comprende:
amplificar una muestra de ácido nucleico en presencia de un conjunto de cebadores para producir una pluralidad de amplicones, incluyendo el conjunto de cebadores una pluralidad de cebadores específicos de diana que se dirigen a regiones de exones de los genes BRCA1 y BRCA2, en donde los cebadores específicos de diana para una región de un exón producen amplicones solapados que cubren el exón;
secuenciar los amplicones para generar una pluralidad de lecturas;
cartografiar las lecturas en una secuencia de referencia, en donde la secuencia de referencia incluye los genes BRCA1 y BRCA2;
determinar un número de lecturas por amplicón para los amplicones asociados con los exones del gen BRCA1 y un número de lecturas por amplicón para los amplicones asociados con los exones del gen BRCA2;
dividir el número de lecturas por amplicón para los amplicones asociados con exones del gen BRCA1 por el número total de lecturas de los amplicones generados a partir de la muestra de ácido nucleico para formar recuentos de lecturas normalizados por amplicón para el gen BRCA1; dividir el número de lecturas por amplicón para los amplicones asociados con exones del gen BRCA2 por el número total de lecturas de los amplicones generados a partir de la muestra de ácido nucleico para formar recuentos de lecturas normalizados por amplicón para el gen BRCA2; determinar los números de copias de exones para los exones de los genes BRCA1 y BRCA2 basándose en el número de lecturas por amplicón para los amplicones asociados con los exones de los genes BRCA1 y BRCA2;
en donde determinar los números de copias del exón comprende además comparar los recuentos de lecturas normalizados por amplicón y una cobertura de referencia para el exón asociado para determinar el número de copias candidatas para el exón;
aplicar un procedimiento de escalado a los números de copias candidatas para amplicones generados a partir de una muestra de germoplasma, comprendiendo el procedimiento de escalado: seleccionar el gen BRCA1 o BRCA2 que tiene un valor máximo de número de copias candidatas; determinar el valor de la mediana de los valores del número de copias candidatas para los exones del gen seleccionado; fijar el valor de la mediana en un nivel de referencia;
escalar los números de copias candidatas de los exones de ambos genes con respecto al nivel de referencia;
detectar una deleción del exón o una duplicación del exón basándose en los números de copias del exón; y
detectar una deleción génica completa del gen BRCA1 o del gen BRCA2 basándose en el número de lecturas por amplicón para los amplicones asociados con los exones de los genes BRCA1 y BRCA2.
2. El método de la reivindicación 1, en donde los exones de los genes BRCA1 y BRCA2 comprenden exones codificantes.
3. El método de la reivindicación 1, en donde determinar los números de copias de exones comprende además aplicar un procedimiento de escalado a los números de copias candidatas para amplicones generados a partir de una muestra somática, comprendiendo el procedimiento de escalado: determinar un primer valor de la mediana de los números de copias candidatas para los exones de el gen BRCA1 y un segundo valor de la mediana de los números de copias candidatas para los exones del gen BRCA2;
fijar el primer valor de la mediana en un nivel de referencia;
escalar los números de copias candidatas para los exones del gen BRCA1 en relación con el nivel de referencia;
fijar el segundo valor de la mediana al nivel de referencia; y
escalar los números de copias candidatas para los exones del gen BRCA2 en relación con el nivel de referencia.
4. El método de la reivindicación 1, en donde la detección de una deleción de exón o de la duplicación de un exón comprende además fusionar llamadas de números de copias para exones adyacentes para formar una llamada de número de copias para un segmento de al menos dos exones.
5. El método de la reivindicación 4, en donde los números de copias candidatas para los exones adyacentes están dentro de un intervalo de un mismo valor entero.
6. El método de la reivindicación 1, en donde la detección de una deleción génica completa comprende además calcular una primera media y una primera desviación estándar de los recuentos de lecturas normalizados por amplicón asociado con el gen BRCA1 y una segunda media y una segunda desviación estándar de los recuentos de lecturas normalizados por amplicón asociado al gen BRCA2.
7. El método de la reivindicación 6, en donde la detección de una deleción génica completa comprende además aplicar una prueba de la t a la primera media y la primera desviación estándar de los recuentos de lecturas normalizados por amplicón asociados con el gen BRCA1 y la
segunda media y segunda desviación estándar de los recuentos de lecturas normalizados por amplicón asociado con el gen BRCA2.
8. El método de la reivindicación 7, en donde la aplicación de una prueba de la t comprende además comparar un valor p con un primer umbral para formar una primera comparación.
9. El método de la reivindicación 8, en donde la aplicación de una prueba de la t comprende además calcular una puntuación PHRED multiplicando -10 veces un logaritmo del valor p.
10. El método de la reivindicación 9, en donde la detección de una deleción génica completa comprende además calcular una primera proporción de la primera desviación estándar con respecto a la primera media y una segunda proporción de la segunda desviación estándar con respecto a la segunda media; comparar la primera relación con un segundo umbral para formar una segunda comparación; y comparar la segunda relación con el segundo umbral para formar una tercera comparación.
11. El método de la reivindicación 10, en donde la detección de una deleción génica completa comprende además tomar una decisión sobre un evento de deleción de un gen completo utilizando los resultados de las comparaciones primera, segunda y tercera.
12. El método de la reivindicación 1, que comprende además detectar pequeñas variantes en los genes BRCA1 y BRCA2.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201762511815P | 2017-05-26 | 2017-05-26 | |
| US201762518383P | 2017-06-12 | 2017-06-12 | |
| PCT/US2018/034564 WO2018218103A1 (en) | 2017-05-26 | 2018-05-25 | Methods and systems to detect large rearrangements in brca1/2 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2986639T3 true ES2986639T3 (es) | 2024-11-12 |
Family
ID=62683436
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES18732543T Active ES2986639T3 (es) | 2017-05-26 | 2018-05-25 | Métodos para detectar grandes reordenamientos en BRCA1/2 |
Country Status (5)
| Country | Link |
|---|---|
| US (2) | US20180340234A1 (es) |
| EP (1) | EP3631018B1 (es) |
| CN (1) | CN110997944A (es) |
| ES (1) | ES2986639T3 (es) |
| WO (1) | WO2018218103A1 (es) |
Families Citing this family (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11783917B2 (en) | 2019-03-21 | 2023-10-10 | Illumina, Inc. | Artificial intelligence-based base calling |
| US11210554B2 (en) | 2019-03-21 | 2021-12-28 | Illumina, Inc. | Artificial intelligence-based generation of sequencing metadata |
| US11593649B2 (en) | 2019-05-16 | 2023-02-28 | Illumina, Inc. | Base calling using convolutions |
| US11423306B2 (en) | 2019-05-16 | 2022-08-23 | Illumina, Inc. | Systems and devices for characterization and performance analysis of pixel-based sequencing |
| US11749380B2 (en) | 2020-02-20 | 2023-09-05 | Illumina, Inc. | Artificial intelligence-based many-to-many base calling |
| US12354008B2 (en) | 2020-02-20 | 2025-07-08 | Illumina, Inc. | Knowledge distillation and gradient pruning-based compression of artificial intelligence-based base caller |
| US20210265016A1 (en) | 2020-02-20 | 2021-08-26 | Illumina, Inc. | Data Compression for Artificial Intelligence-Based Base Calling |
| CN111394468A (zh) * | 2020-04-30 | 2020-07-10 | 北京和合医学诊断技术股份有限公司 | 用于检测brca基因突变的引物组及其应用方法 |
| CN113897420A (zh) * | 2020-06-22 | 2022-01-07 | 上海思路迪生物医学科技有限公司 | 基于扩增子测序的大片段重排检测的引物组合物、试剂盒和检测方法 |
| CN111793677B (zh) * | 2020-07-30 | 2021-10-19 | 臻悦生物科技江苏有限公司 | 一种基于二代测序技术检测brca1和brca2突变的方法及试剂盒 |
| CN111899789B (zh) * | 2020-08-03 | 2021-05-25 | 北京市肿瘤防治研究所 | 二代测序鉴定brca1/2大片段重排的方法及系统 |
| CN112501266A (zh) * | 2020-11-26 | 2021-03-16 | 申友基因组研究院(南京)有限公司 | 一种用于检测brca1基因长片段拷贝数变异的试剂盒 |
| US20220336057A1 (en) | 2021-04-15 | 2022-10-20 | Illumina, Inc. | Efficient voxelization for deep learning |
| US12217829B2 (en) | 2021-04-15 | 2025-02-04 | Illumina, Inc. | Artificial intelligence-based analysis of protein three-dimensional (3D) structures |
| CN114686589B (zh) * | 2022-03-16 | 2025-10-03 | 郑州安图生物工程股份有限公司 | Brca全外显子基因突变检测用组合物、试剂盒、测序文库构建方法 |
| CN115662512B (zh) * | 2022-11-02 | 2025-09-16 | 苏州赛美科基因科技有限公司 | 基于多重pcr测序中检测点突变的方法、装置、设备和介质 |
| WO2024163553A1 (en) * | 2023-01-31 | 2024-08-08 | Life Technologies Corporation | Methods for detecting gene level copy number variation in brca1 and brca2 |
| CN116179710B (zh) * | 2023-03-14 | 2023-11-24 | 成都诺森医学检验有限公司 | 基于高通量测序平台的brca1/2基因突变检测的引物组、文库构建与环化方法 |
Family Cites Families (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5965377A (en) * | 1997-03-24 | 1999-10-12 | Baystate Medical Center | Method for determining the presence of mutated BRCA protein |
| EP2463389A1 (en) | 2006-10-20 | 2012-06-13 | Innogenetics N.V. | Methodology for analysis of sequence variations within the HCV NS5B genomic region |
| AU2007334393A1 (en) | 2006-12-14 | 2008-06-26 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
| US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
| US8906620B2 (en) * | 2007-03-23 | 2014-12-09 | Dana-Farber Cancer Institute, Inc. | Exon grouping analysis |
| CN101798570B (zh) * | 2010-03-09 | 2012-07-04 | 珠海市英平生物科技有限公司 | 从基因组dna中快速扩增目的基因的方法 |
| US20130090860A1 (en) | 2010-12-30 | 2013-04-11 | Life Technologies Corporation | Methods, systems, and computer readable media for making base calls in nucleic acid sequencing |
| US8594951B2 (en) | 2011-02-01 | 2013-11-26 | Life Technologies Corporation | Methods and systems for nucleic acid sequence analysis |
| US20130345066A1 (en) | 2012-05-09 | 2013-12-26 | Life Technologies Corporation | Systems and methods for identifying sequence variation |
| US20140052381A1 (en) | 2012-08-14 | 2014-02-20 | Life Technologies Corporation | Systems and Methods for Detecting Homopolymer Insertions/Deletions |
| EP2984598B1 (en) | 2013-03-06 | 2024-12-04 | Life Technologies Corporation | Systems and methods for determining copy number variation |
| US20140296080A1 (en) | 2013-03-14 | 2014-10-02 | Life Technologies Corporation | Methods, Systems, and Computer Readable Media for Evaluating Variant Likelihood |
| CN104531862B (zh) * | 2014-12-19 | 2017-12-29 | 钱学庆 | 检测人类brca1和brca2基因全外显子序列突变位点的方法和引物 |
| CN105525009B (zh) * | 2016-01-26 | 2018-10-16 | 绍兴华因生物科技有限公司 | 检测杂合性brca1/2基因缺失的方法及所用引物 |
-
2018
- 2018-05-25 US US15/989,359 patent/US20180340234A1/en not_active Abandoned
- 2018-05-25 WO PCT/US2018/034564 patent/WO2018218103A1/en not_active Ceased
- 2018-05-25 CN CN201880034530.4A patent/CN110997944A/zh active Pending
- 2018-05-25 EP EP18732543.6A patent/EP3631018B1/en active Active
- 2018-05-25 ES ES18732543T patent/ES2986639T3/es active Active
-
2023
- 2023-08-08 US US18/366,912 patent/US20240035094A1/en active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| CN110997944A (zh) | 2020-04-10 |
| EP3631018A1 (en) | 2020-04-08 |
| US20240035094A1 (en) | 2024-02-01 |
| US20180340234A1 (en) | 2018-11-29 |
| WO2018218103A1 (en) | 2018-11-29 |
| EP3631018B1 (en) | 2024-07-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2986639T3 (es) | Métodos para detectar grandes reordenamientos en BRCA1/2 | |
| US12243626B2 (en) | Methods for compression of molecular tagged nucleic acid sequence data | |
| JP7373047B2 (ja) | 圧縮分子タグ付き核酸配列データを用いた融合の検出のための方法 | |
| US20250157581A1 (en) | Methods, systems and computer readable media to correct base calls in repeat regions of nucleic acid sequence reads | |
| US11866778B2 (en) | Methods and systems for evaluating microsatellite instability status | |
| US20250084470A1 (en) | Methods for partner agnostic gene fusion detection | |
| US20250354221A1 (en) | Methods for detecting gene level copy number variation in brca1 and brca2 | |
| US20250243534A1 (en) | System and method for genotyping structural variants | |
| EP3539039B1 (en) | Methods, systems and computer readable media to correct base calls in repeat regions of nucleic acid sequence reads |