JP2025507713A - ヌクレオチド配列決定のための較正配列 - Google Patents
ヌクレオチド配列決定のための較正配列 Download PDFInfo
- Publication number
- JP2025507713A JP2025507713A JP2024550604A JP2024550604A JP2025507713A JP 2025507713 A JP2025507713 A JP 2025507713A JP 2024550604 A JP2024550604 A JP 2024550604A JP 2024550604 A JP2024550604 A JP 2024550604A JP 2025507713 A JP2025507713 A JP 2025507713A
- Authority
- JP
- Japan
- Prior art keywords
- calibration
- sequence
- sequencing
- nucleobase
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 784
- 239000002773 nucleotide Substances 0.000 title claims abstract description 142
- 125000003729 nucleotide group Chemical group 0.000 title claims description 131
- 239000012634 fragment Substances 0.000 claims abstract description 204
- 108091034117 Oligonucleotide Proteins 0.000 claims abstract description 180
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims abstract description 130
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 90
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 90
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 90
- 238000000034 method Methods 0.000 claims abstract description 61
- 238000012268 genome sequencing Methods 0.000 claims abstract description 58
- 230000037452 priming Effects 0.000 claims description 76
- 238000009826 distribution Methods 0.000 claims description 71
- 230000000295 complement effect Effects 0.000 claims description 35
- 238000010606 normalization Methods 0.000 claims description 33
- 230000003287 optical effect Effects 0.000 claims description 15
- 238000010899 nucleation Methods 0.000 claims description 13
- 238000005286 illumination Methods 0.000 claims description 9
- 238000000386 microscopy Methods 0.000 claims description 8
- 230000009977 dual effect Effects 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 239000000523 sample Substances 0.000 description 358
- 238000001514 detection method Methods 0.000 description 24
- 210000004027 cell Anatomy 0.000 description 21
- 108020004414 DNA Proteins 0.000 description 20
- 238000003860 storage Methods 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 16
- 239000002299 complementary DNA Substances 0.000 description 16
- 238000012937 correction Methods 0.000 description 14
- 238000010348 incorporation Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 description 11
- 230000008859 change Effects 0.000 description 11
- 230000002441 reversible effect Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- 239000003153 chemical reaction reagent Substances 0.000 description 9
- 239000000178 monomer Substances 0.000 description 9
- 238000013442 quality metrics Methods 0.000 description 9
- 230000008901 benefit Effects 0.000 description 7
- 239000000975 dye Substances 0.000 description 7
- 230000003321 amplification Effects 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 6
- 230000005284 excitation Effects 0.000 description 6
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 229920000642 polymer Polymers 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 238000012175 pyrosequencing Methods 0.000 description 5
- 230000007017 scission Effects 0.000 description 5
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 4
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 238000004166 bioassay Methods 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 4
- 235000011180 diphosphates Nutrition 0.000 description 4
- 239000007850 fluorescent dye Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 238000001712 DNA sequencing Methods 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000007672 fourth generation sequencing Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- KDLHZDBZIXYQEI-UHFFFAOYSA-N Palladium Chemical compound [Pd] KDLHZDBZIXYQEI-UHFFFAOYSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 2
- 210000004209 hair Anatomy 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000008774 maternal effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 238000000059 patterning Methods 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 210000002381 plasma Anatomy 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 210000000582 semen Anatomy 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- 101710092462 Alpha-hemolysin Proteins 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 101001007348 Arachis hypogaea Galactose-binding lectin Proteins 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- FCKYPQBAHLOOJQ-UHFFFAOYSA-N Cyclohexane-1,2-diaminetetraacetic acid Chemical compound OC(=O)CN(CC(O)=O)C1CCCCC1N(CC(O)=O)CC(O)=O FCKYPQBAHLOOJQ-UHFFFAOYSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000010777 Disulfide Reduction Effects 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000011888 autopsy Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000011842 forensic investigation Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000000370 laser capture micro-dissection Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 239000002086 nanomaterial Substances 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 229910052763 palladium Inorganic materials 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000002161 passivation Methods 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 239000012521 purified sample Substances 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Analytical Chemistry (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
本開示は、短い較正配列を配列決定装置に導入し、較正サイクルを実行して、配列決定装置に対応する配列決定パラメータを調整するか、又は別様で決定することができる方法、非一時的コンピュータ可読媒体、及びシステムを記載する。例えば、開示されるシステムは、試料のライブラリ断片に又は試料-ヌクレオチドスライドの表面に組み込まれた較正配列を用いてフローセル(又は他の試料-ヌクレオチドスライド)を検出することができる。試料ゲノム配列についてのゲノム配列決定サイクルとは別に、較正配列に対応するオリゴヌクレオチド上に核酸塩基を組み込み、較正配列についての対応する画像を撮影するために1つ以上の較正サイクルを実行することによって、開示されるシステムは、配列決定装置に対応する配列決定パラメータを決定することができる。
Description
(関連出願の相互参照)
本出願は、2022年2月25日に出願された「CALIBRATION SEQUENCES FOR NUCELOTIDE SEQUENCING」と題する米国仮出願第63/268,547号の利益及び優先権を主張する。上記出願は、参照によりその全体が本明細書に組み込まれる。
本出願は、2022年2月25日に出願された「CALIBRATION SEQUENCES FOR NUCELOTIDE SEQUENCING」と題する米国仮出願第63/268,547号の利益及び優先権を主張する。上記出願は、参照によりその全体が本明細書に組み込まれる。
近年、バイオテクノロジー企業及び研究機関は、ゲノム試料(又は他の核酸ポリマー)についてのヌクレオチド断片リードを決定する配列決定機械、及びかかるヌクレオチド断片リードについての核酸塩基コールを分析する配列決定データ分析ソフトウェアの両方のためのハードウェア及びソフトウェアを改善している。ゲノム試料についての核酸塩基コールを生成及び分析するために、一部の既存の配列決定機械、オンデバイスソフトウェア、及び配列決定データ解析ソフトウェア(合わせて「既存の配列決定システム」)は、境界を画定するか、ベースラインシグナル若しくはノイズを設定するか、又は別様で核酸塩基コールを決定することに導くか若しくは描く配列決定パラメータを構成している。既存の配列決定システムは、イコライザ係数若しくは他の所定の配列決定パラメータなどの、特定の配列決定機械若しくはパイプラインのための一部のかかる配列決定パラメータをオフラインで決定することができ、又はオフセット補正パラメータなどの、配列決定機械上での配列決定実行中の他の配列決定パラメータを決定することができる。特定の配列決定パラメータを較正するために、既存の配列決定システムは、多くの場合、Phi-Xなどの明確に定義されたゲノム試料から抽出されたオリゴヌクレオチドのゲノム配列決定サイクルを実行し、明確に定義されたゲノム試料の既知の配列に基づいてパラメータを決定又は調整している。しかし、既存の配列決定システムによる従来の較正は、配列決定の失敗及び不正確な核酸塩基コールを導入する可能性があり、並びにゲノム配列決定サイクルにおける較正のためのコンピューティング及び他のリソースを消費する可能性がある。
ちょうど示唆されるように、配列決定機械又は配列決定パイプラインのための配列決定パラメータを予め決定する既存の配列決定パラメータは、エラーを導入する可能性がある。例えば、1つの配列決定機械のためにオフラインで予め決定された配列決定パラメータは、異なる配列決定機械のために使用される類似ハードウェア及び同様の消耗品にもかかわらず、別の配列決定機械、フローセル、又は試薬のセットの環境のために良好に機能しない場合がある。更に、所定の配列決定パラメータが最初に(例えば、出荷時に)配列決定機械のために適切に構成されている場合であっても、配列決定機械のハードウェア又はソフトウェアは、経時的に変化し、強度値を抽出するためのイコライザ係数などの配列決定パラメータを予め決定するときに使用されるハードウェア又はソフトウェアの状態をもはや反映しない場合がある。
所定の配列決定パラメータによって形成されるエラーに加えて、既存の配列決定システムは、較正のために研究室でゲノム配列決定サイクルを使用するとき、配列決定機械上での従来の配列決定実行の一部(又は全て)の間にランダムな失敗を示すことが多い。例えば、既存の配列決定システムは、配列決定パラメータを構成するために、初期ゲノム配列決定サイクル(又は初期ゲノム配列決定サイクルのセット)中に捕捉されたメトリックにしばしば依拠している。しかし、初期のゲノム配列決定サイクルにおけるランダムな失敗は、残りのゲノム配列決定サイクルに影響を及ぼし、エラーを導入する可能性がある。初期ゲノム配列決定サイクルでは、例えば、配列決定機械は、ヌクレオチドを組み込み、ヌクレオチド-試料スライド上の気泡によって影響されるオリゴヌクレオチドのクラスターから画像を撮影し、焦点外カメラ又はクラスター上で不正確に自動中心化されたカメラを使用して、かかるクラスターの画像を撮影し、又は後のサイクルのための温度を表さない初期温度で画像を撮影する可能性がある。経時的に、配列決定機械及びヌクレオチド-試料スライドの環境が変化するにつれて、プレゲノム配列決定サイクルから構成された配列決定パラメータは、後のゲノム配列決定サイクルにおける条件を誤って表し、核酸塩基コールのための配列決定パラメータを歪める可能性がある。場合によっては、初期のプレゲノム配列決定サイクルにおけるランダムな失敗は、例えば、既存の配列決定システムが、プレゲノム配列決定サイクルにおける超解像機器についての歪み係数又は位相オフセットを誤って推定する場合、配列決定実行全体の完全な失敗をもたらす可能性がある。
配列決定機械又は試料-ヌクレオチドスライドのランダムな条件を超えて、場合によっては、未知のゲノム試料又は明確に定義されたゲノム試料についてのヌクレオチド断片リードにおける核酸塩基型の分布は、配列決定パラメータを歪曲又は偏らせる可能性がある。一部のゲノム配列決定サイクルにおいて、例えば、オリゴヌクレオチドのクラスターは、ある核酸塩基型を別の核酸塩基型に対して不均衡に表す核酸塩基を組み込んでいる場合がある。例えば、初期のゲノム配列決定サイクルから配列決定パラメータを学習する場合、既存の配列決定システムは、核酸塩基型の多様性が低い領域を有するゲノム試料からの不正確な配列決定パラメータに収束し得る。1つの最近の研究において、研究者らは、配列決定機械が、Phi-Xについての初期サイクルの間に単一の核酸塩基型の100%を組み込んだゲノム配列決定サイクルを見出した。配列決定機械が不均衡に分布した核酸塩基型のゲノム配列決定サイクルに基づいて配列決定パラメータを構成する場合、核酸塩基コールについての配列決定機械の精度が損なわれる可能性がある。実際、Phi-Xスパイクインなしでは、単一の核酸塩基の100%のサイクルから構成された配列決定パラメータは、核酸塩基コールについて2倍高いエラー率をもたらした。
精度の問題とは無関係に、場合によっては、既存の配列決定システムは、別様で未知の試料のゲノム配列を決定するために使用され得るコンピューティング及び配列決定機械リソースを消費する従来の較正アプローチを使用する。例えば、既存の配列決定システムは、概して、配列決定パラメータの較正を容易にするために、明確に定義されたゲノム試料にオリゴヌクレオチドのクラスターを専用にする。しかし、試料-ヌクレオチドスライドのウェル又は他の部分をコントロール試料専用にすることによって、既存の配列決定システムは、未知のゲノム試料を決定するために使用され得る試料-ヌクレオチドスライド及びゲノム配列決定サイクルの部分を縮小する。
これらは、更なる問題及び課題とともに、既存の配列決定システムに存在する。
本開示は、上記の問題のうちの1つ以上を解決するか、又は当技術分野に勝る他の利点を提供する、システム、方法、及び非一時的コンピュータ可読記憶媒体の1つ以上の実施形態を説明する。特に、開示されるシステムは、短い較正配列を配列決定装置に導入し、較正サイクルを実行して、配列決定装置に対応する配列決定パラメータを調整するか、又は別様で決定することができる。例えば、開示されるシステムは、試料のライブラリ断片又は試料-ヌクレオチドスライドの表面に組み込まれた較正配列を用いてフローセル(又は他の試料-ヌクレオチドスライド)を検出することができる。試料ゲノム配列についてのゲノム配列決定サイクルとは別に、較正配列に対応するオリゴヌクレオチド上に核酸塩基を組み込み、較正配列についての対応する画像を撮影するために1つ以上の較正サイクルを実行することによって、開示されるシステムは、配列決定装置に対応する配列決定パラメータを決定することができる。例えば、開示されるシステムは、較正サイクルの間又は後に検出される一部の配列決定パラメータを直接推定することができ、複数の較正サイクルの間に検出された初期配列決定パラメータから配列決定パラメータを決定することができ、かつ/又は(i)較正配列に対する相補鎖についての核酸塩基コールと(ii)較正配列についての既知の相補的核酸塩基との間の塩基コール差に基づいて初期配列決定パラメータを調整することができる。
本開示の1つ以上の実施形態の追加の特徴及び利点は、以下の説明に記載され、一部は説明から明らかになるか、又はかかる例示的な実施形態の実施によって習得され得る。
「発明を実施するための形態」は、以下に簡単に説明される図面を参照する。
本開示の1つ以上の実施形態による較正-配列決定システムが動作することができる環境を示す。
本開示の1つ以上の実施形態による、較正配列を含むヌクレオチド-試料スライドを受け取り、較正配列に基づいて配列決定装置に対応する1つ以上の配列決定パラメータを決定する較正-配列決定システムの概略図を示す。
本開示の1つ以上の実施形態による、配列決定装置に対応する1つ以上の配列決定パラメータを決定するために、異なる種類の較正サイクルを実施する較正-配列決定システムの概略図を示す。
本開示の1つ以上の実施形態による、ゲノム配列決定サイクル又はインデックスサイクル中に較正サイクルからの配列決定パラメータを使用する較正-配列決定システムの概略図を示す。
本開示の1つ以上の実施形態による、試料ライブラリ断片内に統合された較正配列を示す。
本開示の1つ以上の実施形態による、試料ライブラリ断片内に統合された較正配列を示す。
本開示の1つ以上の実施形態による、較正-配列決定システムの例示的な較正サイクルを示す。
本開示の1つ以上の実施形態による、試料ライブラリ断片内に組み込まれた較正配列、及びヌクレオチド-試料スライド内のオリゴヌクレオチドのクラスターを通して分配された試料ライブラリ断片を示す。
本開示の1つ以上の実施形態による、試料ライブラリ断片内に組み込まれた較正配列、及びヌクレオチド-試料スライド内のオリゴヌクレオチドのクラスターを通して分配された試料ライブラリ断片を示す。
本開示の1つ以上の実施形態による、試料ライブラリ断片内に組み込まれた較正配列、及びヌクレオチド-試料スライド内のオリゴヌクレオチドのクラスターを通して分配された試料ライブラリ断片を示す。
本開示の1つ以上の実施形態による、試料ライブラリ断片内に組み込まれた較正配列、及びヌクレオチド-試料スライド内のオリゴヌクレオチドのクラスターを通して分配された試料ライブラリ断片を示す。
本開示の1つ以上の実施形態による、試料ライブラリ断片内に組み込まれた較正配列、及びヌクレオチド-試料スライド内のオリゴヌクレオチドのクラスターを通して分配された試料ライブラリ断片を示す。
本開示の1つ以上の実施形態による、ランダムにコールされた核酸塩基又は較正配列からの既知の核酸塩基のいずれかに基づく異なる核酸塩基型に対応する異なるチャネルについての強度値分布を示す。
本開示の1つ以上の実施形態による、較正配列に基づく、異なるチャネルに対する異なる核酸塩基型に対応する強度値に対する散布図を示す。
本開示の1つ以上の実施形態による、較正配列に基づく、異なるチャネルに対する異なる核酸塩基型に対応する強度値に対する散布図を示す。
本開示の1つ以上の実施形態による、未較正の配列決定パラメータ及び較正された配列決定パラメータを有するサイクルに対応する強度値についての散布図を示す。
本開示の1つ以上の実施形態による、未較正の配列決定パラメータ及び較正された配列決定パラメータを有するサイクルに対応する強度値についての散布図を示す。
本開示の1つ以上の実施形態による、較正配列を含むヌクレオチド-試料スライドを受け取り、較正配列に基づいて配列決定装置に対応する1つ以上の配列決定パラメータを決定するための一連の動作を示す。
本開示の1つ以上の実施形態による、較正核酸塩基を含むヌクレオチド-試料スライドを受け取り、較正核酸塩基に基づいて配列決定装置に対応する1つ以上の配列決定パラメータを決定するための一連の動作を示す。
本開示の1つ以上の実施形態による例示的なコンピューティング装置のブロック図を示す。
本開示は、試料-ヌクレオチドスライド上に配置されたライブラリ断片に関連する短い較正配列を検出し、較正サイクルを実行して、短い較正配列に基づいて配列決定装置に対応する配列決定パラメータを決定することができる較正-配列決定システムの1つ以上の実施形態を記載する。例えば、較正-配列決定システムは、(i)1つ以上のゲノム試料についてのライブラリ断片、又は(ii)試料-ヌクレオチドスライドの基板に組み込まれた較正配列を含むフローセル(又は他の試料-ヌクレオチドスライド)を検出することができる。続いて、較正-配列決定システムは、1つ以上の較正サイクルを実行して、較正配列に対応するオリゴヌクレオチドに核酸塩基を組み込み、較正配列の核酸塩基に基づいて1つ以上の配列決定パラメータ(例えば、強度値、強度値境界、イコライザ係数)を決定することができる。かかる較正サイクルは、ライブラリ断片からの試料ゲノム配列又は相補的デオキシリボ核酸(cDNA)を後に配列決定するゲノム配列決定サイクルの前に実行することができる。
上記で示唆されるように、較正-配列決定システムは、1つ以上の較正サイクルを使用して、様々な方法で配列決定パラメータを決定することができる。例えば、場合によっては、較正-配列決定システムは、1つ以上の較正サイクルを実行して、例えば、核酸塩基シグナルの強度値、強度値の核酸塩基重心、核酸塩基の強度値境界、又は他の配列決定パラメータを検出することによって、較正配列中の特定の既知の核酸塩基型に対応する配列決定パラメータを直接検出する。追加的又は代替的に、較正-配列決定システムは、複数の較正サイクルの間又は後に検出する初期配列決定パラメータから配列決定パラメータを決定することができる。更に、特定の実装形態では、較正-配列決定システムは、較正サイクルを実行して較正配列についての核酸塩基コールを決定し、較正配列に対する相補鎖/オリゴヌクレオチドについての核酸塩基コールと較正配列についての既知の相補的核酸塩基との間の塩基コール差(又は他の検出された配列決定メトリック差)に基づいて1つ以上の配列決定パラメータを調整する。
較正配列を用いて較正サイクルを実行することによって、較正-配列決定システムは、配列決定装置又は配列決定パイプラインに対応する様々な種類の配列決定パラメータを決定することができる。例えば、場合によっては、較正-配列決定システムは、較正配列を使用して、以前にオフラインで決定され、イコライザ係数などの事前構成されたパラメータとして提供された1つ以上の配列決定パラメータを決定する。更なる例として、特定の実施形態では、較正-配列決定システムは、較正配列を使用して、配列決定装置上での配列決定実行中に学習された1つ以上の配列決定パラメータ、例えば、非線形光学歪みパラメータ、構造化照明顕微鏡(structured illumination microscopy、SIM)パラメータ、クラスターごとの正規化パラメータ、又は特定のチャネルについてのオフセット補正パラメータを決定する。
較正サイクルを実行するとき、較正-配列決定システムは、様々な方法で較正サイクルを配置又は順序付けすることができる。例えば、特定の実装形態では、較正-配列決定システムは、ゲノム配列決定サイクル又はインデックスサイクルを実施する前及び/又は実施せずに、較正サイクルを実施する。所与の較正サイクルの間に、較正-配列決定システムは、1つ以上の較正配列を反映する成長オリゴヌクレオチドの較正-配列位置に1つ以上の核酸塩基型の核酸塩基を組み込むことができ、それによって、較正配列のセットが所与の較正-配列位置において単一の核酸塩基型又は異なる核酸塩基型を有し得ることを反映する。一部のかかる較正サイクルでは、較正-配列決定システムは、2つ、3つ、又は4つの核酸塩基型の比例分布を、1つ以上の較正配列を反映する成長オリゴヌクレオチドの所与の較正-配列位置に組み込み、それによって、較正配列のセットが、所与の較正-配列位置において2つ、3つ、又は4つの核酸塩基型のほぼ等しい分布を有し得ることを反映する。
実際に、較正配列の所与のセットは、同じ順序の核酸塩基の単一の配列(例えば、ACGTAC)、異なる順序の核酸塩基の配列(例えば、1つの順序についてACGTAC及び異なる順序についてCGTACAなど)、所与の較正-配列位置で核酸塩基型の比例分布を有する核酸塩基の異なる配列(例えば、第1の位置で50%/50%のG/Cの2重、第2の位置で50%/50%のG/Tの2重など)、又は以下に記載される様々な他の配列順序若しくは配置を含み得る。
較正サイクルの配置又は順序にかかわらず、較正-配列決定システムは、(i)ゲノム試料から調製された試料ライブラリ断片内の(又はそれに関して)異なる位置に配置されたか、又は(ii)試料-ヌクレオチドスライドの表面に付着した、較正配列の内容物を受け取るか、又は決定することができる。例えば、較正配列は、試料ライブラリ断片内の非ゲノム配列及び/又は非トランスクリプトーム配列の一部又は全部であってよい。一部のかかる場合では、較正配列は、結合アダプター配列とインデックス配列との間、インデックス配列とリードプライミング配列との間、又はリードプライミング配列と試料ゲノム配列との間に位置する。対照的に、較正配列は、非ランダム固有分子識別子(unique molecular identifier、UMI)配列、固有デュアルインデックス(unique dual index、UDI)配列、インデックス配列、又は結合アダプター配列の一部又は全部であってもよい。
較正配列のための様々な異なる位置に加えて、較正-配列決定システムは、較正配列(又は較正配列を含む試料ライブラリ断片)を、ヌクレオチド-試料スライド(例えば、フローセル)の異なる位置に受け取るか、又は配置することができる。例えば、較正-配列決定システムは、(i)各ウェル内のオリゴヌクレオチドの各クラスターをシーディングするために各ウェルにおいて、又は(ii)ウェルのサブセット内の各クラスターをシーディングするか、若しくはウェルのサブセット内のオリゴヌクレオチドのクラスターのサブセットをシーディングするためにウェルのサブセットにおいて、較正配列を有するヌクレオチド-試料スライドを受け取るか、又は検出することができる。代替的に、一部の実施形態では、較正-配列決定システムは、(i)ウェルのサブセット又はウェルのサブセット内のオリゴヌクレオチドのクラスターのサブセット中に較正配列を有し、(ii)ウェルの別のサブセット又はオリゴヌクレオチドのクラスターの別のサブセット中に較正配列を有さない、ヌクレオチド-試料スライドを受け取るか、又は検出する。以下に記載されるように、較正配列についてのかかる異なるウェル配置は、試料ライブラリ断片に関連する較正配列の異なる位置と組み合わされ得る。
上記のように、較正-配列決定システムは、既存の配列決定システムと比較して、配列決定パラメータ及びヌクレオチド配列決定の精度、速度、及び効率を改善することなどによって、既存の配列決定システムと比較して複数の技術的利点を提供する。例えば、一部の実施形態では、較正-配列決定システムは、特定の配列決定装置、画像分析、及び対応する核酸塩基コールのための1つ以上の配列決定パラメータの精度を改善する。上記のように、一部の既存の配列決定システムは、所与のゲノム配列決定サイクルにおいて、又はゲノム配列決定サイクルにわたって、特定の核酸塩基型を不均衡に表す未知の又は周知のゲノム試料(例えば、Phi-X)からかかるパラメータを推定することによって、配列決定パラメータを歪める。対照的に、較正-配列決定システムは、所与の較正サイクルについて、又は較正サイクルにわたって、核酸塩基型の分布を均一にすることができる核酸塩基の較正配列を有するヌクレオチド-試料スライドを受け取るか、又は検出し、それによって、核酸塩基型のより比例した表現を示す。較正配列のセットの1つ以上の核酸塩基を組み込むために較正サイクルを実施することによって、較正-配列決定システムは、配列決定装置に対応するより正確な配列決定パラメータを決定することができる。同様のハードウェア及び同様の消耗品のパイプラインのための配列決定パラメータを使用する既存のシステムとは異なり、較正-配列決定システムは、特定の配列決定装置上で較正サイクルを実行して、強度値、強度値境界、イコライザ係数、又は配列決定装置に固有の他の配列決定パラメータを生成することができる。したがって、較正-配列決定システムは、較正配列及び較正サイクルを使用して、特定の配列決定装置のためにカスタマイズされた精度で配列決定パラメータを決定することができる。かかる改善された配列決定パラメータの結果として、較正-配列決定システムは同様に、配列決定装置が配列決定サイクル中にオリゴヌクレオチドのクラスターの画像を撮影し、それらの画像を分析し、かかる分析に基づいて核酸塩基コールを決定する精度を改善する。
改善された精度に加えて、特定の実装形態では、較正-配列決定システムは、配列決定装置に対応する1つ以上の配列決定パラメータを即時的に調整し、リアルタイムで異常又はエラーを補正し、既存の配列決定システムに存在しないある種の即時的柔軟性を導入する。上記のように、一部の既存の配列決定システムは、配列決定パラメータを決定するために初期のゲノム配列決定サイクル(時にはエラーを伴う)を使用することによって配列決定パラメータを歪めるか又は失効させ、その後、ソフトウェア又はハードウェアが経時的に変化し得るため、かかるパラメータを調整することができない。既存のシステムとは対照的に、一部の実施形態では、較正-配列決定システムは、較正配列を含むヌクレオチド-試料スライドを受け取り、較正配列を使用して較正サイクルを実行して、配列決定装置の現在の状態に対応する配列決定パラメータをその場で決定する。したがって、較正-配列決定システムは、較正配列を含む各ヌクレオチド-試料スライドを用いて、かつ/又は較正サイクルにわたって、1つ以上の配列決定パラメータを決定(又は調整)することができる。配列決定装置のためのカメラが焦点又はセンタリングを変更すると、配列決定装置内の温度が変化すると、あるいは他のハードウェア又はソフトウェア構成要素が変化すると、較正-配列決定システムは、配列決定装置又は対応するソフトウェアの現在又は最近の状態を反映する1つ以上の配列決定パラメータを決定することができる。
改善されたパラメータ精度及び適時調整を超えて、一部の実施形態では、較正-配列決定システムは、配列決定装置及び対応する配列決定サイクルの空間及びコンピューティングリソースを保存することによって、ヌクレオチド配列決定のコンピューティング効率を改善する。上記のように、一部の既存の配列決定システムは、配列決定パラメータの較正のための専用のクラスターを用いて、未知の又は周知のゲノム試料(例えば、Phi-X)に対するゲノム配列決定サイクルを消費する。実際に、一部の既存の配列決定システムは、較正のために、配列決定実行全体又はヌクレオチド-試料スライドの特定のクラスターをゲノム配列専用にする。既存のシステムとは対照的に、特定の実装形態では、較正-配列決定システムは、試料ライブラリ断片内に埋め込む(又は付着させる)ことができる比較的短い較正配列、及び試料ライブラリ断片内の試料ゲノム配列を決定するためのゲノム配列決定サイクルと同じ配列決定実行中に実施することができる較正サイクルを使用する。比較的短い較正配列を用いて較正サイクルを実行することによって、較正-配列決定システムは、ゲノム配列決定サイクルも実施する配列決定実行中に配列決定装置に対応する配列決定パラメータを決定(又は調整)することができ、それによって、別様で較正専用であったであろう未知の試料のゲノム配列決定のためのヌクレオチド-試料スライド上のコンピューティングリソース及び空間を保存する。
前述の議論によって例証されるように、本開示は、較正-配列決定システムの特徴及び利点を説明するために、様々な用語を利用する。本明細書で使用される場合、例えば、「較正配列」という用語は、配列決定装置又は対応するソフトウェアの1つ以上の配列決定パラメータを較正することを容易にする核酸塩基型を表す2つ以上の核酸塩基の配列を指す。例えば、較正配列は、配列決定パラメータを決定又は調整するために使用される核酸塩基型の標的化された分布を有する核酸塩基の人工的な非ゲノム配列及び/又は非トランスクリプトーム配列を含む。したがって、かかる非ゲノム配列及び/又は非トランスクリプトーム配列は、試料からのgDNA断片、cDNA断片、又はRNA断片(例えば、mRNA断片)の一部ではない。かかる核酸塩基型の標的化された分布は、較正配列のセットの位置にわたる異なる核酸塩基型の比例的分布、所与の較正-配列位置における異なる核酸塩基型の組み合わせの比例的分布、較正配列のセットの位置にわたる核酸塩基型の代表的な分布(例えば、分類学上の門、綱、目、科、属、又は種の平均又は別様で代表的な分布)、又は核酸塩基型の別の所定の分布を含み得る。較正配列の所与のセットは、例えば、同じ順序で核酸塩基型の標的化された分布を有する核酸塩基の単一の配列(例えば、ACTGCGC)、異なる順序で核酸塩基型の標的化された分布を有する核酸塩基の配列(例えば、1つの順序についてACGT及び異なる順序についてCGTAなど)、又は所与の較正-配列位置で核酸塩基型の標的化された分布を有する核酸塩基の異なる配列(例えば、第1の位置における25%/25%/25%/25%での4重のA/C/G/T、第2の位置における25%/25%/25%/25%での別の4重のA/C/G/Tなど)を含み得る。場合によっては、較正配列は、長さが4~8核酸塩基など、比較的短い。較正配列は、試料ライブラリ断片の1つ以上のヌクレオチド配列(又はその一部)にライゲートされ得るか、又はヌクレオチド-試料スライドの表面にライゲートされ得る。
関連して、「較正核酸塩基」という用語は、配列決定装置又は対応するソフトウェアの1つ以上の配列決定パラメータを較正することを容易にする核酸塩基を指す。例えば、較正核酸塩基の群は、配列決定パラメータを決定又は調整するために使用される核酸塩基型の標的化された分布を有する核酸塩基の人工的な非ゲノム及び/又は非トランスクリプトミクスセットを含む。したがって、かかる核酸塩基の非ゲノム及び/又は非トランスクリプトミクスセットは、gDNA断片又はcDNA断片の一部ではなく、又はそれから抽出されたものでもない。かかる核酸塩基型の標的化された分布は、試料ライブラリ断片の異なるセットにわたる異なる核酸塩基型の比例的分布、試料ライブラリ断片の異なるセットにわたる核酸塩基型の代表的な分布(例えば、分類学上の門、綱、目、科、属、又は種の平均又は別様で代表的な分布)、又は核酸塩基型の別の所定の分布を含み得る。較正配列と同様に、較正核酸塩基は、試料ライブラリ断片の1つ以上のヌクレオチド配列(又はその一部)にライゲートされ得るか、又はヌクレオチド-試料スライドの表面にライゲートされ得る。
本明細書中で更に使用される場合、「試料ライブラリ断片」という用語は、試料ゲノム配列又はcDNA配列の検出又は単離を容易にする1つ以上のアダプター配列又はプライマー配列を含むようにライゲートされた試料ゲノム配列(又はcDNA配列)を指す。例えば、試料ライブラリ断片は、試料から抽出され、結合アダプター配列、インデックス配列、又はリードプライミング配列のうちの1つ以上と直接又は間接的に結合するようにライゲートされた試料ゲノム配列(又はcDNA配列)を含むことができるが、これらに限定されない。
関連して、「試料ゲノム配列」という用語は、試料の染色体から抽出又はコピーされたヌクレオチド配列を指す。例えば、試料ゲノム配列は、試料の染色体DNAから分離又はコピーされたヌクレオチド配列を含む。したがって、試料ゲノム配列は、特定の未知の試料のゲノムDNA(genomic DNA、gDNA)を含む。本明細書に記載されるように、一部の実施形態では、較正-配列決定システムは、試料ライブラリ断片中のgDNAを含む試料ゲノム配列ではなく、cDNAを含む試料相補的配列を使用することができ、又は当業者によって理解されるように、好適なcDNAがgDNAを置き換え得る場合はいつでも使用することができる。
対照的に、「インデックス配列」は、試料についてのヌクレオチド断片リードを同定し、試料のヌクレオチド配列(例えば、gDNA断片若しくはcDNA断片)又は試料ライブラリ断片内の別の配列にライゲートされる、固有の人工ヌクレオチド配列を指す。上記のように、インデックス配列は、試料ライブラリ断片の一部であり得る。同様に、インデックス配列を使用して、とりわけ、試料によって、又は異なるファイルにヌクレオチド断片リードをソートすることができる。場合によっては、試料ライブラリ断片は、リードプライミング配列とは異なり、かつインデックス配列の核酸塩基を決定するための出発点又は出発核酸塩基を示すインデックスプライマー配列を含む。
本明細書中で更に使用される場合、「結合アダプター配列」という用語は、ヌクレオチド-試料スライドの表面(例えば、ウェル)上のオリゴヌクレオチドに結合し、試料のヌクレオチド配列(例えば、gDNA断片又はcDNA断片)又は試料ライブラリ断片内の別の配列にライゲートされるヌクレオチド配列を指す。場合によっては、結合アダプター配列は、試料ライブラリ断片の末端(例えば、5’末端又は3’末端)にライゲートされ、試料-ヌクレオチドスライドのオリゴヌクレオチドローンからのオリゴヌクレオチドに結合するヌクレオチド配列を含む。
また、本明細書で使用される場合、「リードプライミング配列」という用語は、試料のヌクレオチド配列(例えば、gDNA断片又はcDNA断片)の核酸塩基を決定するための開始点又は開始核酸塩基を示し、試料のヌクレオチド配列にライゲートされるヌクレオチド配列を指す。配列決定中、場合によっては、配列決定プライマーは、試料ライブラリ断片からのリードプライミング配列に結合又はアニールし、ポリメラーゼ酵素又は他の酵素は、ヌクレオチド断片リードを配列決定するために、配列決定プライマーに付加され、試料ゲノム配列(及び/又は試料ライブラリ断片からの他のヌクレオチド配列)に相補的である核酸塩基を組み込む。上に示されるように、リードプライミング配列は、試料ライブラリ断片の一部であり得る。
関連して、本明細書で使用される場合、「配列決定プライマー」という用語は、ヌクレオチド断片リードの開始部分としてリードプライミング配列(又は他のプライマー部位)に結合するヌクレオチド断片を指す。特に、配列決定プライマーは、配列決定サイクル(例えば、ゲノム配列決定サイクル、較正サイクル)中にリードプライミング配列(又は他のプライマー部位)に結合し、ヌクレオチド断片リードの新生配列を形成するヌクレオチド断片を含む。上記で示唆されるように、配列決定サイクル中に、酵素は、核酸塩基ごとに配列決定プライマーに核酸塩基を付加するか、又は組み込んで、ヌクレオチド断片リードを成長させるか、又は配列決定する。
更に上述したように、較正-配列決定システムは、1つ以上の較正サイクルを実施又は実行することができる。「較正サイクル」という用語は、オリゴヌクレオチドのクラスター又はオリゴヌクレオチドのクラスターのセットについての1つ以上の較正配列を表すか又はそれに対応する1つ以上のオリゴヌクレオチドに1つ以上の核酸塩基を付加するか又は組み込む反復を指す。特に、較正サイクルは、1つ以上の較正配列を表すか又はそれに対応するオリゴヌクレオチド(又は並行してオリゴヌクレオチド)に付加されたか又は組み込まれた1つ以上の核酸塩基を示すオリゴヌクレオチドのクラスターの1つ以上の画像を撮影及び分析する反復を含むことができる。オリゴヌクレオチド又は対応するウェルの一部のクラスターは較正配列を含み得るが、オリゴヌクレオチド又は対応するウェルの他のクラスターは較正配列を含み得ないため、較正サイクルは、場合によっては、オリゴヌクレオチドのクラスター又はオリゴヌクレオチドのクラスターのセットに特異的である。較正サイクルは、較正サイクルが1つ以上の較正配列からの少なくとも1つの核酸塩基(又は核酸塩基の大部分)の配列決定を含むという点で、インデックスサイクル又はゲノム配列決定サイクルとは異なる。較正配列を分配する際のクラスター間の潜在的な差異に起因して、一部の実施形態では、較正-配列決定システムは、同時に、(i)1つ以上の較正配列に対応する1つ以上の核酸塩基を組み込むことによって、オリゴヌクレオチドの1つのクラスター(又はオリゴヌクレオチドのクラスターの1つのサブセット)についての較正サイクルを実施することができ、(ii)それぞれ、1つ以上の試料ゲノム配列又は1つ以上のインデックス配列のいずれかに対応する1つ以上の核酸塩基を組み込むことによって、オリゴヌクレオチドの別のクラスター(又はオリゴヌクレオチドのクラスターの別のサブセット)についてのゲノム配列決定サイクル又はインデックスサイクルを実施することができる。
対照的に、「インデックスサイクル」という用語は、インデックス配列を表すか若しくはそれに対応するオリゴヌクレオチドに核酸塩基を付加するか若しくは組み込む反復、又は並行してインデックス配列を表すか若しくはそれに対応するオリゴヌクレオチドに核酸塩基を付加するか若しくは組み込む反復を指す。特に、インデックスサイクルは、1つ以上のインデックス配列を表す又はそれに対応する1つのオリゴヌクレオチド又は複数のオリゴヌクレオチドに(並行して)付加された又は組み込まれた1つ以上の核酸塩基を示すオリゴヌクレオチドのクラスターの1つ以上の画像を撮影及び分析する反復を含むことができる。インデックスサイクルは、インデックスサイクルが、1つ以上の試料ライブラリ断片を同定又は符号化する1つ以上のインデックス配列からの少なくとも1つの核酸塩基(又は核酸塩基の大部分)の配列決定を含むという点で、較正サイクル又はゲノム配列決定サイクルとは異なる。較正サイクルは、オリゴヌクレオチドの単一のクラスター又は複数のクラスターに特異的であり得るため、オリゴヌクレオチドの1つのクラスターについてのインデックスサイクルは、オリゴヌクレオチドの別のクラスターについての較正サイクルと同時に実施され得る。
本明細書で更に使用される場合、「ゲノム配列決定サイクル」という用語は、試料ゲノム配列(若しくはcDNA配列)を表すか若しくはそれに対応するオリゴヌクレオチドに核酸塩基を付加するか若しくは組み込む反復、又は試料ゲノム配列(若しくはcDNA配列)を表すか若しくはそれに対応するオリゴヌクレオチドに核酸塩基を並列に付加するか若しくは組み込む反復を指す。特に、ゲノム配列決定サイクルは、1つ以上の試料ゲノム配列を表すか又はそれに対応する1つのオリゴヌクレオチド又は複数のオリゴヌクレオチドに(並行して)付加されたか又は組み込まれた個々の核酸塩基を示すデータを有する1つ以上の画像を撮影及び分析する反復を含み得る。例えば、1つ以上の実施形態では、各ゲノム配列決定サイクルは、画像を撮影及び分析して、ゲノム試料(又はゲノム試料から転写された配列)の一部を表すDNA(又はRNA)鎖のいずれかの単一リードを決定することを含む。しかし、上記で示唆されるように、ゲノム配列決定サイクルは、場合によっては、オリゴヌクレオチドのクラスター又はオリゴヌクレオチドのクラスターのセットに特異的である。較正配列を分配する際のクラスター間の潜在的な差異のために、一部の実施形態では、較正-配列決定システムは、同時に(i)オリゴヌクレオチドの1つのクラスター(又はオリゴヌクレオチドのクラスターの1つのサブセット)について較正サイクルを実施することができ、(ii)オリゴヌクレオチドの別のクラスター(又はオリゴヌクレオチドのクラスターの別のサブセット)についてゲノム配列決定サイクル又はインデックスサイクルを実施することができる。
場合によっては、較正サイクル、インデックスサイクル、及びゲノム配列決定サイクルの各々は、ヌクレオチド-試料スライドの画像又はヌクレオチド-試料スライドの複数のセクション(例えば、タイル)の画像を撮影して、特定のオリゴヌクレオチドに付加又は組み込まれた特定の核酸塩基の画像データを生成するカメラを含み、これは、多くの場合、クラスターにグループ化される。画像撮影段階に続いて、較正-配列決定システムは、組み込まれた核酸塩基から特定の蛍光標識を除去し、較正配列、インデックス配列、又は試料ゲノム配列が完全に配列決定されるまで、別のサイクルを実施することができる。
本明細書で更に使用される場合、「配列決定実行」という用語は、試料(例えば、ゲノム試料)からのヌクレオチド配列の一次構造を決定するための配列決定装置上での反復プロセスを指す。特に、配列決定実行は、試料から抽出され、ヌクレオチド-試料スライド全体にシーディングされたヌクレオチド配列(又はライブラリ断片内の他の配列)からのヌクレオチド断片リードを決定するために、成長オリゴヌクレオチドに核酸塩基を組み込む配列決定装置によって実施される配列決定化学及び撮像のサイクルを含む。場合によっては、配列決定実行は、ヌクレオチド-試料スライド(例えば、フローセル)全体にわたってクラスターでシーディングされた1つ以上のゲノム試料からヌクレオチド配列を複製することを含む。配列決定実行が完了すると、配列決定装置は、ファイル内に塩基コールデータを生成することができる。
ちょうど示唆されるように、「塩基コールデータ」という用語は、ヌクレオチド断片リード及び/又は対応する配列決定メトリックについての核酸塩基コールを表すデータを指す。例えば、塩基コールデータは、対応する塩基コール品質メトリック、深度メトリック、及び/又は他の配列決定メトリックとともに、ヌクレオチド断片リードの核酸塩基コールをテキスト(例えば、A、C、G、T)として表すテキストデータを含む。場合によっては、塩基コールデータは、バイナリ塩基コール(binary base call、BCL)配列ファイルなどのテキストファイルで、又は高速オール品質(fast-all quality、FASTQ)ファイルとしてフォーマットされる。
本明細書中で更に使用される場合、「配列決定パラメータ」という用語は、(i)特定の核酸塩基型の核酸塩基が、配列決定装置を使用して正確に検出、定量、若しくは分析され得る設定、境界、若しくは環境、又は(ii)核酸塩基型の特定のシグナル(又はノイズ若しくは核酸塩基型に関連する化学物質)が、配列決定装置を使用して正確に検出、定量、若しくは分析され得る設定、境界、若しくは環境を定量するか又は表す、標準化されたか又はスケーリングされた因子、測定基準、又は値を指す。例えば、配列決定パラメータは、イコライザ係数、畳み込みカーネル係数、強度値の核酸塩基重心、核酸塩基特異的バックグラウンド強度値、強度正規化係数、ガウス共分散行列、非線形光学歪みパラメータ、構造化照明顕微鏡(SIM)パラメータ、特定のチャネルについてのクラスターごとの正規化パラメータ、チャネル特異的正規化パラメータ(例えば、特定のチャネルについてのオフセット補正パラメータ、特定のチャネルについてのクラスターごとの強度パラメータ、特定のチャネルについてのクラスターごとの輝度パラメータ)、クラスター特異的シグナル正規化パラメータ(例えば、配列決定-装置-クラスター-増幅-効率パラメータ、配列決定-装置-クラスター-ハイブリダイゼーション-効率パラメータ)、色チャネル間クロストークパラメータ、又はポリコロナリティパラメータのうちの1つ以上を含むが、これらに限定されない。
本明細書中で更に使用される場合、「ヌクレオチド-試料スライド」という用語は、ゲノム試料又は他の試料核酸ポリマー由来のヌクレオチド配列を配列決定するためのオリゴヌクレオチドを含むプレート又はスライドを指す。特に、ヌクレオチド-試料スライドは、配列決定の一部として試薬及び緩衝液が移動することができる流体チャネルを含有するスライドを指す。例えば、1つ以上の実施形態では、ヌクレオチド-試料スライドは、小さい流体チャネル及び結合アダプター配列に相補的な短いオリゴヌクレオチドを含むフローセル(例えば、パターン化フローセル又は非パターン化フローセル)を含む。上記のように、ヌクレオチド-試料スライドは、オリゴヌクレオチドのクラスターを含むウェル(例えば、ナノウェル)を含むことができる。
上記で示唆されるように、フローセル又は他のヌクレオチド-試料スライドは、(i)反応構造体の複数の反応部位と連絡するフローチャネルをその間に形成するために反応構造体の上に延びる蓋を有する装置を備え得、(ii)反応部位又はその近位で生じる指定された反応を検出するように構成された検出装置を備え得る。フローセル又は他のヌクレオチド-試料スライドは、電荷結合素子(Charge-Coupled Device、CCD)又は相補型金属酸化膜半導体(Complementary Metal-Oxide Semiconductor、CMOS)(光)検出装置などの固体光検出又は撮像装置を含んでもよい。1つの具体的な例として、フローセルは、流体的に構成し、バイオアッセイシステムに流体的及び/又は電気的に結合するように構成することができるカートリッジ(一体型ポンプを有する)に電気的に結合することができる。カートリッジ及び/又はバイオアッセイシステムは、所定のプロトコル(例えば、合成による配列決定)に従ってフローセルの反応部位に反応溶液を送達し、複数の撮像事象を実施することができる。例えば、カートリッジ及び/又はバイオアッセイシステムは、フローセルのフローチャネルを通して、それによって反応部位に沿って、1つ以上の反応溶液を導くことができる。反応溶液のうちの少なくとも1つは、同じ又は異なる蛍光標識を有する4種類のヌクレオチドを含んでもよい。ヌクレオチドは、反応部位の対応するオリゴヌクレオチドなどの、フローセルの反応部位に結合させることができる。次いで、カートリッジ及び/又はバイオアッセイシステムは、励起光源(例えば、発光ダイオード(light-emitting diode、LED)などの固体光源)を使用して、反応部位を照明することができる。励起光は、フローセルの光センサによって検出され得る発光シグナル(例えば、励起光とは異なる、かつ潜在的には互いに異なる、1つ又は複数の波長の光)を提供することができる。
本明細書で更に使用される場合、「ヌクレオチド断片リード」(又は単に「リード」)という用語は、試料ヌクレオチド配列(例えば、試料ゲノム配列、cDNA)の全部又は一部からの1つ以上の核酸塩基(又は核酸塩基対)の推測される配列を指す。特に、ヌクレオチド断片リードは、ゲノム試料に対応する試料ライブラリ断片からのヌクレオチド配列(又はモノクローナルヌクレオチド配列の群)について決定又は予測された核酸塩基コールの配列を含む。例えば、場合によっては、配列決定装置は、ヌクレオチド-試料スライドのナノ細孔を通過した、蛍光タグ付けを介して決定された、又はフローセル内のクラスターから決定された核酸塩基についての核酸塩基コールを生成することによって、ヌクレオチド断片リードを決定する。
本明細書で更に使用される場合、「核酸塩基コール」(又は単に「塩基コール」)という用語は、配列決定サイクル中のオリゴヌクレオチド(例えば、リード)についての、又は試料ゲノムのゲノム座標についての特定の核酸塩基(又は核酸塩基対)の決定又は予測を指す。特に、核酸塩基コールは、(i)ヌクレオチド-試料スライド上のオリゴヌクレオチド内に組み込まれた核酸塩基の型の決定若しくは予測(例えば、リードベースの核酸塩基コール)、又は(ii)デジタル出力ファイル中のバリアントコール若しくは非バリアントコールを含む、ゲノム内のゲノム座標若しくは領域に存在する核酸塩基の型の決定若しくは予測を示すことができる。場合によっては、ヌクレオチド断片リードについて、核酸塩基コールは、(例えば、フローセルのクラスター中の)ヌクレオチド-試料スライドのオリゴヌクレオチドに付加された蛍光タグ付きヌクレオチドから得られる強度値に基づく核酸塩基の決定又は予測を含む。代替的に、核酸塩基コールは、ヌクレオチド-試料スライドのナノ細孔を通過するヌクレオチドから生じるクロマトグラムピーク又は電流変化からの核酸塩基の決定又は予測を含む。対照的に、核酸塩基コールはまた、ゲノム座標に対応するヌクレオチド断片リードに基づくバリアントコールファイル(variant call file、VCF)又は他の塩基コール出力ファイルについての、試料ゲノムのゲノム座標における核酸塩基の最終予測も含み得る。したがって、核酸塩基コールは、ゲノム座標及び参照ゲノムに対応する塩基コール、例えば、参照ゲノムに対応する特定の位置におけるバリアント又は非バリアントの表示を含み得る。実際に、核酸塩基コールは、単一ヌクレオチドバリアント(single nucleotide variant、SNV)、挿入若しくは欠失(インデル)を含むがこれらに限定されないバリアントコール、又は構造バリアントの一部である塩基コールを指すことができる。上記で示唆されるように、単一の核酸塩基コールは、アデニン(A)コール、シトシン(C)コール、グアニン(G)コール、又はチミン(T)コールであり得る。
関連して、「核酸塩基型」という用語は、特定の型又は種類の窒素含有塩基を指す。例えば、ゲノム又はヌクレオチド配列は、アデニン(A)、シトシン(C)、グアニン(G)、又はチミン(T)、又はウラシル(U)を含む、5つの異なる核酸塩基型を含み得る。
以下の段落は、例示的な実施形態及び実装形態を描写する例示的な図に関して較正-配列決定システムを説明する。例えば、図1は、1つ以上の実施形態による較正-配列決定システム106が動作するシステム環境(又は「環境」)100の概略図を示す。図示されるように、環境100は、ネットワーク116を介して、サーバ装置102と、配列決定装置112と、ユーザクライアント装置108と、を含む。図1は、較正-配列決定システム106の実施形態を示すが、本開示は、以下の代替的な実施形態及び構成を説明する。図1に示されるように、配列決定装置112、サーバ装置102、及びユーザクライアント装置108は、ネットワーク116を介して互いに通信することができる。ネットワーク116は、コンピューティング装置が通信し得る任意の好適なネットワークを含む。例示的なネットワークについては、図11に関して以下で更に詳細に説明する。
図1によって示されるように、配列決定装置112は、ゲノム試料又は他の核酸ポリマーを配列決定し、較正サイクルを実行するための、コンピューティング装置、配列決定装置システム114、及び較正-配列決定システム106を含む。一部の実施形態では、配列決定装置システム114又は較正-配列決定システム106を実行することによって、配列決定装置112は、ゲノム試料から抽出された核酸セグメント又はオリゴヌクレオチドを分析して、配列決定装置112上で直接的又は間接的のいずれかでコンピュータ実施方法及びシステム(本明細書に記載される)を利用して、ヌクレオチド断片リード又は他のデータを生成する。より具体的には、配列決定装置112は、試料から抽出されたヌクレオチド配列を含むヌクレオチド-試料スライド(例えば、フローセル)を受け取り、次いで、かかる抽出されたヌクレオチド配列の核酸塩基配列をコピーし、決定する。
上記で示唆されるように、配列決定装置システム114又は較正-配列決定システム106を実行することによって、配列決定装置112は、配列決定実行の一部として、1つ以上の較正サイクル、インデックスサイクル、又はゲノム配列決定サイクルを実行することができる。較正-配列決定システム106を実行することによって、例えば、配列決定装置112は、試料-ヌクレオチドスライド上に配置されたライブラリ断片に関連する較正配列を検出し、較正サイクルを実行して、較正配列に基づいて配列決定装置112に対応する配列決定パラメータを決定することができる。1つ以上の実施形態では、配列決定装置112は、合成による配列決定(Sequencing by Synthesis、SBS)を利用して、核酸ポリマーをヌクレオチド断片リードに配列決定する。ネットワーク116を介して通信することに加えて、又はその代替として、一部の実施形態では、配列決定装置112は、ネットワーク116をバイパスし、サーバ装置102又はユーザクライアント装置108と直接通信する。
場合によっては、サーバ装置102は、配列決定装置112の同じ物理的位置に若しくはその近くに、又は配列決定装置112から遠隔に位置する。実際に、一部の実施形態では、サーバ装置102及び配列決定装置112は、同じコンピューティング装置に統合される。サーバ装置102は、配列決定システム104又は較正-配列決定システム106を実行して、塩基コールデータを受け取ること、又はかかる塩基コールデータを分析することに基づいてバリアントコールを決定することなどによって、デジタルデータを生成し、受け取り、分析し、記憶し、送信することができる。図1によって示唆されるように、配列決定装置112は、配列決定装置112の配列決定実行中に生成された塩基コールデータを送信することができる(サーバ装置102はそれを受け取ることができる)。配列決定システム104又は較正-配列決定システム106の形態のソフトウェアを実行することによって、サーバ装置102は、ヌクレオチド断片リードを参照ゲノムとアラインし、アラインされたヌクレオチド断片リードに基づいて遺伝子バリアントを決定することができる。サーバ装置102は、ユーザクライアント装置108とも通信することができる。特に、サーバ装置102は、バリアントコールファイル(VCF)、又は核酸塩基コール、配列決定メトリック、エラーデータ、若しくは他のメトリックを示す他の情報を含むデータをユーザクライアント装置108に送信することができる。
一部の実施形態では、サーバ装置102は、サーバの分散型集合を備え、サーバ装置102は、ネットワーク116にわたって分散され、同じか又は異なる物理的場所に位置する、一部のサーバ装置を含む。更に、サーバ装置102は、コンテンツサーバ、アプリケーションサーバ、通信サーバ、ウェブホスティングサーバ、又は別の種類のサーバを備えることができる。
図1に更に示され、表されるように、ユーザクライアント装置108は、デジタルデータを生成し、記憶し、受け取り、送信することができる。特に、ユーザクライアント装置108は、バリアントコール及び対応する配列決定メトリックをサーバ装置102から受け取るか、又は塩基コールデータ(例えば、BCL又はFASTQ)及び対応する配列決定メトリックを配列決定装置112から受け取ることができる。更に、ユーザクライアント装置108は、サーバ装置102又はサーバ装置102と通信して、核酸塩基コール及び/又は塩基コール品質メトリック若しくはパスフィルタメトリックなどの他のメトリックを含むVCFを受け取ることができる。したがって、ユーザクライアント装置108は、グラフィカルユーザインターフェース内のバリアントコール又は他の核酸塩基コールに関する情報を、ユーザクライアント装置108と関連付けられたユーザに提示又は表示することができる。
図1は、ユーザクライアント装置108をデスクトップ又はラップトップコンピュータとして描写するが、ユーザクライアント装置108は、様々な種類のクライアント装置を備えてもよい。例えば、一部の実施形態では、ユーザクライアント装置108は、デスクトップコンピュータ若しくはサーバ、又は他の種類のクライアント装置などの非モバイル装置を含む。更に他の実施形態では、ユーザクライアント装置108は、ラップトップ、タブレット、携帯電話、又はスマートフォンなどのモバイル装置を含む。ユーザクライアント装置108に関する追加の詳細は、図11に関して以下で説明される。
図1に更に図示されるように、ユーザクライアント装置108は、配列決定アプリケーション110を含む。配列決定アプリケーション110は、ユーザクライアント装置108上に記憶され、実行されるウェブアプリケーション又はネイティブアプリケーション(例えば、モバイルアプリケーション、デスクトップアプリケーション)であってもよい。配列決定アプリケーション110は、(実行されると)ユーザクライアント装置108に、較正-配列決定システム106からデータを受け取らせ、ユーザクライアント装置108での表示のために、(例えば、BCLからの)塩基コールデータ又はVCFからのデータを提示させる命令を含むことができる。
図1に更に図示されるように、較正-配列決定システム106のバージョンは、配列決定アプリケーション110の一部としてユーザクライアント装置108上に、又はサーバ装置102上に位置し得る。したがって、一部の実施形態では、較正-配列決定システム106は、ユーザクライアント装置108によって実装される(例えば、全体的又は部分的に配置される)。更に他の実施形態では、較正-配列決定システム106は、サーバ装置102などの環境100の1つ以上の他の構成要素によって実装される。特に、較正-配列決定システム106は、配列決定装置112、ユーザクライアント装置108、及びサーバ装置102にわたって様々な異なる方法で実装することができる。例えば、較正-配列決定システム106は、サーバ装置102から配列決定装置112及び/又はユーザクライアント装置108にダウンロードすることができ、較正-配列決定システム106の機能性の全て又は一部は、環境100内の各それぞれの装置で実施される。
上述のように、較正-配列決定システム106は、較正配列を含むヌクレオチド-試料スライドを検出し、較正サイクルを実行して、配列決定装置に対応する配列決定パラメータを調整するか、又は別様で決定することができる。1つ以上の実施形態による、図2Aは、(i)較正配列及び試料ライブラリ断片に関連する試料ライブラリ断片を含むヌクレオチド-試料スライドを受け取り、(ii)較正配列に対応するオリゴヌクレオチドに核酸塩基を組み込むために較正サイクルを実行し、較正サイクル及び較正配列に基づいて配列決定装置に対応する配列決定パラメータを決定する、較正-配列決定システム106の例を示す。
図2Aに示されるように、例えば、較正-配列決定システム106は、試料ライブラリ断片205a~205nに関連する較正配列204a~204nを含むヌクレオチド-試料スライド202を受け取るか、又は検出する。図示されるように、場合によっては、較正配列204a~204nは、長さが4~8核酸塩基など、比較的短い。ヌクレオチド-試料スライド202は、ウェル206a~206n(例えば、ナノウェル)内に試料ライブラリ断片205a~205nを含み、較正配列204a~204nは、試料ライブラリ断片205a~205nの一部である。したがって、較正配列204a~204nは、試料ライブラリ断片205a~205nを有するオリゴヌクレオチドのシーディングクラスターの一部として、ウェル206a~206a内に(又は、場合によっては、ウェルを欠くパターン化されていないヌクレオチド-試料スライドの表面上に)配置されている。較正配列の更なる実施形態は、図3A~図3B及び図5A~図5Eを参照して以下に説明される。
図2Aに更に示されるように、較正-配列決定システム106は、配列決定装置112を使用して1つ以上の較正サイクル208を実施する。較正サイクル中、例えば、較正-配列決定システム106は、配列決定装置112を使用して、較正配列204a~204nの核酸塩基に相補的な核酸塩基型の核酸塩基を付加する(例えば、Tを相補するAを組み込む)ことなどによって、1つ以上の核酸塩基型の核酸塩基を、較正配列204a~204nに対応する成長オリゴヌクレオチドに組み込む。単一のヌクレオチド断片リード又はペアエンドヌクレオチド断片リード内の較正配列204a~204nを補完するか又はそれに続く成長オリゴヌクレオチドに核酸塩基を付加することによって、場合によっては、較正-配列決定システム106は、較正配列204a~204n内の核酸塩基型の標的分布を反映するオリゴヌクレオチドのクラスターを生成する。
上記で示唆されるように、較正-配列決定システム106は、較正サイクル208の間に較正配列204a~204nについての核酸塩基コールを決定するか、又は決定しないかのいずれかである。したがって、所与の較正サイクル中に、較正-配列決定システム106は、較正配列204a~204nを補完又はミラーリングするタグ(例えば、蛍光タグ)を有する核酸塩基を組み込んだオリゴヌクレオチドのクラスターの画像を撮影及び分析することができる。しかし、較正-配列決定システム106は、所与の較正サイクル中にタグを有する組み込まれた核酸塩基についての核酸塩基コールを必ずしも決定しない。
較正サイクル208の間又はその後、一部の実施形態では、較正-配列決定システム106は、初期配列決定パラメータ210を検出するか、又は別様で決定する。例えば、較正-配列決定システム106は、核酸塩基に対応するシグナルの強度値、強度値境界、強度値の核酸塩基重心、ノイズ測定基準、又は較正サイクル中に検出若しくは出力された他の様々な測定基準のうちの1つ以上を決定することによって、初期配列決定パラメータ210のうちの1つ以上を決定することができる。以下で更に説明するように、初期配列決定パラメータ210は、1つ以上の配列決定パラメータの基礎を直接的又は間接的に形成することができる。
初期配列決定パラメータ210の有無にかかわらず、較正-配列決定システム106は、配列決定装置112に対応する配列決定パラメータ212を決定する。そうするために、場合によっては、較正-配列決定システム106は、配列決定装置112から新たに及び直接配列決定パラメータを推定又は検出し、配列決定装置112に対応するデフォルト又は予め構成された配列決定パラメータ(例えば、イコライザ係数)を調整し、又は複数の較正サイクルからの初期配列決定パラメータに基づいて(例えば、初期配列決定パラメータの平均として)配列決定パラメータを推定する。アプローチにかかわらず、場合によっては、較正-配列決定システム106は、配列決定装置112(又はその環境)から直接又は間接的に配列決定パラメータ212を決定するか、又は初期配列決定パラメータを調整して、較正配列204a~204nに対応する核酸塩基コールに基づいて配列決定パラメータ212を生成することができる。
上記で示唆されるように、較正-配列決定システム106は、(i)従来オフラインで決定され、イコライザ係数などの事前構成されたパラメータとして提供された配列決定パラメータを決定すること、又は(ii)非線形光学歪みパラメータ、構造化照明顕微鏡(SIM)パラメータ、クラスターごとの正規化パラメータ、又は特定のチャネルに対するオフセット補正パラメータなどの配列決定装置上での配列決定実行中に学習された配列決定パラメータを決定することによって、配列決定パラメータ212を決定することができる。
図2Aに更に示されるように、較正サイクル208に加えて、較正-配列決定システム106は、ゲノム配列決定サイクル214及びインデックスサイクル216を必要に応じて実施する。較正配列204a~204nについて較正サイクル208を実施し、配列決定パラメータ212を決定した後、例えば、較正-配列決定システム106は、必要に応じて、(i)試料ライブラリ断片205a~205n内の試料ゲノム配列を相補するか又はそれに続く核酸塩基を組み込むことによってゲノム配列決定サイクル214を実施し、かかる組み込まれた核酸塩基についての核酸塩基コールを決定し、(ii)試料ライブラリ断片205a~205n内のインデックス配列を相補するか又はそれに続く核酸塩基を組み込むことによってインデックスサイクル216を実施し、かかる組み込まれた核酸塩基についての核酸塩基コールを決定する。場合によっては、較正-配列決定システム106は、ゲノム配列決定サイクル214の前又は後にインデックスサイクル216を実行する。実際、一部の既存の配列決定システムとは対照的に、較正-配列決定システム106は、それぞれ、試料ライブラリ断片205a~205n内の較正配列204a~204nの位置に応じて、ゲノム配列決定サイクル214の前にインデックスサイクル216を実行することがある。上記のように、一部の実施形態では、オリゴヌクレオチドの1つのクラスターについてのインデックスサイクルは、オリゴヌクレオチドの別のクラスターについての較正サイクルと同時に実施され得るが、これは、較正サイクルは、以下の様々な較正スキームによって概説されるように、オリゴヌクレオチドの1つのクラスター又は複数のクラスターに特異的であり得るためである。
較正配列204a~204nに加えて、又はその代替として、一部の実施形態では、較正-配列決定システム106は、試料ライブラリ断片に関連する較正核酸塩基を含むヌクレオチド-試料スライド(例えば、ヌクレオチド-試料スライド202)を受け取るか、又は検出する。例えば、試料ライブラリ断片のセット内の各試料ライブラリ断片は、単一の較正核酸塩基を含み得る。しかし、試料ライブラリ断片のセットにわたって、較正核酸塩基のセットは、較正核酸塩基にわたる4つの異なる核酸塩基型(例えば、A、T、C、G)の比例分布などの、異なる核酸塩基型の標的化分布を示すことができる。本開示は、図4に関して、かかる較正核酸塩基の更なる例を以下に提供する。
較正配列204a~204nと同様に、特定の実装形態では、較正-配列決定システム106は、較正核酸塩基を使用して、配列決定装置112に対応する配列決定パラメータを決定することができる。例えば、一部の実施形態では、較正-配列決定システム106は、配列決定装置112を使用して較正サイクルを実施して、相補的核酸塩基を較正核酸塩基に対応するオリゴヌクレオチドに組み込み、較正サイクル及び較正核酸塩基に基づいて配列決定パラメータを決定する。
上述したように、較正-配列決定システム106は、様々な方法で配列決定装置に対応する配列決定パラメータを決定することができる。1つ以上の実施形態によれば、図2Bは、(i)較正サイクル中又はその後に配列決定装置から検出された配列決定パラメータを直接決定するため、(ii)複数の較正サイクル中に検出された初期配列決定パラメータに基づいて配列決定パラメータを決定するため、及び/又は(iii)較正配列に対する相補鎖の核酸塩基コールと較正配列の既知の相補的核酸塩基との間の塩基コール差に基づいて初期配列決定パラメータを調整するために、較正サイクルを実行する較正-配列決定システム106を示す。
上述のように、較正-配列決定システム106は、1つ以上の較正サイクル中又はその後に、配列決定装置から配列決定パラメータを直接検出することができる。図2Bに示されるように、例えば、較正-配列決定システム106は、初期較正サイクル218を実施して、1つ以上の較正配列の既知の核酸塩基を相補するか又は一致する核酸塩基をクラスター内のオリゴヌクレオチドに組み込む。初期較正サイクル218の間又は後に、較正-配列決定システム106は、配列決定装置のカメラ、センサ、又は他の構成要素から初期配列決定パラメータ222aを検出する。場合によっては、較正-配列決定システム106は、初期配列決定パラメータ222aを調整しないが、配列決定パラメータとして初期配列決定パラメータ222aを使用して、後続のゲノム配列決定サイクル又はインデックスサイクル中に核酸塩基コールを決定することを容易にする。
初期較正サイクル218中又はその後の直接検出の例として、場合によっては、較正-配列決定システム106は、ヌクレオチド-試料スライド内のオリゴヌクレオチドの特定のクラスターに対応する特定のチャネルの輝度パラメータ(例えば、特定の蛍光標識の画像)を検出又は測定する。追加的又は代替的に、較正-配列決定システム106は、初期較正サイクル218中にオリゴヌクレオチドに組み込まれない特定の核酸塩基のノイズ又はバックグラウンド強度値を検出又は測定する。更なる例として、較正-配列決定システム106は、初期較正サイクル218中に、1つ以上の蛍光標識核酸塩基間のスペクトル重複を示す色チャネル間クロストークパラメータを検出又は測定する。
更に上述したように、較正-配列決定システム106は、複数の較正サイクル中に検出された初期配列決定パラメータに基づいて配列決定パラメータを決定することができる。図2Bに示されるように、特定の実装形態では、較正-配列決定システム106は、初期較正サイクル218及び後続の較正サイクル220aの両方を実施する。後続の較正サイクル220aは、初期較正サイクル218の直後、又は初期較正サイクル218に続く1つ以上の追加の較正サイクルの後のいずれかに生じることができる。
初期較正サイクル218及び後続の較正サイクル220aにおいて、較正-配列決定システム106は、初期配列決定パラメータ222a及び初期配列決定パラメータ222bを決定する。配列決定パラメータの種類に応じて、特定の実装形態では、初期配列決定パラメータ222a及び222bは、初期配列決定パラメータ222a及び222bの両方のための特定のチャネルに対する初期クラスターごとの輝度パラメータを判定すること、又は初期配列決定パラメータ222a及び222bの両方のための初期色チャネル間クロストークパラメータを判定することなどによって、同じ種類の配列決定パラメータを表す。初期配列決定パラメータ222a及び222bに応じて、場合によっては、較正-配列決定システム106は、正確な配列決定パラメータの決定を容易にするために、初期較正サイクル218及び後続の較正サイクル220aの間に同じ核酸塩基型の核酸塩基を組み込む。
図2Bに更に示すように、場合によっては、較正-配列決定システム106は、初期配列決定パラメータ222a及び222bに基づいて配列決定パラメータ224を決定する。例えば、特定の実施形態では、較正-配列決定システム106は、初期配列決定パラメータ222a及び222bの平均又は加重平均を決定して、配列決定パラメータ224を決定する。一部のかかる場合では、較正-配列決定システム106は、より早い又はより遅い較正サイクルをより重く重み付けする。平均化とは対照的に、場合によっては、較正-配列決定システム106は、配列決定パラメータ224を決定するために、初期配列決定パラメータ222bに基づいて、初期配列決定パラメータ222aを漸増的に調整する(例えば、閾値変化まで又はその範囲内で値を増加又は減少させることによって)。
複数の較正サイクル(例えば、初期較正サイクル218及び後続の較正サイクル220a)からの初期配列決定パラメータの組み合わせから配列決定パラメータを決定することに加えて、又はその代替として、較正-配列決定システム106は、較正配列についての(又はそれに相補的な)核酸塩基コールと較正配列についての既知の核酸塩基との間の塩基コール差に基づいて、1つ以上の初期配列決定パラメータを調整することができる。
図2Bに示されるように、例えば、較正-配列決定システム106は、後続の較正サイクル220bを実施する。後続の較正サイクル220bの間、較正-配列決定システム106は、初期配列決定パラメータ222cを決定し、1つ以上の較正配列に対応する成長オリゴヌクレオチドのセットに組み込まれた核酸塩基についての核酸塩基コール228を決定する。対応する較正配列に応じて、組み込まれる核酸塩基は、同じ核酸塩基型であってもよく、又は異なる核酸塩基型の標的化された分布を有してもよい。
関連する較正配列についての既知の相補的核酸塩基226の比較に基づいて、較正-配列決定システム106は、塩基コール差230を決定する。図2Bに示されるように、例えば、塩基コール差230は、関連する較正配列についての既知の核酸塩基(又は相補的核酸塩基)が異なる核酸塩基型(例えば、A)である場合、1つの核酸塩基型(例えば、G)の核酸塩基コールであり得る。較正-配列決定システム106は、初期配列決定パラメータ222a及び222cのいずれか又は両方を、塩基コール差230に基づいて更に調整して、調整された配列決定パラメータ232を生成する。調整された配列決定パラメータ232を生成するために、例えば、較正-配列決定システム106は、核酸塩基についての強度値又は強度値境界についての核酸塩基重心を調整して、塩基コール差230を補正し、関連する較正配列に基づいてコールされるべきであった既知の核酸塩基(又は相補的核酸塩基)を反映し得る。
較正-配列決定システム106は、例えば、較正配列のセットに対応する核酸塩基コールが、較正配列のセットによって示される標的化された分布と異なる場合に、配列決定パラメータを調整するために、塩基コール差に依存し得る。例えば、場合によっては、較正配列のセットは、所与の較正-配列位置における核酸塩基型の標的化された分布(例えば、所与の位置における25%/25%/25%/25%でのA/C/G/Tの4重)を有し得る。較正-配列決定システム106が、核酸塩基型の標的化された分布(例えば、所与の位置における23%/27%/25%/25%でのT/G/C/A)を補完しない核酸塩基コールを決定する場合、較正-配列決定システム106は、配列決定パラメータ(例えば、核酸塩基重心、強度値境界、色チャネル間クロストークパラメータ)を、既知の較正配列によって示される核酸塩基型の標的化された分布(又は補完的な標的化された分布)を生成したであろう程度又は値に調整することができる。
1つ以上の配列決定パラメータを決定した後、較正-配列決定システム106は、インデックスサイクル又はゲノム配列決定サイクル中の様々な段階で、かかる配列決定パラメータを適用することができる。1つ以上の実施形態による、図2Cは、1つ以上の較正サイクルの間に決定された1つ以上の配列決定パラメータを適用して、(i)オリゴヌクレオチドのクラスターの画像から強度値を抽出するか、(ii)抽出された強度値を補正するか、又は(iii)ゲノム配列決定サイクル若しくはインデックスサイクルのいずれかの間に、組み込まれた核酸塩基についての核酸塩基コールを決定する、較正-配列決定システム106又は配列決定装置システム114を示す。
図2Cに示されるように、較正-配列決定システム106又は配列決定装置システム114は、例えば、ゲノム配列決定サイクル又はインデックスサイクルを実施することによって、配列決定サイクル233を実施する。図2Cは、1つ以上の較正サイクル後に実行される配列決定サイクル233の選択された段階を示す。配列決定サイクル233の一部として、例えば、較正-配列決定システム106又は配列決定装置システム114は、ヌクレオチド-試料スライド202の様々なセクション(例えば、タイル)の画像234を撮影し、配列決定装置システム114などのオンデバイスソフトウェアに入力する。場合によっては、画像は、配列決定サイクル233中にオリゴヌクレオチドのクラスターに組み込まれた蛍光タグ付き核酸塩基によって放出された蛍光を示す。
画像234を入力した後、較正-配列決定システム106又は配列決定装置システム114は、画像234によって撮影されたオリゴヌクレオチドのクラスターの位置を識別することによって、位置テンプレート236を生成する。較正-配列決定システム106又は配列決定装置システム114は更に、座標系(例えば、X及びY位置)を使用して、オリゴヌクレオチドのクラスターの識別された場所を画像238に登録又はマッピングすることによって、場所を画像234に登録する。図2Cによって示されるように、較正-配列決定システム106又は配列決定装置システム114は、必要に応じて、既存の方法を使用して、配列決定サイクル233から1つ以上の配列決定パラメータ248を決定する。したがって、1つ以上の配列決定パラメータ248は、較正サイクルからの配列決定パラメータ250とは有意に異なり、上述の技術的問題のうちの1つ以上を受ける。
図2Cに更に示されるように、クラスター位置を登録した後、較正-配列決定システム106又は配列決定装置システム114は、画像234から強度値240を抽出する。例えば、較正-配列決定システム106又は配列決定装置システム114は、クラスターに対応する蛍光を数値形式の強度値240に変換する。強度値240を抽出するとき、較正-配列決定システム106又は配列決定装置システム114は、較正サイクルからの配列決定パラメータ250のうちの1つ以上を適用することができる。例えば、較正-配列決定システム106又は配列決定装置システム114は、画像234から強度値240を抽出することの一部として、以前の較正サイクル中に決定されたイコライザ係数をピクセルに適用することができる。一部のかかる場合、較正-配列決定システム106又は配列決定装置システム114は、参照によりその全体が本明細書に組み込まれる「Equalization-Based image Processing and Spatial Crosstalk Attenuator」米国特許第11,188,778号(2021年11月30日発行)によって説明されるようなイコライザ係数を適用する。
画像から強度値を抽出した後、較正-配列決定システム106又は配列決定装置システム114は、較正サイクルからの配列決定パラメータ250のうちの1つ以上を使用して、強度値242を補正する。例えば、場合によっては、較正-配列決定システム106又は配列決定装置システム114は、補正(例えば、シグナル補正関数)の一部として、正規化パラメータ、ノイズレベル、又はシグナル対雑音比メトリックを強度値240のうちの1つ以上に適用するか、又は考慮に入れる。更なる例として、特定の実施形態では、較正-配列決定システム106又は配列決定装置システム114は、補正(例えば、シグナル補正機能)の一部として強度値240のうちの1つ以上に整相係数を適用する。一部のかかる場合、較正-配列決定システム106又は配列決定装置システム114は、参照によりその全体が本明細書に組み込まれる「Generating Cluster-Specific-Signal Corrections for Determining Nucleotide-Base Calls」米国特許出願第63/285,187号(2021年12月2日出願)によって記載されるような位相係数を適用する。
図2Cに更に示されるように、強度値を補正した後、較正-配列決定システム106又は配列決定装置システム114は、塩基及び品質メトリック244を呼び出す。例えば、場合によっては、較正-配列決定システム106又は配列決定装置システム114は、補正された強度値に基づいて、配列決定サイクル233の間にオリゴヌクレオチドの撮像されたクラスターに組み込まれた1つ以上の核酸塩基についての核酸塩基コールを決定する。核酸塩基コール及び品質メトリック244を決定することの一部として、較正-配列決定システム106又は配列決定装置システム114は、較正サイクルからの配列決定パラメータ250のうちの1つ以上を適用又は考慮することができる。例えば、較正-配列決定システム106又は配列決定装置システム114は、特定の核酸塩基についての強度値及び/又は強度値境界についての核酸塩基重心に従って、補正された強度値に基づいて、組み込まれた核酸塩基についての核酸塩基コールを決定することができる。更なる例として、場合によっては、較正-配列決定システム106又は配列決定装置システム114は、特定のチャネルについてのクラスターごとの強度パラメータ又は特定のチャネルについてのクラスターごとの輝度パラメータを考慮するアルゴリズム又は関数に従って、核酸塩基コールの品質メトリック(例えば、塩基コール品質メトリック)を決定することができる。
図2Cに更に示されるように、塩基及び品質メトリック244をコールした後、較正-配列決定システム106又は配列決定装置システム114は、出力246(例えば、塩基コール及び品質メトリック)を生成することができる。場合によっては、例えば、較正-配列決定システム106又は配列決定装置システム114は、配列決定サイクル233及び配列決定実行における他の配列決定サイクルについての塩基コールデータを、BCLファイルの形態で生成する。
上記のように、較正配列は、試料ライブラリ断片又は関連するyアダプター内の非ゲノム配列及び/又は非トランスクリプトーム配列の一部又は全部であってもよい。1つ以上の実施形態による、図3A~図3Bは、試料ライブラリ断片内にあるか、又は別様で試料ライブラリ断片と関連するかのいずれかである非ゲノム配列及び非トランスクリプトーム配列内に(又はその一部として)較正配列を挿入又はライゲートする較正-配列決定システム106を示す。特に、図3Aは、結合アダプター配列、インデックス配列、リードプライミング配列、又は試料ゲノム配列のうちの1つ以上の間に較正配列を付加する(又はそれを含むヌクレオチド-試料スライドを検出する)較正-配列決定システム106を示す。図3Bは、試料ライブラリ断片のためのyアダプターからの固有分子識別子(UMI)配列又は固有デュアルインデックス(UDI)配列の一部又は全部として較正配列を追加する(又はそれを含むヌクレオチド-試料スライドを検出する)較正-配列決定システム106を示す。
図3Aに示されるように、例えば、較正配列300は、試料ライブラリ断片302に挿入又はライゲートされる。示されるように、較正配列300は、比較的短い(例えば、4~8の核酸塩基長)。しかし、較正-配列決定システム106は、任意の好適な長さの較正配列を使用することができる。示されるように、試料ライブラリ断片302は、試料ゲノム配列310(例えば、gDNA断片)を含むか、代替的に、試料トランスクリプトミクス配列(例えば、cDNA断片)を含む。しかし、較正配列300は、試料ゲノム配列310又は代替的に試料トランスクリプトミクス配列に追加又は挿入されない。
上記で示唆されるように、較正-配列決定システム106は、様々な非ゲノム配列と非トランスクリプトーム配列との間に較正配列300を含むヌクレオチド-試料スライド316を検出又は受け取ることができる。図3Aによって示唆されるように、場合によっては、較正配列300は、(i)第1の結合アダプター配列304aと第1のインデックス配列306aとの間、(ii)第2の結合アダプター配列304bと第2のインデックス配列306bとの間、(iii)第1のインデックス配列306aと第1のリードプライミング配列308aとの間、(iv)第2のインデックス配列306bと第2のリードプライミング配列308bとの間、(v)第1のリードプライミング配列308aと試料ゲノム配列310(又は試料トランスクリプトミクス配列)との間、又は(vi)第2のリードプライミング配列308bと試料ゲノム配列310(又は試料トランスクリプトミクス配列)との間にある。
場合によっては、間に較正配列が挿入される様々なアダプター、プライマー、及びインデックス配列は、市販されている既知の配列の形態をとることができる。例えば、特定の実施形態では、第1の結合アダプター配列304aは、P7結合アダプター配列を構成し、第1のインデックス配列306aは、i7インデックス配列を構成し、第1のリードプライミング配列308aは、第1のリードプライミング配列(例えば、sbs12、B15ME)を構成し、第2のリードプライミング配列308bは、第2のリードプライミング配列(例えば、sbs3’、A14ME)を構成し、第2のインデックス配列306bは、i5インデックス配列を構成し、第2の結合アダプター配列304bは、P5結合アダプター配列を構成する。以下に記載されるように、図3Bは、アダプター結合配列(例えば、UDI配列)の更なる具体例を示す。
上記で更に示唆されるように、較正-配列決定システム106は、特定の非ゲノム配列及び非トランスクリプトーム配列の一部又は全部として較正配列300を含むヌクレオチド-試料スライド316を検出又は受け取ることができる。図3Aによって示唆されるように、例えば、較正配列300は、第1の結合アダプター配列304a、第1のインデックス配列306a、第2の結合アダプター配列304b、第2のインデックス配列306b、又は表面結合オリゴヌクレオチド312を形成するヌクレオチド配列の一部又は全部であり得る。表面結合オリゴヌクレオチド312は、試料ライブラリ断片302の一部ではないが、表面結合オリゴヌクレオチド312は、ヌクレオチド-試料スライド316の表面(例えば、ウェル)に付着し、第1の結合アダプター配列304a又は第2の結合アダプター配列304bのいずれかとともにアニールする。
図3Aに更に示されるように、試料ライブラリ断片302は、ヌクレオチド-試料スライド316内のウェル314のうちの1つの中に配置される。上記で示唆されるように、較正配列を含むか、又は別様で較正配列に関連する更なる試料ライブラリ断片は、同様に、ヌクレオチド-試料スライド316のウェル314内に配置される。続いて、ヌクレオチド-試料スライド316を配列決定装置(例えば、配列決定装置112)に挿入し、配列決定装置によって検出することができる。
ここで図3Bを参照すると、この図において、較正配列324は、試料ライブラリ断片のy-アダプター326に挿入又は組み込まれる。試料ライブラリ断片を調製するためにyアダプター326を使用することの一部として、又はその後に、例えば、較正-配列決定システム106は、較正配列324を、固有分子識別子(UMI)配列322a又はUMI配列322b(それぞれ、UMIアダプター配列320a及び320bの近くに示されている)の一部又は全部に挿入又は組み込むことができる。場合によっては、UMI配列322a及び/又は322bは、非ランダムUMI配列であってもよい。代替的に、一部の実施形態では、較正-配列決定システム106は、較正配列324を固有デュアルインデックス(UDI)配列318a又はUDI配列318bの一部又は全部に挿入又は統合する。
上述のように、較正-配列決定システム106は、ゲノム配列決定サイクル及びインデックスサイクルと併せて較正サイクルを実施することができ、インデックスサイクル及び対応するインデックス配列は、ゲノム配列決定サイクル及び対応する試料ゲノム配列の前又は後に生じる。較正配列324がUDI配列318a又はUDI配列318bの一部又は全部である場合、一部の実施形態では、較正-配列決定システム106は、試料ライブラリ断片からの試料ゲノム配列についてのゲノム配列決定サイクルの前に、インデックス配列についてのインデックスサイクルを実施する。対照的に、較正配列324がUMI配列322a又はUMI配列322bの一部又は全部である場合、特定の実装形態では、較正-配列決定システム106は、試料ライブラリ断片からのインデックス配列についてのインデックスサイクルの前に、試料ゲノム配列についてのゲノム配列決定サイクルを実施する。
図3A又は図3Bのいずれかに関して、較正配列を結合アダプター配列(例えば、UDI配列)に挿入又は組み込む場合、較正-配列決定システム106は、結合アダプター配列(例えば、gDNAの上流)に既に存在する核酸塩基を較正配列として使用し得るか、又はライブラリ調製プロセス中に試料ゲノム配列の末端に付着する結合アダプター配列に較正配列として合成核酸塩基を付加し得るかのいずれかである。結合アダプター配列中に既に存在する核酸塩基を使用するために、較正-配列決定システム106は、核酸塩基の数だけリードプライミング配列を短縮することができる。結果として、サイクル(例えば、較正サイクル)の最初に組み込まれた塩基は、バインダーアダプター配列に対応する。較正配列として合成核酸塩基を結合アダプター配列に付加するために、較正-配列決定システム106は、(例えば、共通の核酸塩基を有する結合アダプター配列を延長することによって)合成核酸塩基を結合アダプター配列に付加する(又は埋め込む)ことができる。
既存の核酸塩基を使用するか、又は較正配列のための結合アダプター配列に合成核酸塩基を付加するかにかかわらず、較正-配列決定システム106は、インデックス配列の順列又は組み合わせを使い尽くす必要なく、ヌクレオチド-試料スライド中のオリゴヌクレオチドの全てのクラスターについてのヌクレオチド断片リードの最初に同じ較正配列を組み込むことができる。較正配列のために結合アダプター配列を使用することによって、較正-配列決定システム106は、より正確な較正を提供することができるが、これは、既に存在する結合アダプター配列は、各異なるプライマーアニーリング配列決定及びテンプレートハイブリダイゼーションを使用することによって変化し得る変動源(テンプレートからプライマーへのハイブリダイゼーション効率)を作製しないためである。
試料ライブラリ断片に対する較正配列の位置にかかわらず、較正-配列決定システム106は、較正配列を構成する核酸塩基及び較正配列の間に成長オリゴヌクレオチドに組み込まれる核酸塩基を様々な方法で配置又は順序付けることができる。1つ以上の実施形態によれば、図4は、核酸塩基型の異なる標的化分布を有する異なる較正配列又は較正核酸塩基の例を示す。上記のように、核酸塩基型の標的化された分布を使用することによって、較正-配列決定システム106は、不規則に分布したゲノム試料の歪んだ分布を排除する(及び分布を均一にする)ことによって、配列決定パラメータ及び対応する核酸塩基コールの精度を改善することができる。
図4に示されるように、例えば、較正-配列決定システム106は、較正サイクルにわたって4つの核酸塩基型の比例分布を有する核酸塩基の較正配列402を使用することができる。特に、較正配列402は、較正サイクルにわたるA、C、G、及びTの比例分布を含む。場合によっては、較正配列402は、4つの較正-配列位置で異なる核酸塩基型を有する4つの核酸塩基に及ぶ。他の場合では、較正配列402は、図4に示される8つの較正-配列位置(及び対応する較正サイクル)のうちの2つにおいて4つの異なる核酸塩基型のうちの1つを有する8つの核酸塩基に及ぶ。較正配列402は、較正-配列決定システム106が、ヌクレオチド-試料スライド中のオリゴヌクレオチドの各クラスター又はクラスターのサブセット中の較正配列として(例えば、試料ライブラリ断片の一部として)使用することができるモノテンプレートを表すことができる。場合によっては、例えば、較正-配列決定システム106は、較正配列402又は類似のモノテンプレート配列に続く核酸塩基の同じ配列又は単一の配列を各々含む較正配列のセットを使用する。図4に示されるように、オリゴヌクレオチドの単一のクラスター又は複数のクラスターのいずれにおいても、較正-配列決定システム106は、較正サイクル1~8を実施して、較正配列402における核酸塩基型の分布に基づいて1つ以上の配列決定パラメータを決定することができる。
図4に更に示されるように、特定の実施形態では、較正-配列決定システム106は、異なる較正-配列位置及び対応する較正サイクルで2つの核酸塩基型(又は2つの核酸塩基型の組み合わせ)の比例分布を有する較正配列のセット403aを使用する。較正配列のセット403aは、較正-配列位置にある1つの核酸塩基型のおよそ50%及び同じ較正-配列位置にある別の核酸塩基型のおよそ50%を有する2重テンプレート較正-配列セットを表す。したがって、較正配列のセット403a内の所与の較正配列は、2つの異なる核酸塩基型のうちの1つを較正-配列位置に含むおよそ50%の確率を有する。較正配列のセット403aからの較正配列は、同様に、オリゴヌクレオチドの各クラスター又はヌクレオチド-試料スライド中のクラスターのサブセットに分配され得る。
図4によって示されるように、較正配列のセット403aは、第1の較正サイクルに対応する第1の較正-配列位置における2つの核酸塩基型(例えば、A及びC)の比例的分布、及び第2の較正サイクルに対応する第2の較正-配列位置における2つの異なる核酸塩基型(例えば、G及びT)の比例的分布を有する。較正-配列位置及び較正サイクルが継続するにつれて、較正配列のセット403aは、第3の較正サイクルに対応する第3の較正-配列位置における2つの核酸塩基型(例えば、A及びT)の異なる組み合わせの比例分布と、第4の較正サイクルに対応する第4の較正-配列位置における2つの核酸塩基型(例えば、G及びC)の別の異なる組み合わせの比例分布とを有する。場合によっては、較正配列のセット403aは、較正-配列位置5~8及び対応する較正サイクル5~8における2つの核酸塩基型の組み合わせの比例分布を示す較正配列セット409aで継続する。
図4に更に示されるように、1つ以上の実施形態では、較正-配列決定システム106は、異なる較正-配列位置及び対応する較正サイクルで、4つの核酸塩基型(又は4つの核酸塩基型の組み合わせ)の比例分布を有する較正配列のセット403bを使用する。較正配列のセット403bは、所与の較正-配列位置におよそ25%の4つの異なる核酸塩基型(例えば、A、C、G、T)を有する4重テンプレート較正-配列セットを表す。したがって、較正配列のセット403b内の所与の較正配列は、較正-配列位置に4つの異なる核酸塩基型のうちの1つを含むおよそ25%の確率を有する。較正配列のセット403bからの較正配列は、同様に、オリゴヌクレオチドの各クラスター又はヌクレオチド-試料スライド中のクラスターのサブセットに分配され得る。
図4によって更に図示されるように、較正配列のセット403bは、各較正-配列位置及び各対応する較正サイクルにおいて、4つの核酸塩基型(例えば、A、C、G、T)の比例的分布を有する。較正配列のセット403bは、同様に、3~8個の較正-配列位置及び3~8個の対応する較正サイクルなど、様々な較正-配列位置及び較正サイクルに及ぶことができる。較正-配列セット406によって示されるように、一部の実施形態では、較正-配列決定システム106は、3つの較正-配列位置にわたる較正配列のセット403b(例えば、各較正配列は3つの核酸塩基にわたる)を用いて3つの較正サイクルを実行し、それによって、配列決定装置を有効に較正し、1つ以上の配列決定パラメータを決定することができる。
上記で示唆されるように、一部の実施形態では、較正-配列決定システム106は、較正核酸塩基を使用して、配列決定装置を較正し、1つ以上の配列決定パラメータを決定する。図4に示されるように、例えば、較正核酸塩基404のセットは、単一の較正-配列位置及び単一の較正サイクルにおいて、4つの異なる核酸塩基型(例えば、A、C、G、T)の比例分布を有する。実際に、一部の実施形態では、較正-配列決定システム106は、単一の較正-配列位置(例えば、各試料ライブラリ断片内の1つの較正核酸塩基)で較正核酸塩基404のセットを用いて単一の較正サイクルを実行し、それによって配列決定装置を有効に較正し、1つ以上の配列決定パラメータを決定することができる。
図4によって更に示唆されるように、一部の実施形態では、較正-配列決定システム106は、配列決定実行のために、較正配列402、較正配列のセット403a、及び較正配列のセット403bの異なる組み合わせを使用する。較正サイクル1~8のための1つの例示的な経路として、特定の実装形態では、較正-配列決定システム106は、(i)較正配列402からのモノテンプレートヌクレオチド配列408に続く較正配列のセットを使用して、較正サイクル1~4を実施し、(ii)その後、2重テンプレート較正-配列セットを有する較正配列セット409aを使用して、較正サイクル4~8を実施する。較正サイクル1~8のための別の例示的な経路として、特定の実装形態では、較正-配列決定システム106は、(i)較正配列402からのモノテンプレートヌクレオチド配列408に続く較正配列のセットを使用して、較正サイクル1~4を実施し、(ii)その後、4重テンプレート較正-配列セットを有する較正配列セット409bを使用して、較正サイクル4~8を実施する。較正-配列決定システム106は、同様に、較正サイクル中に本明細書に記載される様々な他の較正配列を組み合わせることができる。
上記のように、較正-配列決定システム106は、試料ライブラリ断片に対して様々な位置に配置され、様々なクラスターに配置された較正配列を含むヌクレオチド-試料スライドを検出又は受け取ることができる。1つ以上の実施形態による、図5A~図5Eは、試料ライブラリ断片内(又はその近く)に較正配列を組み込み、かかる試料ライブラリ断片をヌクレオチド-試料スライド中のオリゴヌクレオチドの異なるクラスターに分配する、異なる較正スキームを示す。以下で更に説明するように、場合によっては、較正-配列決定システム106は、図5A~図5Eに示す異なる較正スキームを組み合わせる。
図5Aによって示されるように、第1の較正スキーム下で、較正-配列決定システム106は、所与の較正サイクル内及び較正サイクルにわたっての両方で、十分に多様化された核酸塩基型のセットを有する較正配列のセットを含むヌクレオチド-試料スライドを受け取る。場合によっては、例えば、較正-配列決定システム106は、(i)核酸塩基の第1の順序(例えば、配列中の順序A、C、G、T)に従って異なる核酸塩基型を含む第1の較正配列、(ii)核酸塩基の第2の順序(例えば、配列中の順序C、G、T、A)に従って異なる核酸塩基型を含む第2の較正配列、(iii)核酸塩基の第3の順序(例えば、配列中の順序G、T、A、C)に従って異なる核酸塩基型を含む第3の較正配列、及び(iv)核酸塩基の第4の順序(例えば、配列中の順序T、A、C、G)に従って異なる核酸塩基型を含む第4の較正配列を含む較正配列のセットを使用する。第1、第2、第3、及び第4の較正配列の各々は、同様に、ちょうど記載された異なる順序に従う異なる核酸塩基型を含む較正配列の第1、第2、第3、及び第4のサブセットの一部であり得る。
上述のように、一部の既存の配列決定システムは、反復モノヌクレオチド、反復ジヌクレオチド、高G/C反復、又は他のモチーフなどの比較的低い多様性のゲノム試料を使用して配列決定装置を較正することによって、配列決定パラメータを偏らせるか、又は歪める。実際に、一部の既存の較正方法は、既存の配列決定システムが十分に多様化されたゲノム試料に対して較正する誤認に対して機能する。しかしながら、既知の核酸塩基型を有する十分に多様化された較正配列のセットを使用して較正サイクルを実行することによって、較正-配列決定システム106は、一貫して先験的に既知であり、比較的低い核酸塩基型多様性のゲノム試料に依拠するバイアスを受けない、特定の核酸塩基に対するガウス共分散行列又は強度値境界などの配列決定パラメータを決定することができる。
以下の表1に示されるように、例えば、較正-配列決定システム106は、4つの較正サイクルの各々において核酸塩基型の均一な組成を提供する4つの異なる較正配列を含む、十分に多様化された較正配列のセットを使用して、較正サイクルを実施することができる。一部の実施形態では、以下の表1に示されるように、十分に多様化された較正配列のかかるセットは、所与の較正-配列位置においておよそ25%の4つの異なる核酸塩基型(例えば、A、C、G、T)を有する4重テンプレート較正-配列セットの形態をとることができる。
図5Aに示されるように、場合によっては、較正-配列決定システム106は、位置510a、510b、又は510cにおいて試料ライブラリ断片500a内に組み込まれた、十分に多様化された較正配列のかかるセットからの所定の較正配列を含むヌクレオチド-試料スライドを検出又は受け取る。例えば、位置510aで統合される場合、較正配列は、第2のリードプライミング配列502bとインデックス配列506との間に位置するか、又は代替的に、第2のリードプライミング配列502b又はインデックス配列506の一部又は全部として統合される。
場合によっては、インデックス配列は、二本鎖であり(すなわち、核酸塩基対として配置される)、8、10、又は20の核酸塩基長に及ぶ。かかるインデックス配列を使用することによって、較正-配列決定システム106は、理論的には、それぞれインデックスのためのおよそ416、420、又は440個の一意の組み合わせを有する。ハミング編集距離要件を考慮した後、インデックス配列における生物学的試料標識に利用可能な順列の数は減少するが、依然として、較正サイクルの組み込みを可能にするのに十分であるはずである。固有の組み合わせの数の結果として、較正-配列決定システム106は、較正サイクルになるために一部のインデックスサイクルを活用することができる。上記で示唆されるように、インデックス配列を使用して較正サイクルを実施するために、較正-配列決定システム106は、較正サイクル、続いてインデックスサイクル、続いてゲノム配列決定サイクルを実施することができる。
位置510bで統合される場合、較正配列は、インデックス配列506と結合アダプター配列508との間に位置するか、又は代替的に、インデックス配列506又は結合アダプター配列508の一部又は全部として統合される。例えば、較正配列は、図3Bに示されるように、非ランダムUMI配列の一部又は全部であってもよい。一部のかかる場合には、非ランダムUMI配列を試料ゲノム配列の末端にライゲートした後、ポリメラーゼ連鎖反応(Polymerase Chain Reaction、PCR)を行って、結合アダプター配列(例えば、P7及びP5)及びインデックス配列を付加又は完成させる。
位置510cに組み込まれる場合、較正配列は、第1のリードプライミング配列502aと試料ゲノム配列504aとの間に位置するか、又は代替的に、第1のリードプライミング配列502aの一部若しくは全部として組み込まれる。図5Aによって示されるように、一部の実施形態では、配列決定プライマー501aは、第1のリードプライミング配列502aに結合する。配列決定実行中、酵素は、核酸塩基ごとに配列決定プライマー501aに付加するか、又は組み込んで、試料ライブラリ断片500aからの対応するヌクレオチド配列に相補的なヌクレオチド断片リードを生成する。したがって、場合によっては、較正-配列決定システム106は、酵素(例えば、ポリメラーゼ酵素)を使用して、配列決定プライマー501aに付加され、位置510cの較正配列に相補的である核酸塩基を組み込む。配列の順序及び較正配列の位置は異なり得るが、較正-配列決定システム106は同様に、酵素及び配列決定プライマーを使用して、本開示によって記載又は図示される他の位置で較正配列に相補的な核酸塩基を組み込むことができる。
図5Aに更に示されるように、第1の較正スキームに従って、十分に多様化された較正配列のセットからの所与の較正配列は、(i)オリゴヌクレオチドのモノクローナルクラスター512a内(例えば、ヌクレオチド-試料スライドのウェル内)に配置された試料ライブラリ断片内に組み込まれ得るか、又は(ii)オリゴヌクレオチドのポリクローナルクラスター512b内(例えば、ヌクレオチド-試料スライドのウェル内)に配置された異なる試料ライブラリ断片内に組み込まれ得る。比較のために、図5Aはまた、較正配列又は試料ライブラリ断片を欠く非占有ウェル514を示し、非占有ウェルからの強度値を、試料ライブラリ断片及び/又は較正配列を含むウェルからの強度値と比較することによって、特定の配列決定パラメータ(例えば、ウェル内バックグラウンド強度値)を決定するために使用され得る。上記の説明と一致して、較正-配列決定システム106は、第1の較正サイクル中に、第1の核酸塩基型(例えば、A)の核酸塩基をオリゴヌクレオチドのモノクローナルクラスター512aに組み込み、第2の較正サイクル中に、第2の核酸塩基型(例えば、C)の核酸塩基をオリゴヌクレオチドのモノクローナルクラスター512aに組み込み、第3の較正サイクル中に、第3の核酸塩基型(例えば、G)の核酸塩基をオリゴヌクレオチドのモノクローナルクラスター512aに組み込む。
第1の較正スキームによる十分に多様化された較正配列のセットからの所与の較正配列が、オリゴヌクレオチドのポリクローナルクラスター512b内に統合される場合、例えば、所与の較正配列は、ウェル内の選択された既知の位置の一部であり得る。例えば、オリゴヌクレオチドのポリクローナルクラスター512bをカバーする較正サイクルを実行する場合、較正-配列決定システム106は、第1の較正サイクル中に、第2の及び第4の核酸塩基型(例えば、C及びT)の核酸塩基をオリゴヌクレオチドのポリクローナルクラスター512bに組み込み、第2の較正サイクル中に第1の核酸塩基型(例えば、A)の核酸塩基をオリゴヌクレオチドのポリクローナルクラスター512bに組み込み、第3の較正サイクル中に第4の及び第2の核酸塩基型(例えば、T及びC)の核酸塩基をオリゴヌクレオチドのポリクローナルクラスター512bに組み込む。
十分に多様化された較正配列のセットからの所与の較正配列は、較正サイクルにわたって核酸塩基型の多様性を有するため、同じ較正配列のうちの2つをしばしば一緒にポリクローナルクラスター中に見出す可能性は低い。場合によっては、十分に多様化された較正配列のセットは、各試料ライブラリ断片に組み込まれた(及び各試料ライブラリ断片に特異的な)異なる較正配列を有し得る。したがって、第1の較正スキームによる十分に多様化された較正配列のセットを用いると、モノクローナルクラスターは各々、較正サイクル中に固有の純粋な光シグナルを放出する組み込まれた核酸塩基を含む。しかし、ポリクローナルクラスターは、ポリクローナルクラスターをシーディングした異なる試料ライブラリ断片に組み込まれている特異的較正配列に起因して多様なシグナルを一緒に放出する可能性が高い、組み込まれた核酸塩基を含む。
上記の表1に示されるように、又は別様で記載されるように、第1の較正スキームに従って、十分に多様化された較正配列のセットを使用して較正サイクルを実行することによって、較正-配列決定システム106は、ゲノム配列決定サイクルについての学習プロセスの間にしばしば歪められる配列決定パラメータをより正確に決定することができる。例えば、較正-配列決定システム106は、ウェルの理論的位置をヌクレオチド-試料スライド切片の画像において観察される実際の位置に変換する非線形マッピング関数を実行するために、初期ゲノム配列決定サイクルを使用するのではなく、較正サイクル中により正確な非線形光学歪みパラメータを決定することができる。
更なる例として、較正-配列決定システム106は、初期の予測不可能なゲノム配列決定サイクル中にかかるパラメータを学習するのではなく、十分に多様化された較正配列のセットを使用して較正サイクルを実行することによって、特定のチャネルについてより正確な構造化照明顕微鏡(SIM)パラメータ、クラスターごとの正規化パラメータ、又はオフセット補正パラメータを決定することができる。更に別の例として、較正-配列決定システム106は、ゲノム配列決定データを使用して、各配列決定装置に対してコンテキスト外及びオフラインで推定されたかかるイコライザ係数ではなく、第1の較正スキームに従って較正サイクルを実行することによって、より正確なイコライザ係数を決定することができる。カメラの光学的欠陥、ゲノム試料の低核酸塩基型多様性、配列決定が困難なゲノム領域、又は流体欠陥を受けるゲノム配列決定サイクルを消費することによって、かかる配列決定パラメータを学習するのではなく、較正-配列決定システム106は、これらの技術的障害を回避して、第1の較正スキームに従って、十分に多様化された較正配列のセットを用いて較正サイクル中に同じ配列決定パラメータを決定することができる。
配列決定パラメータを改善することに加えて、第1の較正スキームに従って、十分に多様化された較正配列のセットを使用して較正サイクルを実行することによって、較正-配列決定システム106はまた、ヌクレオチド-試料スライドのどのウェルがオリゴヌクレオチドのクラスターで占有されていないか(例えば、非占有ウェル514)を決定するためのプロセス、又はクラスターに対応するヌクレオチド断片リードについての核酸塩基コールが品質フィルタを通過することを決定するためのプロセスを改善することができる。特定の核酸塩基についてのガウス共分散行列又は強度値境界などの、核酸塩基コールについての標準を提供する配列決定パラメータを改善することによって、較正-配列決定システム106は、塩基コール品質メトリックの精度及び信頼性を改善し、その結果、どの核酸塩基コールが品質フィルタを通過するかを判定する。
ここで図5Bを参照すると、第2の較正スキームの下で、較正-配列決定システム106は、較正サイクルにわたって異なる核酸塩基型を有するクロスサイクル多様化較正配列のセットを含むヌクレオチド-試料スライドを受け取る。場合によっては、較正-配列決定システム106は、各較正配列がモノテンプレート較正配列に続くクロスサイクル多様化較正配列のセットを使用する。モノテンプレート較正配列の例として、場合によっては、かかるセット内の各較正配列は、同じ順序に従い、核酸塩基の単一の配列内に4つの核酸塩基型を有する核酸塩基の単一の配列を含む。かかるモノテンプレート較正配列は、2、4、6、又は8個の核酸塩基にわたるなど、比較的短くてもよい。
クロスサイクル多様化較正配列のセットを使用するために、特定の場合では、較正-配列決定システム106は、(i)第1の較正-配列位置において、第1の核酸塩基型及び第2の核酸塩基型(例えば、G及びC)の比例的分布を集合的に含み、(ii)第2の較正-配列位置において、第1の核酸塩基型及び第3の核酸塩基型(例えば、G及びT)の比例的分布を集合的に含み、(iii)第3の較正-配列位置において、第1の核酸塩基型及び第4の核酸塩基型(例えば、G及びA)の比例的分布を集合的に含む、較正配列のセットを使用する。
以下の表2に示されるように、例えば、較正-配列決定システム106は、モノテンプレート較正配列に従うことによって、クロスサイクル多様化較正配列のセットを使用して、較正サイクルを実施することができる。
追加的又は代替的に、以下の表3に示されるように、較正-配列決定システム106は、異なる較正サイクルに対応する異なる較正-配列位置における異なる核酸塩基型の組み合わせの比例的分布を有する、クロスサイクル多様化較正配列のセットを使用して、較正サイクルを実施することができる。例えば、クロスサイクル多様化較正配列のセットは、表3に示されるような2重テンプレート較正-配列セットに従うことができる。
図5Bに示されるように、場合によっては、較正-配列決定システム106は、位置520a、520b、若しくは520cにおいて試料ライブラリ断片500b内に、又は位置520d若しくは520eにおいて試料ライブラリ断片500c内に統合された、クロスサイクル多様化較正配列のセットからの所与の較正配列を含むヌクレオチド-試料スライドを検出又は受け取る。例えば、試料ライブラリ断片500bの位置520aで組み込まれる場合、較正配列は、結合アダプター配列522aの一部又は全部として組み込まれる。試料ライブラリ断片500bの位置520bに組み込まれる場合、較正配列は、第1のリードプライミング配列524aの一部又は全部として組み込まれる。対照的に、試料ライブラリ断片500bの位置520cで組み込まれる場合、較正配列は、第2のリードプライミング配列526aの一部又は全部として組み込まれる。上記で示唆されるように、試料ゲノム配列504bは、較正配列を含まない。
較正配列のための位置520a、520b、又は520cにおいて、較正-配列決定システム106は、ヌクレオチド-試料-スライド-調製キットからの試料ライブラリ断片中の結合アダプター配列、インデックス配列、又はリードプライミング配列の一部として較正配列を含むことができる。一部のかかる場合では、かかる試料ライブラリ断片の配列(例えば、SBS配列)に既に共通性が存在するため、較正配列は、全てのシーディングされた試料ライブラリ断片に共通である。位置520a、520b、又は520cのうちの1つにおいて統合されるとき、一部の実施形態では、較正-配列決定システム106は、対応する短縮された配列決定プライマーの後に較正-配列決定システム106によって組み込まれる核酸塩基が較正配列に対応するように、(例えば、およそ30塩基対の配列決定プライマーを1つ以上の核酸塩基だけ短縮することによって)対応する配列決定プライマーを短縮する。一部のかかる場合では、短縮された配列決定プライマーは、酵素による配列決定のために較正配列を露出させる。較正配列を結合アダプター配列、インデックス配列、又はリードプライミング配列の一部として統合し、対応する配列決定プライマーを短縮することによって、較正-配列決定システム106は、ヌクレオチド-試料-スライド-調製キットからの配列決定プライマーを変更しながら、較正配列を試料-ライブラリ-断片-調製キットの構成要素と適合性にすることができる。
図5Bに示されるように、例えば、較正-配列決定システム106は、短縮された配列決定プライマーを使用して、位置520a、520b、又は520cに組み込まれた較正配列の配列決定を容易にすることができる。一例として、場合によっては、較正配列は、較正-配列決定システム106が配列決定プライマー501bの後に組み込む核酸塩基が較正配列を補完するように、結合アダプター配列522aの下流部分内に(位置520aにおいて)組み込まれる。更なる例として、一部の実施形態では、較正配列は、較正-配列決定システム106が配列決定プライマー501cの後に組み込む核酸塩基が較正配列を補完するように、第1のリードプライミング配列524aの下流部分内に(位置520bにおいて)組み込まれる。更に別の例として、一部の実装形態では、較正配列は、較正-配列決定システム106が配列決定プライマー501dの後に組み込む核酸塩基が較正配列を補完するように、第2のリードプライミング配列526aの下流部分内に(位置520cにおいて)組み込まれる。
リードプライミング配列又は結合アダプター配列の一部として、2重テンプレート較正-配列セットからのモノテンプレート較正配列又は較正配列を統合することによって、較正-配列決定システム106は、核酸塩基順列又はインデックス配列の組み合わせを消費する必要なく、クラスターごとにヌクレオチド断片リードの開始時に同じ較正配列を使用することができる。リードプライミング配列又は結合アダプター配列の一部を較正配列としてそのように使用することによって、較正-配列決定システム106は、配列決定パラメータをより正確に決定することができるが、これは、かかるプライマー又はアダプターアプローチは、異なる試料ライブラリ断片及び異なるリードプライミング配列の各異なるハイブリダイゼーションとともに変化し得る変動源(試料ライブラリ断片対リードプライミング配列ハイブリダイゼーション効率)を除去するためである。
試料ライブラリ断片500b内の位置とは対照的に、図5Bに更に示されるように、試料ライブラリ断片500cの位置520dで統合されるとき、較正配列は、第2のリードプライミング配列526bとインデックス配列528bとの間に位置する。代替的に、較正配列は、インデックス配列528a又はインデックス配列528bの一部又は全部として統合されてもよい。試料ライブラリ断片500cの位置520eに組み込まれる場合、較正配列は、第1のリードプライミング配列524bと試料ゲノム配列504cとの間に位置する。図5Bによって示されるように、一部の実施形態では、配列決定プライマー501eは、位置520eで較正配列から上流に位置付けられた第1のリードプライミング配列524bに結合する。配列決定実行中に、酵素は、核酸塩基ごとに配列決定プライマー501eに核酸塩基を付加又は組み込んで、位置520eの較正配列に相補的な核酸塩基を含む試料ライブラリ断片500cからの対応するヌクレオチド配列に相補的なヌクレオチド断片リードを生成する。
較正配列が試料ライブラリ断片500c内の位置520d又は520eに組み込まれる場合、場合によっては、較正-配列決定システム106は、試料-ライブラリ-断片-調製キットを、リードプライミング配列とインデックス配列との間、又はリードプライミング配列と試料ゲノム配列との間に配置するための較正配列を含むように変更する。しかし、較正配列がかかる位置に配置され、修正された試料-ライブラリ-断片-調製キットの一部である場合、較正-配列決定システム106は、ヌクレオチド-試料-スライド-調製キットから配列決定プライマーを変更する必要はない。
モノテンプレート較正配列又は2重テンプレート較正-配列セットからの較正配列が、インデックス配列528a又はインデックス配列528bの一部又は全部として統合されるとき、一部の実施形態では、較正-配列決定システム106は、インデックス配列を使用するときに典型的に消費されるように、標識のための試料ゲノム配列504cのための利用可能な核酸塩基を減少させる際に、ほぼ同じコストを被る可能性がある。8、10、又は20個の核酸塩基にわたる一部の既存の二本鎖インデックス配列は、およそ416、420、又は440個の固有の組み合わせを有するため、較正-配列決定システム106は、インデックス配列の一部を較正配列として使用するのに十分な核酸塩基の順列空間を有する。しかし、インデックスプライマー配列及びリードプライミング配列は、通常、別々の生化学的ハイブリダイゼーション事象を使用するため、インデックス配列の一部を較正配列として使用する較正-配列決定システム106の較正サイクルは、オリゴヌクレオチドのクラスター中のかかる較正配列に基づいて配列決定パラメータを決定する場合、追加の(しかし、おそらく無視できる)ノイズを検出することができる。
図5Bに更に示されるように、異なる核酸塩基型を有するクロスサイクル多様化較正配列のセットからの所与の較正配列は、(i)オリゴヌクレオチドのモノクローナルクラスター516a中(例えば、ヌクレオチド-試料スライドのウェル内)に配置された試料ライブラリ断片内に組み込まれ得るか、又は(ii)オリゴヌクレオチドのポリクローナルクラスター516b中(例えば、ヌクレオチド-試料スライドのウェル内)に配置された異なる試料ライブラリ断片内に組み込まれ得る。比較のために、図5Bはまた、較正配列又は試料ライブラリ断片を欠き、特定の配列決定パラメータ(例えば、ウェル内バックグラウンド強度値)を決定するために使用され得る、非占有ウェル518を示す。モノテンプレート較正配列の上記の説明と一致して、較正-配列決定システム106は、第1の較正サイクル中に、第1の核酸塩基型(例えば、A)の核酸塩基をオリゴヌクレオチドのモノクローナルクラスター516aに組み込み、第2の較正サイクル中に、第2の核酸塩基型(例えば、C)の核酸塩基をオリゴヌクレオチドのモノクローナルクラスター516aに組み込み、第3の較正サイクル中に、第3の核酸塩基型(例えば、T)の核酸塩基をオリゴヌクレオチドのモノクローナルクラスター512aに組み込む。表3の例からの組み込まれた核酸塩基は、より潜在的な核酸塩基型多様性を有する。
異なる核酸塩基型を有するクロスサイクル多様化較正配列のセットからの所与の較正配列が、上記のように、オリゴヌクレオチドのポリクローナルクラスター516b内に統合される場合、所与の較正配列は、ウェル内の選択された既知の位置の一部であり得る。オリゴヌクレオチドのポリクローナルクラスター516bを網羅する較正サイクルにわたって、較正-配列決定システム106は、第1の較正サイクル中に、第1の核酸塩基型(例えば、A)の核酸塩基をオリゴヌクレオチドのポリクローナルクラスター516bに組み込み、第2の較正サイクル中に第2の核酸塩基型(例えば、C)の核酸塩基をオリゴヌクレオチドのポリクローナルクラスター516bに組み込み、第3の較正サイクル中に第3の核酸塩基型(例えば、T)の核酸塩基をオリゴヌクレオチドのポリクローナルクラスター516bに組み込む。
モノテンプレート較正配列を使用する場合、共通較正配列は、結合アダプター配列中の既存のヌクレオチド配列を(内因性コードとして)使用することによって、又は新しいヌクレオチド配列を結合アダプター配列中に(外因性コードとして)導入することによって読み取られ得る。結合アダプター配列からの内因性コードを使用するために、較正-配列決定システム106は、リードプライミング配列を複数の核酸塩基(例えば、図5Bの位置520a、520b、及び520c)だけ短縮し、天然結合アダプター配列内の核酸塩基を読み取ることができる。かかる天然の結合アダプター配列は、全ての試料-ライブラリ-断片-調製キットと完全に後方互換性があるが、カスタマイズされたリードプライミング配列を必要とする。代替的に、較正-配列決定システム106は、較正配列を外因性コードとして、インデックス配列内の上流(例えば、図5Bの位置520d)、下流、又はゲノム試料配列の直前(例えば、図5Bの位置520e)に導入することができる。任意のかかる位置において、較正-配列決定システム106は、リードプライミング配列を変更することによって、又は組み込まれた核酸塩基の画像を撮影しない暗較正サイクルを使用することによってのいずれかで、配列決定実行から較正サイクルを除外することができる。
第2の較正スキームに従ってモノテンプレート較正配列を使用することによって、較正-配列決定システムは、先験的に既知のヌクレオチド配列を利用して、図5Aに関して上記の例を有する十分に多様化された較正配列のセットを使用して決定された1つ以上の配列決定パラメータを補完する配列決定パラメータを決定することができる。例えば、モノテンプレート較正配列を使用することによって、較正-配列決定システム106は、より正確な核酸塩基特異的バックグラウンド強度値を決定することができる。各較正サイクルについて組み込まれた核酸塩基は既知であるため、較正-配列決定システム106は、モノテンプレート較正配列に対応する各核酸塩基型についてのバックグラウンド強度値を推定する。較正-配列決定システム106は、かかる核酸塩基特異的バックグラウンド強度値を使用して、表面化学を改善若しくは最適化するためのフィードバックを提供するか、又は完全機能性ヌクレオチド(fully functional nucleotide、ffN)ヌクレオチド位置パラメータを開発して、化学及びシグナル対ノイズ比メトリックを改善することができる。
更なる例として、モノテンプレート較正配列などの、第2の較正スキームによるクロスサイクル多様化較正配列のセットを使用することによって、較正-配列決定システム106は、より正確な強度正規化係数を決定することができる。かかる強度正規化係数を決定するために、較正-配列決定システム106は、較正サイクルにおける各核酸塩基型の最大強度及び最小強度を推定し、最大及び最小強度に基づいて強度正規化係数を決定することができる。
更に別の例として、モノテンプレート較正配列などの、第2の較正スキームによるクロスサイクル多様化較正配列のセットを使用することによって、較正-配列決定システム106は、ガウス混合モデル(Gaussian Mixture Model、GMM)のより正確なガウス共分散行列及びガウス平均パラメータを決定することができる。モノテンプレート較正配列に対して単一の核酸塩基型のみを組み込むことによって、較正-配列決定システム106は、GMMを適合させる必要なく、又は期待値最大化(Expectation Maximization、EM)を実施する必要なく、ガウス共分散行列及びガウス平均パラメータの推定を単純化する。較正-配列決定システム106は、かかる簡略化された計算を、低核酸塩基型多様性配列決定サイクルのためのシードとして、又は後のゲノム配列決定サイクルにおける実際のGMMパラメータの初期推定値として使用して、配列決定パラメータの調整又は核酸塩基コールの決定のロバスト性及び精度を増加させることができる。
更に、モノテンプレート較正配列などの、第2の較正スキームによるクロスサイクル多様化較正配列のセットを使用することによって、較正-配列決定システム106はまた、特定のチャネルに対するより正確なクラスターごとの強度正規化パラメータを決定することができる。較正-配列決定システム106は、各塩基位置における各クラスターについてのパラメータを正確に1回検出し得るため、較正-配列決定システム106は、特定の配列決定パラメータについての推定アルゴリズムの小さな修正を用いて、第1の較正スキームと同じクラスターごとの較正を実施することができる。
上記の改善された配列決定パラメータに加えて、場合によっては、モノテンプレート較正配列などの、第2の較正スキームによるクロスサイクル多様化較正配列のセットを使用することによって、較正-配列決定システム106はまた、配列決定装置化学及びアッセイを容易にする配列決定パラメータを推定することができる。例えば、較正-配列決定システム106は、(例えば、チャネルについての)単色分布のタイトネス又は値の差を決定することによって、配列決定-装置-クラスター-増幅-効率パラメータ及び配列決定-装置-クラスター-ハイブリダイゼーション-効率パラメータを推定することができる。更なる例として、較正-配列決定システム106は、配列決定装置のためのセンサ又は光学設計の改良を促進することに役立ち得る、色チャネル間クロストークパラメータを決定することができる。
更に別の例として、第2の較正スキームに従ってクロスサイクル多様化較正配列のセットを使用することによって、較正-配列決定システム106は、クラスターが複数の試料ライブラリ断片によってシーディングされる場合に、オリゴヌクレオチドの各クラスターのポリコロナリティを決定することができる。モノテンプレート較正配列のための較正サイクルは、異なる試料ライブラリ断片にわたって同じ核酸塩基を組み込むため、一部の実施形態では、較正-配列決定システム106は、較正サイクルからのモノクローナル入力のセットを識別し、続いて、ゲノム配列決定サイクルからのポリクローナル入力を識別し、それによって、比較されると、クラスターごとのベースでポリコロナリティの尺度をもたらす入力シグナルを識別することができる。
ここで図5Cを参照すると、第3の較正スキームの下で、較正-配列決定システム106は、第1の較正スキーム及び第2の較正スキームをハイブリダイズするか、又は組み合わせる。かかる較正スキームをハイブリダイズするか又は組み合わせるために、較正-配列決定システム106は、較正-配列位置にわたって及び較正サイクルにわたって核酸塩基型のハイブリッド多様化セットを有する較正配列のセットを使用して較正サイクルを実施する。第1及び第2の較正スキームをハイブリダイズすることによって、較正-配列決定システム106は、モノテンプレート較正配列又は2重テンプレート較正-配列セットに続く較正配列(又は較正部分配列)を使用して較正サイクルを実施して、配列決定パラメータの第1のセットを決定し得、4重テンプレート較正-配列セットに続く他の較正配列(又は較正部分配列)を使用して較正サイクルを実施して、配列決定パラメータの第2のセットを決定することができる。したがって、ハイブリッド多様化較正配列のかかるセットは、較正サイクルのセットにおいて、第1の較正スキームを使用してより良好に較正された配列決定パラメータ(例えば、非線形光学歪みパラメータ、SIMパラメータ)、及び第2の較正スキームを使用してより良好に較正された他の配列決定パラメータ(例えば、核酸塩基特異的バックグラウンド強度値、強度正規化係数)を決定することができる。
例えば、ハイブリッド多様化較正配列のセットは、(i)モノテンプレート較正配列に続く第1の較正配列(又は部分配列)、及び(ii)4重テンプレート較正-配列セットに続く第2の較正配列(又は部分配列)(例えば、所与の較正-配列位置における4つの異なる核酸塩基型のおよそ25%)を含み得る。上記及び図4に示されるように、例えば、較正-配列決定システム106は、(i)較正配列402からのモノテンプレートヌクレオチド配列408に続く較正配列のセットを使用して、較正サイクル1~4を実施すること、及び(ii)4重テンプレート較正-配列セットを有する較正配列セット409bを使用して、較正サイクル4~8を実施することによって、ハイブリッド多様化較正配列のセットを使用して較正サイクルを実施する。
図5Cに更に示されるように、場合によっては、較正-配列決定システム106は、試料ライブラリ断片500d内の非ゲノム配列及び/又は非トランスクリプトーム配列の一部又は全部として統合された、ハイブリッド多様化較正配列のセットからの所与の較正配列を含むヌクレオチド-試料スライドを検出又は受け取る。第3の較正スキームに従って試料ライブラリ断片500d内に統合されるとき、場合によっては、ハイブリッド多様化較正配列のセットからの較正配列は、リードプライミング配列532a(例えば、第1のリードプライミング配列)又はリードプライミング配列532b(例えば、第2のリードプライミング配列)の一部又は全部として統合される。特定の場合には、リードプライミング配列532a又は532bの一部として統合されるとき、較正-配列決定システム106は、核酸塩基の数だけ関連するリードプライミング配列を短縮し、酵素(例えば、DNAポリメラーゼ)のための部位を提供する既存又は共通の核酸塩基を保持し、第1の較正スキーム(例えば、4重テンプレート較正-配列セット)と一致する核酸塩基を追加する。
第3の較正スキームについて図5Cによって更に示されるように、上記の位置の代替として、ハイブリッド多様化較正配列のセットからの較正配列の一部又は全部を、リードプライミング配列532aと試料ゲノム配列504dとの間の位置536a、リードプライミング配列532aとインデックス配列534aとの間の位置536b、又はリードプライミング配列532bとインデックス配列534bとの間の位置536cに統合することができる。
ハイブリッド多様化較正配列のセットを使用して較正サイクルを実施する場合、場合によっては、ヌクレオチド-試料スライドは、ハイブリッド多様化較正配列のサブセット(例えば、モノテンプレート較正配列のサブセット)に相補的な核酸塩基を組み込むオリゴヌクレオチドのモノクローナルクラスター、及びハイブリッド多様化較正配列の別のサブセット(例えば、2又は4重テンプレート較正-配列セットのサブセット)に相補的な核酸塩基を組み込むオリゴヌクレオチドのポリクローナルクラスターを含む。
図5Cによって示されるように、例えば、オリゴヌクレオチドのモノクローナルクラスター529aは、モノテンプレート較正配列のサブセットを含む。オリゴヌクレオチドのモノクローナルクラスター529aについての較正サイクル1~4において、較正-配列決定システム106は、第1の較正サイクル中に、第1の核酸塩基型(例えば、A)の核酸塩基をオリゴヌクレオチドのモノクローナルクラスター529aに組み込み、第2の較正サイクル中に、第2の核酸塩基型(例えば、C)の核酸塩基をオリゴヌクレオチドのモノクローナルクラスター529aに組み込み、第3の較正サイクル中に、第3の核酸塩基型(例えば、G)の核酸塩基をオリゴヌクレオチドのモノクローナルクラスター529aに組み込み、第4の較正サイクル中に、第4の核酸塩基型(例えば、T)の核酸塩基をオリゴヌクレオチドのモノクローナルクラスター529aに組み込む。比較のために、図5Cはまた、較正配列又は試料ライブラリ断片を欠き、特定の配列決定パラメータ(例えば、ウェル内バックグラウンド強度値)を決定するために使用され得る、非占有ウェル530を示す。
図5Cによって更に示されるように、オリゴヌクレオチドのポリクローナルクラスター529bは、2重又は4重のテンプレート-較正-配列セットのサブセットを有する較正配列のセットを含む。オリゴヌクレオチドのポリクローナルクラスター529bについての較正サイクル1~4において、較正-配列決定システム106は、第1の較正サイクルの間に、第1の核酸塩基型(例えば、A)の核酸塩基をオリゴヌクレオチドのポリクローナルクラスター529bに組み込み、第2の較正サイクル中に、第2の核酸塩基型(例えば、C)の核酸塩基をオリゴヌクレオチドのポリクローナルクラスター529bに組み込み、第3の較正サイクル中に第4の及び第1の核酸塩基型(例えば、T及びA)の核酸塩基をオリゴヌクレオチドのポリクローナルクラスター529bに組み込み、第4の較正サイクル中に第1及び第3の核酸塩基型(例えば、A及びc)の核酸塩基をオリゴヌクレオチドのポリクローナルクラスター529bに組み込む。
第1及び第2の較正スキームをハイブリダイズする第3の較正スキームの下でハイブリッド多様化較正配列のセットを用いて較正サイクルを実施することによって、較正-配列決定システム106は、第2の較正スキームを排他的に実行するために消費されていたであろうメモリを低減する。特に、第3のハイブリダイズ較正スキームの下では、較正-配列決定システム106は、関連する配列決定パラメータ(例えば、強度値又はガウス共分散行列についての核酸塩基重心)を推定する前に、強度値を評価するための複数の較正サイクルをもはや必要としない。モノテンプレート較正配列を十分に多様化された較正配列と組み合わせる、第3の較正スキーム下のハイブリッド多様化較正配列のかかるセットは、高スループット配列装置上で特に効率的であり得る。十分に多様化された較正配列及びクロスサイクル多様化較正配列の両方を示す較正サイクルを実施することによって、較正-配列決定システム106は、同様に、配列決定パラメータを決定する精度及びロバスト性を増加させる。
第3のハイブリダイズ較正スキームに加えて、又はその代替として、一部の実施形態では、較正-配列決定システム106は、ヌクレオチド-試料スライド内のクラスター又はウェルの選択されたサブセットを使用して、第4の較正スキーム下で動作する。この第4の較正スキームにおいて、較正-配列決定システム106は、ヌクレオチド-試料スライド内のオリゴヌクレオチドの選択されたクラスター(又は対応する選択されたウェル)において、第1の較正スキーム、第2の較正スキーム、又は第3の較正スキームのうちの1つ以上を実装する。実際、場合によっては、較正-配列決定システムは、(i)各ウェル内にオリゴヌクレオチドの各クラスターをシーディングするためにヌクレオチド-試料スライドの各ウェルにおいて、(ii)ウェルのサブセット内にオリゴヌクレオチドの各クラスターをシーディングするためにヌクレオチド-試料スライドのウェルのサブセットにおいて、又は(iii)ウェルのサブセット内にオリゴヌクレオチドのクラスターのサブセットをシーディングするためにヌクレオチド-試料スライドのウェルのサブセットにおいて、第1、第2、又は第3の較正スキームの1つ以上に従う較正配列を含むヌクレオチド-試料スライドを受け取るか、又は検出する。同様に、パターン化されていないヌクレオチド-試料スライドに関して、較正-配列決定システムは、オリゴヌクレオチドの各クラスター又はオリゴヌクレオチドのクラスターのサブセットにおいて、第1、第2、又は第3の較正スキームのうちの1つ以上に従う較正配列を含むヌクレオチド-試料スライドを受け取るか、又は検出する。
ウェルのサブセット又はクラスターのサブセットを選択して、試料ライブラリ断片の異なるセット内の異なる種類の較正配列を統合することによって、較正-配列決定システム106は、異なる種類の較正配列に対応する異なる配列決定パラメータを決定することができる。加えて、較正配列を統合するためにウェルの第1のサブセット又はクラスターの第1のサブセットを選択し、ウェルの第2のサブセット又はクラスターの第2のサブセットから較正配列を省略することによって、較正-配列決定システム106は、クラスター-ウェルの第2のサブセットに対して他の配列決定サイクル(例えば、インデックスサイクル)を実施しながら、クラスター/ウェルの第1のサブセットに対して較正サイクルを必要に応じて実施することができる。
1つ以上の実施形態によれば、図5Dは、ウェルの1つのサブセット又はクラスターのサブセットに対して較正サイクルを実行しながら、ウェルの別のサブセット又はクラスターのサブセットに対して他の配列決定サイクルを実行する較正-配列決定システム106の例を示す。図5Dに示されるように、例えば、較正-配列決定システム106は、較正配列を欠く試料ライブラリ断片を含むヌクレオチド-試料スライド内のウェル538の第1のサブセットについて、インデックスサイクルなどの配列決定サイクルを実施する。場合によっては、ウェルの第1のサブセット538は、ヌクレオチド-試料スライド内のウェルの85%以上を構成する。図5Dに更に示されるように、較正-配列決定システム106は、試料ライブラリ断片内の較正配列を含むヌクレオチド-試料スライド内のウェル540の第2のサブセットについて較正サイクルを実施する。場合によっては、ウェルの第2のサブセット540は、ヌクレオチド-試料スライド内のウェルの5%以下を構成する。図5Dによって更に示されるように、ヌクレオチド-試料スライドは、ウェル内バックグラウンド強度値などの特定の配列決定パラメータを決定するための試料ライブラリ断片又は較正配列を有さないウェル542の第3のサブセットを含む。
上記の第1、第2、又は第3の較正スキームと一致して、ウェル540の第2のサブセットにおける較正配列は、試料ライブラリ断片内の異なる位置にあり得る。第4の較正スキームの下で、図5Dは、ウェル540の第2のサブセットの1つのウェル内の試料ライブラリ断片内に組み込まれた較正配列についての位置の一例のみを示す。例えば、試料ライブラリ断片500e内に組み込まれる場合、較正配列546は、結合アダプター配列544の一部又は全部として組み込まれる。場合によっては、結合アダプター配列544の一部として統合される場合、較正-配列決定システム106は、UDI配列の一部又は全部を較正配列546として使用する。
上記で示唆されるように、場合によっては、較正-配列決定システム106は、第1のヌクレオチド断片リード、続いて第2のヌクレオチド断片リードを配列決定するポリメラーゼをそれぞれ開始する第1のリードプライミング配列及び第2のリードプライミング配列を含む試料ライブラリ断片に関連する較正配列を使用する。1つ以上の実施形態によれば、図5Eは、第1のヌクレオチド断片リード及び第2のヌクレオチド断片リードの同時配列決定のための較正サイクル及び較正配列の位置を示す。ヌクレオチド-試料スライドの表面に付着した1つ以上の表面結合オリゴヌクレオチドの一部として較正配列を追加又は統合することによって、一部の実施形態では、較正-配列決定システム106は、試料ライブラリ断片からの同時に配列決定されたヌクレオチド-断片リードからのクロストークシグナルを回避する較正サイクルを実施することができる。
図5Eに示されるように、例えば、較正配列556は、ヌクレオチド-試料スライドの表面558に付着した表面結合オリゴヌクレオチド554の一部又は全部として組み込まれる。例えば、場合によっては、較正配列556は、ポリ(N-(5-アジドアセトアミジルペンチル)アクリルアミド-コ-アクリルアミド(poly(N-(5-azidoacetamidylpentyl)acrylamide-co-acrylamide、PAZAM)などの、ヌクレオチド-試料スライドのローンのためのポリマーコーティングに付着した表面結合オリゴヌクレオチド554の一部又は全部である。ヌクレオチド-試料スライドのためのPAZAMに付着した、又は別の表面に付着したオリゴヌクレオチドの一部として較正配列556を組み込み、試料ライブラリ断片500fが表面結合オリゴヌクレオチド554とアニール又は結合する前に較正サイクルを実施することによって、較正-配列決定システム106は、Illumina,Inc.からのSPEARベースコーリングなどの同時に配列決定されたヌクレオチド断片リードからのクロストークシグナルを回避する較正サイクルを、又は同時配列決定中のリードプライミング配列の切断前に、実施することができる。場合によっては、ヌクレオチド断片リードのかかる同時配列決定又はリードプライミング配列の切断は、Flow Cells、国特許出願第16/626,452号(2019年6月7日出願)又はFlow Cells、米国特許出願第17/126,548号(2020年12月18日出願)に記載されており、これらはその全体が参照により本明細書に組み込まれる。
表面結合オリゴヌクレオチド554の代替において、較正配列556は、試料ライブラリ断片500fの位置に組み込まれ得る。図5Eには示されていないが、一部の実施形態では、較正配列556は、第1のリードプライミング配列と試料ライブラリ断片500fの試料ゲノム配列との間、又は第2のリードプライミング配列と試料ライブラリ断片500fの試料ゲノム配列との間に位置する。更に他の実施形態では、較正配列556は、試料ライブラリ断片500fの第1のリードプライミング配列又は第2のリードプライミング配列の一部又は全部として統合される。
第1及び第2のヌクレオチド断片リードを同時に配列決定する配列決定実行において較正配列を用いて較正サイクルを実施する場合、一部の実施形態では、較正-配列決定システム106は、モノテンプレート較正配列などの図5Bからの第2の較正スキームを使用し、各ウェルは、所与の較正サイクルにおいて同じ種類の較正配列を含む。代替的に、一部の実施形態では、較正-配列決定システム106は、4重テンプレート較正-配列セットなどの図5Aからの第1の較正スキームを使用し、ウェルは、芝生化学パターニング(SPEAR様パターニング)における進歩を予期して、所与の較正サイクルにおいて異なる種類の較正配列を備える。
更に、第1及び第2のヌクレオチド断片リードを同時に配列決定する配列決定実行において較正配列を用いて較正サイクルを実施する場合、一部の実施形態では、較正-配列決定システム106は、ヌクレオチド-試料スライドの各ウェル内又はヌクレオチド-試料スライドのウェルのサブセット内に較正配列を含むヌクレオチド-試料スライドを検出するか、又は受け取る。バックグラウンド強度値などの配列決定パラメータを決定するために、ヌクレオチド-試料スライドは、較正-配列決定システム106の較正サイクル中に空のウェル(例えば、シーディング可能ではない)を含み得る。
図5Eに更に示されるように、較正-配列決定システム106は、試料ライブラリ断片を含み得るか又は含み得ないヌクレオチド-試料スライド内のウェル548の第1のサブセットについて、配列決定サイクル(例えば、インデックスサイクル)を実施する。上記のように、較正配列が表面結合オリゴヌクレオチドの一部として組み込まれる場合、較正-配列決定システム106は、試料ライブラリ断片が表面結合オリゴヌクレオチド又はヌクレオチド-試料スライドの表面とアニーリング又は結合する前に、較正サイクルを実施することができる。図5Eに更に示されるように、較正-配列決定システム106は、ヌクレオチド-試料スライドの表面に付着した表面結合オリゴヌクレオチドの一部として組み込まれた較正配列を含むヌクレオチド-試料スライド内のウェル550の第2のサブセットについて較正サイクルを実施する。図5Eによって更に示されるように、ヌクレオチド-試料スライドは、ウェル内バックグラウンド強度値などの特定の配列決定パラメータを決定するための試料ライブラリ断片又は較正配列を有さないウェル552の第3のサブセットを含む。
上述のように、図5A~図5Eは、様々な較正スキームを示す。図5A~図5Eに関して上述した実施形態に加えて、又はそれと併せて、以下の表4は、表4の較正スキーム参照の下で決定された例示的な較正サイクル数及び例示的な標的配列決定パラメータを有する各較正スキームの一部の特定の例を示す。較正スキームの特定の例の一部は、近似数の較正サイクルを含むが、任意の好適な数の較正サイクルが、所与の較正スキームのために実装されてもよい。
上述のように、一部の実施形態では、較正-配列決定システム106は、較正配列を使用して配列決定装置を較正することによって、1つ以上の配列決定パラメータ及び対応する核酸塩基コールの精度を改善する。1つ以上の実施形態によれば、図6は、ランダムにコールされた核酸塩基又は較正配列からの既知の核酸塩基のいずれかに基づく異なる核酸塩基型に対応する異なるチャネルについての強度値分布のボックスプロット図600を示す。ボックスプロット図600によって示されるように、較正-配列決定システム106は、従来の較正に典型的な未知の又はランダムにコールされた核酸塩基よりも良好な較正配列からの既知の核酸塩基に基づいて、特定のチャネルについての強度パラメータ(例えば、クラスターごとの強度パラメータ)を決定することができる。
図6に示されるように、ボックスプロット図600は、強度値軸602に沿ったチャネル0及びチャネル1についての強度値、並びに核酸塩基軸604に沿ったサイクル1~15についてコールされる核酸塩基を示す。強度値を決定するために、較正-配列決定システム106は、配列決定サイクル1~4を実施して、非較正配列からランダム核酸塩基についての強度値を組み込み、決定し、ここで、「X」は、異なる核酸塩基型のランダム核酸塩基を示す。較正-配列決定システム106は、較正サイクル5~15を更に実施して、モノテンプレート較正配列に続く較正配列のセットからの既知の核酸塩基についての強度値を組み込み、決定し、ここで、サイクル数の次の文字は、特定の核酸塩基型の既知の核酸塩基を示す(例えば、「5-G」についてグアニン及び「6-A」についてアデニン)。チャネル0は、特定の蛍光染料に対するクラスターによって放出される光と、サイクル中に光を撮影する画像とを表す。チャネル1は、異なる蛍光染料のクラスターによって放出される光と、サイクル中に光を撮影する異なる画像とを表す。較正-配列決定システム106は、AZM染料及び65℃撮像を伴うiSeqKeplerを使用して、ボックスプロット図に描写されるサイクルを実施した。
ボックスプロット図600が示すように、較正-配列決定システム106は、モノテンプレート較正配列を使用して、異なるチャネル内の特定の核酸塩基型に対する強度値の明確かつ別個の範囲及び平均を決定する。対照的に、較正-配列決定システム106は、ランダム又は未知の核酸塩基を使用して、異なるチャネルにおける強度値の不明確であまり有用でない範囲又は平均を決定する。
クラスターごとの強度パラメータを改善することに加えて、較正-配列決定システム106は、配列決定装置を較正するために較正配列を使用することによって、特定の核酸塩基型の強度値境界などの他の配列決定パラメータの精度を改善することができる。1つ以上の実施形態によれば、図7A~図7Bは、異なる種類の較正配列に基づく異なるチャネルについての異なる核酸塩基型に対応する強度値の散布図700a及び700bを示す。特に、図7Aは、第2の較正スキーム下のモノテンプレート較正配列に続く較正配列のセットからの4つの異なる核酸塩基型の核酸塩基に対応する強度値の散布図700aを示す。図7Bは、第1の較正スキーム下の4重テンプレート較正-配列セットに続く較正配列のセットからの4つの異なる核酸塩基型の核酸塩基に対応する強度値の散布図700bを示す。
図7Aに示されるように、例えば、散乱プロット図700aは、強度値軸702aに沿ったチャネル1の強度値と、強度値軸704aに沿ったチャネル0の強度値とを示す。図7Aに示される強度値を捕捉するために、較正-配列決定システム106は、モノテンプレート較正配列に続く較正配列のセットについて30回の較正サイクルを実施した。上記のように、かかるモノテンプレート較正配列は、配列決定パラメータの決定を容易にする既知の核酸塩基を含む。したがって、散乱プロット図700aは、30回の較正サイクルにわたって品質フィルタを通過したオリゴヌクレオチドの複数のクラスターについての強度値を示す。
図7Bに示すように、散乱プロット図700bは、強度値軸702bに沿ったチャネル1の強度値と、強度値軸704bに沿ったチャネル0の強度値とを示す。図7Bに示される強度値を捕捉するために、較正-配列決定システム106は、4重テンプレート較正-配列セットに続く較正配列のセットに対して単一の較正サイクルを実施した。したがって、散乱プロット図700bは、単一の較正サイクルに対して品質フィルタを通過したオリゴヌクレオチドの複数のクラスターに対する強度値を示す。
図7A及び図7Bの比較によって示されるように、4つの異なる核酸塩基型(例えば、G、A、C、T)に対応する強度値クラウドは、散乱プロット図700a及び700bにおいて一貫しており、互いに相関する。したがって、一部の実施形態では、較正-配列決定システム106は、モノテンプレート較正配列又は4重テンプレート較正-配列セットのいずれかを使用して、特定の核酸塩基型の強度値境界を正確に決定することができる。場合によっては、較正-配列決定システム106はまた、モノテンプレート較正配列を使用して、較正サイクルから1つ以上の配列決定パラメータを決定し、次いで、4重テンプレート較正-配列セットを使用して、較正サイクル中に1つ以上の配列決定パラメータを調整する(又は開始点として使用する)こともできる。
上で更に示されるように、一部の実施形態では、較正-配列決定システム106は、改善された配列決定パラメータを用いて核酸塩基コールを改善する。1つ以上の実施形態によれば、図8A~図8Bは、較正されていない配列決定パラメータ及び較正された配列決定パラメータを使用した、対応する核酸塩基コールを有する異なる核酸塩基型の核酸塩基についての強度値の散布図を示す。
図8Aに示されるように、例えば、散乱プロット図800aは、較正されていない配列決定パラメータ、及び核酸塩基コールに対する色分けされたキー802aによって示されるような、組み込まれた核酸塩基に対する対応する核酸塩基コールを使用して、配列決定サイクル(例えば、インデックスサイクル)中に異なる核酸塩基型(例えば、G、T、C、A)の組み込まれた核酸塩基によって放出された光の画像のセットから抽出された強度値を描写する。特に、散布図800aに関して、較正-配列決定システム106は、1に設定された正規化パラメータ及び0に設定されたオフセット補正パラメータを使用して、強度値及び核酸塩基コールを決定する。対照的に、散布図800bは、較正されたクラスターごとの強度正規化パラメータを含む、較正された配列決定パラメータを使用して、画像の同じセットから抽出された強度値と、核酸塩基コールに対する色分けされたキー802bによって示されるような、組み込まれた核酸塩基に対する対応する核酸塩基コールとを描写する。かかる較正されたクラスターごとの強度正規化パラメータは、例えば、較正されたスケーリング係数、較正されたオフセット補正パラメータ、対数正規化係数、又はシグモイド変換を含み得る。分散プロット図800a及び分散プロット図800bの比較によって示されるように、較正-配列決定システム106は、較正された配列決定パラメータを使用して、より正確な核酸塩基コールを決定する。
図8Bに示されるように、散乱プロット図800cは、較正されていない配列決定パラメータ及び組み込まれた核酸塩基についての対応する核酸塩基コール(核酸塩基コールについての色分けされたキー802cによって示される)を使用して、図8Aに示されるものとは異なる配列決定サイクル(例えば、インデックスサイクル)の間に、異なる核酸塩基型(例えば、G、T、C、A)の組み込まれた核酸塩基によって放出された光の画像のセットから抽出された強度値を示す。特に、図8Bの散乱プロット図800cについて、較正-配列決定システム106は、1に設定されたスケーリング係数及び0に設定されたオフセット補正パラメータを使用して、強度値及び核酸塩基コールを決定する。対照的に、散乱プロット図800dは、較正されたスケーリング係数及び較正されたオフセット補正パラメータを含む、較正された配列決定パラメータを使用して、画像の同じセットから抽出された強度値と、核酸塩基コールに対する色分けされたキー802dによって示されるような、組み込まれた核酸塩基に対する対応する核酸塩基コールとを描写する。分散プロット図800c及び分散プロット図800dの比較によって示されるように、較正-配列決定システム106は、較正された配列決定パラメータを使用して、より正確な核酸塩基コールを決定する。
次に図9を参照すると、この図は、本開示の1つ以上の実施形態による、較正配列を含むヌクレオチド-試料スライドを受け取り、較正配列に基づいて配列決定装置に対応する1つ以上の配列決定パラメータを決定する一連の動作900のフローチャートを示す。図9は、一実施形態による動作を示すが、代替的な実施形態は、図9に示される動作のいずれかを省略、追加、再順序付け、及び/又は修正することができる。図9の動作は、方法の一部として実施することができる。代替的に、非一時的コンピュータ可読記憶媒体は、1つ以上のプロセッサによって実行されると、コンピューティング装置又はシステムに図9に示された動作を実施させる命令を備えることができる。なお更なる実施形態では、システムは、少なくとも1つのプロセッサと、1つ以上のプロセッサによって実行されると、システムに図9の動作を実施させる命令を備える非一時的コンピュータ可読媒体と、を備える。
図9に示すように、動作900は、較正配列を含むヌクレオチド-試料スライドを受け取る動作902を含む。特に、一部の実施形態では、動作902は、核酸塩基の較正配列を含むヌクレオチド-試料スライドを受け取ることを含む。追加的又は代替的に、動作902は、核酸塩基の較正配列及び較正配列に関連する試料ライブラリ断片を含むヌクレオチド-試料スライドを受け取ることを含む。一部の実施形態では、較正配列は、ヌクレオチド-試料スライド上に配置された試料ライブラリ断片の一部、又はヌクレオチド-試料スライドの表面に付着した表面結合オリゴヌクレオチドの一部である。
特定の実施形態では、較正配列は、4つの核酸塩基型の比例分布を有する核酸塩基の異なる配列を含む。関連して、特定の実装形態では、核酸塩基の異なる配列は、核酸塩基の第1の順序に従って4つの核酸塩基型を含む第1の較正配列と、核酸塩基の第2の順序に従って4つの核酸塩基型を含む第2の較正配列と、を含む。
更に、場合によっては、較正配列は各々、核酸塩基の同じ順序に従い、核酸塩基の単一の配列内に4つの核酸塩基型を有する核酸塩基の単一の配列を含む。追加的又は代替的に、較正配列は各々、4つの核酸塩基型の比例分布を有する核酸塩基の単一の配列を含む。特定の場合では、較正配列は、所与の較正-配列位置において、第1の核酸塩基型及び第2の核酸塩基型の分布を集合的に含み、後続の較正-配列位置において、第1の核酸塩基型及び第3の核酸塩基型の分布、又は第3の核酸塩基型及び第4の核酸塩基型の分布を集合的に含む、核酸塩基の異なる配列を含む。
上述のように、場合によっては、ヌクレオチド-試料スライドを受け取ることは、各ウェル内にオリゴヌクレオチドの各クラスターをシーディングするために、ヌクレオチド-試料スライドの各ウェル内に較正配列、ウェルのサブセット内のオリゴヌクレオチドの各クラスターをシーディングするための、ヌクレオチド-試料スライドのウェルのサブセット内の較正配列、又は、ウェルのサブセット内のオリゴヌクレオチドのクラスターのサブセットをシーディングするための、ヌクレオチド-試料スライドのウェルのサブセット中の較正配列を含むヌクレオチド-試料スライドを受け取ることを含む。
更に上述したように、一部の実施形態では、ヌクレオチド-試料スライドを受け取ることは、第1の配列決定パラメータを較正するための較正配列の第1のセットを含む試料ライブラリ断片の第1のセットと、第2の配列決定パラメータを較正するための較正配列の第2のセットを含む試料ライブラリ断片の第2のセットと、を含むヌクレオチド-試料スライドを受け取ることを含む。関連して、特定の実施形態では、ヌクレオチド-試料スライドを受け取ることは、試料ライブラリ断片内の非ゲノム配列及び/又は非トランスクリプトーム配列の一部又は全部として較正配列を含む試料ライブラリ断片を含むヌクレオチド-試料スライドを受け取ることを含む。
追加的又は代替的に、ヌクレオチド-試料スライドを受け取ることは、結合アダプター配列とインデックス配列との間、インデックス配列とリードプライミング配列との間、又はリードプライミング配列と試料ゲノム配列との間に較正配列を含む試料ライブラリ断片を含むヌクレオチド-試料スライドを受け取ることを含む。
関連して、場合によっては、結合アダプター配列とインデックス配列との間の較正配列は、P7結合アダプター配列とi7インデックス配列との間又はP5結合アダプター配列とi5インデックス配列との間の較正配列を含み、インデックス配列とリードプライミング配列との間の較正配列は、i7インデックス配列と第1のリードプライミング配列との間、又はi5インデックス配列と第2のリードプライミング配列との間の較正配列を含み、リードプライミング配列と試料ゲノム配列との間の較正配列は、第1のリードプライミング配列と試料ゲノム配列との間、又は第2のリードプライミング配列と試料ゲノム配列との間の較正配列を含む。
追加的又は代替的に、ヌクレオチド-試料スライドを受け取ることは、非ランダム固有分子識別子(UMI)配列の一部若しくは全部として、固有デュアルインデックス(UDI)配列の一部若しくは全部として、インデックス配列の一部若しくは全部として、又は結合アダプター配列の一部若しくは全部として較正配列を含む試料ライブラリ断片を含むヌクレオチド-試料スライドを受け取ることを含む。
図9に更に示されるように、動作900は、配列決定装置及び較正配列を使用して較正サイクルを実施する動作904を含む。特に、一部の実施形態では、動作904は、較正配列に対応するオリゴヌクレオチドに核酸塩基を組み込むために、配列決定装置を使用して1つ以上の較正サイクルを実施することを含む。場合によっては、1つ以上の較正サイクルを実施することは、少なくとも4回の較正配列決定サイクルを実施することを含む。
上記で示唆されるように、特定の実施形態では、1つ以上の較正サイクルを実施することは、1つの核酸塩基型又は2つの核酸塩基型の核酸塩基を、較正配列のセットに対応する成長オリゴヌクレオチドのセットの較正-配列位置に組み込むことを含む。更に、場合によっては、1つ以上の較正サイクルを実施することは、2つの核酸塩基型の比例分布、3つの核酸塩基型の比例分布、又は4つの核酸塩基型の比例分布を有する核酸塩基を、較正配列のセットに対応する成長オリゴヌクレオチドのセットの較正-配列位置に組み込むことを含む。
上記で更に示唆されるように、1つ以上の実施形態では、1つ以上の較正サイクルを実施することは、較正配列のセットについての核酸塩基コールを決定することなく、較正配列のセットに対応する成長オリゴヌクレオチドのセットに核酸塩基を組み込むことを含む。更に、特定の実装形態では、1つ以上の較正サイクルを実施することは、試料ライブラリ断片内の試料ゲノム配列についての核酸塩基コールを決定するために、配列決定装置を使用してゲノム配列決定サイクルを実施する前又は後に、1つ以上の較正サイクルを実施することを含む。
図9に更に示されるように、動作900は、較正サイクルに基づいて配列決定装置に対応する配列決定パラメータを決定する動作906を含む。特に、特定の実装形態では、動作906は、1つ以上の較正サイクル及び較正配列に基づいて、配列決定装置に対応する配列決定パラメータを決定することを含む。上記で示唆されるように、一部の実施形態では、配列決定装置に対応する配列決定パラメータを決定することは、1つ以上の較正サイクル中又はその後に配列決定装置から配列決定パラメータを検出することを含む。
更に、場合によっては、初期配列決定パラメータ又は配列決定パラメータを決定することは、イコライザ係数、畳み込みカーネル係数、強度値の核酸塩基重心、特定の核酸塩基型の強度値境界、核酸塩基特異的バックグラウンド強度値、強度正規化係数、ガウス共分散行列、ガウス平均パラメータ、ガウスシードパラメータ、完全機能性ヌクレオチド(fFN)特異的ヌクレオチド位置パラメータ、非線形光学歪みパラメータ、構造化照明顕微鏡(SIM)パラメータ、クラスターごとの正規化パラメータ、チャネル特異的正規化パラメータ、クラスター特異的シグナル正規化パラメータ、色チャネル間クロストークパラメータ、又はポリコロナリティパラメータのうちの1つ以上を決定することを含む。
動作902~906に加えて、特定の実装形態では、動作900は、1つ以上の較正サイクルを実施して、較正配列に対応するオリゴヌクレオチドの組み込まれた核酸塩基に関連する初期配列決定パラメータを決定することと、初期配列決定パラメータに基づいて配列決定パラメータを推定することによって、配列決定装置に対応する配列決定パラメータを決定することと、を更に含む。
上記で更に示唆されるように、特定の場合には、動作900は、配列決定装置に対応する初期配列決定パラメータと、1つ以上の較正配列に対応する成長オリゴヌクレオチドのセットに組み込まれる所与の核酸塩基についての核酸塩基コールとを決定するために較正サイクルを実施することによって、1つ以上の較正サイクルを実施することと、配列決定装置に対応する配列決定パラメータを、成長オリゴヌクレオチドのセットに組み込まれた所与の核酸塩基についての核酸塩基コールと、1つ以上の較正配列についての既知の相補的核酸塩基との比較から塩基コール差を決定し、塩基コール差に基づいて、配列決定装置に対応する初期配列決定パラメータを調整することによって、決定することと、を更に含む。
上記の動作900を超えて、又はその代替として、一部の実施形態では、動作900は、1つ以上の較正サイクルを実施し、その後、試料ゲノム配列についての核酸塩基コールを決定するためにゲノム配列決定サイクルを実施する前に、インデックス配列についての核酸塩基コールを決定するためにインデックスサイクルを実施すること、又は、インデックス配列についての核酸塩基コールを決定するためにインデックスサイクルを実施する前に、試料ゲノム配列についての核酸塩基コールを決定するためにゲノム配列決定サイクルを実施することを含む。
ここで図10を参照すると、この図は、本開示の1つ以上の実施形態による、較正配列を含むヌクレオチド-試料スライドを受け取り、較正配列に基づいて配列決定装置に対応する1つ以上の配列決定パラメータを決定する一連の動作1000のフローチャートを示す。図10は、一実施形態による動作を示すが、代替的な実施形態は、図10に示される動作のいずれかを省略、追加、再順序付け、及び/又は修正することができる。図10の動作は、方法の一部として実施することができる。代替的に、非一時的コンピュータ可読記憶媒体は、1つ以上のプロセッサによって実行されると、コンピューティング装置又はシステムに図10に示された動作を実施させる命令を備えることができる。なお更なる実施形態では、システムは、少なくとも1つのプロセッサと、1つ以上のプロセッサによって実行されると、システムに図10の動作を実施させる命令を備える非一時的コンピュータ可読媒体とを備える。
図10に示すように、動作1000は、較正核酸塩基を含むヌクレオチド-試料スライドを受け取る動作1002を含む。特に、一部の実施形態では、動作1002は、較正核酸塩基及び較正核酸塩基に関連する試料ライブラリ断片を含むヌクレオチド-試料スライドを受け取ることを含む。上記のように、特定の場合では、較正核酸塩基の較正核酸塩基は、試料ライブラリ断片の一部、又はヌクレオチド-試料スライドの表面に付着した表面結合オリゴヌクレオチドの一部である。
場合によっては、較正核酸塩基は、異なる核酸塩基型の比例分布を含む。関連して、特定の実施形態では、試料ライブラリ断片の第1のセットは、第1の核酸塩基型の第1の較正核酸塩基を含み、試料ライブラリ断片の第2のセットは、第2の核酸塩基型の第2の較正核酸塩基を含む。
図10に更に示されるように、動作1000は、配列決定装置及び較正核酸塩基を使用して較正サイクルを実施する動作1004を含む。特に、一部の実施形態では、動作1004は、配列決定装置を使用して1つ以上の較正サイクルを実施して、較正核酸塩基及び関連する試料ライブラリ断片に対応するオリゴヌクレオチド中に核酸塩基を組み込むことを含む。追加的又は代替的に、1つ以上の較正サイクルを実施することは、組み込まれた核酸塩基についての核酸塩基コールを決定することを含まない。
上記で示唆されるように、特定の実施形態では、1つ以上の較正サイクルを実施することは、試料ライブラリ断片内の試料ゲノム配列についての核酸塩基コールを決定するために、配列決定装置を使用してゲノム配列決定サイクルを実施する前又は後に、1つ以上の較正サイクルを実施することを含む。
図10に更に示されるように、動作1000は、較正サイクルに基づいて配列決定装置に対応する配列決定パラメータを決定する動作1006を含む。特に、特定の実装形態では、動作1006は、1つ以上の較正サイクル及び較正核酸塩基に基づいて、配列決定装置に対応する配列決定パラメータを決定することを含む。
更に、場合によっては、配列決定装置に対応する配列決定パラメータを決定することは、イコライザ係数、畳み込みカーネル係数、強度値の核酸塩基重心、特定の核酸塩基型の強度値境界、核酸塩基特異的バックグラウンド強度値、強度正規化係数、ガウス共分散行列、ガウス平均パラメータ、ガウスシードパラメータ、完全機能性ヌクレオチド(fFN)特異的ヌクレオチド位置パラメータ、非線形光学歪みパラメータ、構造化照明顕微鏡(SIM)パラメータ、特定のチャネルについてのクラスターごとの正規化パラメータ、チャネル特異的正規化パラメータ、クラスター特異的シグナル正規化パラメータ、色チャネル間クロストークパラメータ、又はポリコロナリティパラメータのうちの1つ以上を決定することを含む。
本明細書に記載の方法は、様々な核酸配列決定技術と併せて使用することができる。特に適用可能な技術は、核酸を、それらの相対的位置が変化しないようにアレイ内の固定位置に付着させ、アレイが繰り返し撮像されるものである。例えば、1つのヌクレオチド塩基型を別のヌクレオチド塩基型と区別するために使用される異なる標識と一致する異なる色チャネルで画像が得られる実施形態は、特に適用可能である。一部の実施形態では、標的核酸のヌクレオチド配列を決定するプロセスは、自動化プロセスであり得る。好ましい実施形態は、合成による配列決定(SBS)技術を含む。
SBS技術は、一般に、テンプレート鎖に対するヌクレオチドの反復的付加による、新生核酸鎖の酵素的伸長を伴う。SBSの従来の方法では、単一のヌクレオチドモノマーが、各送達においてポリメラーゼの存在下で標的ヌクレオチドに提供され得る。しかしながら、本明細書に記載の方法では、送達中のポリメラーゼの存在下で、2つ以上の種類のヌクレオチドモノマーを標的核酸に提供することができる。
SBSは、ターミネーター部分を有するヌクレオチドモノマー、又は任意のターミネーター部分を欠くヌクレオチドモノマーを利用することができる。ターミネーターを欠くヌクレオチドモノマーを利用する方法としては、例えば、以下に更に詳細に記載されるように、γ-リン酸標識ヌクレオチドを使用するパイロシーケンシング及び配列決定が挙げられる。ターミネーターを含まないヌクレオチドモノマーを使用する方法では、各サイクルに添加されるヌクレオチドの数は、概ね可変であり、テンプレート配列及びヌクレオチド送達のモードに依存する。ターミネーター部分を有するヌクレオチドモノマーを利用するSBS技術では、ターミネーターは、ジデオキシヌクレオチドを利用する従来のSanger配列決定の場合のように使用される配列決定条件下で有効に不可逆的であり得るか、又はターミネーターは、Solexa(現Illumina,Inc.)によって開発された配列決定方法の場合のように可逆的であり得る。
SBS技術は、標識部分を有するヌクレオチドモノマー、又は標識部分を欠くヌクレオチドモノマーを使用することができる。したがって、標識の蛍光などの標識の特性、分子量又は電荷などのヌクレオチドモノマーの特性、ピロリン酸の放出などのヌクレオチドの組み込みの副生成物などに基づいて、組み込みイベントを検出することができる。2つ以上の異なるヌクレオチドが配列決定試薬中に存在する実施形態では、異なるヌクレオチドは、互いに区別可能であり得るか、又は代替的に、2つ以上の異なる標識は、使用される検出技術の下で区別可能であり得る。例えば、配列決定試薬中に存在する異なるヌクレオチドは、異なる標識を有することができ、それらは、Solexa(現Illumina,Inc.)によって開発された配列決定方法によって例示される適切な光学系を使用して区別することができる。
好ましい実施形態としては、パイロシーケンシング技術が挙げられる。パイロシーケンシングは、特定のヌクレオチドが新生鎖に組み込まれるときに無機ピロリン酸塩(inorganic pyrophosphate、PPi)の放出を検出する(Ronaghi,M.,Karamohamed,S.,Pettersson,B.,Uhlen,M.and Nyren,P.(1996)「Real-time DNA sequencing using detection of pyrophosphate release.」Analytical Biochemistry 242(1),84-9、Ronaghi,M.(2001)「Pyrosequencing sheds light on DNA sequencing.」Genome Res.11(1),3-11、Ronaghi,M.,Uhlen,M.and Nyren,P.(1998)「A sequencing method based on real-time pyrophosphate.」Science 281(5375),363、米国特許第6,210,891号、同第6,258,568号及び同第6,274,320号、参照によりその開示の全体が本明細書に組み込まれる)。パイロシーケンシングにおいて、放出されたPPiは、ATPスルフラーゼによってアデノシン三リン酸(adenosine triphosphate、ATP)に即座に変換されることによって検出することができ、生成されたATPのレベルはルシフェラーゼで生成された光子を介して検出される。配列決定される核酸は、アレイ中の特徴に付着させることができ、アレイは、アレイの特徴にヌクレオチドを組み込むことにより生成される化学発光シグナルを捕捉するために撮像することができる。アレイを特定のヌクレオチド型(例えば、A、T、C、又はG)で処理した後に、画像を得ることができる。各ヌクレオチド型の添加後に得られる画像は、アレイ内のどの特徴が検出されるかに関して異なる。画像内のこれらの差異は、アレイ上の特徴の異なる配列コンテンツを反映する。しかしながら、各特徴の相対的な位置は、画像内で変わらないままである。画像は、本明細書に記載の方法を使用して記憶、処理、及び分析することができる。例えば、アレイを各異なるヌクレオチド型で処理した後に得られる画像は、可逆的ターミネーターベースの配列決定方法についての異なる検出チャネルから得られる画像について、本明細書に例示されるものと同じ方法で処理することができる。
別の例示的な種類のSBSでは、サイクル配列決定は、例えば、その開示が参照により組み込まれる、国際公開第04/018497号及び米国特許第7,057,026号に記載されているような切断可能な又は光漂白可能な色素標識を含む可逆的ターミネーターヌクレオチドを段階的に付加することによって達成される。この手法は、Solexa(現Illumina Inc.)によって商品化されており、国際公開第91/06678号及び同第07/123,744号にも記載されており、これらの各々は、参照により本明細書に組み込まれる。終端の両方を逆転させることができ、蛍光標識が開裂された蛍光標識ターミネーターの可用性は、効率的な循環可逆的終端(cyclic reversible termination、CRT)配列決定を容易にする。ポリメラーゼはまた、これらの修飾されたヌクレオチドを効率的に組み込み、かつそこから伸長するように共操作することもできる。
好ましくは、可逆的ターミネーターベースの配列決定実施形態では、標識は、SBS反応条件下での伸長を実質的に阻害しない。しかしながら、検出標識は、例えば、開裂又は分解によって除去可能であり得る。画像は、アレイ化された核酸特徴への標識の組み込み後に撮影することができる。特定の実施形態では、各サイクルは、アレイへの4つの異なるヌクレオチド型の同時送達を伴い、各ヌクレオチド型は、スペクトル的に異なる標識を有する。次に、4つの異なる標識のうちの1つに選択的な検出チャネルを各々使用して、4つの画像を得ることができる。代替的に、異なるヌクレオチド型を順次追加することができ、各追加ステップの間にアレイの画像を得ることができる。かかる実施形態では、各画像は、特定の型のヌクレオチドを組み込んだ核酸特徴を示す。各特徴部のシーケンスコンテンツが異なるため、異なる画像に異なる特徴部が存在するか、又は存在しない。しかしながら、特徴の相対的な位置は、画像内で変わらないままである。かかる可逆的ターミネーター-SBS方法から得られる画像は、本明細書に記載されるように、保存、処理、及び分析することができる。画像撮影ステップに続いて、標識を除去することができ、その後のヌクレオチド添加及び検出のサイクルについて可逆的ターミネーター部分を除去することができる。特定のサイクルで検出された後、及び後続のサイクルの前に標識を除去すると、サイクル間のバックグラウンドシグナル及びクロストークを低減できるという利点がある。有用な標識及び除去方法の例を以下に記載する。
特定の実施形態では、ヌクレオチドモノマーの一部又は全部は、可逆的ターミネーターを含むことができる。かかる実施形態では、可逆的ターミネーター/開裂可能なフルオロフォア(fluor)は、3’エステル結合を介してリボース部分に結合したフルオロフォア(fluor)を含むことができる(Metzker,Genome Res.15:1767-1776(2005)、これは参照により本明細書に組み込まれる)。他の手法は、ターミネーターの化学を蛍光標識の切断から分離している(参照によりその全体が本明細書に組み込まれる、Ruparel et al.,Proc Natl Acad Sci USA 102:5932-7(2005))。Ruparelらは、少量の3’アリル基を使用して伸長をブロックするが、パラジウム触媒で短時間処理することにより容易に脱ブロックすることができる可逆的ターミネーターの開発について説明している。フルオロフォアは、長波長UV光への30秒の曝露によって容易に開裂することができる光開裂可能リンカーを介して基に付着した。したがって、ジスルフィド還元又は光開裂のいずれかを開裂可能なリンカーとして使用することができる。可逆的終端への別の手法は、dNTP上に嵩高な染料を配置した後に続く自然終端の使用である。dNTP上の帯電した嵩高な染料の存在は、立体障害及び/又は静電障害を介して効果的なターミネーターとして作用することができる。1つの組み込みイベントの存在は、染料が除去されない限り、更なる結合を防止する。染料の開裂は、フルオロフォア(fluor)を除去し、終端を効果的に逆転させる。修飾ヌクレオチドの例はまた、米国特許第7,427,673号及び同第7,057,026号に記載されており、これらの開示は、参照によりそれらの全体が本明細書に組み込まれる。
本明細書に記載の方法及びシステムとともに利用することができる追加の例示的なSBSシステム及び方法は、米国特許出願公開第2007/0166705号、同第2006/0188901号、米国特許第7,057,026号、米国特許出願公開第2006/0240439号、同第2006/0281109号、国際公開第05/065814号、米国特許出願公開第2005/0100900号、国際公開第06/064199号、同第07/010,251号、米国特許出願公開第2012/0270305号、及び同第2013/0260372号に記載されており、これらの開示は、参照によりその全体が本明細書に組み込まれる。
一部の実施形態は、4つ未満の異なる標識を使用する4つの異なるヌクレオチドの検出を利用することができる。例えば、SBSは、組み込まれた資料である米国特許出願公開第2013/0079232号に記載される方法及びシステムを使用して実施することができる。第1の例として、ヌクレオチド型の対は、同じ波長で検出することができるが、対のうちの1つのメンバーに対する強度の差に基づいて、又は、対の他の部材について検出されたシグナルと比較して明らかなシグナルを出現又は消失させる、対の1つのメンバーへの変化(例えば、化学修飾、光化学修飾、又は物理的改質を行うことを介して)に基づいて区別され得る。第2の例として、4つの異なるヌクレオチド型のうちの3つを特定の条件下で検出することができ、一方、第4のヌクレオチド型は、それらの条件下で検出可能な標識がないか、又はそれらの条件下で最小限に検出される(例えば、バックグラウンド蛍光による最小限の検出など)。最初の3つのヌクレオチド型を核酸に組み込むことは、それらの対応するシグナルの存在に基づいて決定することができ、第4のヌクレオチド型を核酸に組み込むことは、任意のシグナルの不在又は最小限の検出に基づいて決定することができる。第3の例として、1つのヌクレオチド型は、2つの異なるチャネルで検出される標識を含むことができ、一方、他のヌクレオチド型は、チャネルのうちの1つ以下で検出される。前述の3つの例示的な構成は、相互に排他的であるとはみなされず、様々な組み合わせで使用することができる。3つ全ての例を組み合わせた例示的な実施形態は、第1のチャネルで検出される第1のヌクレオチド型(例えば、第1の励起波長によって励起されたときに第1のチャネルで検出される標識を有するdATP)、第2のチャネルで検出される第2のヌクレオチド型(例えば、第2の励起波長によって励起されたときに第2のチャネルで検出される標識を有するdCTP)、第1及び第2のチャネルの両方において検出される第3のヌクレオチド型(例えば、第1及び/又は第2の励起波長によって励起されたときに両方のチャネルで検出される少なくとも1つの標識を有するdTTP)、及びいずれのチャネルでも検出されないか、又は最小限に検出される標識を欠く第4のヌクレオチド型(例えば、標識のないdGTP)を使用する蛍光ベースのSBS方法である。
更に、組み込まれた資料である米国特許出願公開第2013/0079232号に記載のように、配列決定データは、単一のチャネルを使用して得ることができる。かかるいわゆる1つの染料配列決定方法では、第1のヌクレオチド型は標識されるが、第1の画像が生成された後に標識が除去され、第2のヌクレオチド型は、第1の画像が生成された後にのみ標識される。第3のヌクレオチド型は、第1及び第2の画像の両方においてその標識を保持し、第4のヌクレオチド型は、両方の画像において標識されていないままである。
一部の実施形態は、ライゲーション技術による配列決定を利用することができる。かかる技術は、DNAリガーゼを利用してオリゴヌクレオチドを組み込み、かかるオリゴヌクレオチドの組み込みを特定する。オリゴヌクレオチドは、典型的には、オリゴヌクレオチドがハイブリダイズする配列中の特定のヌクレオチドの同一性と相関する異なる標識を有する。他のSBS方法と同様に、標識された配列決定試薬で核酸特徴のアレイを処理した後、画像を得ることができる。各画像は、特定の型の標識を組み込んだ核酸特徴を示す。各特徴部のシーケンスコンテンツが異なるため、異なる画像に異なる特徴部が存在するか、又は存在しないが、特徴部の相対的な位置は、画像内で変わらないままである。ライゲーションベースの配列決定方法から得られる画像は、本明細書に記載されるように保存、処理、及び分析することができる。本明細書に記載の方法及びシステムとともに利用することができる例示的なSBSシステム及び方法は、米国特許第6,969,488号、同第6,172,218号、及び同第6,306,597号に記載されており、これらの開示は、参照によりそれらの全体が本明細書に組み込まれる。
一部の実施形態は、ナノ細孔配列決定を利用することができる(Deamer,D.W.& Akeson,M.「Nanopores and nucleic acids:prospects for ultrarapid sequencing.」Trends Biotechnol.18,147-151(2000)、Deamer,D.and D.Branton,「Characterization of nucleic acids by nanopore analysis」.Acc.Chem.Res.35:817-825(2002)、Li,J.,M.Gershow,D.Stein,E.Brandin,and J.A.Golovchenko,「DNA molecules and configurations in a solid-state nanopore microscope」Nat.Mater.2:611-615(2003)、これらの開示は、参照によりそれらの全体が本明細書に組み込まれる)。かかる実施形態では、標的核酸はナノ細孔を通過する。ナノ細孔は、α-ヘモリジンなどの合成孔又は生体膜タンパク質であり得る。標的核酸がナノ細孔を通過するとき、各塩基対は、細孔の電気コンダクタンスの変動を測定することによって特定することができる。(米国特許第7,001,792号、Soni,G.V.& Meller,「A.Progress toward ultrafast DNA sequencing using solid-state nanopores.」Clin.Chem.53,1996-2001(2007)、Healy,K.「Nanopore-based single-molecule DNA analysis.」Nanomed.2,459-481(2007)、Cockroft,S.L.,Chu,J.,Amorin,M.& Ghadiri,M.R.「A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution.」J.Am Chem.Soc.130,818-820(2008)、これらの開示は、参照によりそれらの全体が本明細書に組み込まれる)。ナノ細孔配列決定から得られるデータは、本明細書に記載されるように、保存、処理、及び分析することができる。具体的には、データは、本明細書に記載される光学画像及び他の画像の例示的な処理に従って、画像として処理することができる。
一部の実施形態は、DNAポリメラーゼ活性のリアルタイムモニタリングを伴う方法を利用することができる。ヌクレオチドの組み込みは、例えば、(各々が参照により本明細書に組み込まれる)、米国特許第7,329,492号及び同第7,211,414号に記載されているようなフルオロフォア含有ポリメラーゼとγ-ホスフェート標識ヌクレオチドとの間の蛍光共鳴エネルギー移動(fluorescence resonance energy transfer、FRET)対話を介して検出することができ、又はヌクレオチドの組み込みは、例えば、(参照により本明細書に組み込まれる)、米国特許第7,315,019号に記載されているようなゼロモード導波路、並びに、例えば、(各々が参照により本明細書に組み込まれる)、米国特許第7,405,281号及び米国特許出願公開第2008/0108082号に記載されているような蛍光ヌクレオチド類似体及び操作ポリメラーゼを使用して検出することができる。照明は、蛍光標識されたヌクレオチドの組み込みが低バックグラウンドで観察され得るように、表面繋留ポリメラーゼの周囲のゼプトリットルスケールの体積に制限することができる(Levene,M.J.et al.「Zero-mode waveguides for single-molecule analysis at high concentrations.」Science,299,682-686(2003)、Lundquist,P.M.et al.「Parallel confocal detection of single molecules in real time.」Opt.Lett.33,1026-1028(2008)、Korlach,J.et al.「Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures.」Proc.Natl.Acad.Sci.USA 105,1176-1181(2008)、これらの開示は、参照によりそれらの全体が本明細書に組み込まれる)。かかる方法から得られる画像は、本明細書に記載されるように、記憶、処理、及び分析することができる。
一部のSBS実施形態は、伸長産物へのヌクレオチドの組み込み時に放出されるプロトンの検出を含む。例えば、放出されたプロトンの検出に基づく配列決定は、Ion Torrent(Guilford,CT、Life Technologiesの子会社)から市販されている電気検出器及び関連技術を使用し得る、又は、米国特許出願公開第2009/0026082(A1)号、同第2009/0127589(A1)号、同第2010/0137143(A1)号、若しくは同第2010/0282617(A1)号に記載されている配列決定方法及びシステムであり、これらの各々は、参照により本明細書に組み込まれる。動力学的除外を使用して標的核酸を増幅するための本明細書に記載の方法は、プロトンを検出するために使用される基材に容易に適用することができる。より具体的には、本明細書に記載の方法を使用して、プロトンを検出するために使用されるアンプリコンのクローン集団を生成することができる。
上記のSBS方法は、複数の異な標的核酸が同時に操作されるように、多重形式で有利に実施することができる。特定の実施形態では、異なる標的核酸は、共通の反応容器又は特定の基材の表面上で処理することができる。これにより、配列決定試薬の簡便な送達、未反応試薬の除去、及び取り込み事象の検出が多重方式で可能になる。表面結合された標的核酸を使用する実施形態では、標的核酸は、アレイ形式であり得る。アレイ形式では、標的核酸は、典型的には、空間的に区別可能な方式で表面に結合され得る。標的核酸は、直接共有結合、ビーズ若しくは他の粒子への結合、又は表面に結合したポリメラーゼ若しくは他の分子への結合によって結合され得る。アレイは、各部位(特徴とも称される)における標的核酸の単一コピーを含むことができ、又は同じ配列を有する複数のコピーは、各部位若しくは特徴に存在することができる。複数のコピーは、以下で更に詳細に記載されるブリッジ増幅又はエマルジョンPCRなどの増幅方法によって生成することができる。
本明細書に記載の方法は、例えば、少なくとも約10個の特徴部/cm2、100個の特徴部/cm2、500個の特徴部/cm2、1,000個の特徴部/cm2、5,000個の特徴部/cm2、10,000個の特徴部/cm2、50,000個の特徴部/cm2、100,000個の特徴部/cm2、1,000,000個の特徴部/cm2、5,000,000個の特徴部/cm2、又はそれ以上を含む、様々な密度のいずれかの特徴部を有するアレイを使用することができる。
本明細書に記載の方法の利点は、複数の標的核酸の迅速かつ効率的な検出を並行して提供することである。したがって、本開示は、上記で例示されるものなどの当該技術分野において既知の技術を使用して核酸を調製及び検出することができる統合システムを提供する。したがって、本開示の統合システムは、増幅試薬及び/又は配列決定試薬を1つ以上の固定化されたDNA断片に送達することができる流体構成要素を含むことができ、システムは、ポンプ、バルブ、リザーバ、流体ラインなどの構成要素を含む。フローセルは、標的核酸を検出するための統合システムで構成及び/又は使用することができる。例示的なフローセルは、例えば、米国特許出願公開第2010/0111768(A1)号及び米国特許出願第13/273,666号に記載され、これらの各々は、参照により本明細書に組み込まれる。フローセルについて例示されるように、統合システムの流体構成要素の1つ以上を増幅方法及び検出方法に使用することができる。核酸配列決定の実施形態を一例としてとると、統合システムの流体構成要素の1つ以上を、本明細書に記載の増幅方法、及び上記に例示したような配列決定方法における配列決定試薬の送達に使用することができる。代替的に、統合システムは、増幅方法を実施し、検出方法を実施するための別々の流体システムを含み得る。増幅された核酸を作成し、また核酸の配列を決定することができる統合配列決定システムの例としては、MiSeq(商標)プラットフォーム(Illumina,Inc.、San Diego,CA)、及び参照により本明細書に組み込まれる、米国特許出願第13/273,666号に記載の装置が挙げられるが、これらに限定されない。
上記の配列決定システムは、配列決定装置によって受け取られた試料中に存在する核酸ポリマーを配列決定する。本明細書で定義されるように、「試料」及びその派生語は、最も広い意味で使用され、標的を含むことが疑われる任意の試料、培養物などを含む。一部の実施形態では、試料は、DNA、RNA、PNA、LNA、キメラ又はハイブリッド形態の核酸を含む。試料は、1以上の核酸を含有する任意の生物学的試料、臨床試料、外科試料、農業試料、大気試料又は水試料を含むことができる。この用語はまた、任意の単離された核酸試料、例えば、ゲノムDNA、新鮮凍結又はホルマリン固定パラフィン包埋核酸試料を含む。試料は、単一個体、遺伝的に関連するメンバーからの核酸試料のコレクション、遺伝的に関連しないメンバーからの核酸試料、腫瘍試料及び正常組織試料のような単一個体からの核酸試料(適合)、又は母体被験体から得られた母体及び胎児DNAのような遺伝物質の2つの異なる形態を含む単一供給源からの試料、又は植物又は動物DNAを含む試料中の混入細菌DNAの存在に由来し得ることも想定される。一部の実施形態では、核酸物質の供給源は、例えば新生児スクリーニングに典型的に使用されるような新生児から得られた核酸を含むことができる。
核酸試料は、ゲノムDNA(genomic DNA、gDNA)などの高分子量物質を含むことができる。試料は、FFPE又は保管されたDNA試料から得られた核酸分子などの低分子量物質を含むことができる。別の実施形態では、低分子量物質は、酵素的又は機械的に断片化されたDNAを含む。試料は、無細胞循環DNAを含むことができる。一部の実施形態では、試料は、生検、腫瘍、擦過物、スワブ、血液、粘液、尿、血漿、精液、毛髪、レーザー捕捉顕微解剖、外科的切除、及び他の臨床的又は実験室で得られた試料から得られた核酸分子を含むことができる。一部の実施形態では、試料は、疫学、農業、法医学又は病原性の試料であり得る。一部の実施形態では、試料は、ヒト又は哺乳動物源などの動物から得られた核酸分子を含むことができる。別の実施形態では、試料は、植物、細菌、ウイルス又は真菌などの非哺乳類源から得られた核酸分子を含むことができる。一部の実施形態では、核酸分子の供給源は、保存された又は絶滅した試料若しくは種であり得る。
更に、本明細書中に開示される方法及び組成物は、法医学試料からの分解及び/又は断片化されたゲノムDNAなどの低品質核酸分子を有する核酸試料を増幅するのに有用であり得る。一実施形態では、法医学試料は、犯罪現場から得られた核酸、行方不明者DNAデータベースから得られた核酸、法医学調査と関連した研究所から得られた核酸を含むことができ、又は法執行機関、1つ以上のミリタリーサービス若しくは任意のかかる隊員によって得られた法医学試料を含むことができる。核酸試料は、例えば、口腔スワブ、紙、布、又は唾液、血液、若しくは他の体液で含浸され得る他の基材に由来する、精製された試料又は溶解物を含む粗DNAであり得る。したがって、一部の実施形態では、核酸試料は、ゲノムDNAなどの、少量のDNA又は断片化されたDNAの部分を含むことができる。一部の実施形態では、標的配列は、限定されるものではないが、血液、痰、血漿、精液、尿及び血清を含む1つ以上の体液に存在し得る。一部の実施形態では、標的配列は、犠牲者の毛髪、皮膚、組織試料、剖検又は遺体から得ることができる。一部の実施形態では、1つ以上の標的配列を含む核酸は、死亡した動物又はヒトから得ることができる。一部の実施形態では、標的配列は、微生物、植物又は昆虫学的DNAなど非ヒトDNAから得られた核酸を含むことができる。一部の実施形態では、標的配列又は増幅された標的配列は、ヒト同定を目的とする。一部の実施形態では、本開示は、概して、法医学試料の特徴を同定するための方法に関する。一部の実施形態では、本開示は、概して、本明細書に開示された1つ以上の標的特異的プライマー、又は本明細書に概説されたプライマー設計基準を用いて設計された1以上の標的特異的プライマーを使用するヒト同定方法に関する。一実施形態では、少なくとも1つの標的配列を含む法医学試料又はヒト同定試料は、本明細書に開示された標的特異的プライマーのいずれか1つ以上を用いて、又は本明細書に概説されたプライマー基準を用いて増幅することができる。
較正-配列決定システム106の構成要素は、ソフトウェア、ハードウェア、又は両方を含むことができる。例えば、較正-配列決定システム106の構成要素は、コンピュータ可読記憶媒体に記憶され、1つ以上のコンピューティング装置(例えば、ユーザクライアント装置108)のプロセッサによって実行可能な1つ以上の命令を含むことができる。1つ以上のプロセッサによって実行されると、較正-配列決定システム106のコンピュータ実行可能命令は、コンピューティング装置に、本明細書で説明される気泡検出方法を実施させることができる。代替的に、較正-配列決定システム106の構成要素は、特定の機能又は機能群を実施するための専用処理装置などのハードウェアを含むことができる。追加的又は代替的に、較正-配列決定システム106の構成要素は、コンピュータ実行可能命令及びハードウェアの組み合わせを含むことができる。
更に、較正-配列決定システム106に関して本明細書に記載される機能を実施する較正-配列決定システム106の構成要素は、例えば、スタンドアロンアプリケーションの一部として、アプリケーションのモジュールとして、アプリケーションのプラグインとして、他のアプリケーションによって呼び出され得るライブラリ機能として、かつ/又はクラウドコンピューティングモデルとして実装され得る。したがって、較正-配列決定システム106の構成要素は、パーソナルコンピューティング装置又はモバイル装置上のスタンドアロンアプリケーションの一部として実装され得る。追加的又は代替的に、較正-配列決定システム106の構成要素は、Illumina BaseSpace、Illumina DRAGEN、又はIllumina TruSightソフトウェアを含むが、これらに限定されない、配列決定サービスを提供する任意のアプリケーションにおいて実装され得る。「Illumina」、「BaseSpace」、「DRAGEN」、及び「TruSight」は、米国及び/又は他の国におけるIllumina,Inc.の登録商標又は商標である。
本開示の実施形態は、以下でより詳細に考察されるように、例えば、1つ以上のプロセッサ及びシステムメモリなどのコンピュータハードウェアを含む、専用又は汎用コンピュータを含み、又は利用してもよい。本開示の範囲内の実施形態はまた、コンピュータ実行可能命令及び/又はデータ構造を搬送又は記憶するための物理的及び他のコンピュータ可読媒体を含む。特に、本明細書で説明されるプロセスのうちの1つ以上は、非一時的コンピュータ可読媒体において具現化され、1つ以上のコンピューティング装置(例えば、本明細書で説明されるメディアコンテンツアクセス装置のうちのいずれか)によって実行可能な命令として少なくとも部分的に実装されてもよい。概して、プロセッサ(例えば、マイクロプロセッサ)は、非一時的コンピュータ可読媒体(例えば、メモリなど)から命令を受け取り、それらの命令を実行し、それによって、本明細書で説明するプロセスのうちの1つ以上を含む、1つ以上のプロセスを実施する。
コンピュータ可読媒体は、汎用コンピュータシステム又は専用コンピュータシステムによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータ実行可能命令を記憶するコンピュータ可読媒体は、非一時的コンピュータ可読記憶媒体(装置)である。コンピュータ実行可能命令を搬送するコンピュータ可読媒体は、伝送媒体である。したがって、限定ではなく例として、本開示の実施形態は、少なくとも2つの明確に異なる種類のコンピュータ可読媒体、すなわち非一時的コンピュータ可読記憶媒体(装置)及び伝送媒体を含むことができる。
非一時的コンピュータ可読記憶媒体(装置)は、RAM、ROM、EEPROM、CD-ROM、(例えば、RAMに基づく)ソリッドステートドライブ(solid state drive、SSD)、フラッシュメモリ、相変化メモリ(phase-change memory、PCM)、他の種類のメモリ、他の光ディスクストレージ、磁気ディスクストレージ若しくは他の磁気ストレージ装置、又はコンピュータ実行可能命令若しくはデータ構造の形態で所望のプログラムコード手段を記憶するために使用することができ、汎用若しくは専用コンピュータによってアクセスすることができる任意の他の媒体を含む。
「ネットワーク」は、コンピュータシステム及び/又はモジュール及び/又は他の電子装置間の電子データの移送を可能にする1つ以上のデータリンクとして定義される。情報が、ネットワーク又は別の通信接続(ハードワイヤード、ワイヤレス、又はハードワイヤード若しくはワイヤレスの組み合わせのいずれか)を介してコンピュータに転送又は提供されるとき、コンピュータは、その接続を伝送媒体として適切に認識する。伝送媒体は、コンピュータ実行可能命令又はデータ構造の形態で所望のプログラムコード手段を搬送するために使用することができ、汎用又は専用コンピュータによってアクセスすることができるネットワーク及び/又はデータリンクを含むことができる。上記の組み合わせも、コンピュータ可読媒体の範囲内に含まれるべきである。
更に、様々なコンピュータシステム構成要素に到達すると、コンピュータ実行可能命令又はデータ構造の形態のプログラムコード手段は、伝送媒体から非一時的コンピュータ可読記憶媒体(装置)に(又はその逆に)自動的に転送され得る。例えば、ネットワーク又はデータリンクを介して受け取られたコンピュータ実行可能命令又はデータ構造は、ネットワークインターフェースモジュール(例えば、NIC)内のRAMにバッファリングされ、次いで、最終的に、コンピュータシステムRAM及び/又はコンピュータシステムにおけるより揮発性の低いコンピュータ記憶媒体(装置)に転送され得る。したがって、非一時的コンピュータ可読記憶媒体(装置)は、伝送媒体も(又は更に主に)利用するコンピュータシステム構成要素に含まれ得ることを理解されたい。
コンピュータ実行可能命令は、例えば、プロセッサで実行されると、汎用コンピュータ、専用コンピュータ、又は専用処理装置に特定の機能又は機能のグループを実施させる命令及びデータを含む。一部の実施形態では、コンピュータ実行可能命令は、汎用コンピュータ上で実行され、汎用コンピュータを、本開示の要素を実装する専用コンピュータに変える。コンピュータ実行可能命令は、例えば、バイナリ、アセンブリ言語などの中間フォーマット命令、又は更にソースコードであってもよい。主題は、構造的特徴及び/又は方法論的動作に特有の言語で説明されているが、添付の特許請求の範囲において定義される主題は、説明された特徴又は上述の動作に必ずしも限定されないことを理解されたい。むしろ、説明された特徴及び動作は、特許請求の範囲を実装する例示的な形態として開示される。
当業者は、本開示が、パーソナルコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、メッセージプロセッサ、ハンドヘルド装置、マルチプロセッサシステム、マイクロプロセッサベース又はプログラム可能な家庭用電化製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、携帯電話、PDA、タブレット、ページャ、ルータ、スイッチなどを含む、多くの種類のコンピュータシステム構成を有するネットワークコンピューティング環境で実施され得ることを理解するであろう。本開示はまた、ネットワークを介して(ハードワイヤードデータリンク、ワイヤレスデータリンク、又はハードワイヤード及びワイヤレスデータリンクの組み合わせのいずれかによって)リンクされたローカル及びリモートコンピュータシステムが両方ともタスクを実施する分散システム環境において実施され得る。分散システム環境では、プログラムモジュールは、ローカルメモリストレージ装置及びリモートメモリストレージ装置の両方に位置することができる。
本開示の実施形態は、クラウドコンピューティング環境において実装することもできる。本明細書では、「クラウドコンピューティング」は、構成可能なコンピューティングリソースの共有プールへのオンデマンドネットワークアクセスを可能にするためのモデルとして定義される。例えば、クラウドコンピューティングは、構成可能なコンピューティングリソースの共有プールへのユビキタスで便利なオンデマンドアクセスを提供するために、市場で使用され得る。構成可能なコンピューティングリソースの共有プールは、仮想化を介して迅速に設定され、低い管理労力又はサービスプロバイダ対話で公開され、次いで、それに応じて拡大縮小され得る。
クラウドコンピューティングモデルは、例えば、オンデマンドセルフサービス、広域ネットワークアクセス、リソースプーリング、迅速な弾力性、測定されたサービスなどの様々な特性から構成することができる。クラウドコンピューティングモデルはまた、例えば、Software as a Service(SaaS)、Platform as a Service(PaaS)、及びInfrastructure as a Service(IaaS)などの様々なサービスモデルを公開することができる。クラウドコンピューティングモデルは、プライベートクラウド、コミュニティクラウド、パブリッククラウド、ハイブリッドクラウドなどの異なる展開モデルを使用して展開することもできる。本明細書及び特許請求の範囲において、「クラウドコンピューティング環境」は、クラウドコンピューティングが採用される環境である。
図11は、上記で説明したプロセスのうちの1つ以上を実施するように構成され得るコンピューティング装置1100のブロック図を示す。コンピューティング装置1100などの1つ以上のコンピューティング装置が、較正-配列決定システム106及び配列決定システム104を実装し得ることを理解されるであろう。図11によって示されるように、コンピューティング装置1100は、プロセッサ1102と、メモリ1104と、ストレージ装置1106と、I/Oインターフェース1108と、通信インターフェース1110と、を備えることができ、これらは、通信インフラストラクチャ1112によって通信可能に結合され得る。特定の実施形態では、コンピューティング装置1100は、図11に示すものよりも少ない又は多い構成要素を含むことができる。以下の段落は、図11に示されるコンピューティング装置1100の構成要素を更に詳細に説明する。
1つ以上の実施形態では、プロセッサ1102は、コンピュータプログラムを構成する命令などの命令を実行するためのハードウェアを含む。限定ではなく、例として、ワークフローを動的に修正するための命令を実行するために、プロセッサ1102は、内部レジスタ、内部キャッシュ、メモリ1104、又はストレージ装置1106から命令を取り出し(又はフェッチし)、それらを復号し、実行することができる。メモリ1104は、データ、メタデータ、及びプロセッサによる実行のためのプログラムを記憶するために使用される揮発性又は非揮発性メモリであってもよい。ストレージ装置1106は、本明細書で説明される方法を実施するためのデータ又は命令を記憶するための、ハードディスク、フラッシュディスクドライブ、又は他のデジタルストレージ装置などのストレージを含む。
I/Oインターフェース1108は、ユーザが、コンピューティング装置1100に入力を提供し、そこから出力を受け取り、別様に、そこにデータを転送し、そこからデータを受け取ることを可能にする。I/Oインターフェース1108は、マウス、キーパッド若しくはキーボード、タッチスクリーン、カメラ、光学スキャナ、ネットワークインターフェース、モデム、他の既知のI/O装置、又はかかるI/Oインターフェースの組み合わせを含むことができる。I/Oインターフェース1108は、限定はしないが、グラフィックスエンジン、ディスプレイ(例えば、ディスプレイスクリーン)、1つ以上の出力ドライバ(例えば、ディスプレイドライバ)、1つ以上のオーディオスピーカー、及び1つ以上のオーディオドライバを含む、ユーザに出力を提示するための1つ以上の装置を含み得る。特定の実施形態では、I/Oインターフェース1108は、ユーザに提示するためにディスプレイにグラフィカルデータを提供するように構成される。グラフィカルデータは、1つ以上のグラフィカルユーザインターフェース及び/又は特定の実装形態に役立ち得る任意の他のグラフィカルコンテンツを表してもよい。
通信インターフェース1110は、ハードウェア、ソフトウェア、又は両方を含むことができる。いずれにしても、通信インターフェース1110は、コンピューティング装置1100と1つ以上の他のコンピューティング装置又はネットワークとの間の通信(例えば、パケットベースの通信など)のための1つ以上のインターフェースを提供することができる。限定ではなく、例として、通信インターフェース1110は、イーサネット若しくは他の有線ベースのネットワークと通信するためのネットワークインターフェースコントローラ(network interface controller、NIC)若しくはネットワークアダプター、又はWI-FIなどのワイヤレスネットワークと通信するためのワイヤレスNIC(wireless NIC、WNIC)若しくはワイヤレスアダプターを含むことができる。
追加的に、通信インターフェース1110は、様々な種類の有線又はワイヤレスネットワークとの通信を容易にすることができる。通信インターフェース1110は、様々な通信プロトコルを使用して通信を容易にすることもできる。通信インフラストラクチャ1112はまた、コンピューティング装置1100の構成要素を互いに結合するハードウェア、ソフトウェア、又はその両方を含み得る。例えば、通信インターフェース1110は、1つ以上のネットワーク及び/又はプロトコルを使用して、特定のインフラストラクチャによって接続された複数のコンピューティング装置が、本明細書で説明するプロセスの1つ以上の態様を実施するために互いに通信することを可能にし得る。例示すると、配列決定プロセスは、複数の装置(例えば、クライアント装置、配列決定装置、及びサーバ装置)が配列決定データ及びエラー通知などの情報を交換することを可能にすることができる。
前述の明細書において、本開示は、その特定の例示的な実施形態を参照して説明された。本開示の様々な実施形態及び態様は、本明細書で考察される詳細を参照して説明され、添付の図面は様々な実施形態を図示する。上記の説明及び図面は、本開示の例示であり、本開示を限定するものとして解釈されるべきではない。本開示の様々な実施形態の完全な理解を提供するために、多数の特定の詳細が説明される。
本開示は、その趣旨又は本質的な特徴から逸脱することなく、他の特定の形態で具現化されてもよい。記載された実施形態は、全ての点において、例示的なものに過ぎず、限定的ではないとみなされるべきである。例えば、本明細書で説明される方法は、より少ない又はより多いステップ/動作を用いて実施されてもよく、又はステップ/動作は、異なる順序で実施されてもよい。追加的に、本明細書に記載されるステップ/動作は、互いに並行して、又は同じ若しくは同様のステップ/動作の異なる出現と並行して、繰り返されるか、又は実施され得る。したがって、本出願の範囲は、前述の説明ではなく、添付の特許請求の範囲によって示される。特許請求の範囲の意味及び均等範囲内に含まれる全ての変更は、それらの範囲内に包含されるものである。
Claims (32)
- システムであって、
少なくとも1つのプロセッサと、
非一時的コンピュータ可読媒体と、を備え、前記非一時的コンピュータ可読媒体が、前記少なくとも1つのプロセッサによって実行されると、前記システムに、
核酸塩基の較正配列を含むヌクレオチド-試料スライドを受け取らせ、
配列決定装置を使用して1つ以上の較正サイクルを実施させて、前記較正配列に対応するオリゴヌクレオチドに核酸塩基を組み込ませ、
前記1つ以上の較正サイクル及び前記較正配列に基づいて、前記配列決定装置に対応する配列決定パラメータを決定させる、命令を含む、システム。 - 前記較正配列は、前記ヌクレオチド-試料スライド上に配置された試料ライブラリ断片の一部であるか、又は前記ヌクレオチド-試料スライドの表面に付着した表面結合オリゴヌクレオチドの一部である、請求項1に記載のシステム。
- 前記少なくとも1つのプロセッサによって実行されると、前記システムに、前記1つ以上の較正サイクル中又はその後に、前記配列決定装置から前記配列決定パラメータを検出することによって、前記配列決定装置に対応する前記配列決定パラメータを決定させる命令を更に含む、請求項1に記載のシステム。
- 前記少なくとも1つのプロセッサによって実行されると、前記システムに、
前記1つ以上の較正サイクルを実施させて、前記較正配列に対応する前記オリゴヌクレオチドの組み込まれた前記核酸塩基に関連する初期配列決定パラメータを決定させ、
前記初期配列決定パラメータに基づいて前記配列決定パラメータを推定することによって、前記配列決定装置に対応する前記配列決定パラメータを決定させる、命令を更に含む、請求項1に記載のシステム。 - 前記少なくとも1つのプロセッサによって実行されると、前記システムに、イコライザ係数、畳み込みカーネル係数、強度値の核酸塩基重心、特定の核酸塩基型の強度値境界、核酸塩基特異的バックグラウンド強度値、強度正規化係数、ガウス共分散行列、ガウス平均パラメータ、ガウスシードパラメータ、完全機能性ヌクレオチド(fFN)特異的ヌクレオチド位置パラメータ、非線形光学歪みパラメータ、構造化照明顕微鏡(SIM)パラメータ、特定のチャネルのクラスターごとの正規化パラメータ、チャネル特異的正規化パラメータ、クラスター特異的シグナル正規化パラメータ、色チャネル間クロストークパラメータ、又はポリコロナリティパラメータのうちの1つ以上を決定することによって、前記初期配列決定パラメータ又は前記配列決定パラメータを決定させる命令を更に含む、請求項4に記載のシステム。
- 前記少なくとも1つのプロセッサによって実行されると、前記システムに、
前記配列決定装置に対応する初期配列決定パラメータと、1つ以上の較正配列に対応する成長オリゴヌクレオチドのセットに組み込まれた所与の核酸塩基についての核酸塩基コールとを決定するために較正サイクルを実施することによって、前記1つ以上の較正サイクルを実施させ、
前記配列決定装置に対応する前記配列決定パラメータを、
前記成長オリゴヌクレオチドのセットに組み込まれた前記所与の核酸塩基についての前記核酸塩基コールと、前記1つ以上の較正配列についての既知の相補的核酸塩基との比較から塩基コール差を決定し、
前記塩基コール差に基づいて、前記配列決定装置に対応する前記初期配列決定パラメータを調整することによって決定させる、命令を更に含む、請求項1に記載のシステム。 - 前記少なくとも1つのプロセッサによって実行されると、前記システムに、1つの核酸塩基型又は2つの核酸塩基型の核酸塩基を、較正配列のセットに対応する成長オリゴヌクレオチドのセットの較正-配列位置に組み込むことによって、前記1つ以上の較正サイクルを実施させる命令を更に含む、請求項1に記載のシステム。
- 前記少なくとも1つのプロセッサによって実行されると、前記システムに、2つの核酸塩基型の比例分布、3つの核酸塩基型の比例分布、又は4つの核酸塩基型の比例分布を有する核酸塩基を、較正配列のセットに対応する成長オリゴヌクレオチドのセットの較正-配列位置に組み込むことによって、前記1つ以上の較正サイクルを実施させる命令を更に含む、請求項1に記載のシステム。
- 前記少なくとも1つのプロセッサによって実行されると、前記システムに、
各ウェル内にオリゴヌクレオチドの各クラスターをシーディングするための、前記ヌクレオチド-試料スライドの各ウェル内の前記較正配列、
ウェルのサブセット内のオリゴヌクレオチドの各クラスターをシーディングするための、前記ヌクレオチド-試料スライドのウェルの前記サブセット内の前記較正配列、又は
ウェルの前記サブセット内のオリゴヌクレオチドのクラスターのサブセットをシーディングするための、前記ヌクレオチド-試料スライドのウェルの前記サブセット内の前記較正配列、を含む前記ヌクレオチド-試料スライドを受け取らせる命令を更に含む、請求項1に記載のシステム。 - 前記少なくとも1つのプロセッサによって実行されると、前記システムに、
第1の配列決定パラメータを較正するための較正配列の第1のセットを含む試料ライブラリ断片の第1のセットと、
第2の配列決定パラメータを較正するための較正配列の第2のセットを含む試料ライブラリ断片の第2のセットと、を含む前記ヌクレオチド-試料スライドを受け取らせる命令を更に含む、請求項1に記載のシステム。 - 前記少なくとも1つのプロセッサによって実行されると、前記システムに、較正配列のセットについての核酸塩基コールを決定することなく、前記較正配列のセットに対応する成長オリゴヌクレオチドのセットに核酸塩基を組み込むことによって、前記1つ以上の較正サイクルを実施させる命令を更に含む、請求項1に記載のシステム。
- 前記少なくとも1つのプロセッサによって実行されると、前記システムに、試料ライブラリ断片内の試料ゲノム配列についての核酸塩基コールを決定するために、前記配列決定装置を使用してゲノム配列決定サイクルを実施する前又は後に、前記1つ以上の較正サイクルを実施させる命令を更に含む、請求項1に記載のシステム。
- 非一時的コンピュータ可読媒体であって、少なくとも1つのプロセッサによって実行されると、システムに、
核酸塩基の較正配列と、前記較正配列に関連する試料ライブラリ断片と、を含むヌクレオチド-試料スライドを受け取らせ、
配列決定装置を使用して1つ以上の較正サイクルを実施させて、前記較正配列に対応するオリゴヌクレオチドに組み込ませ、
前記1つ以上の較正サイクル及び前記較正配列に基づいて、前記配列決定装置に対応する配列決定パラメータを決定させる、命令を含む、非一時的コンピュータ可読媒体。 - 前記較正配列は、前記試料ライブラリ断片の一部、又は前記ヌクレオチド-試料スライドの表面に付着した表面結合オリゴヌクレオチドの一部である、請求項13に記載の非一時的コンピュータ可読媒体。
- 前記較正配列は、4つの核酸塩基型の比例的分布を有する核酸塩基の異なる配列を含む、請求項13に記載の非一時的コンピュータ可読媒体。
- 核酸塩基の前記異なる配列は、核酸塩基の第1の順序に従って4つの核酸塩基型を含む第1の較正配列と、核酸塩基の第2の順序に従って前記4つの核酸塩基型を含む第2の較正配列と、を含む、請求項15に記載の非一時的コンピュータ可読媒体。
- 前記較正配列は各々、核酸塩基の同じ順序に従い、かつ核酸塩基の単一の配列内に4つの核酸塩基型を有する核酸塩基の前記単一の配列を含む、請求項13に記載の非一時的コンピュータ可読媒体。
- 前記較正配列は各々、4つの核酸塩基型の比例分布を有する核酸塩基の単一の配列を含む、請求項13に記載の非一時的コンピュータ可読媒体。
- 前記較正配列は、所与の較正-配列位置において、第1の核酸塩基型及び第2の核酸塩基型の分布を集合的に含み、後続の較正-配列位置において、前記第1の核酸塩基型及び第3の核酸塩基型の分布、又は前記第3の核酸塩基型及び第4の核酸塩基型の分布を集合的に含む、核酸塩基の異なる配列を含む、請求項13に記載の非一時的コンピュータ可読媒体。
- 前記少なくとも1つのプロセッサによって実行されると、前記システムに、試料ライブラリ断片内の非ゲノム配列及び/又は非トランスクリプトーム配列の一部又は全部として較正配列を含む前記試料ライブラリ断片を含む前記ヌクレオチド-試料スライドを受け取らせる命令を更に含む、請求項13に記載の非一時的コンピュータ可読媒体。
- 前記少なくとも1つのプロセッサによって実行されると、前記システムに、結合アダプター配列とインデックス配列との間、前記インデックス配列とリードプライミング配列との間、又は前記リードプライミング配列と試料ゲノム配列との間に較正配列を含む試料ライブラリ断片を含む前記ヌクレオチド-試料スライドを受け取らせる命令を更に含む、請求項13に記載の非一時的なコンピュータ可読媒体。
- 前記結合アダプター配列と前記インデックス配列との間の前記較正配列は、P7結合アダプター配列とi7インデックス配列との間又はP5結合アダプター配列とi5インデックス配列との間の前記較正配列を含み、
前記インデックス配列と前記リードプライミング配列との間の前記較正配列は、前記i7インデックス配列と第1のリードプライミング配列との間又は前記i5インデックス配列と第2のリードプライミング配列との間の前記較正配列を含み、
前記リードプライミング配列と前記試料ゲノム配列との間の前記較正配列は、前記第1のリードプライミング配列と前記試料ゲノム配列との間又は前記第2のリードプライミング配列と前記試料ゲノム配列との間の前記較正配列を含む、請求項21に記載の非一時的コンピュータ可読媒体。 - 前記少なくとも1つのプロセッサによって実行されると、前記システムに、非ランダム固有分子識別子(UMI)配列の一部若しくは全部として、固有デュアルインデックス(UDI)配列の一部若しくは全部として、インデックス配列の一部若しくは全部として、又は結合アダプター配列の一部若しくは全部として較正配列を含む試料ライブラリ断片を含む前記ヌクレオチド-試料スライドを受け取らせる命令を更に含む、請求項13に記載の非一時的コンピュータ可読媒体。
- 前記少なくとも1つのプロセッサによって実行されると、前記システムに、前記1つ以上の較正サイクルを実施させ、その後、
試料ゲノム配列についての核酸塩基コールを決定するためにゲノム配列決定サイクルを実施する前に、インデックス配列についての核酸塩基コールを決定するためにインデックスサイクルを実施させるか、又は
前記インデックス配列についての核酸塩基コールを決定するために前記インデックスサイクルを実施する前に、前記試料ゲノム配列についての核酸塩基コールを決定するために前記ゲノム配列決定サイクルを実施させる、命令を更に含む、請求項13に記載の非一時的コンピュータ可読媒体。 - 前記少なくとも1つのプロセッサによって実行されると、前記システムに、少なくとも4つの較正配列決定サイクルを実施することによって、前記1つ以上の較正サイクルを実施させる命令を更に含む、請求項13に記載の非一時的コンピュータ可読媒体。
- コンピュータ実施方法であって、
較正核酸塩基及び前記較正核酸塩基に関連する試料ライブラリ断片を含むヌクレオチド-試料スライドを受け取ることと、
配列決定装置を使用して1つ以上の較正サイクルを実施して、前記較正核酸塩基及び前記関連する試料ライブラリ断片に対応するオリゴヌクレオチドに核酸塩基を組み込むことと、
前記1つ以上の較正サイクル及び前記較正核酸塩基に基づいて、前記配列決定装置に対応する配列決定パラメータを決定することと、を含む、コンピュータ実施方法。 - 前記較正核酸塩基は、異なる核酸塩基型の比例分布を含む、請求項26に記載のコンピュータ実施方法。
- 試料ライブラリ断片の第1のセットは、第1の核酸塩基型の第1の較正核酸塩基を含み、試料ライブラリ断片の第2のセットは、第2の核酸塩基型の第2の較正核酸塩基を含む、請求項26に記載のコンピュータ実施方法。
- 前記較正核酸塩基の較正核酸塩基は、前記試料ライブラリ断片の一部であるか、又は前記ヌクレオチド-試料スライドの表面に付着した表面結合オリゴヌクレオチドの一部である、請求項26に記載のコンピュータ実施方法。
- 前記1つ以上の較正サイクルを実施することは、組み込まれた前記核酸塩基についての核酸塩基コールを決定することを含まない、請求項26に記載のコンピュータ実施方法。
- 前記1つ以上の較正サイクルを実施することは、試料ライブラリ断片内の試料ゲノム配列についての核酸塩基コールを決定するために、前記配列決定装置を使用してゲノム配列決定サイクルを実施する前又は後に、前記1つ以上の較正サイクルを実施することを含む、請求項26に記載のコンピュータ実施方法。
- 前記配列決定装置に対応する前記配列決定パラメータを決定することは、イコライザ係数、畳み込みカーネル係数、強度値の核酸塩基重心、特定の核酸塩基型の強度値境界、核酸塩基特異的バックグラウンド強度値、強度正規化係数、ガウス共分散行列、ガウス平均パラメータ、ガウスシードパラメータ、完全機能性ヌクレオチド(fFN)特異的ヌクレオチド位置パラメータ、非線形光学歪みパラメータ、構造化照明顕微鏡(SIM)パラメータ、クラスターごとの正規化パラメータ、チャネル特異的正規化パラメータ、クラスター特異的シグナル正規化パラメータ、色チャネル間クロストークパラメータ、又はポリコロナリティパラメータのうちの1つ以上を決定することを含む、請求項26に記載のコンピュータ実施方法。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US202263268547P | 2022-02-25 | 2022-02-25 | |
| US63/268,547 | 2022-02-25 | ||
| PCT/US2023/063285 WO2023164660A1 (en) | 2022-02-25 | 2023-02-24 | Calibration sequences for nucelotide sequencing |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2025507713A true JP2025507713A (ja) | 2025-03-21 |
Family
ID=85873964
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024550604A Pending JP2025507713A (ja) | 2022-02-25 | 2023-02-24 | ヌクレオチド配列決定のための較正配列 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US20230410944A1 (ja) |
| EP (1) | EP4483372A1 (ja) |
| JP (1) | JP2025507713A (ja) |
| KR (1) | KR20240152324A (ja) |
| CN (1) | CN118871994A (ja) |
| WO (1) | WO2023164660A1 (ja) |
Family Cites Families (34)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0450060A1 (en) | 1989-10-26 | 1991-10-09 | Sri International | Dna sequencing |
| US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
| US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
| GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
| GB9626815D0 (en) | 1996-12-23 | 1997-02-12 | Cemu Bioteknik Ab | Method of sequencing DNA |
| JP2002503954A (ja) | 1997-04-01 | 2002-02-05 | グラクソ、グループ、リミテッド | 核酸増幅法 |
| US6969488B2 (en) | 1998-05-22 | 2005-11-29 | Solexa, Inc. | System and apparatus for sequential processing of analytes |
| US6274320B1 (en) | 1999-09-16 | 2001-08-14 | Curagen Corporation | Method of sequencing a nucleic acid |
| US7001792B2 (en) | 2000-04-24 | 2006-02-21 | Eagle Research & Development, Llc | Ultra-fast nucleic acid sequencing device and a method for making and using the same |
| CN101525660A (zh) | 2000-07-07 | 2009-09-09 | 维西根生物技术公司 | 实时序列测定 |
| EP1354064A2 (en) | 2000-12-01 | 2003-10-22 | Visigen Biotechnologies, Inc. | Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity |
| US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
| EP3795577A1 (en) | 2002-08-23 | 2021-03-24 | Illumina Cambridge Limited | Modified nucleotides |
| GB0321306D0 (en) | 2003-09-11 | 2003-10-15 | Solexa Ltd | Modified polymerases for improved incorporation of nucleotide analogues |
| EP3175914A1 (en) | 2004-01-07 | 2017-06-07 | Illumina Cambridge Limited | Improvements in or relating to molecular arrays |
| US7315019B2 (en) | 2004-09-17 | 2008-01-01 | Pacific Biosciences Of California, Inc. | Arrays of optical confinements and uses thereof |
| EP1828412B2 (en) | 2004-12-13 | 2019-01-09 | Illumina Cambridge Limited | Improved method of nucleotide detection |
| US8623628B2 (en) | 2005-05-10 | 2014-01-07 | Illumina, Inc. | Polymerases |
| GB0514936D0 (en) | 2005-07-20 | 2005-08-24 | Solexa Ltd | Preparation of templates for nucleic acid sequencing |
| US7405281B2 (en) | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
| EP3722409A1 (en) | 2006-03-31 | 2020-10-14 | Illumina, Inc. | Systems and devices for sequence by synthesis analysis |
| WO2008051530A2 (en) | 2006-10-23 | 2008-05-02 | Pacific Biosciences Of California, Inc. | Polymerase enzymes and reagents for enhanced nucleic acid sequencing |
| EP4134667B1 (en) | 2006-12-14 | 2025-11-12 | Life Technologies Corporation | Apparatus for measuring analytes using fet arrays |
| US8349167B2 (en) | 2006-12-14 | 2013-01-08 | Life Technologies Corporation | Methods and apparatus for detecting molecular interactions using FET arrays |
| US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
| US8407012B2 (en) * | 2008-07-03 | 2013-03-26 | Cold Spring Harbor Laboratory | Methods and systems of DNA sequencing |
| US20100137143A1 (en) | 2008-10-22 | 2010-06-03 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
| US8951781B2 (en) | 2011-01-10 | 2015-02-10 | Illumina, Inc. | Systems, methods, and apparatuses to image a sample for biological or chemical analysis |
| CA2859660C (en) | 2011-09-23 | 2021-02-09 | Illumina, Inc. | Methods and compositions for nucleic acid sequencing |
| JP6159391B2 (ja) | 2012-04-03 | 2017-07-05 | イラミーナ インコーポレーテッド | 核酸シークエンシングに有用な統合化した読取りヘッド及び流体カートリッジ |
| WO2017084998A1 (en) * | 2015-11-16 | 2017-05-26 | Qiagen Instruments Ag | Calibration probe and method for calibrating an electronic device |
| US10689684B2 (en) * | 2017-02-14 | 2020-06-23 | Microsoft Technology Licensing, Llc | Modifications to polynucleotides for sequencing |
| WO2019161039A2 (en) * | 2018-02-14 | 2019-08-22 | Regents Of The University Of Minnesota | Size standards for next-generation sequencing |
| US11188778B1 (en) | 2020-05-05 | 2021-11-30 | Illumina, Inc. | Equalization-based image processing and spatial crosstalk attenuator |
-
2023
- 2023-02-24 JP JP2024550604A patent/JP2025507713A/ja active Pending
- 2023-02-24 WO PCT/US2023/063285 patent/WO2023164660A1/en not_active Ceased
- 2023-02-24 KR KR1020247028301A patent/KR20240152324A/ko active Pending
- 2023-02-24 CN CN202380023184.0A patent/CN118871994A/zh active Pending
- 2023-02-24 EP EP23715341.6A patent/EP4483372A1/en active Pending
- 2023-02-24 US US18/174,468 patent/US20230410944A1/en active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| CN118871994A (zh) | 2024-10-29 |
| US20230410944A1 (en) | 2023-12-21 |
| WO2023164660A1 (en) | 2023-08-31 |
| EP4483372A1 (en) | 2025-01-01 |
| KR20240152324A (ko) | 2024-10-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2025170247A (ja) | 配列決定のためのヌクレオチド-試料スライド内の泡を検出するための機械学習モデル | |
| US20240038327A1 (en) | Rapid single-cell multiomics processing using an executable file | |
| US20230343415A1 (en) | Generating cluster-specific-signal corrections for determining nucleotide-base calls | |
| US20220415442A1 (en) | Signal-to-noise-ratio metric for determining nucleotide-base calls and base-call quality | |
| JP2025507713A (ja) | ヌクレオチド配列決定のための較正配列 | |
| US20240266003A1 (en) | Determining and removing inter-cluster light interference | |
| US20250210137A1 (en) | Directly determining signal-to-noise-ratio metrics for accelerated convergence in determining nucleotide-base calls and base-call quality | |
| US20250111898A1 (en) | Tracking and modifying cluster location on nucleotide-sample slides in real time | |
| US20240127906A1 (en) | Detecting and correcting methylation values from methylation sequencing assays | |
| US20250111899A1 (en) | Predicting insert lengths using primary analysis metrics | |
| WO2024206848A1 (en) | Tandem repeat genotyping | |
| WO2025240924A1 (en) | Blind equalization systems for base calling applications | |
| WO2025006570A2 (en) | Modifying sequencing cycles or imaging during a sequencing run to meet customized coverage estimation | |
| JP2025523520A (ja) | 候補スプリットグループをインテリジェントに同定しスコアリングすることによるスプリットリードアラインメントの改善 | |
| WO2025240241A1 (en) | Modifying sequencing cycles during a sequencing run to meet customized coverage estimations for a target genomic region | |
| CA3224595A1 (en) | Machine-learning models for detecting and adjusting values for nucleotide methylation levels |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240827 |