FR3013733A1 - Procede et kit pour determiner le sexe et/ou l'empreinte genetique d'un sujet - Google Patents
Procede et kit pour determiner le sexe et/ou l'empreinte genetique d'un sujet Download PDFInfo
- Publication number
- FR3013733A1 FR3013733A1 FR1361715A FR1361715A FR3013733A1 FR 3013733 A1 FR3013733 A1 FR 3013733A1 FR 1361715 A FR1361715 A FR 1361715A FR 1361715 A FR1361715 A FR 1361715A FR 3013733 A1 FR3013733 A1 FR 3013733A1
- Authority
- FR
- France
- Prior art keywords
- seq
- locus
- group
- determining
- alleles
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 230000002068 genetic effect Effects 0.000 title description 32
- 108700028369 Alleles Proteins 0.000 claims abstract description 102
- 241000282414 Homo sapiens Species 0.000 claims abstract description 52
- 241000282577 Pan troglodytes Species 0.000 claims abstract description 45
- 230000020509 sex determination Effects 0.000 claims description 13
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 9
- 230000004544 DNA amplification Effects 0.000 claims description 9
- 150000007523 nucleic acids Chemical group 0.000 claims 1
- 108020004414 DNA Proteins 0.000 description 102
- 230000035772 mutation Effects 0.000 description 45
- 238000003199 nucleic acid amplification method Methods 0.000 description 42
- 230000003321 amplification Effects 0.000 description 40
- 210000002966 serum Anatomy 0.000 description 29
- 210000004369 blood Anatomy 0.000 description 25
- 239000008280 blood Substances 0.000 description 25
- 239000003550 marker Substances 0.000 description 23
- 238000003752 polymerase chain reaction Methods 0.000 description 19
- 108091092878 Microsatellite Proteins 0.000 description 16
- 241000894007 species Species 0.000 description 16
- 239000012634 fragment Substances 0.000 description 13
- 238000012360 testing method Methods 0.000 description 13
- 241000282579 Pan Species 0.000 description 12
- 108091093088 Amplicon Proteins 0.000 description 11
- 241000288906 Primates Species 0.000 description 11
- 108090000623 proteins and genes Proteins 0.000 description 11
- 210000002593 Y chromosome Anatomy 0.000 description 9
- 238000007403 mPCR Methods 0.000 description 9
- 241000735376 Hapalemur Species 0.000 description 8
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 8
- 230000000692 anti-sense effect Effects 0.000 description 8
- 238000004113 cell culture Methods 0.000 description 8
- 241000282575 Gorilla Species 0.000 description 7
- 241000282412 Homo Species 0.000 description 7
- 238000012217 deletion Methods 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 241000531315 Avahi Species 0.000 description 6
- 241000282620 Hylobates sp. Species 0.000 description 6
- 241000288975 Lepilemur Species 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- BFMYDTVEBKDAKJ-UHFFFAOYSA-L disodium;(2',7'-dibromo-3',6'-dioxido-3-oxospiro[2-benzofuran-1,9'-xanthene]-4'-yl)mercury;hydrate Chemical compound O.[Na+].[Na+].O1C(=O)C2=CC=CC=C2C21C1=CC(Br)=C([O-])C([Hg])=C1OC1=C2C=C(Br)C([O-])=C1 BFMYDTVEBKDAKJ-UHFFFAOYSA-L 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 239000004744 fabric Substances 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 108010007570 Amelogenin Proteins 0.000 description 5
- 241000282405 Pongo abelii Species 0.000 description 5
- 241000282676 Sapajus apella Species 0.000 description 5
- 241000168914 Strepsirrhini Species 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 210000003296 saliva Anatomy 0.000 description 5
- XGWIJUOSCAQSSV-XHDPSFHLSA-N (S,S)-hexythiazox Chemical compound S([C@H]([C@@H]1C)C=2C=CC(Cl)=CC=2)C(=O)N1C(=O)NC1CCCCC1 XGWIJUOSCAQSSV-XHDPSFHLSA-N 0.000 description 4
- 241000282703 Alouatta caraya Species 0.000 description 4
- 102100039109 Amelogenin, Y isoform Human genes 0.000 description 4
- 241000282709 Aotus trivirgatus Species 0.000 description 4
- 241000282558 Cercocebus torquatus Species 0.000 description 4
- 241000282693 Cercopithecidae Species 0.000 description 4
- 241000003884 Eulemur flavifrons Species 0.000 description 4
- 241001416540 Eulemur macaco macaco Species 0.000 description 4
- 101000959107 Homo sapiens Amelogenin, Y isoform Proteins 0.000 description 4
- 241001481815 Indri indri Species 0.000 description 4
- 241001277092 Lophocebus albigena Species 0.000 description 4
- 241000282537 Mandrillus sphinx Species 0.000 description 4
- 241001502096 Pan troglodytes troglodytes Species 0.000 description 4
- 241000862462 Papio sp. Species 0.000 description 4
- 241000282416 Pongo sp. Species 0.000 description 4
- 241001444746 Prolemur simus Species 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 210000001182 human Y chromosome Anatomy 0.000 description 4
- 229910001629 magnesium chloride Inorganic materials 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 102100039088 Amelogenin, X isoform Human genes 0.000 description 3
- 241000591274 Avahi cleesei Species 0.000 description 3
- 241000531316 Avahi laniger Species 0.000 description 3
- 241000288950 Callithrix jacchus Species 0.000 description 3
- 241000252253 Catostomus Species 0.000 description 3
- 241000282555 Erythrocebus patas Species 0.000 description 3
- 101000959114 Homo sapiens Amelogenin, X isoform Proteins 0.000 description 3
- 241000282619 Hylobates lar Species 0.000 description 3
- 241000696964 Lepilemur ankaranensis Species 0.000 description 3
- 241001313482 Lepilemur dorsalis Species 0.000 description 3
- 241000282559 Macaca sylvanus Species 0.000 description 3
- 241001416543 Propithecus Species 0.000 description 3
- 241001531919 Propithecus sp. Species 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000005251 capillar electrophoresis Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 210000004209 hair Anatomy 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000018412 transposition, RNA-mediated Effects 0.000 description 3
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- 102000007325 Amelogenin Human genes 0.000 description 2
- 241000906092 Avahi occidentalis Species 0.000 description 2
- 241000282551 Cercopithecus Species 0.000 description 2
- 241000282549 Cercopithecus cephus Species 0.000 description 2
- 241001504511 Cercopithecus nictitans Species 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 2
- 241000735542 Eulemur Species 0.000 description 2
- 102100039111 FAD-linked sulfhydryl oxidase ALR Human genes 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 241000531383 Hapalemur aureus Species 0.000 description 2
- 241000735380 Hapalemur griseus Species 0.000 description 2
- 241000531327 Hapalemur griseus griseus Species 0.000 description 2
- 241001100447 Hapalemur griseus meridionalis Species 0.000 description 2
- 241000531380 Hapalemur griseus occidentalis Species 0.000 description 2
- 101000959079 Homo sapiens FAD-linked sulfhydryl oxidase ALR Proteins 0.000 description 2
- 101000996109 Homo sapiens Neuroligin-4, Y-linked Proteins 0.000 description 2
- 241000288904 Lemur Species 0.000 description 2
- 241000288902 Lemur catta Species 0.000 description 2
- 241000697236 Lepilemur aeeclis Species 0.000 description 2
- 241000199143 Lepilemur mittermeieri Species 0.000 description 2
- 241001314395 Lepilemur ruficaudatus Species 0.000 description 2
- 241000697238 Lepilemur sahamalazensis Species 0.000 description 2
- 241000282553 Macaca Species 0.000 description 2
- 241000282560 Macaca mulatta Species 0.000 description 2
- 241000282563 Macaca sp. Species 0.000 description 2
- 241001416539 Microcebus murinus Species 0.000 description 2
- 102100034448 Neuroligin-4, Y-linked Human genes 0.000 description 2
- 101100274389 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) chz-1 gene Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 241000282520 Papio Species 0.000 description 2
- 241001504519 Papio ursinus Species 0.000 description 2
- 241000282407 Pongo pygmaeus pygmaeus Species 0.000 description 2
- 241000191711 Propithecus deckenii deckenii Species 0.000 description 2
- 241001416541 Propithecus tattersalli Species 0.000 description 2
- 241001481823 Propithecus verreauxi Species 0.000 description 2
- 241000531366 Propithecus verreauxi verreauxi Species 0.000 description 2
- 101100386054 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CYS3 gene Proteins 0.000 description 2
- 210000001766 X chromosome Anatomy 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 2
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 2
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 210000003608 fece Anatomy 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 101150035983 str1 gene Proteins 0.000 description 2
- 239000010981 turquoise Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- QCPFFGGFHNZBEP-UHFFFAOYSA-N 4,5,6,7-tetrachloro-3',6'-dihydroxyspiro[2-benzofuran-3,9'-xanthene]-1-one Chemical compound O1C(=O)C(C(=C(Cl)C(Cl)=C2Cl)Cl)=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 QCPFFGGFHNZBEP-UHFFFAOYSA-N 0.000 description 1
- NJYVEMPWNAYQQN-UHFFFAOYSA-N 5-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C21OC(=O)C1=CC(C(=O)O)=CC=C21 NJYVEMPWNAYQQN-UHFFFAOYSA-N 0.000 description 1
- 241000282514 Alouatta Species 0.000 description 1
- 208000002109 Argyria Diseases 0.000 description 1
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 101150029409 CFTR gene Proteins 0.000 description 1
- 241000288951 Callithrix <genus> Species 0.000 description 1
- 241000282513 Cebidae Species 0.000 description 1
- 241000282668 Cebus Species 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 206010013774 Dry eye Diseases 0.000 description 1
- 241000282554 Erythrocebus Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 102100026338 F-box-like/WD repeat-containing protein TBL1Y Human genes 0.000 description 1
- 241000282418 Hominidae Species 0.000 description 1
- 101000835690 Homo sapiens F-box-like/WD repeat-containing protein TBL1Y Proteins 0.000 description 1
- 241000282597 Hylobates Species 0.000 description 1
- 241001289717 Hypolimnas Species 0.000 description 1
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 1
- 241000984001 Lemur sp. Species 0.000 description 1
- 241001277090 Lophocebus Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000721558 Microcebus Species 0.000 description 1
- 241000282576 Pan paniscus Species 0.000 description 1
- 244000082204 Phyllostachys viridis Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 241000288935 Platyrrhini Species 0.000 description 1
- 241000212139 Propithecus coquereli Species 0.000 description 1
- 241000694004 Propithecus diadema diadema Species 0.000 description 1
- 101710138718 Protochlorophyllide reductase B, chloroplastic Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 241000282696 Saimiri sciureus Species 0.000 description 1
- 241000555745 Sciuridae Species 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 241000252794 Sphinx Species 0.000 description 1
- 108091035286 Strbase Proteins 0.000 description 1
- 101150104530 TBL1Y gene Proteins 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 210000002969 egg yolk Anatomy 0.000 description 1
- 229940047127 fiore Drugs 0.000 description 1
- 102000054766 genetic haplotypes Human genes 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 210000004090 human X chromosome Anatomy 0.000 description 1
- 102000054584 human Y acceptor Human genes 0.000 description 1
- 108700023876 human Y acceptor Proteins 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 238000009399 inbreeding Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 102000045222 parkin Human genes 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 210000003765 sex chromosome Anatomy 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6879—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for sex determination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
La présente invention concerne un procédé pour caractériser un échantillon d'ADN humain ou de chimpanzé comprenant une étape de : -détermination des allèles d'au moins 10 loci STR de l'échantillon d'ADN, les loci étant choisis dans le groupe M1 et/ou le groupe M2, dans lequel : -le groupe M1 consiste en : DYS485, DYS588, DYS502, DYS461, DYS638, DYS643, DYS587, DYS575, DYS578, DYS632, DYS508, DYS640, DYS511, DYS577, DYS556, DYS517, DYS565 et DYS538 et -le groupe M2 consiste en : Y-GATA-A10, DYS570, DYS549, DYS460, DYS442, DYS510, DYS541, DYS576, DYS513, DYS458, DYS481, DYS612, DYS444 et DYS533.
Description
DOMAINE DE L'INVENTION: La présente invention concerne un procédé et un kit pour caractériser un échantillon d'ADN d'un sujet humain ou chimpanzé en vue de déterminer le sexe et/ou l'empreinte génétique de ce sujet.
ARRIERE-PLAN DE L'INVENTION: Un profil génétique correspond à la combinaison spécifique de plusieurs marqueurs permettant d'identifier un individu grâce à son ADN. Il existe essentiellement deux grands types de marqueurs pour établir un profil génétique: les SNPs (Single Nucleotide Polymorphism), et les STR (Short Tandem Repeat ou microsatellites). Un SNP correspond au changement d'une base en une autre à un endroit de la séquence ADN, par exemple un changement de A en C. Il se décline donc sous la forme de 2 allèles. Les SNP se caractérisent par un taux de mutation bas (2.1 x 10-6 mutation/génération/locus) en raison de la faible fréquence à laquelle surviennent ces mutations. Ce sont d'excellents outils phylogénétiques qui nous renseignent sur l'origine phylo- géographique d'un individu. Par contre, ils ne sont pas assez discriminants pour nous renseigner sur les relations existant entre des individus étroitement apparentés. Les STR sont quant à eux, très largement utilisés dans le cadre de recherche en paternité, d'affaires de viols ou de meurtres, et en recherche fondamentale afin de reconstruire l'histoire du peuplement humain. Ils possèdent, un fort pouvoir discriminant, en raison d'un taux de mutation élevé. Ce sont des unités répétées en tandem (ex. [CA]e) qui mutent par gain ou perte d'une répétition, et se déclinent sous la forme de multiples états. Leur taux de mutation est plus ou moins élevé en fonction de leur taille, par exemple un CA6 mutera moins rapidement qu'un CA15. Ces différences de taux de mutation observées en fonction des motifs explique le large spectre de mutation de ces marqueurs (1.38 x 10-6 et 6.54 x 10-2 mut/gén/locus) et leur capacité à discriminer des individus plus ou moins apparentés. Si l'extrême mutabilité de certains loci (>10-3) est très utile pour discriminer des individus proches génétiquement (frères, cousins), celle-ci ne permet pas d'obtenir une information robuste sur l'origine phylo-géographique d'un individu (comme il est possible de le faire avec des SNPs).
De plus, cette hyper-mutabilité peut induire une « saturation mutationnelle » i.e. que lorsque un marqueur mute trop vite, les états intermédiaires de mutations ne sont pas toujours visibles - il en résulte un taux de mutation mal estimé et des indicateurs statistiques dérivés, approximatifs et peu robustes.
Idéalement, il faudrait pouvoir disposer, d'un outil complet, constitué de marqueurs ayant un taux de mutation faible, capables de donner une information « phylogénétique » sur les individus, et de marqueurs ayant un taux de mutation moyen ou élevé, capables de discriminer les individus même apparentés. Hors techniquement parlant, mélanger SNPs et STRs,,ce n'est pas possible - même en utilisant des technologies de NGS (next generation sequencing) - au demeurant relativement lourdes à utiliser en routine dans un laboratoire lambda.
En médecine légale et en recherche fondamentale, il existe un produit phare servant à établir un profil génétique masculin: le AnnpFtSTRO Yfiler® un multiplex de 17 marqueurs STR distribué par Applied Biosystems (life technologies). Cependant, ce produit ne répond pas correctement aux attentes des différents clients ciblés car il contient peu de marqueurs ayant un taux de mutation élevé, indispensables en médecine légale pour discriminer des profils génétiques très proches, ainsi qu'en généalogie moléculaire et recherche fondamentale. De plus, parmi les quelques marqueurs ayant un taux de mutation élevé qu'il contient, deux d'entre eux (DYS385a et b) sont dupliqués et de ce fait inutilisables sans une connaissance approfondie des mécanismes moléculaires impliqués dans leur mutation. Les marqueurs inclus dans ce kit, ayant des taux et pouvoir discriminant très variables, ne permettent ni de correctes études exploratoires à large échelle (faible apparentement : génétique évolutive à l'échelle continentale), ni de correctes études à fine échelle (ex. fort apparentement en généalogie moléculaire ou médecine légale). Enfin, les caractéristiques intrinsèques de 5 des 15 marqueurs restants, ne permettent pas d'envisager des études de modélisation afin de fournir des statistiques fiables sur les taux de mutation. Deux outils similaires ont été développé par des laboratoires publics: le 20-plex (Butler et al. 2002, Forensic Sci. Int) et le 14-plex (Parkin et al. 2006, Forensic Sci. Int) : ces 2 multiplex bien que publiés, il y a 10 et 6 ans respectivement, ne se sont pas imposés dans la communauté scientifique car utiliser ces outils dans un laboratoire demanderait un lourd investissement en temps, expertise et finances afin de mettre en place le protocole dans un laboratoire. L'investissement se justifie d'autant moins que 70% des marqueurs sont déjà inclus dans l'AmpFfSTRO Yfiler®; il n'existe donc aucune réelle plus-value à les utiliser. Il est à noter qu'il n'existe aucun équivalent de ce type d'outil pour les chimpanzés, dont la gestion et la conservation dans les parcs et réserve, nécessite une connaissance pointue des relations généalogiques entre individus. RESUME DE L'INVENTION: L'inventeur a réussi à concevoir un procédé pour caractériser un échantillon d'ADN reposant sur un ensemble de marqueurs génomiques du même type, qui permet de déterminer l'empreinte génétique à haute résolution d'un sujet sans présenter les inconvénients précités. L'ensemble des marqueurs selon l'invention est utilisable non seulement sur des ADN parfaits, mais aussi sur des ADN de moyenne qualité (ADN ancien ou sérum). En effet, ces marqueurs permettent de travailler sur des fragments de taille relativement courte. Ainsi, ces marqueurs peuvent être amplifiés avec des tailles toujours inférieures à 350bp. De plus, les marqueurs selon l'invention sont fiables/simples, i.e. qu'ils peuvent être utilisés sans une connaissance approfondie des structures moléculaires. En effet, il n'y a pas de duplications, de faux allèle, ni de structure complexe à considérer dans l'utilisation des taux ou mécanismes de mutation associés à ces marqueurs.
Un premier aspect de l'invention concerne, par conséquent, un procédé pour caractériser un échantillon d'ADN humain ou de chimpanzé comprenant une étape de : - détermination des allèles d'au moins 10 loci STR de l'échantillon d'ADN, les loci étant choisis dans le groupe M1 et/ou le groupe M2, dans lequel : -le groupe M1 consiste en : DYS485, DYS588, DYS502, DYS461, DYS638, DYS643, DYS587, DYS575, DYS578, DYS632, DYS508, DYS640, DYS511, DYS577, DYS556, DYS517, DYS565 et DYS538 et -le groupe M2 consiste en : Y-GATA-A10, DYS570, DYS549, DYS460, DYS442, DYS510, DYS541, DYS576, DYS513, DYS458, DYS481, DYS612, DYS444 et DYS533. La présente invention concerne également un kit comprenant des moyens pour déterminer les allèles d'au moins 10 loci de STR un échantillon d'ADN humain ou de chimpanzé, les loci étant choisis dans le groupe M1 et/ou le groupe M2, dans lequel: -le groupe M1 consiste en: DYS485, DYS588, DYS502, DYS461, DYS638, DYS643, DYS587, DYS575, DYS578, DYS632, DYS508, DYS640, DYS511, DYS577, DYS556, DYS517, DYS565 et DYS538 et -le groupe M2 consiste en: Y-GATA-A10, DYS570, DYS549, DYS460, DYS442, DYS510, DYS541, DYS576, DYS513, DYS458, DYS481, DYS612, DYS444 et DYS533.
DESCRIPTION DETAILLEE DE L'INVENTION Définitions Le terme « allèle » désigne une des différentes formes d'une séquence d'ADN occupant le même locus. Le terme « locus » désigne une position spécifique sur un chromosome. Le terme « STR » ou « Short Tandem Repeat » ou « séquences répétées en tandem » ou microsatellite désigne toutes les séquences entre 2 et 7 nucléotides qui sont répétées en tandem. Détermination du profil génétique d'un sujet La présente invention concerne un procédé pour caractériser un échantillon d'ADN humain ou de chimpanzé comprenant une étape de : - détermination des allèles d'au moins 10 loci de STR de l'échantillon d'ADN, les loci étant choisis dans le groupe M1 et/ou le groupe M2, dans lequel : -le groupe M1 consiste en : DYS485, DYS588, DYS502, DYS461, DYS638, DYS643, DYS587, DYS575, DYS578, DYS632, DYS508, DYS640, DYS511, DYS577, DYS556, DYS517, DYS565 et DYS538 et -le groupe M2 consiste en : Y-GATA-A10, DYS570, DYS549, DYS460, DYS442, DYS510, DYS541, DYS576, DYS513, 10 DYS458, DYS481, DYS612, DYS444 et DYS533. Le procédé selon l'invention permet de déterminer le profil génétique d'un sujet. Ce procédé présente l'avantage d'être à la fois utilisable pour déterminer le profil génétique 15 d'un homme et celui d'un chimpanzé. Typiquement, les allèles de 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32 loci peuvent être déterminés. 20 Le choix du nombre de loci est fonction de l'utilisation souhaitée. En effet, les STRs du groupe M1 ont un taux de mutation faible à intermédiaire. Ces marqueurs permettent une discrimination de profils à large échelle, par exemple à l'échelle des continents ou des pays. Quant aux STRs du groupe M2, ils ont un taux de mutation élevé. Ces marqueurs permettent une discrimination de profils à plus fine échelle, par exemple à l'échelle d'une région. 25 Si la méthode est utilisée pour discriminer des individus peu apparentés, 5 marqueurs de M1 et 5 de M2 pourront être utilisés pour caractériser leurs profils génétiques. Si la méthode est utilisée pour discriminer des individus très apparentés, 10 marqueurs dans M1 et 10 dans M2 pourront être utilisés pour caractériser un échantillon d'ADN provenant de chacun de ces individus. Dans un mode de réalisation préféré, les allèles des 32 loci sont 30 déterminés. Les différents loci sont décrits dans le tableau 1 ci-dessous et classés par ordre croissant de leur taux de mutation chez l'homme. La description moléculaire des STR correspondant à ces loci sont donnés dans Kayser et- al. 2004 et Ballantyne et al. 2010. 35 GBD ID Grou pe Locus ID Localisation de bande Détails de . Taux de mutation médian bayésien (Kayser chromosomique localisation details et al. (rétrotransposition, 2004) gène...) DYS502 M1 Y3S60 Yq11.221 LINE1 L 3,85E-04 NLGN4Y mRNA DYS575 M1 Y4S49 Yp11.2 Alu L 3,91 E-04 DYS588 M1 Y5C23 Yq11.221 Alu R 3,92E-04 DYS538 M1 Y4C32 Yq11.221 Aucune 3,94E-04 retransposition DYS632 M1 BV005731 Yq11.221 Alu R 3,97E-04 DYS640 M1 Y4S38 Yq11.221 Alu L etLINE1 R 3,98E-04 DYS485 M1 Y3S1 Yq11.222 Alu R et LINE1 L 4,04E-04 DYS577 M1 Y4S54 Yq11.221 Alu R 4,11 E-04 DYS461/ M1 - Yq11.222 L1 L famille LINE 9,89E-04 Y-GATA-A7.2 DYS578 M1 Y4S56 Yq11.223 Alu L, E ERV1 LIN 9,95E-04 R DYS638 M1 Y4S26 Yq11.221 Alu R 1,04E-03 DYS511 M1 Y4C114 Yq11.221 Aucune 1,52E-03 (mais proche d'une autre simple répétition) DYS556 M1 Y4C75 Yq11.223 LINE1 L et R 1,59E-03 DYS565 M1 Y4S18 Yq11.221 Alu L 2,09E-03 DYS587 M1 Y5C22 Yq11.221 Aucune 2,62E-03 retransposition DYS508 M1 Y4C109 Yq11.221 Aucune 3,03E-03 DYS517 M1 Y4C126 Yq11.221 Aucune 3,21E-03 DYS643 M1 Y5C20 Yq11.221 LINE1 R 1,50E-03 Y-GATA-A10 M2 - Yq11.221 Aucune 3,32E-03 DYS541 M2 Y4C36 Yq11.221 LINE1 R 3,92E-03 DYS549 M2 Y4C52 Yq11.222 LINE1 L et R 4,55E-03 DYS481 M2 Y3C59 Yp11.2 Aucune 4,97E-03 DYS533 M2 Y4C215 Yq11.221 Aucune 5,01 E-03 (proche d'un autre Y-STR) DYS444 M2 Y4C37 Yq11.221 Tigger2a DNA R 5,45E-03 DYS510 M2 Y4C113 Yq11.221 Aucune 5,99E-03 (mais proche d'une autre simple répétition) DYS513 M2 Y4C116 Yq11.221 aucune 6,09E-03 DYS460/ M2 - Yq11.222 (Li R famille 6,22E-03 Y-GATA-A7.1 LINE) DYS458 M2 - Yp11.2 Alu L et R 8,36E-03 DYS442 M2 - Y11q21 LINE1 L et R 9,78E-03 DYS570 M2 Y4S4 Yp11.2 5'UTR du gène 1,24E-02 TBL1Y (codant pour une protéine) DYS576 M2 Y4S5 Yp11.2 Alu L 1,43E-02 DYS612 M2 Y3C22 Yq11.221 Aucune 1,45E-02 Tableau 1 Les marqueurs selon l'invention sont des marqueurs masculins. En effet, les loci sont situés sur le chromosome Y, permettant de générer un profil génétique spécifiquement masculin. L'obtention d'un profil génétique masculin optimal représente un réel enjeu dans de nombreux domaines non seulement en médecine légale car plus de 97% des agressions sont perpétrées par des hommes mais également dans le cadre de test de paternité, en généalogie génétique et en histoire du peuplement afin de retracer l'histoire des lignées masculines d'homo-sapiens.
Le procédé pour caractériser un échantillon d'ADN peut être réalisé sur un échantillon dont le sexe n'a pas été déterminé au préalable. Dans ce cas, étant donné que ce procédé est basé sur des marqueurs masculins, il ne donnera des résultats que si l'échantillon provient d'un mâle. Néanmoins, la présence de marqueurs de sexage inclus permettra de dire si cette non amplification est du à la présence d'un individu féminin (marqueur X amplifié uniquement), ou d'un ADN très dégradé (aucun marqueur n'est amplifié). Dans un mode de réalisation préféré, l'échantillon d'ADN est un échantillon d'ADN humain. Le profil génétique d'un être humain, en particulier d'un homme, est déterminé par exemple à des fins de médecine légale mais aussi à des fins de recherche pour des études de généalogie moléculaire et d'histoire du peuplement. Dans un autre mode de réalisation, l'échantillon d'ADN est un échantillon d'ADN de chimpanzé, en particulier un chimpanzé mâle. Pour le chimpanzé, l'obtention d'un profil génétique peut notamment être utilisée afin de déterminer les relations de parentés des individus en milieu naturel et comprendre l'organisation sociale de cette espèce. Elle peut également permettre d'optimiser les stratégies d'accouplement, éviter la consanguinité et assurer le bon devenir de l'espèce lorsque le chimpanzé est en semi-captivité ou captivité. Selon un mode de réalisation, le procédé selon l'invention comprend une étape de fourniture d'un échantillon d'ADN. L'échantillon d'ADN peut provenir de différentes sources. Des exemples de sources d'ADN, en particulier d'ADN génomique, sont le sang, le sperme, les cheveux, les poils, les tissus, la salive, les urines, les fèces et des mélanges de fluides biologiques. L'échantillon d'ADN peut être frais, ancien, sec ou partiellement dégradé.
Les procédés de préparation d'un échantillon d'ADN en vue de déterminer les allèles de loci de STR sont connus. Par exemple, de tels procédés sont décrits dans Patel, P. I., et al. (1984) "Organization of the HPRT gene and related sequences in the human genome," Somat Cell Mol Genet 10: 483-493, and Gill, P., et al. (1985) "Forensic application of DNA 'fingerprints'," Nature 318: 577-579. A partir de l'échantillon d'ADN, les allèles d'intérêt sont déterminés.
Différents procédés de détermination des allèles de loci de STR sont connus. Des exemples de telles technologies comprennent le séquençage d'ADN ou des techniques d'amplification d'ADN telles que la PCR (« polymerase chain reaction » ou « réaction de polymérisation en chaîne »). Ces techniques qui peuvent être utilisées en combinaison avec des technologies de détection telles que l'électrophorèse, la spectrométrie de masse, etc.
Selon un mode de réalisation préféré, l'étape de détermination des allèles comprend une étape d'amplification telle qu'une amplification par PCR. Les allèles de loci peuvent être déterminés individuellement ou simultanément. De préférence, cette amplification est réalisée simultanément pour plusieurs loci. Ce type d'amplification est appelée amplification multiplex.
L'amplification multiplex est un procédé pour amplifier simultanément plusieurs loci dans une seule réaction. Ces amplifications multiplex ont largement été décrites dans la littérature (Duchenne Muscular Dystrophy (Chamberlain, J. S., et al. (1988) "Deletion screening of the Duchenne muscular dystrophy locus via multiplex DNA amplification"; Morral, N. and Estivill, X. (1992) "Multiplex PCR amplification of three STR within the CFTR gene," Genomics 51: 1362- 1364); Kimpton, C. P., et al. (1993) "Automated DNA profiling employing multiplex amplification of short tandem repeat loci," PCR Methods and Applications 3: 13-22; Hammond; Schumnn, J. W. et al. (1994) "Development of nonisotopic multiplex amplification sets for analysis of polymorphic STR loci," in "The Fourth International Symposium on Human Identification 1993," pp. 177-187). Les amplifications multiplex sont généralement réalisées par PCR. On parle alors de PCR multiplex. L'étape d'amplification peut généralement comprendre une ou plusieurs des étapes suivantes : -la dénaturation de l'ADN afin qu'il soit sous forme simple brin, -l'ajout de paires d'amorces spécifiques pour chacun des STR, une amorce de chaque paire étant substantiellement complémentaire d'une partie de la séquence dans le brin sens et l'autre amorce de chaque paire étant substantiellement complémentaire d'une partie différente de la même séquence sur le brin anti-sens complémentaire, -l'hybridation des paires d'amorces à leur séquence complémentaire, -l'élongation simultanée des amorces hybridées à partir de l'extrémité 3' de chaque amorce pour synthétiser un produit d'élongation complémentaire du brin hybridé à chaque amorce, dit produit d'élongation, lesdits produits d'élongation, après séparation de leur complément servent de matrices pour la synthèse d'un produit d'élongation pour l'autre amorce de chaque paire, -la séparation des produits d'élongation des matrices pour produire des molécules simples brins, -l'amplification des molécules simple brin en répétant au moins une fois les étapes d'hybridation, d'élongation et de séparation.
Dans un mode de réalisation, l'étape d'amplification comprend l'ajout d'au moins 10 paires d'amorces adaptées pour amplifier les loci de STR selon l'invention. Dans un mode de réalisation, l'étape d'amplification comprend l'ajout de 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32 paires d'amorces adaptées pour amplifier les loci de STR selon l'invention. Dans un mode de réalisation, les paires d'amorces ont les séquences nucléiques choisies dans le groupe consistant en: SEQ ID NO : 1 et SEQ ID NO : 2 pour le locus DYS485, SEQ ID NO : 3 et SEQ ID NO : 4 pour le locus DYS588, SEQ ID NO : 5 et SEQ ID NO : 6 pour le locus DYS502, 'SEQ ID NO : 7 et SEQ ID NO : 8 pour le locus DYS461, SEQ ID NO : 9 et SEQ ID NO : 10 pour le locus DYS638, SEQ ID NO : 11 et SEQ ID NO : 12 pour le locus DYS643, SEQ ID NO : 13 et SEQ ID NO : 14 pour le locus DYS587, SEQ ID NO : 15 et SEQ ID NO : 16 pour le locus DYS575, SEQ ID NO : 17 et SEQ ID NO : 18 pour le locus DYS578, SEQ ID NO : 19 et SEQ ID NO : 20 pour le locus DYS632, SEQ ID NO : 21 et SEQ ID NO : 22 pour le locus DYS508, SEQ ID NO : 23 et SEQ ID NO : 24 pour le locus DYS640, SEQ ID NO : 25 et SEQ ID NO : 26 pour le locus DYS511, SEQ ID NO: 27 et SEQ ID NO : 28 pour le locus DYS577, SEQ ID NO : 29 et SEQ ID NO : 30 pour le locus DYS556, SEQ ID NO : 31 et SEQ ID NO : 32 pour le locus DYS517, SEQ ID NO : 33 et SEQ ID NO : 34 pour le locus DYS565, SEQ ID NO : 35 et SEQ ID NO : 36 pour le locus DYS538, SEQ ID NO : 37 et SEQ ID NO : 38 pour le locus Y-GATA-A10 SEQ ID NO : 39 et SEQ ID NO : 40 pour le locus DYS570, SEQ ID NO : 41 et SEQ ID NO : 42 pour le locus DYS549, SEQ ID NO : 43 et SEQ ID NO : 44 pour le locus DYS460, SEQ ID NO : 45 et SEQ ID NO : 46 pour le locus DYS442 SEQ ID NO : 47 et SEQ ID NO : 48 pour le locus DYS510, SEQ ID NO : 49 et SEQ ID NO : 50 pour le locus DYS541, SEQ ID NO : 51 et SEQ ID NO : 52 pour le locus DYS576, SEQ ID NO : 53 et SEQ ID NO : 54 pour le locus DYS513, SEQ ID NO : 55 et SEQ ID NO : 56 pour le locus DYS458, SEQ ID NO : 57 et SEQ ID NO : 58 pour le locus DYS481 SEQ ID NO : 59 et SEQ ID NO : 60 pour le locus DYS612, SEQ ID NO : 61 et SEQ ID NO : 62 pour le locus DYS444 et SEQ ID NO : 63 et SEQ ID NO : 64 pour le locus DYS533. Les séquences des amorces des différents modes de réalisation de l'invention dans lesquels l'échantillon d'ADN est un échantillon d'ADN humain ou de chimpanzé sont données dans le tableau 2 ci-dessous. Marqueur Amorce sens Amorce anti-sens SEQ ID NO Séquence (5'-3') SEQ ID Séquence (5'-3') NO DYS485 1 catataacaaaattgaatgtgtactcc 2 agcctgggtgacaagagttatac DYS588 3 gaatgcagaaccctcaagga 4 agcctgggtgacagaaacac DYS502 5 cagcaagccaccataccata 6 tgtgcttttggagtttggag DYS461 / Y-GATA- A7.2 7 aatacataataaatgataggcagagga 8 gagagctgaataagttgtatcaggtaa DYS638 9 ttctaatttcagtgctttcaattttc 10 aggtgggtcatgaggtcagt DYS643 11 aagccatgcctggttaaactac 12 accaaacaccacccattcc DYS587 13 cttctttggaaagtagcatttcat 14 aaagtctgacaatgagaagggtttctaagttcagg DYS575 15 cagaggttccagtaagcttagatca 16 cattgatgggctttaggttga DYS578 17 gaggcggaactttcagtgag 18 cagaagtcccctgtgtttcaa DYS632 19 cacagtttcagtcttgcatgg 20 tctgggcaacagaaggagac DYS508 21 acaatggcaatcccaaattc 22 gaacaaataaggtgggatggat DYS640 23 ggaaaaaccatgagatcctgtc 24 aagcccgttcatattttaaagac DYS511 25 tggggtggatgtgtaggtaga 26 tctggttgtgccttagatttga DYS577 27 tttttctacgtgtgtatccactaacc 28 gtgtccccagccctgtta DYS556 29 tcaccaatgacattttacagca 30 ttggttagtgtaatgcatçcag DYS517 31 aactgaccagcaaaaatgttaaa 32 tgtctgagacctacaagattgc DYS565 33 ccaggaagcagtgttgcat 34 gcagttctctgcctgtatgg DYS538 35 ttggggaaaacagatggtgt 36 ccaaatacccatcataggaagaa Y-GATA- 37 cctgccatctctatttatcttgcatata 38 ataaatggagatagtgggtggatt Al 0 DYS570 39 tgtgacatcaaggttatgaaacg 40 ggtgaaaattattcagcatagtcaag DYS549 41 gaaaagaaaagtgtaagccaaacc 42 tttggtggcataagtggtaatg DYS460 43 atcctctgcctatcatttattatgtat 44 gaataccagaggaatctgacacc DYS442 45 tgcaaaatcacggaaccaa 46 caagccactgcaaatgtca DYS510 47 tttttcctcccttaccacaga 48 tctggagaagacagaacttgtca DYS541 49 catcattaattctatctgttcatccat 50 tggataaagaacacctttaagaagc DYS576 51 ccaagcaacatagcaagacct 52 aagcgtatttgtcttggctttt DYS513 53 tgttgtaaaaatgactactgtggtatg 54 ccacatcagcactattacttaactca DYS458 55 tgggtggtggaggttactgt 56 cccaaagttctggcattacaa DYS481 57 aggaatgtggctaacgctgt 58 accagaaggttgcaagactca DYS612 59 cccccatgccagtaagaata 60 tgagggaaggcaaaagaaaa DYS444 61 catagaatgaaaggtgtgaacca 62 tgccattcaaactcacgttg DYS533 63 attcatctaacatctttgtcatctacc 64 ttaacttgcctttttgcatcc Tableau 2 Notons cependant que le locus DYS481 est absent chez le chimpanzé, et que le locus DYS533, même s'il est théoriquement présent sur le génome assemblé du chimpanzé (XXX), il n'a jamais pu être amplifié en phase de test - il est donc considéré comme non amplifié en M2. Par conséquent, dans un mode réalisation, l'échantillon d'ADN est un échantillon d'ADN de chimpanzé et les paires d'amorces ont les séquences nucléiques choisies dans le groupe consistant en: SEQ ID NO : 1 et SEQ ID NO : 2 pour le locus DYS485, SEQ ID NO : 3 et SEQ ID NO : 4 pour le locus DYS588, SEQ ID NO : 5 et SEQ ID NO : 6 pour le locus DYS502, SEQ ID NO : 7 et SEQ ID NO : 8 pour le locus DYS461, SEQ ID NO : 9 et SEQ ID NO : 10 pour le locus DYS638, SEQ ID NO : 11 et SEQ ID NO : 12 pour le locus DYS643, SEQ ID NO : 13 et SEQ ID NO : 14 pour le locus DYS587, SEQ ID NO : 15 et SEQ ID NO : 16 pour le locus DYS575, SEQ ID NO : 17 et SEQ ID NO : 18 pour le locus DYS578, SEQ ID NO : 19 et SEQ ID NO : 20 pour le locus DYS632, SEQ ID NO : 21 et SEQ ID NO : 22 pour le locus DYS508, SEQ ID NO : 23 et SEQ ID NO : 24 pour le locus DYS640, SEQ ID NO : 25 et SEQ ID NO : 26 pour le locus DYS511, SEQ ID NO: 27 et SEQ ID NO : 28 pour le locus DYS577, SEQ ID NO : 29 et SEQ ID NO : 30 pour le locus DYS556, SEQ ID NO : 31 et SEQ ID NO : 32 pour le locus DYS517, SEQ ID NO : 33 et SEQ ID NO : 34 pour le locus DYS565, SEQ ID NO : 35 et SEQ ID NO : 36 pour le locus DYS538, SEQ ID NO : 37 et SEQ ID NO : 38 pour le locus Y-GATA-A10 SEQ ID NO : 39 et SEQ ID NO : 40 pour le locus DYS570, SEQ ID NO : 41 et SEQ ID NO : 42 pour le locus DYS549, SEQ ID NO: 43 et SEQ ID NO: 44 pour le locus DYS460, SEQ ID NO : 45 et SEQ ID NO : 46 pour le locus DYS442 SEQ ID NO : 47 et SEQ ID NO : 48 pour le locus DYS510, SEQ ID NO : 49 et SEQ ID NO : 50 pour le locus DYS541, SEQ ID NO : 51 et SEQ ID NO : 52 pour le locus DYS576, SEQ ID NO: 53 et SEQ ID NO: 54 pour le locus DYS513, SEQ ID NO : 55 et SEQ ID NO : 56 pour le locus DYS458, SEQ ID NO : 59 et SEQ ID NO : 60 pour le locus DYS612 et SEQ ID NO : 61 et SEQ ID NO : 62 pour le locus DYS444.
Dans certains modes de réalisation, les produits d'élongation de la PCR peuvent être détectés grâce à des marqueurs fluorescents conjugués aux amorces d'amplification de la PCR (voir par exemple W02009/059049). Les produits de PCR peuvent également être détectés par d'autres techniques comme par exemple la coloration des produits d'amplification telles que la coloration à l'argent, les radio- isotopes, par chimioluminescence. Des exemples de marqueurs fluorescents sont FAM (5-carboxyfluorescéine, fluorescent dans le bleu), VIC® (fluorescent dans le vert, disponible auprès de Life Techologies), NEDTM (fluorescent dans le jaune disponible auprès de Life Techologies) et PET® (fluorescent dans le rouge disponible auprès de Life Techologies), TET (tétrachlorofluorescéine, fluorescent dans le vert), et HEX (6-carboxy 2,4,7,4,7-hexachiorofluorescéine, fluorescent dans le jaune). Dans un mode de réalisation, le procédé pour caractériser un échantillon d'ADN comprend l'étape de détermination des allèles d'au moins 15 loci de STR choisis dans le groupe Ml.
Les STR du groupe M1 ont un taux de mutation bas à intermédiaire. Leur taux de mutation est compris entre 3,85x1ennut/locus/génération et 3,21x10-mmut/locus/génération (cf. tableau 1). Du fait de leur taux de mutation relativement faible, par rapport aux principaux marqueurs existants comme ceux de l'AmpFISTROYfiler, ces marqueurs permettent une discrimination de profils relativement divergeant, c.à.d. que l'on retrouve à large échelle géographique, par exemple à l'échelle de pays ou de continents. Dans un mode de réalisation, le procédé pour caractériser un échantillon d'ADN comprend l'étape de détermination des allèles de 15, 16, 17 ou 18 loci de STR choisis dans le groupe Ml.
Dans un mode de réalisation préféré, le procédé pour caractériser un échantillon d'ADN comprend l'étape de détermination des allèles des 18 loci de STR du groupe Ml.
Dans un mode de réalisation, le procédé pour caractériser un échantillon comprend l'étape de détermination des allèles d'au moins 11 loci de STR choisis dans le groupe M2 Les STR du groupe M2 ont un taux de mutation élevé. Leur taux de mutation est compris entre 3,32x1emut/locus/génération et 1,45x1e2mut/locus/génération (cf. tableau 1). Du fait de leur taux de mutation élevé, ces marqueurs permettent une discrimination de profils relativement similaires, c.à.d. que l'on retrouve à fine échelle géographique, par exemple à l'échelle d'une région. Dans un mode de réalisation, le procédé pour caractériser un échantillon d'ADN comprend l'étape de détermination des allèles de 11, 12, 13 ou 14 loci de STR choisis dans le groupe M2. 10 Dans un autre mode de réalisation préféré, le procédé pour caractériser un échantillon d'ADN comprend l'étape de détermination des allèles des 14 loci de STR du groupe M2. Dans un mode de réalisation, le procédé pour caractériser un échantillon d'ADN comprend une 15 étape de détermination des allèles : -d'au moins 10 loci de STR choisis dans le groupe Ml, et/ou -d'au moins 10 loci de STR choisis dans le groupe M2. 20 Dans un mode de réalisation préféré, les loci dont les allèles sont déterminés sont au moins DYS485, DYS588, DYS461, DYS638, DYS643, DYS587, DYS517, DYS508, DYS511 et DYS565 pour le groupe M1 et/ou au moins DYS570, DYS510, DYS541, DYS576, DYS458, DYS481, DYS612, DYS460, DYS442, DYS513 et DYS444 pour le groupe M2. Plus préférablement, les loci dont les allèles sont déterminés sont au moins DYS485, DYS588, 25 DYS461, DYS638, DYS643, DYS587, DYS517, DYS508, DYS511, DYS565, DYS578, DYS556 et DYS538 pour le groupe M1 et/ou au moins DYS570, DYS510, DYS541, DYS576, DYS458, DYS481, DYS612, DYS460, DYS442, DYS513 et DYS444 pour le groupe M2. Dans un mode de réalisation, le procédé pour caractériser un échantillon d'ADN comprend une 30 étape de détermination des allèles : -de 10, 11, 12, 13, 14, 15, 16, 17 ou 18 loci STR choisis dans le groupe Ml, et/ou -de 10, 11, 12, 13 ou 14 loci STR choisis dans le groupe M2. 35 Dans un mode de réalisation préféré, le procédé pour caractériser un échantillon d'ADN comprend une étape de détermination des allèles des 18 loci STR du groupe M1 et des 14 loci STR du groupe M2. La combinaison des deux ensembles M1 et M2 permet d'obtenir des profils génétiques très 40 informatifs, renseignant aussi bien sur les liens existants entre individus peu comme fortement apparentés.
Il est également intéressant d'utiliser l'ensemble des loci des groupes M1 et M2 dans des populations à faible diversité génétique. Par exemple, chez les chimpanzés, cette espèce ayant subi d'importantes réductions d'effectifs, sa diversité génétique s'est grandement affaiblie. Par conséquent, l'utilisation de l'ensemble des marqueurs permettra une discrimination maximale très utile sur ce type de population à faible diversité génétique. Le procédé pour caractériser un échantillon d'ADN peut être réalisé sur un échantillon dont le sexe n'a pas été déterminé au préalable. Dans ce cas, étant donné que ce procédé est basé sur des marqueurs masculins, il ne donnera des résultats que si l'échantillon provient d'un mâle. De préférence, le procédé pour caractériser un échantillon d'ADN est utilisé sur un échantillon dont il est connu qu'il provient d'un mâle. Selon un mode de réalisation, _le procédé pour caractériser un échantillon d'ADN peut comprendre en outre une étape de détermination du sexe du sujet dont provient l'échantillon d'ADN.
Des procédés de détermination du sexe d'un sujet sont connus. La plupart de ces procédés reposent sur l'amplification du gène de l'amélogénine sur X et Y (cf. Sullivan et al. 1993, Ensminger et Hoffman 2002). De tels procédés sont disponibles dans le commerce via des kits tels que le PowerPlexl6 (Promega) et l'AnnpF/STR Identifiler (Life technologies). Plus rares, il existe également des procédés de détermination du sexe reposant sur l'amplification de deux loci distincts sur les chromosomes sexuels (i.e. DXS8378, DXS6803 sur le chromosome X et SRY sur le chromosome Y). Selon un mode de réalisation, l'étape de détermination du sexe d'un échantillon d'ADN qui comprend une étape d'amplification des gènes SRY, UTY et UTX de l'échantillon d'ADN. Ce procédé pour déterminer le sexe d'un sujet permet, outre l'identification du sexe, d'évaluer indirectement le profil de dégradation de l'échantillon d'ADN masculin étudié. En effet, les 3 marqueurs ayant des tailles de 81 (SRY), 91 (UTY) et 120 (UTX) bp lorsque l'échantillon provient d'un homme ou d'un chimpanzé, l'amplification décroissante de ces 3 marqueurs nous renseigne sur le degré de fragmentation de l'échantillon. Ceci est particulièrement intéressant lorsqu'on utilise ce procédé de détermination du sexe avant de déterminer le profil génétique d'un sujet de manière plus poussée.
Ainsi, en procédant au préalable à cette étape, on peut rapidement évaluer si l'échantillon est apte à être analysé ou pas.
De plus, parfois, le sexage d'un échantillon préalable à la détermination d'un profil génétique d'un individu échoue. Ainsi, certains échantillons identifiés comme féminins, sont, en fait, des échantillons masculins pour lesquels le sexage a échoué. Combiner la détermination d'un profil génétique d'un individu avec un outil de sexage permet de valider le sexage effectué préalablement à la détermination de l'empreinte génétique. Dans un mode de réalisation, l'étape d'amplification des gènes SRY, UTY et UTX comprend l'ajout de paires d'amorces ayant les séquences nucléiques: SEQ ID NO: 65 et SEQ ID NO: 66 pour SRY, SEQ ID NO: 67 et SEQ ID NO: 68 pour UTY et SEQ ID NO: 67 et SEQ ID NO: 69 pour UTX. Marqueur Amorce sens Amorce anti-sens Longueur amplifiée (bp) SEO Séquence (5'-3') SEQ ID NO Séquence (5'-3') ID NO SRY 65 gcgaaactcagagatcagcaag 66 tgtgcctcctggaagaatgg 81 UTY 67 cagtgttaccagccttaacag 68 ggcaggtctacttttgtagag 91 UTX 69 tctgtggactaggtttgtggt 120 Tableau 3 Kit pour caractériser un échantillon d'ADN La présente invention concerne également un kit comprenant des moyens pour déterminer les allèles d'au moins 10 loci STR d'un échantillon d'ADN humain ou de chimpanzé, tes loci étant 25 choisis dans le groupe M1 et/ou le groupe M2, dans lequel : -le groupe M1 consiste en : DYS485, DYS588, DYS502, DYS461, DYS638, DYS643, DYS587, DYS575, DYS578, DYS632, DYS508, DYS640, DYS511, DYS577, DYS556, DYS517, DYS565 et DYS538 et 30 -le groupe M2 consiste en : Y-GATA-A10, DYS570, DYS549, DYS460, DYS442, DYS510, DYS541, DYS576, DYS513, DYS458, DYS481, DYS612, DYS444 et DYS533. 20 Typiquement, le kit comprend les moyens pour déterminer les allèles de 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 ou 32 loci STR.
Dans un mode de réalisation préféré, le kit comprend au moins 10 paires d'amorces adaptées pour amplifier les loci de STR, les loci étant choisis dans le groupe M1 et/ou le groupe M2. Typiquement, le kit comprend 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24,25, 26, 27, 28, 29, 30, 31 ou 32 paires d'amorces.
Dans un mode de réalisation, l'échantillon d'ADN est un échantillon d'ADN humain ou de chimpanzé et les au moins 10 paires d'amorces ont les séquences nucléiques choisies dans le groupe consistant en : SEQ ID NO : 1 et SEQ ID NO : 2 pour le locus DYS485, SEQ ID NO : 3 et SEQ ID NO : 4 pour le locus DYS588, SEQ ID NO : 5 et SEQ ID NO : 6 pour le locus DYS502, SEQ ID NO : 7 et SEQ ID NO : 8 pour le locus DYS461, SEQ ID NO : 9 et SEQ ID NO : 10 pour le locus DYS638, SEQ ID NO : 11 et SEQ ID NO : 12 pour le locus DYS643, SEQ ID NO : 13 et SEQ ID NO : 14 pour le locus DYS587, SEQ ID NO : 15 et SEQ ID NO : 16 pour le locus DYS575, SEQ ID NO : 17 et SEQ ID NO : 18 pour le locus DYS578, SEQ ID NO : 19 et SEQ ID NO : 20 pour le locus DYS632, SEQ ID NO : 21 et SEQ ID NO : 22 pour le locus DYS508, SEQ ID NO : 23 et SEQ ID NO : 24 pour le locus DYS640, SEQ ID NO : 25 et SEQ ID NO : 26 pour le locus DYS511, SEQ ID NO: 27 et SEQ ID NO : 28 pour le locus DYS577, SEQ ID NO : 29 et SEQ ID NO : 30 pour le locus DYS556, SEQ ID NO : 31 et SEQ ID NO : 32 pour le locus DYS517, SEQ ID NO : 33 et SEQ ID NO : 34 pour le locus DYS565, SEQ ID NO : 35 et SEQ ID NO : 36 pour le locus DYS538, SEQ ID NO : 37 et SEQ ID NO : 38 pour le locus Y-GATA-A10 SEQ ID NO : 39 et SEQ ID NO : 40 pour le locus DYS570, SEQ ID NO : 41 et SEQ ID NO : 42 pour le locus DYS549, SEQ ID NO : 43 et SEQ ID NO : 44 pour le locus DYS460, SEQ ID NO : 45 et SEQ ID NO : 46 pour le locus DYS442 SEQ ID NO : 47 et SEQ ID NO : 48 pour le locus DYS510, SEQ ID NO : 49 et SEQ ID NO : 50 pour le locus DYS541, SEQ ID NO : 51 et SEQ ID NO : 52 pour le locus DYS576, SEQ ID NO : 53 et SEQ ID NO : 54 pour le locus DYS513, SEQ ID NO : 55 et SEQ ID NO : 56 pour le locus DYS458, SEQ ID NO : 57 et SEQ ID NO : 58 pour le locus DYS481 SEQ ID NO : 59 et SEQ ID NO : 60 pour le locus DYS612, SEQ ID NO : 61 et SEQ ID NO : 62 pour le locus DYS444 et SEQ ID NO : 63 et SEQ ID NO : 64 pour le locus DYS533.
Dans un mode de réalisation, l'échantillon d'ADN est un échantillon d'ADN de chimpanzé et les au moins 10 paires d'amorces ont les séquences nucléiques choisies dans le groupe consistant en : SEQ ID NO : 1 et SEQ ID NO : 2 pour le locus DYS485, SEQ ID NO : 3 et SEQ ID NO : 4 pour le locus DYS588, SEQ ID NO : 5 et SEQ ID NO : 6 pour le locus DYS502, SEQ ID NO : 7 et SEQ ID NO : 8 pour le locus DYS461, SEQ ID NO : 9 et SEQ ID NO : 10 pour le locus DYS638, SEQ ID NO : 11 et SEQ ID NO : 12 pour le locus DYS643, SEQ ID NO : 13 et SEQ ID NO : 14 pour le locus DYS587, SEQ ID NO : 15 et SEQ ID NO : 16 pour le locus DYS575, SEQ ID NO : 17 et SEQ ID NO : 18 pour le locus DYS578, SEQ ID NO : 19 et SEQ ID NO : 20 pour le locus DYS632, SEQ ID NO : 21 et SEQ ID NO : 22 pour le locus DYS508, SEQ ID NO : 23 et SEQ ID NO : 24 pour le locus DYS640, SEQ ID NO : 25 et SEQ ID NO : 26 pour le locus DYS511, SEQ ID NO: 27 et SEQ ID NO : 28 pour le locus DYS577, SEQ ID NO : 29 et SEQ ID NO : 30 pour le locus DYS556, SEQ ID NO : 31 et SEQ ID NO : 32 pour le locus DYS517, SEQ ID NO : 33 et SEQ ID NO : 34 pour le locus DYS565, SEQ ID NO : 35 et SEQ ID NO : 36 pour le locus DYS538, SEQ ID NO : 37 et SEQ ID NO : 38 pour le locus Y-GATA-A10 SEQ ID NO : 39 et SEQ ID NO : 40 pour le locus DYS570, SEQ ID NO : 41 et SEQ ID NO : 42 pour le locus DYS549, SEQ ID NO : 43 et SEQ ID NO : 44 poule locus DYS460, SEQ ID NO : 45 et SEQ ID NO : 46 pour le locus DYS442 SEQ ID NO : 47 et SEQ ID NO : 48 pour le locus DYS510, SEQ ID NO : 49 et SEQ ID NO : 50 pour le locus DYS541, SEQ ID NO : 51 et SEQ ID NO : 52 pour le locus DYS576, SEQ ID NO : 53 et SEQ ID NO : 54 pour le locus DYS513, SEQ ID NO : 55 et SEQ ID NO : 56 pour le locus DYS458, SEQ ID NO : 59 et SEQ ID NO : 60 pour le locus DYS612 et SEQ ID NO : 61 et SEQ ID NO : 62 pour le locus DYS444.
SECTION M1 Dans un mode de réalisation, le kit comprend des moyens pour déterminer les allèles d'au moins 15 loci de STR choisis dans le groupe Ml.
Dans ce mode de réalisation, le kit comprend des moyens pour déterminer les allèles de 15, 16, 17 ou 18 loci choisis dans le groupe Ml. Dans un mode de réalisation préféré, le kit comprend des moyens pour déterminer les allèles des 18 loci du groupe Ml.
Dans un mode de réalisation préféré, le kit comprend des moyens pour déterminer les allèles d'au moins les loci DYS485, DYS588, DYS461, DYS638, DYS643, DYS587, DYS517, DYS508, DYS511 et DYS565, plus préférablement d'au moins les loci DYS485, DYS588, DYS461, DYS638, DYS643, DYS587, DYS517, DYS508, DYS511, DYS565, DYS578, DYS556 et DYS538. Dans un mode de réalisation préféré, le kit comprend les paires d'amorces ayant les séquences nucléiques : SEQ ID NO : 1 et SEQ ID NO : 2 pour le locus DYS485, SEQ ID NO : 3 et SEQ ID NO : 4 pour le locus DYS588, SEQ ID NO : 5 et SEQ ID NO : 6 pour le locus DYS502, SEQ ID NO : 7 et SEQ ID NO : 8 pour le locus DYS461, SEQ ID NO : 9 et SEQ ID NO : 10 pour le locus DYS638, SEQ ID NO : 11 et SEQ ID NO : 12 pour le locus DYS643, SEQ ID NO : 13 et SEQ ID NO : 14 pour le locus DYS587, SEQ ID NO : 15 et SEQ ID NO : 16 pour le locus DYS575, SEQ ID NO : 17 et SEQ ID NO : 18 pour le locus DYS578, SEQ ID NO : 19 et SEQ ID NO : 20 pour le locus DYS632, SEQ ID NO : 21 et SEQ ID NO : 22 pour le locus DYS508, SEQ ID NO :_23 et SEQ ID NO : 24 pour le locus DYS640, SEQ ID NO : 25 et SEQ ID NO : 26 pour le locus DYS511, SEQ ID NO: 27 et SEQ ID NO : 28 pour le locus DYS577, SEQ ID NO : 29 et SEQ ID NO : 30 pour le locus DYS556, SEQ ID NO : 31 et SEQ ID NO : 32 pour le locus DYS517, SEQ ID NO : 33 et SEQ ID NO : 34 pour le locus DYS565 et SEQ ID NO : 35 et SEQ ID NO : 36 pour le locus DYS538. Ces paires d'amorces correspondent aux paires d'amorces adaptées pour amplifier les loci de STR du groupe M1. Elles peuvent être utilisées tant pour un échantillon d'ADN humain que pour un échantillon d'ADN de chimpanzé. Les STR du groupe M1 ont un taux de mutation bas à intermédiaire. Ces marqueurs permettent une discrimination de profils relativement divergeant. SECTION M2 Dans un mode de réalisation, le kit comprend des moyens pour déterminer les allèles d'au moins 11 loci de STR choisis dans le groupe M2. Dans ce mode de réalisation, le kit comprend des moyens pour déterminer les allèles de 11, 12, 13 ou 14 loci choisis dans le groupe M2. Dans un autre mode de réalisation préféré, le kit comprend des moyens pour déterminer les allèles des 14 loci du groupe M2.
Dans un mode de réalisation préféré, le kit comprend des moyens pour déterminer les allèles d'au moins les loci DYS570, DYS510, DYS541, DYS576, DYS458, DYS481, DYS612, DYS460, DYS442, DYS513 et DYS444. Dans un mode de réalisation préféré, l'échantillon d'ADN est un échantillon d'ADN humain ou de chimpanzé et le kit comprend les paires d'amorces ayant les séquences nucléiques: SEQ ID NO : 37 et SEQ ID NO : 38 pour le locus Y-GATA-A10 SEQ ID NO : 39 et SEQ ID NO : 40 pour le locus DYS570, SEQ ID NO : 41 et SEQ ID NO : 42 pour le locus DYS549, SEQ ID NO : 43 et SEQ ID NO : 44 pour le locus DYS460, SEQ ID NO : 45 et SEQ ID NO : 46 pour le locus DYS442 SEQ ID NO : 47 et SEQ ID NO : 48 pour le locus DYS510, SEQ ID NO : 49 et SEQ ID NO : 50 pour le locus DYS541, SEQ ID NO : 51 et SEQ ID NO : 52 pour le locus DYS576, SEQ ID NO : 53 et SEQ ID NO : 54 pour le locus DYS513, SEQ ID NO : 55 et SEQ ID NO : 56 pour le locus DYS458, SEQ ID NO : 57 et SEQ ID NO : 58 pour le locus DYS481 SEQ ID NO : 59 et SEQ ID NO : 60 pour le locus DYS612, SEQ ID NO : 61 et SEQ ID NO : 62 pour le locus DYS444 et SEQ ID NO : 63 et SEQ ID NO : 64 pour le locus DYS533. Les STRs du groupe M2 ont un taux de mutation élevé. Ces marqueurs permettent une discrimination de profils à plus fine échelle, par exemple à l'échelle d'une région.
Dans un autre mode de réalisation, l'échantillon d'ADN est un échantillon d'ADN de chimpanzé et le kit comprend les paires d'amorces ayant les séquences nucléiques: SEQ ID NO : 37 et SEQ ID NO : 38 pour le locus Y-GATA-A10 SEQ ID NO : 39 et SEQ ID NO : 40 pour le locus DYS570, SEQ ID NO : 41 et SEQ ID NO : 42 pour le locus DYS549, SEQ ID NO : 43 et SEQ ID NO : 44 pour le locus DYS460, SEQ ID NO : 45 et SEQ ID NO : 46 pour le locus DYS442 SEQ ID NO : 47 et SEQ ID NO : 48 pour le locus DYS510, SEQ ID NO : 49 et SEQ ID NO : 50 pour le locus DYS541, SEQ ID NO : 51 et SEQ ID NO : 52 pour le locus DYS576, SEQ ID NO : 53 et SEQ ID NO : 54 pour le locus DYS513, SEQ ID NO : 55 et SEQ ID NO : 56 pour le locus DYS458, SEQ ID NO : 59 et SEQ ID NO : 60 pour le locus DYS612 et SEQ ID NO : 61 et SEQ ID NO : 62 pour le locus DYS444.
SECTION M1 et M2 Dans un mode de réalisation, le kit comprend des moyens pour déterminer les allèles : - d'au moins 10 loci STR choisis dans le groupe M1 - d'au moins 10 loci STR choisis dans le groupe M2. Dans ce mode de réalisation, le kit comprend des moyens pour déterminer les allèles: - de 10, 11, 12, 13, 14, 15, 16, 17 ou 18 loci STR choisis dans le groupe M1 25 et - de 10, 11, 12, 13 ou 14 loci STR choisis dans le groupe M2. Dans un mode de réalisation préféré, le kit comprend des moyens pour déterminer les 18 loci de STR du groupe M1 et les 14 loci de STR du groupe M2. 30 Dans un mode de réalisation préféré, l'échantillon d'ADN est un échantillon d'ADN humain ou de chimpanzé et le kit comprend les paires d'amorces ayant les séquences nucléiques: SEQ ID NO : 1 et SEQ ID NO : 2 pour le locus DYS485, SEQ ID NO : 3 et SEQ ID NO : 4 pour le locus DYS588, 35 SEQ ID NO : 5 et SEQ ID NO : 6 pour le locus DYS502, SEQ ID NO : 7 et SEQ ID NO : 8 pour le locus DYS461, SEQ ID NO : 9 et SEQ ID NO : 10 pour le locus DYS638, SEQ ID NO : 11 et SEQ ID NO : 12 pour le locus DYS643, SEQ ID NO : 13 et SEQ ID NO : 14 pour le locus DYS587, 40 SEQ ID NO : 15 et SEQ ID NO : 16 pour le locus DYS575, SEQ ID NO : 17 et SEQ ID NO : 18 pour le locus DYS578, et SEQ ID NO : 19 et SEQ ID NO : 20 pour le locus DYS632, SEQ ID NO : 21 et SEQ ID NO : 22 pour le locus DYS508, SEQ ID NO : 23 et SEQ ID NO : 24 pour le locus DYS640, SEQ ID NO : 25 et SEQ ID NO : 26 pour le locus DYS511, SEQ ID NO: 27 et SEQ ID NO : 28 pour le locus DYS577, SEQ ID NO : 29 et SEQ ID NO : 30 pour le locus DYS556, SEQ ID NO : 31 et SEQ ID NO : 32 pour le locus DYS517, SEQ ID NO : 33 et SEQ ID NO : 34 pour le locus DYS565, SEQ ID NO : 35 et SEQ ID NO : 36 pour le locus DYS538, SEQ ID NO : 37 et SEQ ID NO : 38 pour le locus Y-GATA-A1 0 SEQ ID NO : 39 et SEQ ID NO : 40 pour le locus DYS570, SEQ ID NO : 41 et SEQ ID NO : 42 pour le locus DYS549, SEQ ID NO : 43 et SEQ ID NO : 44 pour le locus DYS460, 1'5 SEQ ID NO : 45 et SEQ ID NO : 46 pour le locus DYS442 SEQ ID NO : 47 et SEQ ID NO : 48 pour le locus DYS510, SEQ ID NO : 49 et SEQ ID NO : 50 pour le locus DYS541, SEQ ID NO : 51 et SEQ ID NO : 52 pour le locus DYS576, SEQ ID NO : 53 et SEQ ID NO : 54 pour le locus DYS513, 20 SEQ ID NO : 55 et SEQ ID NO : 56 pour le locus DYS458, SEQ ID NO : 57 et SEQ ID NO : 58 pour le locus DYS481 SEQ ID NO : 59 et SEQ ID NO : 60 pour le locus DYS612, SEQ ID NO : 61 et SEQ ID NO : 62 pour le locus DYS444 et SEQ ID NO : 63 et SEQ ID NO : 64 pour le locus DYS533. 25 Dans un autre mode de réalisation, l'échantillon d'ADN est un échantillon d'ADN de chimpanzé et le kit comprend les paires d'amorces ayant les séquences nucléiques: SEQ ID NO : 1 et SEQ ID NO : 2 pour le locus DYS485, SEQ ID NO : 3 et SEQ ID NO : 4 pour le locus DYS588, 30 SEQ ID NO : 5 et SEQ ID NO : 6 pour le locus DYS502, SEQ ID NO : 7 et SEQ ID NO : 8 pour le locus DYS461, SEQ ID NO : 9 et SEQ ID NO : 10 pour le locus DYS638, SEQ ID NO : 11 et SEQ ID NO : 12 pour le locus DYS643, SEQ ID NO : 13 et SEQ ID NO : 14 pour le locus DYS587, 35 SEQ ID NO : 15 et SEQ ID NO : 16 pour le locus DYS575, SEQ ID NO : 17 et SEQ ID NO : 18 pour le locus DYS578, SEQ ID NO : 19 et SEQ ID NO : 20 pour le locus DYS632, SEQ ID NO : 21 et SEQ ID NO : 22 pour le locus DYS508, SEQ ID NO : 23 et SEQ ID NO : 24 pour le locus DYS640, 40 SEQ ID NO : 25 et SEQ ID NO : 26 pour le locus DYS511, SEQ ID NO: 27 et SEQ ID NO : 28 pour le locus DYS577, SEQ ID NO : 29 et SEQ ID NO : 30 pour le locus DYS556, SEQ ID NO : 31 et SEQ ID NO : 32 pour le locus DYS517, SEQ ID NO : 33 et SEQ ID NO : 34 pour le locus DYS565, SEQ ID NO : 35 et SEQ ID NO : 36 pour le locus DYS538, SEQ ID NO : 37 et SEQ ID NO : 38 pour le locus Y-GATA-A10 SEQ ID NO : 39 et SEQ ID NO : 40 pour le locus DYS570, SEQ ID NO : 41 et SEQ ID NO : 42 pour le locus DYS549, SEQ ID NO : 43 et SEQ ID NO : 44 pour le locus DYS460, SEQ ID NO: 45 et SEQ ID NO: 46 pour le locus DYS442 SEQ ID NO : 47 et SEQ ID NO : 48 pour le locus DYS510, SEQ ID NO : 49 et SEQ ID NO : 50 pour le locus DYS541, SEQ ID NO : 51 et SEQ ID NO : 52 pour le locus DYS576, SEQ ID NO : 53 et SEQ ID NO : 54 pour le locus DYS513, SEQ ID NO : 55 et SEQ ID NO : 56 pour le locus DYS458, SEQ ID NO : 59 et SEQ ID NO : 60 pour le locus DYS612 et SEQ ID NO : 61 et SEQ ID NO : 62 pour le locus DYS444. Dans un mode réalisation, le kit comprend, en outre, des moyens de détermination du sexe, dans lequel les moyens de détermination du sexe consistent en des moyens d'amplification des gènes SRY, UTY et UTX. Dans un mode de réalisation, les moyens d'amplification des gènes SRY, UTY et UTX comprennent les paires d'amorces ayant les séquences nucléiques : SEQ ID NO: 65 et SEQ ID NO: 66 pour SRY, SEQ ID NO: 67 et SEQ ID NO: 68 pour UTY et SEQ ID NO: 67 et SEQ ID NO: 69 pour UTX.
Outil de sexage: La présente invention concerne également un procédé pour déterminer le sexe d'un échantillon d'ADN.
Le 1er outil moléculaire développé chez les humains pour l'identification du sexe est le test de l'amélogénine. Ce test repose sur l'utilisation d'une seule paire d'amorces PCR capable de co-amplifier des fragments d'ADN à la fois sur les gènes d'amélogénine des chromosomes X et Y, qui chez les humains différent de 6 bp dans l'intron 1. Cette différence de taille est généralement résolue par électrophorèse capillaire, révélant un seul pic pour les femelles (XX) et un double pic pour les mâles (XY). Cette méthode est aujourd'hui le standard utilisé pour la détermination du sexe en médecine légale et en génétique des populations ; ce test est inclus dans 2 kits notamment PowerPlexl6 (Promega) et l'AmpF/STR Indentifiler (Life technologies). Néanmoins, malgré son utilisation sur le long terme, cet essai de typage du sexe n'est pas entièrement fiable. Beaucoup d'études ont reporté une détermination du sexe erronée car le locus AMELY n'a pas pu être amplifié. Deux causes sont impliquées : une mutation dans le site de liaison de l'amorce et/ou la délétion du locus, spécialement chez les populations chinoises. Le système AMELX/AMELY a aussi été modifié pour réaliser une détermination du sexe chez des primates non humains. Il a été appliqué avec suçcès chez des primates de parenté proche de l'humain mais ne fonctionne pas sur des espèces de parenté lointaine comme les orangs outangs ou les babouins. A cause de l'impossibilité de généraliser l'utilisation d'amélogénine chez les primates non humains, plusieurs méthodes alternatives ont été développées. Pour la plupart d'entre elles des fragments liés au X et Y ont été inclus en plus du test AMELX/AMELY. Cependant la plupart de ces procédés de typage ont été basés sur des références humaines et malgré une amplification positive chez les grands singes grâce leur proche parenté, ils ne fonctionnent pas chez des espèces de primates plus éloignées.
En dehors des essais AMELX/AMELY, une récente étude a identifié le locus UTX/UTY comme un meilleur système candidat pour un marqueur de sexage universel des primates en comparant les données génomiques de plusieurs mammifères. Ce test de sexage donne des résultats positifs sur les babouins et les orangs-outans. Cependant, il présente un risque d'erreur dû aux importantes variations structurales existant sur le chromosome Y et à la probabilité associée d'une amplification nulle de l'allèle Y. Lorsque un locus cible Y ne peut pas être amplifié, cela peut entraîner une mauvaise identification du sexe. La présente invention concerne également un procédé pour déterminer le sexe d'un échantillon d'ADN qui comprend une étape d'amplification des gènes SRY, UTY et UTX de l'échantillon 25 d'ADN. L'amplification d'UTX uniquement, en l'absence de SRY et UTY indique que l'échantillon d'ADN provient d'un sujet de sexe féminin. L'amplification des 3 marqueurs, UTY, SRY et UTX indique que l'échantillon d'ADN provient 30 d'un sujet de sexe masculin. L'amplification de 2 marqueurs, UTY, et UTX, en l'absence de SRY, indique que l'échantillon d'ADN provient d'un sujet de sexe masculin, mais qu'il existe une mutation sur le site d'hybridation des amorces SRY, ou une délétion de ce gène, ne permettant pas son amplification (cas fréquent qui est souvent population spécifique'). 35 L'amplification de 2 marqueurs, SRY, et UTX, en l'absence de UTY, indique que l'échantillon d'ADN provient d'un sujet de sexe masculin, mais qu'il existe une mutation sur le site d'hybridation des amorces UTY, ou une délétion de ce gène, ne permettant pas son amplification (cas fréquent qui est souvent population spécifique').
Le procédé de typage du sexe selon l'invention, est applicable permet d'empêcher les mauvaises identifications du sexe. De plus, il est facilement applicable pour un large spectre de qualité d'ADN.
Ce procédé pour déterminer le sexe d'un sujet permet, outre l'identification du sexe, d'évaluer indirectement le profil de dégradation de l'échantillon d'ADN masculin étudié. En effet, les 3 marqueurs ayant des tailles respectives de 81 (SRY), 91 (UTY) et 120 (UTX) bp pour l'outil de sexage humains et chimpanzés et de 91(UTY), 120 (UTX) et 165 (SRY) pour l'outil de sexage tous primates, l'amplification décroissante (voire nulle) de ces 3 marqueurs nous renseigne sur le degré de fragmentation de l'échantillon. Ceci est particulièrement intéressant lorsqu'on utilise ce procédé de détermination du sexe avant de déterminer le profil génétique d'un sujet de manière plus poussée.
Ainsi, en procédant au préalable à cette étape, on peut rapidement évaluer si l'échantillon est apte à être analysé ou pas. Dans un mode de réalisation préféré, l'étape d'amplification des gènes SRY, UTY et UTX est l'amplification de fragments de 80 à 250 paires de bases d'un exon de SRY, de UTX et de 20 UTY. Les exons étant des parties codantes, il y a plus de chance qu'elles restent conservées à travers le temps chez la même espèce mais aussi entre espèces. 25 Le fragment amplifié peut notamment être compris entre 80 et 250 paires de bases, 80 et 200 paires de bases ou 80 et 150 paires de bases. La présente invention concerne également un kit pour déterminer le sexe d'un échantillon d'ADN dans lequel les moyens de détermination du sexe comprennent des moyens 30 d'amplification des gènes SRY, UTY et UTX. Outil de sexage de 'Tous Primates': Selon un mode de réalisation de ce procédé, l'échantillon d'ADN est un échantillon d'ADN 35 appartenant à l'ordre des primates. L'échantillon d'ADN peut par exemple provenir d'un humain (Homo sapiens), de Pan sp., Gorilla sp., Pongo sp. Hylobates sp.,Cercopithecus sp.,Erythrocebus patas, Cercocebus torquatus, Mandrillus sphinx, Lophocebus albigena, Papio sp., Macaca sp., Alouatta caraya, 40 Sa'frniri sciureus, Cebus apella, Aotus trivirgatus, Callithrix jacchus, Hapalemur sp., Eulemur sp., Microcebus sp., Lepilemur sp., Avahi sp., Propithecus sp., Lemur sp., Indri indri.
En particulier, l'échantillon d'ADN peut provenir de Homo sapiens, Pan troglodytes troglodytes'Pan paniscus, Gorilla gorilla, Pongo pygmaeus pygmaeus, Hylobates lar, Cercopithecus cephus, Cercopithecus nictitans, Erythrocebus patas, Cercocebus torquatus, Mandrillus sphinx, Lophocebus albigena, Macaca mulatta, Macaca sylvanus, Alouatta caraya, Aotus trivirgatus, Saïmiri sciureus, Cebus apella, Callithrix jacchus, Lepilemur dorsalis, Lepilemur sahamalazensis, Lepilemur ankaranensis, Lepilemur mittermeieri, Lepilemur ruficaudatus, Lepilemur aeeclis, Microcebus murinus, Hapalemur griseus ranomafanensis, Hapalemur griseus meridionalis, Hapalemur griseus occidentalis, Hapalemur griseus griseus, Hapalemur aureus, Hapalemur simus, Eulemur macaco macaco, Eulemur macaco flavifrons, Lemur catta, Propithecus diadem ma edwardsi, Propithecus tattersalli, Propithecus verreauxi coquerelli, Propithecus verreauxi verreauxi, Propithecus verreauxi deckeni, Propithecus diademma diademma, Avahi laniger, Avahi occidentalis, Avahi cleesei, Indri indri. Dans un mode de réalisation, l'étape d'amplification des gènes SRY, UTY et UTX est l'amplification de fragments de 100 à 250 paires de bases d'un exon de SRY, de UTX et de UTY. Dans un mode de réalisation, l'étape d'amplification des gènes comprend l'ajout de paires d'amorces ayant les séquences nucléiques: SEQ ID NO: 70 et SEQ ID NO: 66 pour SRY, SEQ ID NO: 67 et SEQ ID NO: 68 pour UTY et SEQ ID NO: 67 et SEQ ID NO: 69 pour UTX.
Les séquences des amorces des différents modes de réalisation préférés du procédé de détermination du sexe sont données dans le tableau 4 ci-dessous. Marqueur Amorce sens Amorce anti-sens Longueur amplifiée (bp) SEQ ID Séquence (5'-3') SEQ ID Séquence (5'-3') NO NO SRY 70 agtgaagcgacccatgaacg 66 tgtgcctcctggaagaatgg 165 UTY 67 cagtgttaccagccttaacag 68 ggcaggtctacttttgtagag 91 UTX 69 tctgtggactaggtttgtggt 120 Tableau 4 Dans un mode de réalisation, le kit est un kit pour déterminer le sexe d'un échantillon d'ADN de primate et les moyens d'amplification des gènes SRY, UTY et UTX comprennent les paires d'amorces ayant les séquences nucléiques: SEQ ID NO: 70 et SEQ ID NO: 66 pour SRY, SEQ ID NO: 67 et SEQ ID NO: 68 pour UTY et SEQ ID NO: 67 et SEQ ID NO: 69 pour UTX.
Typiquement, les amorces s'hybrident dans des conditions stringentes. Par exemple, pour des amorces de 15 à 25 bp, des conditions stringentes sont une température de 55°C dans du tampon ou de 51 °C dans ce même tampon pour des échantillons de prosimiens. Le tampon peut par exemple être composé de Multiplex PCR Master mix 2X comprenant des concentrations optimisées (c'est eux qui le disent !!) de HotStarTaq® Plus DNA Polymerase, MgCl2, et dNTPs Mix (dATP, dCTP, dGTP, dTTP ultrapure quality) et Multiplex PCR Plus Buffer (contains 6 mM MgCl2; pH 8.7), Q-solution 5X, CoralLoad Dye 10X, RNase-free water ultra-pure quality, PCR-grade comme dans le kit QIAGEN Multiplex PCR Plus Kit (réf : 206152).
Outil de sexage humains et chimpanzés : Selon un mode de réalisation de ce procédé, l'échantillon d'ADN est un échantillon d'ADN humain ou de chimpanzé.
Selon un mode de réalisation de ce procédé pour déterminer le sexe d'un échantillon d'ADN, l'échantillon d'ADN provient d'un humain ou d'un chimpanzé et l'étape d'amplification des gènes comprend l'ajout de paires d'amorces choisies dans le groupe consistant en: - pour SRY : -une amorce sens entre 15 et 25 paires de bases s'hybridant entre les bases 2 655 350 et 2 655 400, de préférence entre les bases 2 655 365 et 2 655 395, de manière plus préférée entre les bases 2 655 369 et 2 655 390 du brin négatif du chromosome Y humain et -une amorce anti-sens entre 15 et 25 paires de bases s'hybridant entre les bases 2655 295 et 2 655 340 de préférence entre les bases 2655 300 et 2 655 325, de manière plus préférée entre les bases 2655 304 et 2 655 323 du brin positif du chromosome Y humain, -une amorce sens entre 15 et 25 paires de bases s'hybridant entre les bases 26 202 990et 26 203 035, de préférence entre les bases 26 202 995 et 26 203 030, de manière plus préférée entre les bases 26 203 002 et 26203023du brin positif du chromosome Y de chimpanzé et -une amorce anti-sens entre 15 et 25 paires de bases s'hybridant entre les bases 26 203 055 et 26 203 105 de préférence entre les bases 26 203 060 et 26 203 095, de manière plus préférée entre les bases 26 203 069 et 26 203 088 du brin négatif du chromosome Y de chimpanzé, -pour UTX : -une amorce sens entre 15 et 25 paires de bases s'hybridant entre les bases 44 929 400 et 44 929 450, de préférence entre les bases 44 929 415 et 44 929 440, de manière plus préférée entre les bases 44 929 417 et 44 929 437 du brin positif du chromosome X humain et -une amorce anti-sens entre 15 et 25 paires de bases s'hybridant entre les bases 44 929 505 et 44 929 555, de préférence entre les bases 44 929 515 et 44 929 550, de manière plus préférée entre les bases 44 929 521 et 44 929 541du brin négatif du chromosome X humain, -une amorce sens entre 15 et 25 paires de bases s'hybridant entre les bases 45 534 530 et 45 534 580, de préférence entre les bases 45 534 535 et 45 534 570, de manière plus préférée entre les bases 45 534 544 et 45 534 564 du brin positif du chromosome X de chimpanzé et -une amorce anti-sens entre 15 et 25 paires de bases s'hybridant entre les bases 45 534 630 et 45 534 800, de préférence entre les bases 45 534 535 et 45 534 575, de manière plus préférée entre les bases 45 534 648 et 45 534 668 du brin négatif du chromosome X de chimpanzé, et -pour UTY : -une amorce sens entre 15 et 25 paires de bases s'hybridant entre les bases 15 447 590 et 15 447 645, de préférence entre les bases 15 447 600 et 15 447 635, de manière plus préférée entre les bases 15 447 608 et 15 447 628 du brin négatif du chromosome Y humain et -une amorce anti-sens entre 15 et 25 paires de bases s'hybridant entre les bases 15 447 520 et 15 44 7 560, de préférence entre les bases 15 447 530 et 15 44 7 550, de manière plus préférée entre les bases 15 447 533 et 15 447 553 du brin positif du chromosome Y humain -une amorce sens entre 15 et 25 paires de bases s'hybridant entre les bases 20 860 260 et 20 860 310, de préférence entre les bases 20 860 270 et 20 860 300, de manière plus préférée entre les bases 20 860 275 et 20 860 295 du brin négatif du chromosome Y de chimpanzé et -une amorce anti-sens entre 15 et 25 paires de bases s'hybridant entre les bases 20 860 185 et 20 860 235, de préférence entre les bases 20 860 195 et 20 860 225, de manière plus préférée entre les bases 20 860 200 et 20 860 220 du brin positif du chromosome Y de chimpanzé.
Typiquement, les amorces s'hybrident dans des conditions stringentes. Par exemple, pour des amorces de 15 à 25 bp, des conditions stringentes sont une température de 55°C dans du tampon ou de 51 °C dans ce même tampon pour des échantillons de prosimiens. Le tampon peut par exemple être composé de Multiplex PCR Master mix 2X comprenant des concentrations optimisées (c'est eux qui le disent !!) de HotStarTaq® Plus DNA Polymerase, MgCl2, et dNTPs Mix (dATP, dCTP, dGTP, dTTP ultrapure quality) et Multiplex PCR Plus Buffer (contains 6 mM MgCl2; pH 8.7), Q-solution 5X, CoralLoad Dye 10X, RNase-free water ultra-pure quality, PCR-grade comme dans le kit QIAGEN Multiplex PCR Plus Kit (réf : 206152).
Dans un mode de réalisation, l'étape d'amplification des gènes comprend l'ajout de paires d'amorces ayant les séquences nucléiques: SEQ ID NO: 70 et SEQ ID NO: 66 pour SRY, SEQ ID NO: 67 et SEQ ID NO: 68 pour UTY et SEQ ID NO: 67 et SEQ ID NO: 69 pour UTX. SEQ ID NO: 65 et SEQ ID NO: 66 pour SRY, SEQ ID NO: 67 et SEQ ID NO: 68 pour UTY et SEQ ID NO: 67 et SEQ ID NO: 69 pour UTX. Dans un mode de réalisation préféré, l'étape d'amplification des gènes comprend l'ajout de 25 paires d'amorces ayant les séquences nucléiques: SEQ ID NO: 65 et SEQ ID NO: 66 pour SRY, SEQ ID NO: 67 et SEQ ID NO: 68 pour UTY et SEQ ID NO: 67 et SEQ ID NO: 69 pour UTX. 30 Les séquences des amorces de ce mode de réalisation préféré sont données dans le tableau 5 ci-dessous. Marqueur Amorce sens Amorce anti-sens Longueur amplifiée (bp) SEO Séquence (5'-3') SEQ ID NO Séquence (5'-3') ID NO SRY 65 gcgaaactcagagatcagcaag 66 tgtgcctcctggaagaatgg 81 UTY 67 cagtgttaccagccttaacag 68 ggcaggtctacttttgtagag 91 UTX 69 tctgtggactaggtttgtggt 120 OU Tableau 5 Ce dernier mode de réalisation du procédé de typage du sexe n'est applicable qu'à un nombre limité de primates mais elle permet d'utiliser des amplicons de très petites tailles (entre 80 et 120 bp) et donc de travailler sur de l'ADN est hautement dégradé. L'invention sera illustrée par les figures et exemples suivants. Cependant, étant présentés à titre illustratif, ces exemples et figures ne devraient pas être interprétés de manière à limiter la portée de la présente invention. 10 FIGURES La Figure 1 montre une comparaison entre la mutabilité et le pouvoir discriminant des multiplex existants et ceux de l'invention (CombYplex). La Figure 2 montre un exemple de profil d'homme obtenu à partir du multiplex Ml. 15 Pour chacun des profils, l'axe horizontal représente la taille des fragments d'ADN: à gauche les petites tailles, à droite les plus larges tailles. Chaque pic correspond à un marqueur STR. Chaque ligne correspond à un fluorochrome. La barre grise au-dessus de chaque pic porte le nom du marqueur situé au-dessous, et sa longueur reflète le spectre de tous les allèles attendus (polymorphisme). La place de chaque allèle potentiellement amplifié est représentée 20 sous forme de barre grisée. La Figure 3 montre un exemple de profil d'homme obtenu à partir du multiplex M2 combiné à un outil de sexage. Les codes de lecture sont les mêmes que précédemment. La Figure 4 montre un exemple de profil de chimpanzé obtenu à partir du multiplex M1. Les codes de lecture sont les mêmes que précédemment. 25 La Figure 5 montre un exemple de profil de chimpanzé obtenu à partir du multiplex M2 combiné à un outil de sexage. Les codes de lecture sont les mêmes que précédemment La Figure 6 représente un exemple de profil mâle avec un pic UTY, un pic UTX et un pic SRY (profil A). La Figure 7 représente un exemple de profil mâle avec un pic UTY, un pic UTX mais pas de pic 30 SRY (profil B). La Figure 8 représente un exemple de profil mâle avec un pic UTX et un pic SRY mais pas de pic SRY (profil C). La figure 9 représente un exemple de profil femelle avec uniquement un pic UTX (profil D). 35 EXEMPLES EXEMPLE 1 : Détermination du profil génétique d'un sujet Développement de séquences de référence 40 Une liste exhaustive des marqueurs STR du chromosome Y humain a été établie sur la base des publications disponibles à ce sujet (Goedbloed et al. 2009 ; Hanson et al. 2007 ; Ballantyne et al. 2010 ; Vermeulen et al. 2009 ; Maybruck et al. 2009; Hanson et al. 2012 ; Kayser et al. 2004).et complété d'un travail avec utilisation des banques de données types ncbi, ucsc, ensembl. A partir de cette liste, une étude a été menée afin de recueillir l'ensemble des informations relatives à chaque marqueur listé, qui seraient susceptibles de renseigner sur leur potentiel discriminant (structure moléculaire, taux de mutation, localisation dans le génome, évidence de duplications, etc.). Ces mêmes informations ont été collectées pour le chimpanzé et les marqueurs absents chez cette espèce, ou qui ne convenaient pas pour le chimpanzé, ont été éliminés.
Un classement des marqueurs en fonction de leurs taux de mutation, structure moléculaire, qualité des régions flanquantes, et autres, a été réalisé. Les marqueurs sélectionnés ont été répartis en 2 multiplexes : le Ml, comprenant les marqueurs ayant un taux de mutation moyen (cf. Tableau 6A et 6B), et le M2, comprenant les marqueurs ayant un taux de mutation élevé (cf. Tableau 7A et 7B). 30 GBD ID Locus ID(Kayser Position de Détails de localisation SNP Duplications Base de données de Nombre de copies d'après les Nombre de copies (Kayser et al. 2004) Complexité de et al. la bande (rétrotransposition, dbSNP >1000 bases variants génomiques: informations sur la position l'amplicon 2004) chromosique gène...) (item) variation structurelle chromosomique en Y (UCSC) (Kayser et al. 2004) DYS502 Y3S60 Yq11.221 LINE1 L Pas de SNP Pas de Pas de variant génomique simple copie unique complexe NLGN4Y ARNm duplication DYS575 Y4S49 Yp11.2 Alu L Pas de SNP Pas de Pas de variant génomique simple copie simple simple duplication DYS588 Y5C23 Yq11.221 Alu R Pas de SNP Pas de Pas de variant génomique simple copie simple complexe duplication DYS538 Y4C32 Yq11.221 aucune retransposition rs3049738 Pas de Pas de variant génomique simple copie simple complexe duplication DYS632 BV005731 Yq11.221 Alu R rs112755533 Pas de Pas de variant génomique simple copie simple simple rs60182015 duplication DYS640 Y4S38 Yq11.221 Alu L et LINE1 R Pas de SNP Pas de Pas de variant génomique simple copie simple simple duplication DYS485 Y3S1 Yq11.222 Alu R et LINE1 L rs73626958 Pas de CNV chrY simple copie simple simple duplication 31588 DYS577 Y4S54 Yq11.221 Alu R Pas de SNP Pas de Pas de variant génomique simple copie simple complexe duplication DYS461/ - Yq11.222 L1 L famille LINE Pas de SNP Pas de Pas de variant génomique simple copie simple Simple Y-GATA- duplication 31 A7.2 DYS578 Y4S56 Yq11.223 Alu L, LINE ERV1 R Pas de SNP Pas de CNV chrY simple copie simple Simple duplication 31588 DYS638 Y4S26 Yq11.221 Alu R 1 SNP dans une Pas de Pas de variant génomique simple copie simple Simple région flanquante duplication DYS511 Y4C114 Yq11.221 Aucun (mais à côté d'une autre repetition simple) rs2566502 rs1239021 rs34911488 rs58587911 Pas de Pas de variant génomique simple copie simple Simple duplication DYS556 Y4C75 Yq11.223 LINE1 L et R rs34768548 Pas de CNV chrY simple copie simple Simple duplication 31588 DYS565 Y4S18 Yq11.221 Alu L Pas de SNP Pas de Pas de variant génomique simple copie simple Simple duplication DYS587 Y5C22 Yq11.221 aucune retransposition rs7892960 Pas de Pas de variant génomique simple copie simple Complexe et 2 SNP dans des duplication régions flanquantes DYS508 Y4C109 Yq11.221 aucun rs59873111 Pas de Pas de variant génomique simple copie simple Simple duplication DYS517 Y4C126 Yq11.221 aucun Pas de SNP Pas de Pas de variant génomique simple copie simple Complexe duplication DYS643 Y5C20 Yq11.221 LINE1 R Pas de SNP Pas de Pas de variant génomique simple copie simple Simple duplication aoieau 32 GBD ID Type de répétition Taux de mutation médian bayésien Intervalle de crédibilité de bayésien Gains/ Total Total à 95% Pertes Mut. Méioses DYS502 3 3,85E-04 1.43 x10"5-2.05x10-3 0/0 0 1 792 DYS575 4 3,91E-04 1.47 x10-5-2.09x10-3 0/0 0 1 764 DYS588 5 3,92E-04 1.47 x10-5-2.10x103 0/0 0 1 747 DYS538 4 3,94E-04 1.47 x10-5-2.10x103 0/0 0 1 765 DYS632 4 3,97E-04 1.47 x105-2.13x10-3 0/0 0 1 745 DYS640 4 3,98E-04 1.41 x10-5-2.16x103 0/0 0 1 716 DYS485 3 4,04E-04 1.53 x10-5-2.13x103 0/0 0 1 730 DYS577 4 4,11E-04 1.51 x10-5-2.19x10-3 0/0 0 1 691 33 DYS461/ 4 9,89E-04 1.40 x10-4-3.29x10-3 0/1 1 1 695 Y-GATA-A7.2 DYS578 4 9,95E-04 1.43 x104-3.30x103 1/0 1 1 686 DYS638 4 1,04E-03 1.47 x10-4-3.45x103 1/0 1 1 617 DYS511 4 1,52E-03 3.51 x10-4-4.11x103 1/1 2 1 760 DYS556 4 1,59E-03 3.70 x10-4-4.30x10-3 1/1 2 1 683 DYS565 4 2,09E-03 6.20 x104-4.95x10-3 1/2 3 1 757 DYS587 5 2,62E-03 9.16 x104-5.75x10-3 2/2 4 1 782 DYS508 4 3,03E-03 1.05 x10-3-6.63x10-3 2/2 4 1 544 DYS517 4 3,21E-03 1.25 x10"3-6.62x103 3/2 5 1 766 DYS643 5 1,50E-03 3.49 x10"4-4.05x10"3 2/0 2 1 773 Tableau 6B 34 GBD ID Locus ID Position de - Détails de localisation SNP Duplications Base de données de variants génomiques: variation structurelle Nombre de copies Nombre de Complexité de l'amplicon (Kayser la bande (rétrotransposition, dbSNP >1000 bases d'après les copies (Kayser et al. et al. 2004) chromosique gène...) (item) informations sur la (Kayser et 2004) position al. 2004) chromosomique en Y (UCSC) Y-GATA-A10 - Yq11.221 aucun rs10551136 Pas de Pas de simple copie simple Complexe rs34876041 duplication variant génomique DYS541 Y4C36 Yq11.221 LINE1 R rs72289870 Pas de Pas de simple copie simple Complexe rs149616794 duplication variant rs13303915 génomique DYS549 Y4C52 Yq11.222 LINE1 L and R rs72132766 Pas de CNV chrY simple copie simple Simple rs35436436 duplication 31588 DYS481 Y3C59 Yp11.2 aucun rs34406695 Pas de Pas de simple copie simple Simple duplication variant génomique DYS533 Y4C215 Yq11.221 aucun rs72167351 rs10546066 rs59597498 rs72017788 Pas de Pas de simple copie simple Simple (near another Y-STR) duplication variant génomique 35 DYS444 Y4C37 Yq11.221 Tigger2a DNA R rs78310168 Pas de Pas de simple copie simple Complexe rs3052654 duplication variant génomique DYS510 Y4C113 Yq11.221 aucun (mais près d'une Pas de SNP Pas de Pas de simple copie simple Complexe autre répétition simple) duplication variant génomique DYS513 Y4C116 Yq11.221- aucun rs35947421 Pas de Pas de simple copie simple Complexe rs35984406 duplication variant rs34990939 génomique DYS460/ - Yq11.222 (L1 R famille LINE) rs72164979 Pas de Pas de simple copie simple Simple Y-GATA- duplication variant A7.1 génomique DYS458 - Yp11.2 Alu L et R Pas de SNP Pas de CNV chrY simple copie - - duplication 4180 but variants reported STRbase and YHRD DYS442 - Y1 -iti21 LINE1 L et R rs34353940 Pas de Pas de simple copie - - duplication variant génomique DYS570 Y4S4 Yp11.2 5'UTR du gène TBL1Y Pas de SNP Pas de Pas de simple copie simple Simple (codant pour une duplication variant protéine) génomique DYS576 Y4S5 Yp11.2 Alu L Pas de SNP Pas de Pas de simple copie simple Simple duplication variant génomique 36 Pas de Pas de DYS612 Y3C22 Yq11.221 aucun Pas de SNP duplication variant simple copie simple Complexe génomique Tableau 7A 37 GBD ID Type de répétition Taux de mutation médian bayésien Intervalle de crédibilité de bayésien à 95% Gains/ Total Total . Pertes Mut. Méioses Y-GATA-A10 4 3,32E-03 1.25 x10-3-6.80x103 3/2 5 1 713 DYS541 4 3,92E-03 1.65 x10"3-7.68x10-3 2/4 6 1 700 DYS549 4 4,55E-03 2.05 x10-3-8.58x10-3 1/6 7 1 684 DYS481 3 4,97E-03 2.36 x10-3-9.03x10-3 3/5 8 1 744 DYS533 4 5,01E-03 2.39 x1OE3-9.11x10-3 4/4 . 8 1 730 DYS444 4 5,45E-03 2.68 x10-3-9.65x103 3/6 9 1 775 DYS510 4 5,99E-03 3.09 x10-3-1.03E-02 4/6 10 1 779 38 DYS513 4 6,09E-03 3.14 x10-3-1.05E-02 6/4 10 1 751 ! DYS460/ 4 6,22E-03 3.19 x10-3-1.07E-02 2/8 10 1 717 Y-GATA-A7.1 DYS458 4 8,36E-03 4.80 x10-3-1.34E-02 7/7 14 1 756 DYS442 4 9,78E-03 5.59 x10-3-1.57E-02 2/12 14 1 497 DYS570 4 1,24E-02 7.52 x10-3-1.91 E-02 8/9 17 1 426 DYS576 4 1,43E-02 9.41 x10-3-2.07E-02 12/12 24 1 727 DYS612 3 1,45E-02 9.61 x10-3-2.09E-02 11/14 25 1 767 Tableau 7B Conception des amorces des multiplexes. Le schéma théorique des 2 multiplexes a été réalisé, en organisant les marqueurs par ligne (1 ligne = 1 fluorochrome) en fonction de leurs tailles afin d'assurer une bonne distribution des marqueurs sur le range de taille fixé (de 80 à 350 bp). L'alignement des séquences d'environ 500 bp autour du marqueur homme-chimpanzé a été réalisé pour chaque marqueur. Un couple d'amorces capables d'amplifier le marqueur STR pour les 2 espèces, et pour une taille donnée (proche) a été sélectionné. Les amorces ont été modifiées jusqu'à ce que le schéma théorique désigné soit atteint/obtenu, et dans le cas où ce n'était pas possible, le schéma théorique à été modifié jusqu'à obtenir satisfaction. Pour chaque marqueur, une amplification a été réalisée en utilisant les amorces froides pour un individu mâle et un individu femelle, pour l'homme et le chimpanzé, afin de voir si une bande à la taille attendue était obtenue, et surtout si celle-ci était unique afin d'éviter les a-spécificités et duplications qui n'auraient pas été reportées ou détectées jusque-là. Les amorces ont été remodifiées jusqu'à atteindre satisfaction.
Une fois tous les marqueurs testés indépendamment, ils ont été multiplexés par ligne (c.à.d. par fluorochorme) afin de détecter des interactions potentielles. Les marqueurs ont ensuite été testés marqués ('chauds'), et à nouveau une amplification a été réalisée en utilisant les amorces chaudes pour un individu mâle et un individu femelle, pour l'homme et le chimpanzé, afin de voir si nous obtenions une bande à la taille attendue, et surtout si celle-ci était unique afin d'éviter les a-spécificités et duplications. Les amorces ont été remodifiées jusqu'à atteindre satisfaction. Un multiplexage final a été réalisé, incluant la totalité des marqueurs et les concentrations ont été ajustées jusqu'à obtenir un multiplex équilibré. La même opération a été répétée pour le deuxième multiplex. En parallèle, chaque marqueur a été séquencé afin d'établir une correspondance entre taille de l'amplicon par génotypage et le nombre réel de répétitions correspondant à cette taille. Le tableau 8A ci-dessous récapitule les informations sur les 18 marqueurs du er multiplex M1 pour des échantillons humains.
Le tableau 8B ci-dessous récapitule les informations sur les 18 marqueurs du ter multiplex M1 pour des échantillons de chimpanzés. Le tableau 9A ci-dessous récapitule les informations sur les 14 marqueurs du 2nd multiplex M2 et pour les marqueurs de sexage (SRY, UTY et UTX) pour des échantillons humains. Le tableau 9B ci-dessous récapitule les informations sur les 14 marqueurs du 2nd multiplex M2 et pour les marqueurs de sexage (SRY, UTY et UTX) pour des échantillons de chimpanzés. 41 Marqueur ochr Me Fluor ADN humain control (fx) Déduit de la littérature uniquement Séquence (5'-3') Tm [lig° Séquence (5'-3') Tm pie Allèle (nb Taille Gamme allélique (nb unités répétes) Gamme de taille (C) (°C) unités amplicon ampliconique répétées) (bp) attendue (bp) DYS485 FAM catataacaaaattgaatgtgtactcc SEQ ID NO : 1 57,3 0,5 agcctgggtgacaagagttatac SEQ ID NO : 2 58,7 0,5 16 121 12-22 109-139 DYS588 FAM gaatgcagaaccctcaagga SEQ ID NO : 3 60,2 0,18 agcctgggtgacagaaacac SEQ ID NO : 4 60,2 0,18 12 151 9-16 136-171 DYS502 FAM cagcaagccaccataccata SEQ ID NO : 5 59,6 0,25 tgtgcttttggagtttggag SEQ ID NO : 6 58,9 0,25 8 206 6-9 200-209 DYS461 FAM aatacataataaatgataggcagagga SEQ ID NO : 7 57,9 0,6 gag agctgaataagttgtatcaggtaa SEQ ID NO : 8 58,6 0,6 11 257 8-13 245-265 DYS638 FAM ttctaatttcagtgctttcaattttc SEQ ID NO : 9 59,3 1,2 aggtgggtcatgaggtcagt SEQ ID NO : 10 59,4 1,2 11 312 8-13 300-320 DYS643 VIC aagccatgcctggttaaactac SEQ ID NO : 11 59,6 0,1 accaaacaccacccattcc SEQ ID NO : 12 60,5 0,1 10 136 8-13 126-151 DYS587 VIC cttctttggaaagtagcatttcat SEQ ID NO : 13 58 1 0,8 aaagtctgacaatgagaagggtttctaagttcagg SEQ ID NO : 14 68,9 0,8 11 198 8-16 183-223 , DYS575 VIC cagaggttccagtaagcttagatca SEQ ID NO : 15 60,3 0,3 cattgatgggctttaggttga SEQ ID NO : 16 59,9 0,3 10 263 8-12 255-271 DYS578 VIC gaggcggaactttcagtgag SEQ ID NO : 17 60,0 0,5 cagaagtcccctgtgtttcaa SEQ ID NO : 18 60,1 0,5 9 313 7-10 305-317 DYS632 NED cacagtttcagtcttgcatgg SEQ ID NO : 19 59,3 . tctgggcaacagaaggagac SEQ ID NO : 20 60,4 0,09 9 107 8-10 103-111 0309 42 DYS508 NED acaatggcaatcccaaattc SEQ ID NO : 21 59,6 0,4 gaacaaataaggtgggatggat SEQ ID NO : 22 59,1 0,4 11 174 8-15 162-190 DYS640 NED ggaaaaaccatgagatcctgtc SEQ ID NO : 23 59,8 0,2 aagcccgttcatattttaaagac SEQ ID NO : 24 57,9 0,2 11 258 9-13 250-266 DYS511 NED tggggtggatgtgtaggtaga SEQ ID NO : 25 60,2 0,3 ,tctggttgtgccttagatttga SEQ ID NO : 26 59,7 0,3 10 308 9-14 304-324 DYS577 PET tttttctacgtgtgtatccactaacc SEQ ID NO : 27 59,8 0,15 gtgtccccagccctgtta SEQ ID NO : 28 59,5 0,15 9 103 8-11 99-111 DYS556 PET tcaccaatgacattttacagca SEQ ID NO : 29 59,1 0,6 ttggttagtgtaatgcatccag SEQ ID NO : 30 57,7 0,6 11 168 8-12 156-172 DYS517 PET aactgaccagcaaaaatgttaaa SEQ ID NO : 31 57,9 0,5 tgtctgagacctacaagattgc SEQ ID NO : 32 57,1 0,5 13 219 10-18 207-239 DYS565 PET ccaggaagcagtgttgcat SEQ ID NO : 33 59,8 0,3 gcagttctctgcctgtatgg SEQ ID NO : 34 58,5 0,3 12 290 9-14 278-298 DYS538 PET ttggggaaaacagatggtgt SEQ ID NO : 35 60,2 1,7 ccaaatacccatcataggaagaa SEQ ID NO : 36 59,2 1,7 10 343 9-13 339-355 Tableau 8A : informations sur les 18 marqueurs du Multiplex M1 pour des échantillons humains. Marqueur Fluorochrome Chimpanzé DNA Déduit de la littérature contro (301) uniquement Séquence (5'-3') Tm [lig Séquence (5'-3') Tm (°C) [IIM] Allèle (en Taille Gamme allèlique (nb unités répétes) Gamme de (°C) nb unités amplicon taille répétées) (bp) ampliconique attendue (bp) DYS485 FAM catataacaaaattgaatgtgtactcc 57,3 0,5 agcctgggtgacaagagttatac 58,7 0,5 14 115 8-15 97-118 fn fn fn r-I O fn OZO-00E 01-g 91£ 6 £`0 L'6g 9Z : ON al 03S 25w6enoo6161156101 £`0 Z'09 g3 : ON al 03S e6e166e16161e66166661 G3N I. ISSACI 99Z-Z93 L-9 Z9g 9 Z'O 6`L9 PZ : ON CII 03S Z'O 8'69 £Z : ON al 03S oi6pore6u6wooeeeeu56 CI3N OP9SACI ou6uuenuereop.633obee PZZ-POZ t1.-6 Z1Z 11. P`O 1'69 ZZ : ON al 03S P`O 9'69 1.Z : ON al 03S CI3N 80SSACI 1e661e666156eemeeoue6 ol}uee000leuo66leeoe L01-96 1.1.-8 E0 I- 0l 60'0 P'09 OZ : ON al 03S 60'0 £`69 61- : ON al 03S 661eo6uoi6uoufflepe0 CEN ZE9SAC1 oe6E66ue6uouu36661.q. 600-L6Z 01-L SOC 6 S`0 1'09 81- : ON al 03S 9`0 0'09 L I. : ON 0103S 6e516.eoluoue66o56e6 0IA 8LSSACI Bequel000eue6eo 89Z-P9Z 8-L 179Z L C'0 6'69 91: ON 0103S C1166q113666enuo £`0 £'09 SI. :ON al 03S eow6ullo5eeeoon.66u6eo 01A 9LSSACI 961-9171- 91-9 1-91- 6 8`0 6'89 PI. : ON GI 03S 8`0 1-'89 El- : ON 0103S le0uluo6Beee66mono 0IA L89SAC1 66uon6eeptu666eube6leeoe6leuee 901.-1-6 9-E 1-6 £ 1.'0 9'09 Z I. :ON CII 03S oone000mo2oeuepoe VO 9'69 I. I. :ON CII 03S 01A £P9SAC1 oeeeuoo@e2 plepew 910-00E ZI--8 80E 01 Z` l. P'69 01. : ON al 03S 16e3166e61eo1656166e Z`1. E'69 6 : ON 0103S IA1Vd 8£9SAC1 oaueeoui06i6eouiee1ou 99Z -£9Z Z1.-6 L9Z 0 I- 9'0 9'89 8: ON CII 03S 9'0 6`L9 L : ON CII 03S lltid Z'LV -V1VO-À / 1.9tSAG eu166eole16116equelo6e6e6 e66e6eo66eie61eeeleeTeOelee 0£3-91Z P1.-6 LZZ £1. Sn 6'89 9 : ON al 03S 6u60m6e66uno6161 ge0 9'69 g : ON al 03S 11Vd ZOSSAC1 emooemOoeOO6eeo6eo C81.-891. 91.-Z I- EL I- £1. 81-'0 Z'09 P : ON al 03S 81-'0 Z'09 £ : ON 0103S IA1VA 88SSACI oeoueu6uou51566pobe u55ueopooee6uo0Teuô Z : ON GI 03S I. : ON al 03S Et 44 DYS577 PET tttttctacgtgtgtatccactaacc SEQ ID NO : 27 59,8 0,15 gtgtccccagccctgtta SEQ ID NO : 28 59,5 0,15 8 91 6-11 83-103 DYS556 PET tcaccaatgacattttacagca SEQ ID NO : 29 59,1 0,6 ttggttagtgtaatgcatccag SEQ ID NO : 30 57,7 0,6 4 136 4-5 136-140 DYS517 PET aactgaccagcaaaaatgttaaa SEQ ID NO : 31 57,9 0,5 tgtctgagacctacaagattgc SEQ ID NO : 32 57,1 0,5 11 182 10-18 178-210 DYS565 PET ccaggaagcagtgttgcat SEQ ID NO : 33 59,8 0,3 gcagttctctgcctgtatgg SEQ ID NO : 34 58,5 0,3 6 266 5-9 262-278 DYS538 PET ttggggaaaacagatggtgt SEQ ID NO : 35 60,2 1,7 ccaaatacccatcataggaagaa SEQ ID NO : 36 59,2 1,7 6 327 5-8 323-335 Tableau 8B : Informations sur les 18 marqueurs du Multiplex M1 pour des échantillons de chimpanzés. Marqueur Fluorochrome ADN humain control Déduit de la littérature uniquement fx) Séquence (5'-3') Tm [O]° Séquence (5'-3') Allèle (nb Taille Gamme Gamme de (cC) unités amplicon allèlique taille répétées) (bp) (nb ampliconique unités attendue (bp) répétes) SRY FAM gcgaaactcagagatcagcaag SEQ ID NO : 65 60,1 0,08 tgtgcctcctggaagaatgg SEQ ID NO : 66 61,9 0,08 81 UTY FAM cagtgttaccagccttaacag SEQ ID NO : 67 53,7 0,2 ggcaggtctacttttgtagag SEQ ID NO : 68 52 0,1 91 UTX FAM tctgtggactaggtttgtggt SEQ ID NO : 69 55,6 0,11 120 45 Y-GATA- Al0 FAM cctgccatctctatttatcttgcatata SEQ ID NO : 37 61,9 0,26 ataaatggagatagtgggtggatt SEQ ID NO : 38 59,1 0,26 13 163 9-16 147-175 DYS570 FAM tgtgacatcaaggttatgaaacg SEQ ID NO : 39 59,9 0,29 ggtgaaaattattcagcatagtcaag SEQ ID NO : 40 59,5 0,29 18 229 14-24 213-253 DYS549 FAM gaaaagaaaagtgtaagccaaacc SEQ ID NO : 41 59,6 0,95 tttggtggcataagtggtaatg SEQ ID NO : 42 59,8 0,95 12 299 9-15 287-311 DYS460 VIC atcctctgcctatcatttattatgtat SEQ ID NO : 43 57,1 0,4 gaataccagaggaatctgacacc SEQ ID NO : 44 59,0 0,4 12 113 8-13 97-117 DYS442 VIC tgcaaaatcacggaaccaa SEQ ID NO : 45 61 0,15 caagccactgcaaatgtca SEQ ID NO : 46 59,4 0,15 12 181 9-16 169-197 DYS510 VIC tifttcctccataccacag a SEQ ID NO : 47 58,7 0,48 tctggagaagacagaacttgtca SEQ ID NO : 48 59,1 0,48 11 250 9-15 242-266 DYS541 VIC catcattaattctatctgttcatccat SEQ ID NO : 49 58,8 0,45 tggataaagaacacctttaagaagc SEQ ID NO : 50 59,3 0,45 12 318 10-15 310-330 DYS576 NED ccaagcaacatagcaagacct SEQ ID NO : 51 59,4 0,13 aagcgtatttgtcttggctttt SEQ ID NO : 52 59,4 0,13 19 123 13-22 99-135 DYS513 NED tgttgtaaaaatgactactgtggtatg SEQ ID NO : 53 58,6 0,22 ccacatcagcactattacttaactca SEQ ID NO : 54 58,9 0,22 12 306 9-15 294-318 DYS458 NED tgggtggtggaggttactgt SEQ ID NO : 55 60,3 0,12 cccaaagttctggcattacaa SEQ ID NO : 56 60,0 0,12 18 205 11-24 177-229 DYS481 PET aggaatgtggctaacgctgt SEQ ID NO : 57 59,8 0,2 accagaaggttgcaagactca SEQ ID NO : 58 59,9 0,2 22 122 18-32 110-152 DYS612 PET cccccatgccagtaagaata SEQ ID NO : 59 59,8 1,25 tg ag gg aaggcaaaagaaaa SEQ ID NO : 60 59,8 1,25 26 208 19-31 187-223 DYS444 PET catagaatgaaaggtgtgaacca SEQ ID NO : 61 59,0 0,45 tgccattcaaactcacgttg SEQ ID NO : 62 60,7 0,45 12 265 9-16 253-281 46 Tableau 9A : Informations sur les 14 marqueurs du multiplex M2 et pour SRY, UTY et UTX pour des échantillons humains. Marqueur Fluorochrome Réf. Chimpanzé Déduit de la littérature NC_00024.9 (UCSC) uniquement Séquence (5'-3') Tm (°C) [1.1M]° Séquence (5'-3') Tm (°C) [p.M]° Allèle (nb Taille Gamme Gamme de unités amplicon allélique taille répétées) (bp) (nb ampliconique unités attendue (bp) répétes) SRY FAM gcgaaactcagagatcagcaag SEQ ID NO : 65 60,1 0,08 tgtgcctcctggaagaatgg SEQ ID NO : 66 61,9 0,08 81 UTY FAM cagtgttaccagccttaacag SEQ ID NO : 67 53,7 0,2 ggcaggtctacttttgtagag SEQ ID NO : 68 52 0,1 91 UTX FAM tctgtggactaggtttgtggt SEQ ID NO : 69 55,6 0,11 120 YLGATA- A10 FAM cctgccatctctatttatcttgcatata SEQ ID NO : 37 61,9 0,26 ataaatggagatagtgggtggatt SEQ ID NO : 38 59,1 0,26 4 130 NA NA DYS570 FAM tgtgacatcaaggttatgaaacg SEQ ID NO : 39 59,8 0,29 ggtgaaaattattcagcatagtcaag SEQ ID NO : 40 60,5 0,29 4 176 4 176 DYS549 FAM gaaaagaaaagtgtaagccaaacc SEQ ID NO : 41 59,6 0,95 tttggtggcataagtggtaatg SEQ ID NO : 42 59,8 0,95 8 283 NA NA DYS460 VIC atcctctgcctatcatttattatgt' SEQ ID NO : 43 57,1 0,4 gaataccagaggaatctgacacc SEQ ID NO : 44 59,0 0,4 10 105 NA NA DYS442 VIC tgcaaaatcacggaaccaa 59,7 0,15 caagccactgcaaatgtca 60,1 0,15 11 189 NA NA attcatctaacatctttgtcatctacc SEQ ID NO : 63 ttaacttgcctattgcatcc 0,95 SEQ ID NO : 64 DYS533 PET 58,2 347 9-14 335-355 59,2 0,95 12 47 SEQ ID NO : 45 SEQ ID NO : 46 DYS510 VIC tttttcctcccttaccacaga SEQ ID NO : 47 58,7 0,48 tctggagaagacagaacttgtca SEQ ID NO : 48 59,1 0,48 11 236 9-11 -228-236 DYS541 VIC catcattaattctatctgttcatccat SEQ ID NO : 49 58,8 0,45 tggataaagaacacctttaagaagc SEQ ID NO : 50 59,3 0,45 11 354 10-11 350-354 DYS576 NED ccaagcaacatagcaagacct SEQ ID NO : 51 59,4 0,13 aagcgtatttgtcttggctttt SEQ ID NO : 52 59,4 0,13 3 73 3 73 DYS513 NED tgttgtaaaaatgactactgtggtatg SEQ ID NO : 53 59,4 0,22 ccacatcagcactattacttaactca SEQ ID NO : 54 60,9 0,22 25 351 NA NA DYS458 NED tg g gtggtgg aggttactgt SEQ ID NO : 55 60,3 0,12 cccaaagttctggcattacaa SEQ ID NO : 56 60,0 0,12 25 275 NA NA DYS481 PET aggaatgtggctaacgctgt SEQ ID NO : 57 59,8 0,2 accagaaggttgcaagactca SEQ ID NO : 58 59,9 0,2 - - - - DYS612 PET cccccatgccagtaagaata SEQ ID NO : 59 59,8 1,25 tg ag gg aagg caaaag aaaa SEQ ID NO : 60 59,8 1,25 21 209 7-26 182-223 DYS444 PET catag aatgaaaggtgtg aacca SEQ ID NO : 61 59,0 0,45 tgccattcaaactcacgttg SEQ ID NO : 62 60,7 0,45 14 262 NA NA DYS533 PET attcatctaacatctttgtcatctacc SEQ ID NO : 63 58,2 0,95 ttaacttgcctttttgcatcc SEQ ID NO : 64 59,2 0,95 - - - - .. . Tableau 9B : Informations sur les 14 marqueurs du multiplex M2 pour des échantillons de chimpanzés pour non isponi e Test des multiplexes M1 et M2 sur hommes et chimpanzés: choix des échantillons afin de maximiser la variabilité génétique observée. Un panel d'échantillons de 13 hommes et de 11 chimpanzés ont été testés. Ils ont été génotypés avec les 2 multiplexes afin d'obtenir une idée de la variabilité génétique détectée (Le. allèles) pour les multiplexes M1 et M2, pour les hommes et les chimpanzés. Les hommes proviennent de différents pays et sont donc susceptibles de présenter profils génétiques très différents - ceci devrait permettre d'obtenir une variabilité génétique maximale et d'avoir une idée des gammes d'allèles attendus. Les chimpanzés proviennent eux de divers zoos et collections, afin d'éviter les effets de consanguinité, et de la même façon, de maximiser nos chances d'obtenir des profils différents.
Résultats: Le degré de polymorphisme (variabilité) des marqueurs inclus dans les 2 multiplexes, a été estimé pour le panel. Les résultats sont donnés dans le tableau 10 pour M1, dans le tableau 11 pour M2 et dans le tableau 12 pour l'outil de sexage. On observe bien que le nombre d'allèles et la variance est en accord avec les taux de mutations prédits pour M1 et M2, à savoir une variance plus importante pour M2 (fort taux de mutation) que pour Ml. Capacité discriminante du CombYplex comparée au AmplYfiler : individus même noms de famille : Statistiques descriptives : Les formules suivantes ont été utilisées : (1) capacité discriminante = no. d' individus/no. des differents haplotypes observés; (2) diversité des gènes (h), équivalent à la fréquence attendue des fréquences hétérozygotes avec des loci diploïdes autosomiques a été calculé ainsi (n/(n-1))-(1-Ep?), où pi = fréquence de l'allèle au ième . 49 M1 DYS485 DYS588 DYS502 DYS461 DYS638 DYS643 DYS587 DYS575 DYS578 Echantillons Allèle Taille Allèle Taille Allèle Taille Allèle Taille Allèle Taille Allèle Taille Allèle Taille Allèle Taille Allèle Taille Hu m_FX 16 121,56 12 151,22 8 206,23 11 257,67 11 312,5 10 136,35 11 198 10 263,88 9 313,79 Hum_20FT 16 121,65 13 156,31 8 206,26 11 257,64 9 304,39 11 141,46 11 198,05 10 263,84 8 309,61 Hum_21PF 16 121,57 12 151,26 8 206,25 10 253,69 11 312,48 10 136,4 12 203,01 10 263,9 8 309,61 Hum_28IT 18 127,69 15 166,37 8 206,27 12 261,59 11 312,49 10 136,39 14 212,9 10 263,83 7 305,57 Hum_29AH 16 121,71 13 156,29 8 206,24 10 253,71 11 312,5 9 131,43 11 198,01 10 263,87 8 309,65 Hum_310L 16 121,55 12 151,18 8 206,19 11 257,68 11 312,5 10 136,36 11 198,01 10 263,87 9 313,71 Hum_34AHB 15 118,58 12 151,25 8 206,24 11 257,62 11 312,44 11 141,58 15 218,03 10 263,86 8 309,61 Hum_35JN 16 121,68 13 156,25 8 206,25 11 257,64 9 304,34 9 131,35 11 198,04 10 263,8 8 309,61 Hum_38ME 16 121,58 18 181,44 8 206,26 10 253,69 9 304,39 11 141,46 11 198,13 10 263,85 8 309,61 Hum_39TB 13 112,51 13 156,37 8 206,3 11 257,77 12 316,7 12 146,72 11 198,12 10 263,93 8 309,58 Hum_40EH 17 124,61 12 151,27 8 206,29 11 257,71 11 312,54 10 136,38 11 198,12 10 263,86 9 313,71 Hum_43PF 14 115,63 13 156,34 8 206,3 11 257,7 11 312,46 12 146,61 11 198,03 10 263,89 8 309,55 Hum_45AMB 16 121,67 13 156,36' 8 206,25 12 261,62 11 312,54 12 146,67 16 222,87 10 263,82 8 309,63 Hum_Cesar 16 121,78 13 156,08 8 206,27 11 257,59 11 312,46 12 146,8 11 198,02 10 263,73 8 309,67 Chimp_103 14 115,66 13 173,92 13 227,35 10 257,61 10 308,6 3 91,2 9 161,12 7 264,66 9 305,08 Chimp_211 14 115,55 13 173,96 13 227,34 10 257,7 10 308,7 3 91,19 9 161,14 7 264,74 10 309,21 Chimp_253 14 115,6 13 173,93 13 227,41 11 261,61 10 308,65 3 91,14 9 161,21 7 264,75 9 305,06 Chimp_273 15 118,64 12 168,77 13 227,39 11 261,61 10 308,69 3 91,18 9 161,07 7 264,7 10 309,13 Chimp_295 14 115,62 13 173,99 13 227,37 10 257,62 10 308,7 3 91,18 9 161,14 7 264,68 9 305,09 Chimp_301 14 115,62 13 173,96 12 224,42 11 261,62 10 308,69 3 91,19 9 161,14 7 264,7 10 309,12 Chimp_367 13 112,49 13 173,94 13 227,33 10 257,68 10 308,61 3 91,18 9 161,15 7 264,71 9 305,07 Chimp_61A 14 115,62 13 173,99 12 224,31 10 257,64 10 308,65 3 91,27 9 161,06 7 264,65 9 305,13 Chimp_Sg229 14 115,62 13 173,94 13 227,33 10 257,68 10 308,65 3 91,15 9 161,15 7 264,65 9 305,07 Chimp_Sg369 14 115,63 13 173,94 13 227,32 10 257,75 10 308,67 3 91,18 9 161,15 7 264,78 10 309,17 Chimp_SgC1 15 118,64 15 184,3 13 227,39 11 261,6 10 308,59 3 91,21 9 161,13 7 264,72 9 305,02 Chimp_202 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 50 (femelle) Nb allèles Ho 6 4 1 3 3 4 5 1 3 Gamme 13-18 12-18 (8) 10-12 9-12 9-12 11-16 (10) 7-9 allélique Nb allèles Chz 3 3 2 2 1 1 1 1 2 Gamme 13-15 13-15 12-13 10-11 (10) (3) (9) (7) 9-10 allélique 51 M1 DYS632 DYS508 DYS640 DYS511 DYS577 DYS556 DYS517 DYS565 DYS538 Echantillons Allèle Taille Allèle Taille Allèle Taille Allèle Taille Allèle Taille Allèle Taille Allèle Taille Allèle Taille Allèle Taille Hum_FX 9 107,53 11 174,67 11 258,38 10 308,66 9 103,35 11 168,36 13 219,11 12 290,16 10 343,69 Hum_20FT 8 103,44 12 178,73 11 258,43 10 308,67 9 103,28 10 164,36 12 215,2 11 286,25 9 339,72 Hum_21PF 9 107,57 11 174,7 11 258,43 10 308,67 9 103,28 11 168,34 16 230,56 13 293,99 10 343,73 Hum_28IT 8 103,45 11 174,72 12 262,31 11 312,63 9 103,37 10 164,42 15 226,61 12 290,06 9 339,72 Hum_29AH 8 103,47 11 174,74 12 262,29 9 304,63 9 103,31 11 168,28 12 215,17 11 286,19 10 343,71 Hum_310L 9 107,56 11 174,69 12 262,29 10 308,66 9 103,33 10 164,39 15 226,7 12 290,12 10 343,71 Hum_34AHB 9 107,6 12 178,83 11 258,39 10 308,62 8 99,22 12 172,28 15 226,66 12 290,05 10 343,68 Hum 35JN 8 103,5 12 178,83 12 262,32 9 304,61 9 103,35 11 168,31 16 230,39 11 286,15 10 343,64 Hum_38ME 8 103,44 11 174,66 12 262,25 9 304,75 9 103,36 10 164,4 13 219,18 11 286,33 9 339,72 Hum_39TB 8 103,41 10 170,59 11 258,42 10 308,71 9 103,33 10 164,39 13 219,18 11 286,3 10 343,76 Hum_40EH 9 107,52 11 174,74 11 258,43 10 308,7 9 103,29 10 164,47 14 223,02 12 290,16 10 343,76 Hum_43PF 8 103,42 11 174,7 12 262,28 9 304,71 9 103,34 10 164,43 14 222,96 11 286,28 10 343,71 Hum_45AMB 8 103,48 11 174,79 11 258,42 11 312,69 9 103,32 11 168,36 16 230,6 11 286,33 11 347,71 Hum_Cesar 8 103,51 12 178,98 11 258,42 10 308,56 9 103,43 11 168,27 12 215,9 11 285,99 10 343,69 Chimp_103 10 103,27 11 212,03 6 262,29 9 316,52 8 90,88 4 136,8 11 182,24 6 266,52 6 327,79 Chimp_211 10 103,22 10 207,97 6 262,26 9 316,59 8 90,95 4 136,82 14 193,89 6 266,57 6 327,79 Chimp_253 11 107,38 10 207,97 6 262,27 10 320,73 8 90,9 4 136,82 12 186,13 6 266,65 6 327,77 Chimp_273 10 103,27 10 207,96 6 262,28 9 316,62 8 90,94 4 136,79 11 182,29 6 266,53 6 327,77 Chimp_295 10 103,21 11 212 6 262,34 9 316,59 8 90,94 4 136,83 11 182,28 6 266,57 6 327,77 Chimp_301 10 103,24 12 216,13 6 262,28 10 320,74 8 90,95 4 136,8 10 178,42 6 266,62 6 327,77 Chimp_367 10 103,26 11 212,06 6 262,21 11 324,86 8 90,86 4 136,82 11 182,29 6 266,62 6 327,86 Chimp_61A 11 107,4 10 207,98 6 262,33 7 308,51 8 90,95 4 136,78 13 189,94 6 266,54 6 327,7 Chimp_Sg229 10 103,26 11 212,04 6 262,29 9 316,62 8 90,91 4 136,79 11 182,3 6 266,56 6 327,74 Chimp_Sg369 10 103,26 10 208,02 6 262,36 9 316,62 8 90,94 4 136,82 14 193,94 6 266,7 6 327,76 Chimp_SgC1 11 107,38 9 203,92 6 262,32 8 312,48 8 90,9 4 136,76 13 189,95 6 266,6 6 327,82 Chimp_202 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 52 (femelle/controle) Nb allèles Ho 2 3 2 3 2 3 5 3 3 Gamme allélique 8-9 10-12 11-12 (9-11) 8-9 10-12 12-16 11-13 9-11 Nb allèles Chz 2 4 1 5 1 1 5 1 1 Gamme allélique 10-11 9-12 (6) (7-11) (8) (4) 11-14 (6) (6) Tableau 10 M2 Y_GATA_A10 DYS570 DYS549 DYS460 DYS442 Echantillons Allèle Taille Allèle Taille Allèle Taille Allèle Taille Allèle Taille Hum_FX 13 163,55 18 229,95 12 299,49 12 113,52 12 181,39 Hum_20FT 12 159,45 15 217,57 12 299,49 10 105,19 11 177,4 Hum_21PF 14 167,59 20 238,12 12 299,56 11 109,41 13 185,44 Hum_281T 12 159,45 18 229,93 12 299,56 10 105,18 13 185,48 Hum_29AH 13 163,56 18 229,88 13 303,43 10 105,23 11 177,4 Hum_310L 13 163,6 17 225,85 13 303,47 10 105,28 12 181,45 Hum_34AHB 13 163,53 16 221,7 12 299,49 11 109,39 13 185,44 Hum_35JN 12 159,46 ' 18 229,83 13 303,47 10 105,29 11 177,27 Hum_38ME 12 159,46 16 221,77 12 299,42 11 109,42 11 177,36 Hum_39TB 13 163,52 18 229,84 12 299,63 11 109,29 12 181,41 Hum_40EH 12 159,44 17 225,8 12 299,63 11 109,33 12 181,42 Hum_43PF 12 159,36 19 233,99 12 299,7 11 109,36 12 181,49 Hum_45AMB 12 159,44 22 246,47 11 295,64 11 109,34 12 181,42 Hum_César 13 163,63 18 229,95 13 303,46 10 105,17 12 181,43 Chimp_103 4 130,85 4 176,18 8 283,6 10 105,08 11 189,51 Chimp_211 4 130,8 4 176,06 10 291,54 10 105,05 11 189,48 Chimp_253 4 130,79 4 176,11 8 283,53 9 100,82 11 189,53 Chimp_273 4 130,75 4 176,16 8 283,55 11 109,15 11 189,47 Chimp_295 4 130,83 4 176,17 8 283,56 10 105,01 11 189,54 Chimp_367 4 130,84 4 176,19 9 287,58 10 104,98 11 189,47 Chimp_61A 4 130,84 4 176,11 8 283,61 11 109,18 10 185,5 Chimp_Sg229 4 130,73 4 176,18 8 283,62 10 105,03 11 189,51 Chimp_Sg369 4 130,82 4 176,19 10 291,66 10 104,99 11 189,55 Chimp_SgC1 4 130,85 4 176,19 8 283,59 11 109,13 12 193,61 Chimp_202 ° 0 0 0 0 0 0 0 0 0 (femelle/contrôle) Nb allèles Ho 3 7 3 3 3 Gamme allélique 12-14 15-22 11-13 10-12 11-13 Nb allèles Chz 1 1 2 3 3 Gamme allélique (4) (4), 8-10 9-11 10-12 54 M2 DYS510 DYS541 DYS576 DYS458 DYS513 DYS481 DYS612 DYS444 DYS533 Echantillons Allèle Taille Allèle Taille Allèle Taille Allèle Taille Allèle Taille Allèle Taille Allèle Taille Allèle Taille Allèle Taille Hum_FX 11 250,07 12 318,17 19 123,6 18 205,06 12 306,37 22 122,76 26 208,39 12 265,52 12 347,68 Hum_20FT 11 250,15 11 314 17 116,01 16 197,55 13 310,36 19 113,84 26 208,38 12 265,59 11 343,7 Hum_21PF 13 258,09 12 318,15 18 119,85 15 193,74 12 306,29 23 125,7 25 205,33 14 273,63 12 347,74 Hu m_28IT 11 250,15 13 322,24 15 108,19 15 193,79 13 310,36 22 122,77 27 211,41 12 265,59 12 347,74 H um_29AH 12 254,09 11 314 18 119,85 18.2 207,01 12 306,3 26 134,69 25 205,26 12 265,6 12 347,75 Hum_310L 11 250,15 12 318,2 19 123,65 16 197,5 12 306,31 22 122,81 24 202,26 12 265,62 12 347,7 Hum_34AHB 10 246,05 12 318,2 16 112,1 16 197,49 12 306,31 26 134,65 25 205,34 13 269,59 11 343,67 Hum_35JN 12 254,04 12 318,12 17 116,01 16.2 199,32 11 302,24 25 131,7 29 217,6 12 265,61 11 343,67 Hum_38ME 12 254,08 12 318,2 18 119,77 16 197,44 13 310,36 23 125,74 25 205,32 12 265,57 13 351,81 Hu m_39TB 11 250,15 13 322,26 16 112,14 15 193,8 12 306,25 26 134,66 23 199,15 13 269,66 11 343,66 Hum_40EH 11 250,23 12 318,13 18 119,92 17 201,54 13 310,29 22 122,73 25 205,23 12 265,62 12 347,67 Hu m43PF 11 250,23 11 313,92 16 112,21 15 193,77 11 302,28 27 137,65 28 214,47 13 269,69 11 343,69 Hum_45AMB 11 250,23 10 309,91 18 119,92 17 201,47 12 306,3 26 134,67 26 208,34 12 265,64 11 343,7 H u m_César 11 250,14 11 314 18 119,85 15 193,68 13 310,32 22 122,72 26 208,33 12 265,65 12 347,69 Chimp_103 11 236,96 11 354,82 3 73,36 25 275,3 25 351,36 NA NA 21 209,38 14 262,73 NA NA Chimp_211 10 232,99 12 358,88 3 73,26 26 279,02 25 351,42 NA NA 23 215,62 13 258,67 NA NA Ch imp_253 10 232,96 11.2 356,85 3 73,23 27 282,79 24 347,33 NA NA 22 212,49 13 258,7 NA NA NA NA Chimp_273 9 229,07 10 350,68 3 73,32 24.1 272,37 23 343,18 NA NA 20 206,29 13 258,72 Chimp_295 11 236,93 11 354,86 3 73,4 25 275,26 25 351,37 NA NA 21 209,42 14 262,67 NA NA NA NA NA NA NIA Chimp_367 10 232,93 11 354,82 3 73,35 26 279,17 24 347,3 NA NA 20 206,34 13 258,81 Chimp_61A 10 233,01 11 354,82 3 73,27 27 282,93 23 343,24 NA NA 23 215,56 12 254,83 Chimp_Sg229 11 236,96 11 354,77 3 73,43 25 275,35 25 351,29 NA NA 21 209,35 14 262,75 NA Chimp_Sg369 10 232,91 12 358,87 3 73,37 26 279,24 25 351,36 NA NA 23 215,54 13 258,74 NA NA Chimp_SgC1 11 236,96 10 350,68 3 73,45 26 279,16 23 343,16 NA NA 22 212,46 14 262,66 NA NA Chimp_202 o 0 0 0 0 0 0 0 0 0 NA NA 0 0 0 0 NA NA (femelle/contrôle) Nb allèles Ho 4 4 5 5 3 6 7 3 2 Gamme allélique 10-12 10-13 15-19 15-18 11-13 19-27 23-29 12-14 55 Nb allèles Chz 3 4 1 4 227 NA 4 123-14 NA 9-11 10-12 (3) 3 20-23 23-25 Tableau 11 M2 SRY UTX UTY Samples Allèle Taille Allèle Taille Allèle Taille Hum_FX 1 81,56 1 120,61 1 91,36 Hum_20FT 1 81,57 1 120,61 1 91,4 Hum_21PF 1 81,67 1 120,62 1 91,44 Hum_28IT 1 81,57 1 120,61 1 91,4 Hum_29AH 1 81,56 1 120,62 1 91,36 Hum_310L 1 81,63 1 120,68 1 91,43 Hum_34AHB 1 81,57 1 120,61 1 91,45 Hum_35JN 1 81,56 1 120,61 1 91,4 Hum_38ME 1 81,54 1 120,6 1 91,38 Hum_39TB 1 81,58 1 120,62 1 91,42 Hum_40EH 1 81,67 1 120,62 1 91,38 Hum_43PF 1 81,6 1 120,62 1 91,43 Hum_45AMB 1 81,6 1 120,63 1 91,4 Hum_Cesar 1 81,64 1 120,61 1 91,45 Chimp_103 1 81,59 1 120,7 1 91,34 Chimp_211 1 81,57 1 120,62 1 91,28 Chimp_253 1 81,56 1 120,61 1 91,36 Chimp_273 1 81,68 1 120,63 1 91,35 Chimp_295 1 81,6 1 120,71 1 91,31 Chimp_367 1 81,59 1 120,7 1 91,3 Chimp_61A 1 81,59 1 120,7 1 91,34 Chimp_Sg229 1 81,59 1 120,63 1 91,34 Chimp_Sg369 1 81,59 1 120,62 1 91,3 Chimp_SgC1 1 81,67 1 120,62 1 91,39 Chimp_202_Fem 0 0 1 120,7 0 0 Nb allèles Ho 1 1 1 Nb allèles Chz 1 1 1 Tableau 12 Ces tableaux résument l'ensemble des variations génétiques (appelées aussi allèles) observées chez les individus, et pour chaque marqueur. On voit rapidement que chaque marqueur présente plusieurs allèles chez l'homme et un peu moins chez le chimpanzé - résultat parfaitement compatible avec l'histoire démographique de ces 2 espèces. Ces résultats qui portent uniquement sur 13 et 11 individus, se révèlent déjà plus efficace que ce qui est publié jusque-là chez le chimpanzé. C'est donc très révélateur du pouvoir de discrimination de cet outil. L'ensemble CombYplex qui comprend les multiplex M1 et M2 montre une très bonne reproductibilité et robustesse, à la fois chez le l'homme et chez le chimpanzé. Il permet d'amplifier 30/31 marqueurs avec des tailles toujours inférieures à 350 bp, il permet de faire de l'ADN ancien ou de moyenne qualité, comme testé sur des individus datant du 16ème siècle.
EXEMPLE 2: Outil de sexage Matériels et méthodes Echantillons de primates humains et non humains. Un panel de 177 échantillons d'ADN a été utilisé, incluant 116 échantillons humains, et 61 échantillons de primates non humains à partir de 45 espèces distinctes. Des échantillons humains ont été obtenus à partir de volontaires en bonne santé et les échantillons de primates non humains provenaient d'une collection. Une liste de ces échantillons, incluant le groupe taxonomique, le nom commun de l'espèce et mes informations sur le sexe obtenues préalablement est donné au tableau 13. Les échantillons d'ADN utilisés ont été extraits de différents substrats incluant la salive, le sérum, le sang total, du tissu et une culture cellulaire. 58 Groupe Genre et espèce Nom commun Type ID de Sexe Sexe Taxonomique/ordre d'échantillon l'échantillon rapporté génétique biologique Homo sapiens Humain Salive 1 Mâle Mâle Homo sapiens Humain Sérum 2 Mâle Mâle Homo sapiens Humain Salive 3 Femelle Femelle Homo sapiens Humain Sérum 4 Femelle Femelle 1 ,Pan troglodytes troglodytes Chimpanzé d'Afrique Centrale Sang 5 Mâle Mâle Pan troglodytes troglodytes Chimpanzé d'Afrique Centrale Sérum 6 Mâle Mâle Pan troglodytes troglodytes Chimpanzé d'Afrique Centrale Sang 7 Femelle Femelle Pan troglodytes troglodytes Chimpanzé d'Afrique Centrale Sérum 8 Femelle Femelle 2 Pan paniscus Bonobo Sérum 9 Mâle Mâle 3 Gorilla gorilla Gorille de l'Ouest Sang 10 Mâle Mâle Gorilla gorilla Gorille de l'Ouest Sang 11 Femelle Femelle Gorilla sp. Gorille Sérum 12 Mâle Mâle 4 Pongo pygmaeus pygmaeus Orang-Outan de Bornéo Sérum 13 Mâle Mâle Pongo sp. Orang-Outan Sang 14 Mâle Mâle Pongo sp. Orang-Outan Sang 15 Femelle Femelle Hylobates lar Gibbon à mains blanches Sang 16 Mâle Mâle Hylobates lar Gibbon à mains blanches Sérum 17 Mâle Mâle Hylobatesilar Gibbon à mains blanches Sang 18 Femelle Femelle Hylobates! sp. Gibbon Sérum 19 Femelle Femelle 6 Cercopithecus cephus Guenon à moustache Sérum 20 Femelle? Femelle 7 Cercopithecus nictitans Hocheur Sérum 21 Mâle Mâle 8 Erythrocebus pales Singe rouge Sérum 22 Femelle? Femelle 9 Cercocebus torquatus Mangabey couronné Sérum 23 Mâle Mâle Mandrillus sphinx Mandrill Sérum 24 Mâle Mâle 11 Lophocebus albigena Mangabey à joues blanches Sérum 25 Femelle Femelle 12 Papio sp. Babouin Sang 26 Femelle Femelle 59 Papio sp. Babouin Sang 27 Mâle Mâle 13 Macaca mulatta Macaque rhésus Sang 28 Mâle Mâle Macaca sylvanus Macaque berbère Sang 29 Femelle Femelle 14 Macaca sylvanus Macaque berbère Sang 30 Mâle Mâle Alouatta caraya Singe Hurleur noir Sérum 31 Mâle Mâle Alouatta caraya Singe Hurleur noir Inconnu Mâle 16 Aotus trivirgatus Aotus Sérum 32 Mâle Mâle 17 Saïmiri sciureus Saïmiri commun Sérum 33 Mâle? Mâle Saïmiri sciureus Saïmiri commun Sérum 34 Mâle? Mâle Saïmiri sciureus Saïmiri commun Sérum 35 Mâle? Mâle 18 Cebus apella Apelle Sérum 36 Femelle Femelle Cebus apella Apelle Sérum 37 Mâle Mâle 19 Callithrix jacchus Ouistiti à toupets blancs Sérum 38 Mâle Mâle Lepilemur dorsalis Lépilémur à dos gris Tissu (dans alcool) 39 Inconnu Mâle Lepilemur dorsalis Lépilémur à dos gris Culture cellulaire 40 Inconnu Mâle 21 Lepilemur sahamalazensis Lépilémur de Sahamalaza Culture cellulaire 41 Inconnu Femelle 22 Lepilemur ankaranensis Lépilémur ankaranensis Sang 42 Inconnu Mâle Lepilemur ankaranensis Lépilémur ankaranensis Tissu sec 43 Inconnu Mâle 23 Lepilemur mittermeieri Lépilémur mittermeieri Sang 44 Femelle Femelle 24 Lepilemur ruficaudatus Lépilémur à queue rousse Sang 45 Mâle Mâle Lepilemur aeeclis Lépilémur d'Antafia Sang 46 Mâle Mâle 26 Microcebus murinus Microcèbe mignon Tissu sec 47 Femelle Femelle 27 Hapalemurgriseus ranomafanensis Hapalémur gris Tissu sec 48 Inconnu Femelle 28 Hapalemurgriseus meridionalis Hapalémur bambou gris du Sud Tissu sec 49 Inconnu Femelle 29 Hapalemurgriseus occidentalis Hapalémur occidental gris Tissu sec 50 Mâle Mâle Hapalemur aureus Hapalémur doré Tissu sec 51 Inconnu Femelle 31 Hapalemur simus Grand Hapalémur Tissu sec 52 Femelle Femelle Hapalemur simus Grand Hapalémur Tissu sec 53 Mâle Mâle 60 Hapalemur simus Grand Hapalémur Tissu sec 54 Femelle Femelle 32 Hapalemur griseus griseus Hapalémur gris Tissu sec 55 Femelle Femelle 33 Eulemur macaco macaco Lémur noir na 56 Inconnu Mâle Eulemur macaco macaco Lémur noir na 57 Inconnu Mâle Eulemur macaco macaco Lémur noir Sérum 58 Inconnu Mâle 34 Eulemur macaco flavifrons Lémur aux yeux turquoise Tissu sec 59 Inconnu Mâle Eulemur macaco flavifrons Lémur aux yeux turquoise Tissu sec 60 Inconnu Mâle Lemur catta Lémur catta Sérum 61 Inconnu Mâle 36 Propithecus diademma edwardsi Propithèque de Milne-Edwards Tissu sec 62 Inconnu Femelle 37 Propithecus tattersalli Sifaka de Tattersall Tissu sec 63 Femelle Femelle 38 Propithecus verreauxi coquerelli Propithèque de Coquerel Culture cellulaire 64 Mâle Mâle 39 Propithecus verreauxi verreauxi Propithèque de Verreaux Tissu sec 65 Mâle Mâle Propithecus verreauxi deckeni Propithèque de Verreaux Deckeni Tissu sec 66 Femelle Femelle 41 Propithecus diadema diadema Propithèque à diadème Sang 67 Femelle Femelle 42 Avahi laniger Avahi laineux Sang 68 Mâle Mâle Avahi laniger Avahi laineux Tissu sec 69 Femelle Femelle 43 Avahi occidentalis Avahi occidental Sang 70 Mâle Mâle Avahi occidentalis Avahi occidental Sang 71 Femelle Femelle 44 Avahi cleesei Avahi de John Cleese Culture cellulaire 72 Femelle Femelle Avahi cleesei Avahi de John Cleese Dry tissue 73 Inconnu Mâle Indri indri Indri Culture cellulaire 74 Inconnu Mâle Tableau 13 Extraction d'ADN Le procédé d'extraction d'ADN dépend du type d'échantillon. L'ADN a été extrait de : -(i) sang total en utilisant le mini-kit QiaAmp DNA Blood mini-kit (Qiagen), - (ii) sérum en utilisant le mini-kit i-genomic DNA Blood mini-kit (Euromedex) - (iii) salive en utilisant le kit 0G-300 Oragene DNA Self-Collection Kit (DNA Genotek), - (iv) culture cellulaire en utilisant le mini kit Blood & Cell Culture DNA (Qiagen), selon les instructions du fabricant pour chacun des kits utilisés.
La quantité et la qualité de l'ADN extrait ont été estimées en utilisant un spectrophotomètre NanoDrop. Conception des amorces de PCR Les amorces de PCR pour l'amplification du fragment SRY ont été publiées précédemment (Fiore et al. 2005). Les amorces de PCR pour la co-amplification des régions homologues de UTX et UTY ont été conçues à partir de régions conservées UTX/UTY. Les séquences disponibles dans les banques pour les différentes espèces de primates ont été alignées à l'aide de BioEdit v.7.0.5.3.Les régions conservées pour chaque gène ont été utilisées pour le design d'amorces en utilisant le logiciel Primer3 v.0.4.0 afin de permettre la co-amplification des fragments d'UTX et d'UTY de tailles relativement petites, à partir d'échantillon comprenant probablement de l'ADN dégradé. Des amorces sens marquées en 5' avec un fluorochrome FAM fluorescent (InVitrogen) ont été utilisées pour permettre la détection par électrophorèse capillaire. Les séquences des amorces et les tailles des amplicons sont montrées au tableau 6.
Marqueur Amorce sens Amorce anti-sens Longueur amplifiée (bp) SEQ ID NO Séquence (5'-3') SEQ ID NO Séquence (5'-3') SRY 70 agtgaagcgacccatgaacg 66 tgtgcctcctggaagaatgg 165 UTY 67 cagtgttaccagccttaacag 68 ggcaggtctacttttgtagag 91 UTX 69 tctgtggactaggtttgtggt 120 62 Séquence (5'-3') des amorces sens Conc. Séquence (5'-3') des amorces anti- sens de PCR Conc. Taille de PCR (pM) (pM) amplicon (bp) Amorces test UTXUTY_F1 (FAM-) 1 0,4 UTX_R1 0,2 120 CAGTGTTACCAGCCTTAACAG 5'TCTGTGGACTAGGTTTGTGGT 3' 0,2 91 (SEQ ID NO 67) (SEQ ID NO 69) UTY_R1 5'GGCAGGTCTACTTTTGTAGAG 3' (SEQ ID NO 68) SRY_F1 (FAM-) 2 0,2 SRY_R1 0,2 165 5' AGTGAAGCGACCCATGAACG 3' 5' TGTGCCTCCTGGAAGAATGG 3' (SEQ ID NO : 70) (SEQ ID NO 66) Tableau 6 Amplification par PCR multiplex Des régions d'UTX, UTY et/ou SRY ont été amplifiées simultanément dans un volume final de 12,5 pl consistant à 1X du tampon B de PCR (Fisher Bioblock), 1,5mM de MgCl2, 200pM de chaque dNTP, 0,2 à 0,4 pM d'amorces, 1U d'ADN polymérase Taq (Fisher Bioblock) et 15 à 25 ng d'échantillon d'ADN. Les concentrations des amorces pour chaque amorce sont données dans le tableau 6. Les conditions du cycle de PCR sont une première étape de dénaturation à 94°C pendant 5 min suivie de 40 cycles de dénaturation à 94°C pendant 30s, l'hybridation à 55°C pendant 30s et une élongation à 72°C pendant 30s avec une étape d'élongation finale à 72°C pendant 5min. Il est important de noter la température d'hybridation a été diminuée à 51 °C pour les échantillons prosimiens. Détection par électrophorèse Les produits de PCR ont été d'abord testés visuellement par électrophorèse sur gel d'agarose (140V, 40min) sur des gels à 2% d'agarose en utilisant une coloration SYBR Safe (Invitrogen). Pour la préparation des échantillons pour la détection par électrophorèse capillaire, 1p1 de produits de PCR dilué 100 fois a été alors mélangé avec 0,2p1 de standard interne de taille GeneScan-600LIZ et 8,8p1 formamide Hi-Di . Après dénaturation à 95°C pendant 5 min, les échantillons ont été séparés sur un Genetic Analyzer ABI 3730 en utilisant POP-7 . Les données ont été analysées en utilisant un logiciel GeneMapper y. 4.0 . Séquençage UTX, UTY et SRY ont été amplifiés séparément en utilisant les paires d'amorces dans le tableau 6, comme précédemment décrit. Chaque produit de PCR a été séquencé dans deux réactions en utilisant les amorces PCR sens et anti-sens. La réaction de séquençage a été réalisée avec un kit de séquençage Big Dye Terminator v3.1 (Applied Biosystems). Les produits de PCR ont été séparés sur un Genetic Analyzer ABI 3730 (Applied Biosysems). Les séquences ont été analysées et assemblées en utilisant le logiciel Sequence Scanner v1.0 (Applied Biosystems) et l'éditeur d'alignement de séquence BioEdit. Résultats Les PCR multiplexs développés incluant à la fois les amorces UTX/UTY et SRY permettent une détermination du sexe pour chaque échantillon d'ADN testé. Les résultats sont donnés au tableau 7. Femelle Mâle Profil F -Profil A Profil B Profil C Hominidae Homo sapiens 2 2 0 0 Pan sp. 2 3 0 0 Gorilla sp. 1 2 0 0 Pongo sp. 1 2 0 0 Hylobatidae Hylobates sp. 2 2 0 0 Cercopithecidae Cercopithecus sp. 1 1 0 0 Erythrocebus patas 1 0 0 0 Cercocebus torquatus 0 1 0 0 Mandrillus sphinx 0 1 0 0 Lophocebus albigena 1 0 0 0 Papio sp. 1 1 0 0 Macaca sp. 1 2 0 0 Atelidae Alouatta 0 1 0 0 caraya Cebidae Saïmiri 0 0 0 3 jacchus sciureus Cebus apella 1 0 0 1 Aotus trivirgatus 0 1 0 0 Callithrix 0 1 0 0 Lemuridae Hapalemur sp. 6 7 0 0 Eulemur sp. 0 3 0 1 Lepilemuridae Lepilemur sp. 2 4 2 0 Indriidae Avahi sp. 3 1 1 0 Propithecus sp. 4 2 0 0 Indri indri 0 0 0 1 Tableau 7 Des échantillons femelles ont été identifiés par un seul signal correspondant à des fragments spécifiques d'UTX de 125 bp (profil F, figure 9). Au contraire, trois profils différents ont été observés pour des échantillons mâles comme illustré aux figures 6 à 8. En effet, les échantillons mâles ont été identifiés soit par trois signaux, qui correspondaient au fragment spécifique de X et aux deux fragments spécifiques d'Y (profil A) ou occasionnellement par deux signaux qui correspondaient au fragment spécifique de X et seulement à un des deux fragments du chromosome Y c'est-à-dire soit à SRY (profil C) soit à UTY (profil B). Les résultats obtenus pour chaque échantillon sont donnés au tableau 5. Un profil typique de mâle (profil A) présentant à la fois des fragments SRY et UTY a été observé pour la plupart des échantillons. Les six échantillons qui ne présentaient pas de fragments UTY mais qui montraient clairement un signal spécifique de SRY appartiennent aux espèces de singes du Nouveau Monde (Saïmri sciureus (n=3) et Cebus' apella (n=1)) et aux deux espèces de prosimiens (Indri Indri (n=1) et Eulemur macaco flavifrons (n=1)) Les cinq échantillons qui ne présentaient pas de fragment SRY mais montraient un signal spécifique d'UTY clair appartenaient aux espèces de singes de l'ancien Monde (Lophocebus albigena) et quatre espèces de prosimiens.
Pour les 54 échantillons testés dont le sexe était déjà connu, le sexe déterminé avec le nouveau test a toujours été concordant avec le sexe morphologique. Afin de chercher si un échec de l'amplification du locus UTY ou SRY était du à une mutation dans le site de liaison de l'amorce ou à une délétion de nouveaux sets d'amorces UTRY et SRY ont été conçus. Les amplifications avec les seconds sets d'amorces ont été réussies pour tous les échantillons et le séquençage des amplicons en résultant a révélé que l'impossibilité d'amplifier le locus avec le premier set d'amorces était du à des mutations dans les sites de liaison des amorces. Ainsi, le nouveau procédé développé permet de manière non ambigüe de déterminer le genre de tous les échantillons testés même en présence d'une mutation dans la région de l'amorce. Le premier et principal avantage de ce procédé est qu'il combine deux tests de sexage indépendant UTX/UTY et SRY dans un essai permettant une détermination exacte du sexe. En effet, 11 échantillons mâles qui n'avaient pas de fragments UTY ou SRY qui auraient été précédemment considérés comme des échantillons femelles sur la base de la seule analyse du locus UTXTTUY ou SRY, ont été identifiés comme étant des mâles par la présente approche. Ceci montre le besoin d'un test de détermination du sexe qui inclut au moins 2 marqueurs Y pour les primates, empêchant alors une mauvaise identification du sexe dues à un polymorphisme structurel élevé sur le chromosome Y ou à une mutation sur le site de liaison de l'amorce. En utilisant deux fragments spécifiques de Y, l'effet négatif d'une mutation sur le site de liaison de l'amorce ou d'une délétion sur une amplification peut être minimisée étant donné qu'une mutation et/ou une délétion sur les deux loci a peu de risque de se produire. Le second avantage de ce procédé est son large spectre d'application chez le primate. En effet, il fonctionne sur toutes les espèces testées notamment grâce au travail sur la conception des amorces. Le même procédé fonctionne sur toutes les espèces testées mais une légère optimisation en réduisant la température d'hybridation est préférable pour sexer les espèces prosimiennes éloignées. Ce procédé est accessible aux laboratoires de biologie moléculaire avec un équipement basique étant donné que la différence de taille entre les trois produits d'amplification possibles est suffisamment importante pour être discernée par simple électrophorèse sur gel d'agarose et qu'un séquenceur automatique n'est pas nécessaire. Finalement, la petite taille des produits d'amplification (<200bp) les rend utile pour l'identification du sexe d'échantillons potentiellement dégradés tels que les échantillons de sérum et également les échantillons non invasifs tels que les cheveux ou les fèces. REFERENCES Au cours de cette demande, différentes références décrivent l'état de la technique de l'invention. Les descriptions de ces références sont ici incorporées par référence dans la présente description. Butler JM, Schoske R, Vallone PM, Kline MC, Redd AJ, Hammer MF. A novel multiplex for simultaneous amplification of 20 Y chromosome STR markers. Forensic Sci Int. 2002 Sep 10;129(1):10-24. Parkin EJ, Kraayenbrink T, Opgenort JR, van Driem GL, Tuladhar NM, de Knijff P, Jobling MA. Diversity of 26-locus Y-STR haplotypes in a Nepalese population sample: isolation and drift in the Himalayas.Forensic Sci Int. 2007 Mar 2;166(2-3):176-81. Epub 2006 Jun 15.
Patel, P. I., et al. (1984) "Organization of the HPRT gene and related sequences in the human genome," Somat Cell Mol Genet 10: 483-493, and Gill, P., et al. (1985) "Forensic application of DNA 'fingerprints'," Nature 318: 577-579. Chamberlain JS, Gibbs RA, Ranier JE, Nguyen PN, Caskey CT. Nucleic Acids Res. 1988 Dec 9;16(23):11141-56. Deletion screening of the Duchenne muscular dystrophy locus via multiplex DNA amplification. Morral N, Estivill X. Multiplex PCR amplification of three microsatellites within the CFTR gene. Genomics. 1992 Aug;13(4):1362-4. Ensminger AL, Hoffman SM. Sex identification assay useful in great apes is not diagnostic in a range of other primate species. Am J Primatol. 2002 Feb;56(2):129-34.
Kimpton CP, Gill P, Walton A, Urquhart A, Millican ES, Adams M. Automated DNA profiling employing multiplex amplification of short tandem repeat loci. PCR Methods Appl. 1993 Aug;3(1):13-22. Hammond; Schumm, J. W. et al. (1994) "Development of nonisotopic multiplex amplification sets for analysis of polymorphic STR loci," in "The Fourth International Symposium on Human Identification 1993," pp. 177-187 Goedbloed M, Vermeulen M, Fang RN, Lembring M, Wollstein A, Ballantyne K, Lao O, Brauer S, Krüger C, Roewer L, Lessig R, Ploski R, Dobosz T, Henke L, Henke J, Furtado MR, Kayser M. Comprehensive mutation analysis of 17 Y-chromosomal short tandem repeat polymorphisms included in the AmpFISTR Yfiler PCR amplification kit. Int J Legal Med. 2009 Nov;123(6):471- Hanson EK, Ballantyne J. An ultra-high discrimination Y chromosome short tandem repeat multiplex DNA typing system. PLoS One. 2007 Aug 1;2(8):e688. Ballantyne KN, Goedbloed M, Fang R, Schaap O, Lao O, Wollstein A, Choi Y, van Duijn K, Vermeulen M, Brauer S, Decorte R, Poetsch M, von Wurmb-Schwark N, de Knijff P, Labuda D, Vézina H, Knoblauch H, Lessig R, Roewer L, Ploski R, Dobosz T, Henke L, Henke J, Furtado MR, Kayser M. Mutability of Y-chromosomal microsatellites: rates, characteristics, molecular bases, and forensic implications. Am J Hum Genet. 2010 Sep 10;87(3) :341-53. doi: 10.1016/j.ajhg.2010.08.006. Vermeulen M, Wollstein A, van der Gaag K, Lao O, Xue Y, Wang Q, Roewer L, Knoblauch H, Tyler-Smith C, de Knijff P, Kayser M. Improving global and regional resolution of male lineage differentiation by simple single-copy Y-chromosomal short tandem repeat polymorphisms. Forensic Sci Int Genet. 2009 Sep;3(4):205-13. doi: 10.1016/j.fsigen.2009.01.009. Epub 2009 Feb 23. Maybruck JL, Hanson E, Ballantyne J, Budowle B, Fuerst PA. A comparative analysis of two different sets of Y-chromosome short tandem repeats (Y-STRs) on a common population panel. Forensic Sci Int Genet. 2009 Dec;4(1):11-20. doi: 10.1016/j.fsigen.2009.03.004. Epub 2009 May 17.
Hanson E, Maybruck JL, Ballantyne J, Fuerst PA. Performance evaluation and optimization of multiplex PCRs for the highly discriminating OSU 10-locus set Y-STRs. J Forensic Sci.
2012 Jan;57(1):52-9. doi: 10.1111/j.1556-4029.2011.01910.x. Epub 2011 Sep 21. Kayser M, Kittler R, Erler A, Hedman M, Lee AC, Mohyuddin A, Mehdi SQ, Rosser Z, Stoneking M, Jobling MA, Sajantila A, Tyler-Smith C. A comprehensive survey of human Y- chromosomal microsatellites. Am J Hum Genet.
2004 Jun;74(6):1183-97. SULLIVAN KM, MANNUCCI A, KIMPTON CP, GILL P. A rapid and quantitative dna sex test: fluorescence-based per analysis of x-y homologous gene amelogenin. Biotechniques. 1993 oct;15(4):636-8, 640-1.
Claims (13)
- REVENDICATIONS1. Procédé pour caractériser un échantillon d'ADN humain ou de chimpanzé comprenant une étape de : -détermination des allèles d'au moins 10 loci de STR de l'échantillon d'ADN, les loci étant choisis dans le groupe M1 et/ou le groupe M2, dans lequel : -le groupe M1 consiste en : DYS485, DYS588, DYS502, DYS461, DYS638, DYS643, DYS587, DYS575, DYS578, DYS632, DYS508, DYS640, DYS511, DYS577, DYS556, DYS517, DYS565 et DYS538 et -le groupe M2 consiste en : Y-GATA-A10, DYS570, DYS549, DYS460, DYS442, DYS510, DYS541, DYS576, DYS513, DYS458, DYS481, DYS612, DYS444 et DYS533.
- 2. Procédé pour caractériser un échantillon d'ADN selon la revendication 1 comprenant l'étape de détermination des allèles d'au moins 15 loci de STR choisis dans le groupe Ml.
- 3. Procédé pour caractériser un échantillon d'ADN selon la revendication 1 comprenant l'étape de détermination des allèles d'au moins 11 loci de STR choisis dans le groupe M2.
- 4. Procédé pour caractériser un échantillon d'ADN selon la revendication 1 comprenant la détermination des allèles : -d'au moins 10 loci de STR choisis dans le groupe M1 25 et -d'au moins 10 loci de STR choisis dans le groupe M2.
- 5. Procédé pour caractériser un échantillon d'ADN selon l'une quelconque des revendications 1 à 4 comprenant une étape de détermination du sexe dans lequel la 30 détermination du sexe comprend l'étape d'amplification des gènes SRY, UTY et UTX de l'échantillon d'ADN.
- 6. Procédé pour caractériser un échantillon d'ADN selon la revendication 5 dans lequel l'étape d'amplification des gènes SRY, UTY et UTX comprend l'ajout de paires d'amorces 35 ayant les séquences nucléiques : SEQ ID NO: 65 et SEQ ID NO: 66 pour SRY, SEQ ID NO: 67 et SEQ ID NO: 68 pour UTY et SEQ ID NO: 67 et SEQ ID NO: 69 pour UTX. 40 3 0 13 73 3 69
- 7. Kit comprenant des moyens pour déterminer les allèles d'au moins 10 loci de STR d'un échantillon d'ADN humain ou de chimpanzé, les loci étant choisis dans le groupe M1 et/ou le groupe M2, 5 dans lequel : -le groupe M1 consiste en : DYS485, DYS588, DYS502, DYS461, DYS638, DYS643, DYS587, DYS575, DYS578, DYS632, DYS508, DYS640, DYS511, DYS577, DYS556, DYS517, DYS565 et DYS538 et 10 -le groupe M2 consiste en : Y-GATA-A10, DYS570, DYS549, DYS460, DYS442, DYS510, DYS541, DYS576, DYS513, DYS458, DYS481, DYS612, DYS444 et DYS533.
- 8. Kit selon la revendication 7 comprenant au moins 10 paires d'amorces adaptées pour 15 amplifier les loci de STR et dans lequel les paires d'amorces ont des séquences nucléiques choisies dans le groupe consistant en : SEQ ID NO : 1 et SEQ ID NO : 2 pour le locus DYS485, SEQ ID NO : 3 et SEQ ID NO : 4 pour le locus DYS588, 20 SEQ ID NO : 5 et SEQ ID NO : 6 pour le locus DYS502, SEQ ID NO : 7 et SEQ ID NO : 8 pour le locus DYS461, SEQ ID NO : 9 et SEQ ID NO : 10 pour le locus DYS638, SEQ ID NO : 11 et SEQ ID NO : 12 pour le locus DYS643, SEQ ID NO : 13 et SEQ ID NO : 14 pour le locus DYS587, SEQ ID NO : 15 et SEQ ID NO : 16 pour le locus DYS575, SEQ ID NO : 17 et SEQ ID NO : 18 pour le locus DYS578, SEQ ID NO : 19 et SEQ ID NO : 20 pour le locus DYS632, SEQ ID NO : 21 et SEQ ID NO : 22 pour le locus DYS508, SEQ ID NO : 23 et SEQ ID NO : 24 pour le locus DYS640, SEQ ID NO : 25 et SEQ ID NO : 26 pour le locus DYS511, SEQ ID NO: 27 et SEQ ID NO : 28 pour le locus DYS577, SEQ ID NO : 29 et SEQ ID NO : 30 pour le locus DYS556, SEQ ID NO : 31 et SEQ ID NO : 32 pour le locus DYS517, SEQ ID NO : 33 et SEQ ID NO : 34 pour le locus DYS565, SEQ ID NO : 35 et SEQ ID NO : 36 pour le locus DYS538, SEQ ID NO : 37 et SEQ ID NO : 38 pour le locus Y-GATA-A10 SEQ ID NO : 39 et SEQ ID NO : 40 pour le locus DYS570, SEQ ID NO : 41 et SEQ ID NO : 42 pour le locus DYS549, SEQ ID NO : 43 et SEQ ID NO : 44 pour le locus DYS460, 3 0 13 73 3 70 SEQ ID NO : 45 et SEQ ID NO : 46 pour le locus DYS442 SEQ ID NO : 47 et SEQ ID NO : 48 pour le locus DYS510, SEQ ID NO : 49 et SEQ ID NO : 50 pour le locus DYS541, SEQ ID NO : 51 et SEQ ID NO : 52 pour le locus DYS576, 5 SEQ ID NO : 53 et SEQ ID NO : 54 pour le locus DYS513, SEQ ID NO : 55 et SEQ ID NO : 56 pour le locus DYS458, SEQ ID NO : 57 et SEQ ID NO : 58 pour le locus DYS481 SEQ ID NO : 59 et SEQ ID NO : 60 pour le locus DYS612, SEQ ID NO : 61 et SEQ ID NO : 62 pour le locus DYS444 et 10 SEQ ID NO : 63 et SEQ ID NO : 64 pour le locus DYS533.
- 9. Kit selon les revendications 7 ou 8 comprenant des moyens pour déterminer les allèles d'au moins 15 loci de STR choisis dans le groupe Ml. 15
- 10. Kit selon les revendications 7 ou 8 comprenant des moyens pour déterminer les allèles d'au moins 11 loci de STR choisis dans le groupe M2.
- 11. Kit selon l'une quelconque des revendications 7 à 10 comprenant des moyens pour 20 déterminer les allèles : -d'au moins 10 loci de STR choisis dans le groupe M1 et -d'au moins 10 loci de STR choisis dans le groupe M2. 25
- 12. Kit selon l'une quelconque des revendications 7 à 11 comprenant des moyens de détermination du sexe, dans lequel les moyens de détermination du sexe consistent en des moyens d'amplification des gènes SRY, UTY et UTX.
- 13. Kit selon la revendication 12 dans lequel les moyens d'amplification des gènes SRY, 30 UTY et UTX comprennent les paires d'amorces ayant les séquences nucléiques : SEQ ID NO: 65 et SEQ ID NO: 66 pour SRY, SEQ ID NO: 67 et SEQ ID NO: 68 pour UTY et SEQ ID NO: 67 et SEQ ID NO: 69 pour UTX.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR1361715A FR3013733A1 (fr) | 2013-11-27 | 2013-11-27 | Procede et kit pour determiner le sexe et/ou l'empreinte genetique d'un sujet |
| PCT/EP2014/075866 WO2015078997A1 (fr) | 2013-11-27 | 2014-11-27 | Procede et kit pour determiner le sexe et/ou l'empreinte genetique d'un sujet |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR1361715A FR3013733A1 (fr) | 2013-11-27 | 2013-11-27 | Procede et kit pour determiner le sexe et/ou l'empreinte genetique d'un sujet |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| FR3013733A1 true FR3013733A1 (fr) | 2015-05-29 |
Family
ID=50482928
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| FR1361715A Ceased FR3013733A1 (fr) | 2013-11-27 | 2013-11-27 | Procede et kit pour determiner le sexe et/ou l'empreinte genetique d'un sujet |
Country Status (2)
| Country | Link |
|---|---|
| FR (1) | FR3013733A1 (fr) |
| WO (1) | WO2015078997A1 (fr) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112746096A (zh) * | 2020-12-31 | 2021-05-04 | 郑州高新生物技术有限公司 | 一种基于二代测序的人类y-str检测方法及其应用 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2012155084A1 (fr) * | 2011-05-12 | 2012-11-15 | Netbio, Inc. | Procédés et compositions destinés à l'amplification multiplex rapide de loci de séquences courtes répétées en tandem |
-
2013
- 2013-11-27 FR FR1361715A patent/FR3013733A1/fr not_active Ceased
-
2014
- 2014-11-27 WO PCT/EP2014/075866 patent/WO2015078997A1/fr not_active Ceased
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2012155084A1 (fr) * | 2011-05-12 | 2012-11-15 | Netbio, Inc. | Procédés et compositions destinés à l'amplification multiplex rapide de loci de séquences courtes répétées en tandem |
Non-Patent Citations (14)
| Title |
|---|
| A GREENFIELD ET AL: "The UTX gene escapes X inactivation in mice and humans", HUMAN MOLECULAR GENETICS, vol. 7, no. 4, 1 April 1998 (1998-04-01), pages 737 - 742, XP055127629, DOI: 10.1093/hmg/7.4.737 * |
| AXEL ERLER ET AL: "Development of Y-chromosomal microsatellite markers for nonhuman primates", MOLECULAR ECOLOGY, vol. 13, no. 10, 14 October 2004 (2004-10-14), pages 2921 - 2930, XP055127332, ISSN: 0962-1083, DOI: 10.1111/j.1365-294X.2004.02304.x * |
| BUTLER J M ET AL: "Allele frequencies for 27 Y-STR loci with U.S. Caucasian, African American, and Hispanic samples", FORENSIC SCIENCE INTERNATIONAL, ELSEVIER SCIENTIFIC PUBLISHERS IRELAND LTD, IE, vol. 156, no. 2-3, 27 January 2006 (2006-01-27), pages 250 - 260, XP027939878, ISSN: 0379-0738, [retrieved on 20060127] * |
| ERIN HANSON ET AL: "Performance Evaluation and Optimization of Multiplex PCRs for the Highly Discriminating OSU 10-Locus Set Y-STRs*,+", JOURNAL OF FORENSIC SCIENCES, vol. 57, no. 1, 21 September 2011 (2011-09-21), pages 52 - 59, XP055127616, ISSN: 0022-1198, DOI: 10.1111/j.1556-4029.2011.01910.x * |
| ERIN K. HANSON ET AL: "An Ultra-High Discrimination Y Chromosome Short Tandem Repeat Multiplex DNA Typing System", PLOS ONE, vol. 2, no. 8, 1 August 2007 (2007-08-01), pages e688, XP055062352, DOI: 10.1371/journal.pone.0000688 * |
| GUSMAO L ET AL: "DNA Commission of the International Society of Forensic Genetics (ISFG): An update of the recommendations on the use of Y-STRs in forensic analysis", FORENSIC SCIENCE INTERNATIONAL, ELSEVIER SCIENTIFIC PUBLISHERS IRELAND LTD, IE, vol. 157, no. 2-3, 10 March 2006 (2006-03-10), pages 187 - 197, XP027939835, ISSN: 0379-0738, [retrieved on 20060310] * |
| HANSON E K ET AL: "Population data for 48 'Non-Core' Y chromosome STR loci", LEGAL MEDICNE, JAPANESE SOCIETY OF LEGAL MEDICINE, TOKYO, JP, vol. 9, no. 4, 1 July 2007 (2007-07-01), pages 221 - 231, XP025321576, ISSN: 1344-6223, [retrieved on 20070530], DOI: 10.1016/J.LEGALMED.2006.12.002 * |
| KAYE N. BALLANTYNE ET AL: "Mutability of Y-Chromosomal Microsatellites: Rates, Characteristics, Molecular Bases, and Forensic Implications", THE AMERICAN JOURNAL OF HUMAN GENETICS, vol. 87, no. 3, 1 September 2010 (2010-09-01), pages 341 - 353, XP055079876, ISSN: 0002-9297, DOI: 10.1016/j.ajhg.2010.08.006 * |
| KAYSER ET AL: "Relating two deep-rooted pedigrees from Central Germany by high-resolution Y-STR haplotyping", 20070601, vol. 1, no. 2, 1 June 2007 (2007-06-01), pages 125 - 128, XP022122482 * |
| MAYBRUCK J L ET AL: "A comparative analysis of two different sets of Y-chromosome short tandem repeats (Y-STRs) on a common population panel", FORENSIC SCIENCE INTERNATIONAL: GENETICS, ELSEVIER BV, NETHERLANDS, vol. 4, no. 1, 1 December 2009 (2009-12-01), pages 11 - 20, XP026789909, ISSN: 1872-4973, [retrieved on 20090517], DOI: 10.1016/J.FSIGEN.2009.03.004 * |
| MIRIAM GOEDBLOED ET AL: "Comprehensive mutation analysis of 17 Y-chromosomal short tandem repeat polymorphisms included in the AmpFlSTR TM Yfiler TM PCR amplification kit", INTERNATIONAL JOURNAL OF LEGAL MEDICINE, SPRINGER, BERLIN, DE, vol. 123, no. 6, 26 March 2009 (2009-03-26), pages 471 - 482, XP019760116, ISSN: 1437-1596, DOI: 10.1007/S00414-009-0342-Y * |
| RODIG ET AL: "Evaluation of haplotype discrimination capacity of 35 Y-chromosomal short tandem repeat loci", FORENSIC SCIENCE INTERNATIONAL, ELSEVIER SCIENTIFIC PUBLISHERS IRELAND LTD, IE, vol. 174, no. 2-3, 8 January 2008 (2008-01-08), pages 182 - 188, XP022413310, ISSN: 0379-0738, DOI: 10.1016/J.FORSCIINT.2007.04.223 * |
| VERMEULEN M ET AL: "Improving global and regional resolution of male lineage differentiation by simple single-copy Y-chromosomal short tandem repeat polymorphisms", FORENSIC SCIENCE INTERNATIONAL: GENETICS, ELSEVIER BV, NETHERLANDS, vol. 3, no. 4, 1 September 2009 (2009-09-01), pages 205 - 213, XP026396384, ISSN: 1872-4973, [retrieved on 20090223], DOI: 10.1016/J.FSIGEN.2009.01.009 * |
| VILLESEN PALLE ET AL: "Fast and non-invasive PCR sexing of primates: apes, Old World monkeys, New World monkeys and Strepsirrhines", BMC ECOLOGY, BIOMED CENTRAL LTD., LONDON, GB, vol. 6, no. 1, 8 June 2006 (2006-06-08), pages 8, XP021017110, ISSN: 1472-6785, DOI: 10.1186/1472-6785-6-8 * |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2015078997A1 (fr) | 2015-06-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP1601798B1 (fr) | Biopuces a sondes et leurs methodes d'utilisation | |
| Schmidt et al. | Genotyping‐in‐Thousands by sequencing (GT‐seq) panel development and application to minimally invasive DNA samples to support studies in molecular ecology | |
| EP3329014A2 (fr) | Systèmes et procédés d'analyse génétique | |
| EP3450569A1 (fr) | Procédé d'amplification d'adn | |
| Gomes et al. | Digging deeper into East African human Y chromosome lineages | |
| JP2006512094A5 (fr) | ||
| KR101923647B1 (ko) | 쥬빌리 타입 또는 크림슨 타입 수박 품종 판별용 snp 마커 | |
| US10947592B2 (en) | Method for detecting cystic fibrosis | |
| KR20160138853A (ko) | 한국 토착 갈색 코니쉬 계통 닭 품종 판단용 snp 마커 및 이의 용도 | |
| FR3085689A1 (fr) | Procede pour determiner in vitro ou ex vivo le statut immunitaire d'un individu | |
| Esteve Codina et al. | “GenderPlex” a PCR multiplex for reliable gender determination of degraded human DNA samples and complex gender constellations | |
| Wendt et al. | Analysis of short tandem repeat and single nucleotide polymorphism loci from single-source samples using a custom HaloPlex target enrichment system panel | |
| FR3013733A1 (fr) | Procede et kit pour determiner le sexe et/ou l'empreinte genetique d'un sujet | |
| Miller et al. | Whole blood RNA offers a rapid, comprehensive approach to genetic diagnosis of cardiovascular diseases | |
| EP1802773B1 (fr) | Procédé pour le diagnostic d'une intolérance à l'aspirine | |
| FR2842534A1 (fr) | Amplification multiplex quantitative a l'echelle d'un genome, et applications a la detection de remaniements genomiques | |
| KR102083675B1 (ko) | 단일염기다형성 마커를 이용한 칡소 품종 식별 방법 | |
| EP4097254A1 (fr) | Procede de genotypage hla simple et rapide | |
| CN114507707B (zh) | 一种富集目标区域再酶切构建单倍型的方法 | |
| CN101063172A (zh) | Cyp2c19基因第六号外显子的单核苷酸多态性的检测方法 | |
| EP1944380A1 (fr) | Méthode d'obtention d'un profil génétique spécifique d'une variété d'orge à l'aide de couples d'amorces | |
| KR101700623B1 (ko) | 돼지의 혈액 내 아밀라아제 수준 판단용 snp 마커 및 이의 용도 | |
| KR20250064058A (ko) | 북극식물 담자리꽃나무 판별용 snp 마커 및 이의 용도 | |
| CN118291637A (zh) | 一种用于水獭个体识别的遗传标记及其应用 | |
| EP4101863A1 (fr) | Levures oenologiques pour le controle de la teneur en acide malique des vins |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PLFP | Fee payment |
Year of fee payment: 3 |
|
| PLFP | Fee payment |
Year of fee payment: 4 |
|
| PLFP | Fee payment |
Year of fee payment: 5 |
|
| RX | Complete rejection |