RU2817569C2 - Dna methylation biomarkers for early detection of cervical cancer - Google Patents
Dna methylation biomarkers for early detection of cervical cancer Download PDFInfo
- Publication number
- RU2817569C2 RU2817569C2 RU2021112399A RU2021112399A RU2817569C2 RU 2817569 C2 RU2817569 C2 RU 2817569C2 RU 2021112399 A RU2021112399 A RU 2021112399A RU 2021112399 A RU2021112399 A RU 2021112399A RU 2817569 C2 RU2817569 C2 RU 2817569C2
- Authority
- RU
- Russia
- Prior art keywords
- dna
- methylation
- cervical cancer
- artificial sequence
- dna methylation
- Prior art date
Links
- 206010008342 Cervix carcinoma Diseases 0.000 title claims abstract description 217
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 title claims abstract description 217
- 201000010881 cervical cancer Diseases 0.000 title claims abstract description 217
- 230000007067 DNA methylation Effects 0.000 title abstract description 195
- 239000000090 biomarker Substances 0.000 title abstract description 114
- 238000001514 detection method Methods 0.000 title abstract description 70
- 230000011987 methylation Effects 0.000 claims abstract description 113
- 238000007069 methylation reaction Methods 0.000 claims abstract description 113
- 230000003321 amplification Effects 0.000 claims abstract description 12
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 12
- 238000001369 bisulfite sequencing Methods 0.000 claims abstract description 9
- 238000003556 assay Methods 0.000 claims abstract description 8
- 239000003153 chemical reaction reagent Substances 0.000 claims abstract description 6
- 230000002441 reversible effect Effects 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 abstract description 49
- 230000000694 effects Effects 0.000 abstract description 8
- 239000003814 drug Substances 0.000 abstract description 3
- 239000000126 substance Substances 0.000 abstract 1
- 108020004414 DNA Proteins 0.000 description 130
- 108091033319 polynucleotide Proteins 0.000 description 110
- 102000040430 polynucleotide Human genes 0.000 description 110
- 239000002157 polynucleotide Substances 0.000 description 110
- 238000000034 method Methods 0.000 description 79
- 206010028980 Neoplasm Diseases 0.000 description 57
- 201000011510 cancer Diseases 0.000 description 52
- 101100341529 Oryza sativa subsp. japonica ITPK2 gene Proteins 0.000 description 49
- 239000000523 sample Substances 0.000 description 39
- 230000003902 lesion Effects 0.000 description 30
- 238000012216 screening Methods 0.000 description 29
- 238000005259 measurement Methods 0.000 description 25
- 210000004027 cell Anatomy 0.000 description 23
- 230000000750 progressive effect Effects 0.000 description 21
- 238000012417 linear regression Methods 0.000 description 20
- 210000001519 tissue Anatomy 0.000 description 20
- 238000003745 diagnosis Methods 0.000 description 18
- 238000007619 statistical method Methods 0.000 description 18
- 230000008859 change Effects 0.000 description 17
- 238000000338 in vitro Methods 0.000 description 16
- 241000701806 Human papillomavirus Species 0.000 description 13
- 230000003234 polygenic effect Effects 0.000 description 13
- 238000012175 pyrosequencing Methods 0.000 description 13
- 206010008263 Cervical dysplasia Diseases 0.000 description 11
- 210000003679 cervix uteri Anatomy 0.000 description 11
- 108090000623 proteins and genes Proteins 0.000 description 11
- 238000012163 sequencing technique Methods 0.000 description 11
- 230000007170 pathology Effects 0.000 description 8
- 238000004393 prognosis Methods 0.000 description 8
- 230000035945 sensitivity Effects 0.000 description 8
- 230000002596 correlated effect Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 230000001973 epigenetic effect Effects 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 108010072135 Cell Adhesion Molecule-1 Proteins 0.000 description 5
- 102100024649 Cell adhesion molecule 1 Human genes 0.000 description 5
- 208000032124 Squamous Intraepithelial Lesions Diseases 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 238000009595 pap smear Methods 0.000 description 5
- 238000011282 treatment Methods 0.000 description 5
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 4
- 238000009007 Diagnostic Kit Methods 0.000 description 4
- 101001050321 Homo sapiens Junctional adhesion molecule C Proteins 0.000 description 4
- 102100023429 Junctional adhesion molecule C Human genes 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000000711 cancerogenic effect Effects 0.000 description 4
- 231100000315 carcinogenic Toxicity 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000007417 hierarchical cluster analysis Methods 0.000 description 4
- 230000003211 malignant effect Effects 0.000 description 4
- 238000004949 mass spectrometry Methods 0.000 description 4
- 238000007481 next generation sequencing Methods 0.000 description 4
- 102000005721 Death-Associated Protein Kinases Human genes 0.000 description 3
- 108010031042 Death-Associated Protein Kinases Proteins 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 241000341655 Human papillomavirus type 16 Species 0.000 description 3
- -1 MAL Proteins 0.000 description 3
- 108091007778 MIR124-2 Proteins 0.000 description 3
- 102100033909 Retinoic acid receptor beta Human genes 0.000 description 3
- 108010017842 Telomerase Proteins 0.000 description 3
- 102100032938 Telomerase reverse transcriptase Human genes 0.000 description 3
- 102100030248 Transcription factor SOX-1 Human genes 0.000 description 3
- 108050008750 Transcription factor SOX-1 Proteins 0.000 description 3
- 230000008995 epigenetic change Effects 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 108091045380 miR-124-2 stem-loop Proteins 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000002250 progressing effect Effects 0.000 description 3
- 108091008761 retinoic acid receptors β Proteins 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 210000004291 uterus Anatomy 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- 208000007879 Atypical Squamous Cells of the Cervix Diseases 0.000 description 2
- 102000000905 Cadherin Human genes 0.000 description 2
- 108050007957 Cadherin Proteins 0.000 description 2
- 102000008160 Cyclin A1 Human genes 0.000 description 2
- 108010060267 Cyclin A1 Proteins 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 101001091610 Homo sapiens Krev interaction trapped protein 1 Proteins 0.000 description 2
- 101000712958 Homo sapiens Ras association domain-containing protein 1 Proteins 0.000 description 2
- 102100035878 Krev interaction trapped protein 1 Human genes 0.000 description 2
- 102100040290 LIM homeobox transcription factor 1-alpha Human genes 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 208000009608 Papillomavirus Infections Diseases 0.000 description 2
- 102100033243 Ras association domain-containing protein 1 Human genes 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000013399 early diagnosis Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000001114 immunoprecipitation Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000009826 neoplastic cell growth Effects 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- YLYPIBBGWLKELC-RMKNXTFCSA-N 2-[2-[(e)-2-[4-(dimethylamino)phenyl]ethenyl]-6-methylpyran-4-ylidene]propanedinitrile Chemical compound C1=CC(N(C)C)=CC=C1\C=C\C1=CC(=C(C#N)C#N)C=C(C)O1 YLYPIBBGWLKELC-RMKNXTFCSA-N 0.000 description 1
- 206010000234 Abortion spontaneous Diseases 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 102000012118 Band 4.1-like protein 3 Human genes 0.000 description 1
- 108050002669 Band 4.1-like protein 3 Proteins 0.000 description 1
- 108091029523 CpG island Proteins 0.000 description 1
- 108091029430 CpG site Proteins 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 240000008168 Ficus benjamina Species 0.000 description 1
- 102100033423 GDNF family receptor alpha-1 Human genes 0.000 description 1
- 102100028098 Homeobox protein Nkx-6.1 Human genes 0.000 description 1
- 101000997961 Homo sapiens GDNF family receptor alpha-1 Proteins 0.000 description 1
- 101000578254 Homo sapiens Homeobox protein Nkx-6.1 Proteins 0.000 description 1
- 101001038339 Homo sapiens LIM homeobox transcription factor 1-alpha Proteins 0.000 description 1
- 101000651890 Homo sapiens Slit homolog 2 protein Proteins 0.000 description 1
- 101000651893 Homo sapiens Slit homolog 3 protein Proteins 0.000 description 1
- 101000665937 Homo sapiens Wnt inhibitory factor 1 Proteins 0.000 description 1
- 101710178355 LIM homeobox transcription factor 1-alpha Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108010083674 Myelin Proteins Proteins 0.000 description 1
- 102000006386 Myelin Proteins Human genes 0.000 description 1
- 101150102573 PCR1 gene Proteins 0.000 description 1
- 208000037581 Persistent Infection Diseases 0.000 description 1
- 208000006994 Precancerous Conditions Diseases 0.000 description 1
- 208000005107 Premature Birth Diseases 0.000 description 1
- 102100027340 Slit homolog 2 protein Human genes 0.000 description 1
- 238000012352 Spearman correlation analysis Methods 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 102100038258 Wnt inhibitory factor 1 Human genes 0.000 description 1
- 210000001766 X chromosome Anatomy 0.000 description 1
- 210000002593 Y chromosome Anatomy 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000000091 biomarker candidate Substances 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000004745 cervical carcinogenesis Effects 0.000 description 1
- 208000019065 cervical carcinoma Diseases 0.000 description 1
- 208000016420 cervical intraepithelial neoplasia grade 2/3 Diseases 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000002380 cytological effect Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 231100000676 disease causative agent Toxicity 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 210000003617 erythrocyte membrane Anatomy 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 210000001703 glandular epithelial cell Anatomy 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 230000006607 hypermethylation Effects 0.000 description 1
- 238000011221 initial treatment Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 238000007855 methylation-specific PCR Methods 0.000 description 1
- 208000015994 miscarriage Diseases 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000005012 myelin Anatomy 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 208000000995 spontaneous abortion Diseases 0.000 description 1
- 210000004085 squamous epithelial cell Anatomy 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000003319 supportive effect Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 239000000107 tumor biomarker Substances 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Abstract
Description
Перекрестная ссылка на родственные заявкиCross reference to related applications
Настоящая заявка испрашивает приоритет в соответствии с разделом 119(e) предварительной заявки на патент США No.62/774,994, поданной 4 декабря 2018 г., с названием «DNA METHYLATION MARKERS FOR EARLY DETECTION OF CERVICAL CANCER», содержание которой включено в настоящее изобретение путём ссылки.This application claims benefit under section 119(e) of U.S. Provisional Patent Application No. 62/774,994, filed December 4, 2018, entitled "DNA METHYLATION MARKERS FOR EARLY DETECTION OF CERVICAL CANCER", the contents of which are included in the present invention by reference.
Перечень последовательностейList of sequences
Настоящая заявка содержит Перечень последовательностей, который был подан в электронном виде в формате ASCII и полностью включен в настоящее изобретение путём ссылки. Указанная копия ASCII, созданная 12 января 2020 г., называется TPC53811 Seq List_ST25.txt и имеет размер 36 864 байта.This application contains a Sequence Listing which was filed electronically in ASCII format and is incorporated herein by reference in its entirety. The specified ASCII copy, created on January 12, 2020, is called TPC53811 Seq List_ST25.txt and is 36,864 bytes in size.
Область техники, к которой относится изобретениеField of technology to which the invention relates
Настоящее изобретение в основном относится к сигнатурам метилирования ДНК в ДНК человека, особенно в области молекулярной диагностики. Более конкретно, настоящее изобретение относится к биомаркерам метилирования ДНК в виде панели, индивидуальных, а также комбинации полигенных биомаркеров метилирования ДНК для раннего выявления, а также скрининга рака шейки матки, и их применению в качестве диагностического набора для раннего и точного выявления рака шейки матки.The present invention generally relates to DNA methylation signatures in human DNA, especially in the field of molecular diagnostics. More specifically, the present invention relates to DNA methylation biomarkers in the form of a panel, individual, and combination of polygenic DNA methylation biomarkers for early detection as well as screening of cervical cancer, and their use as a diagnostic kit for early and accurate detection of cervical cancer.
Уровень техники изобретенияBACKGROUND OF THE INVENTION
Рак остается основной причиной смерти у людей. Раннее выявление рака может значительно улучшить показатели излечения и снизить огромные личные и финансовые затраты пациентов, их семей и системы здравоохранения. В то же время, скрининг здоровых людей для оценки экспрессии биомаркеров на предраковой стадии и их изменений применим в методологии скрининга в масштабах всей популяции и помогает выявлять здоровых людей, подверженных риску развития рака, восприимчивых к раку. Рак шейки матки не является исключением. Скрининг может выявить рак на ранней стадии - до того, как он вызовет симптомы. Если рак шейки матки обнаружен на самой ранней стадии, шанс выживания составляет примерно 93%, а на последних стадиях он снижается до 15% https://www.cancer.org/cancer/cervical-cancer/detection-diagnosis-staging/survival.html. Современные методы скрининга включают мазки по Папаниколау, жидкостную цитологию, тестирование на ВПЧ и визуальный осмотр, однако надежный высокоточный и чувствительный способ раннего выявления рака шейки матки отсутствует.Cancer remains the leading cause of death in humans. Early detection of cancer can significantly improve cure rates and reduce enormous personal and financial costs for patients, their families and the healthcare system. At the same time, screening healthy individuals to evaluate the expression of biomarkers at the precancerous stage and their changes is applicable in population-wide screening methodology and helps to identify healthy individuals at risk of developing cancer who are susceptible to cancer. Cervical cancer is no exception. Screening can detect cancer early - before it causes symptoms. If cervical cancer is detected at the earliest stage, the chance of survival is approximately 93%, which drops to 15% in the later stages https://www.cancer.org/cancer/cervical-cancer/detection-diagnosis-staging/survival. html. Current screening methods include Pap smears, liquid-based cytology, HPV testing, and visual inspection, but there is no reliable, highly accurate and sensitive method for early detection of cervical cancer.
Биомаркеры составляют одну из важнейших областей диагностики рака. Биомаркеры рака особенно полезны для раннего выявления или диагностики заболевания. Биомаркеры можно использовать для скрининга пациентов, для классификации различных стадий или степеней рака и для составления прогноза и прогнозирования устойчивости к терапии.Biomarkers constitute one of the most important areas of cancer diagnosis. Cancer biomarkers are particularly useful for early detection or diagnosis of the disease. Biomarkers can be used to screen patients, to classify different stages or grades of cancer, and to provide prognosis and predict treatment resistance.
Общепризнанное открытие того, что вирус папилломы человека (ВПЧ) является возбудителем неоплазии шейки матки, произвело революцию в методах предотвращения и лечения этого гинекологического заболевания с вспомогательных позиций (молекулярное тестирование на ВПЧ) (1). Знание генотипа ВПЧ действительно полезно для клинического прогнозирования, поскольку ВПЧ типов 16 и/или 18 связан с большим риском прогрессирования поражения, чем другие канцерогенные типы. Однако стойкая инфекция канцерогенными генотипами ВПЧ является необходимым предшественником и движущей силой канцерогенеза шейки матки. Последний представляет собой поэтапное прогрессирование от предраковых стадий (дисплазия шейки матки, ДШМ) к инвазивному раку шейки матки. ДШМ низкой степени (ДШМ1) в высшей степени обратима, тогда как ДШМ высокой степени 2 и 3 (то есть ДШМ2 и ДШМ3, соответственно) имеет высокий риск прогрессирования инвазии, то есть рака шейки матки. Это особенно верно для ДШМ3.The widely accepted discovery that human papillomavirus (HPV) is the causative agent of cervical neoplasia has revolutionized the prevention and treatment of this gynecological disease from a supportive perspective (molecular testing for HPV) (1). Knowledge of HPV genotype is indeed useful for clinical prognosis, since HPV types 16 and/or 18 are associated with a greater risk of disease progression than other carcinogenic types. However, persistent infection with carcinogenic HPV genotypes is a necessary precursor and driving force for cervical carcinogenesis. The latter represents a stepwise progression from precancerous stages (cervical dysplasia, CDM) to invasive cervical cancer. Low-grade DSM (DSM1) is highly reversible, whereas high-grade DSM 2 and 3 (i.e., DSM2 and DSM3, respectively) have a high risk of progression to invasion, i.e., cervical cancer. This is especially true for DShM3.
Ведение женщин с патологиями ДШМ в клинике по-прежнему представляет собой серьезную дилемму для гинекологов, поскольку агрессивное абляционное или эксцизионное лечение может вызвать немедленные осложнения или повысить риск выкидыша или преждевременных родов в более позднем возрасте, когда пациентка решит забеременеть. Недавние данные свидетельствуют о том, что эпигенетические изменения в определенных генах могут опосредовать или предсказать канцерогенное прогрессирование. Биомаркер раннего выявления рака может однозначно дифференцировать редкие клетки с поражениями на бессимптомной и предраковой стадиях, благодаря значительным изменениям, которые включают в себя биохимические изменения на эпигенетическом уровне. Эти эпигенетические изменения в качестве биомаркеров довольно часто вырабатываются в аномально больших количествах в раковых тканях и часто препятствуют проявлению самого заболевания. Для выявления молекулярных изменений, происходящих задолго до начала и прогрессирования заболевания, чрезвычайно важна разработка молекулярных биомаркеров. Было показано, что уровни одного из таких эпигенетических биомаркеров - уровни метилирования ДНК определенных сайтов CpG в вирусных генах и генах хозяина - увеличиваются с тяжестью первичных поражений шейки матки (2-7).Clinical management of women with DSM pathology continues to pose a major dilemma for gynecologists, as aggressive ablative or excisional treatment may cause immediate complications or increase the risk of miscarriage or preterm birth later in life when the patient decides to become pregnant. Recent evidence suggests that epigenetic changes in certain genes may mediate or predict carcinogenic progression. The early cancer detection biomarker can uniquely differentiate rare cells with lesions at the asymptomatic and precancerous stages due to significant changes that include biochemical changes at the epigenetic level. These epigenetic changes, as biomarkers, are quite often produced in abnormally high quantities in cancerous tissues and often interfere with the expression of the disease itself. To identify molecular changes that occur long before disease onset and progression, the development of molecular biomarkers is critical. Levels of one such epigenetic biomarker—DNA methylation levels of specific CpG sites in viral and host genes—have been shown to increase with the severity of primary cervical lesions (2–7).
К числу наиболее изученных и целевых генов хозяина с эпигенетическими изменениями, связанными с раком шейки матки и его предшественниками, относятся молекула клеточной адгезии 1 (CADM1); ассоциированная со смертью протеинкиназа 1 (DAPK1); миелин и лимфоциты, белок дифференцировки Т-клеток (MAL); парный бокс 1 (PAX1); теломеразная обратная транскриптаза (TERT); белок 3, подобный полосе 4.1 белка мембраны эритроцитов (EPB41L3), член 1 семейства доменов ассоциации Ras (RASSF1); SRY-box 1 (SOX1); кадгерин 1 (CDH1); LIM гомеобоксный фактор транскрипции 1 альфа (LMX); циклин A1 (CCNA1); семейство со сходством последовательностей из 19 членов A4, хемокиноподобный мотив C-C (FAM19A4); и рецептор ретиноевой кислоты бета (RARβ)8. Были исследованы одиночные (9) маркеры метилирования в дополнение к тем, которые включали два (т.е., CADM1 и MAL (3,4,10); MAL и miR124-2 (11-14), три (т.е., CADM1, MAL и miR124-2) (13,15), четыре (т.е., JAM3, EPB41L3, TERT и C13ORF18) (16,17) и пять (т.е., PAX1, DAPK1, RARβ, WIF1 и SLIT2) (14) маркеров в панели, а также панели, включающие различные комбинации маркеров SOX1, PAX1, LMX1A и NKX6-1 для достижения достаточно высокой чувствительности для запущенных поражений (18).Some of the most studied and targeted host genes with epigenetic changes associated with cervical cancer and its precursors include cell adhesion molecule 1 (CADM1); death associated protein kinase 1 (DAPK1); myelin and lymphocytes, T-cell differentiation protein (MAL); pair box 1 (PAX1); telomerase reverse transcriptase (TERT); erythrocyte membrane protein band 4.1-like protein 3 (EPB41L3), Ras association domain family member 1 (RASSF1); SRY-box 1 (SOX1); cadherin 1 (CDH1); LIM homeobox transcription factor 1 alpha (LMX); cyclin A1 (CCNA1); the 19-member sequence similarity family A4, C-C chemokine-like motif (FAM19A4); and retinoic acid receptor beta (RARβ)8. Single (9) methylation markers were examined in addition to those that included two (i.e., CADM1 and MAL (3,4,10); MAL and miR124-2 (11–14), three (i.e., , CADM1, MAL, and miR124-2) (13,15), four (i.e., JAM3, EPB41L3, TERT, and C13ORF18) (16,17) and five (i.e., PAX1, DAPK1, RARβ, WIF1 and SLIT2) (14) markers in a panel, as well as panels including various combinations of SOX1, PAX1, LMX1A, and NKX6-1 markers to achieve sufficiently high sensitivity for advanced lesions (18).
Однако только одно предыдущее исследование с использованием подхода изучения метилирования по всему геному выявило три панели метилирования (JAM3/ANKRD18CP, C13ORF18/JAM3/ANKRD18CP и JAM3/GFRA1/ANKRD18CP) с самой высокой комбинированной диагностической точностью для обнаружения ДШМ2+ в образцах шейки матки; и их чувствительность составила 72%, 74% и 73%, соответственно, с соответствующей специфичностью 79%, 76% и 77% (2). Соответственно, существует потребность в улучшенных способах идентификации биомаркеров метилирования ДНК, панели биомаркеров метилирования ДНК, связанных с ранним выявлением и прогнозированием риска рака шейки матки, а также в наборах реагентов, основанных на таких биомаркерах, для скрининга в масштабах популяции клинически здоровых женщин с целью раннего выявления рака шейки матки и предрасположенности к нему, а также для оценки риска его развития у женщин с предраковыми патологиями.However, only one previous study using a genome-wide methylation approach identified three methylation panels (JAM3/ANKRD18CP, C13ORF18/JAM3/ANKRD18CP, and JAM3/GFRA1/ANKRD18CP) with the highest combined diagnostic accuracy for detecting DSM2+ in cervical samples; and their sensitivity was 72%, 74%, and 73%, respectively, with corresponding specificity of 79%, 76%, and 77% (2). Accordingly, there is a need for improved methods for identifying DNA methylation biomarkers, a panel of DNA methylation biomarkers associated with early detection and risk prediction of cervical cancer, and reagent kits based on such biomarkers for population-wide screening of clinically healthy women for early detection of cervical cancer and predisposition to it, as well as to assess the risk of its development in women with precancerous pathologies.
Настоящее изобретение относится к решению проблемы, связанной с отсутствием маркеров раннего выявления рака шейки матки, путём использования биомаркеров метилирования ДНК в качестве единичных, комбинированных, а также панельных биомаркеров, поскольку отсутствует один или комбинированный маркер метилирования, который обладает соответствующими диагностическими характеристиками для прогнозирования риска рака шейки матки на ранней стадии в настоящее время. Настоящее изобретение относится к способу получения ранних биомаркеров прогрессирования предракового поражения до рака шейки матки, которые можно использовать для общего скрининга у женщин без симптомов, а также у женщин с патологиями от ДШМ1 до ДШМ3.The present invention relates to solving the problem associated with the lack of markers for early detection of cervical cancer by using DNA methylation biomarkers as single, combined, and panel biomarkers, since there is no single or combined methylation marker that has the appropriate diagnostic characteristics for predicting cancer risk cervix at an early stage at present. The present invention relates to a method for obtaining early biomarkers of progression of a precancerous lesion to cervical cancer, which can be used for general screening in women without symptoms, as well as in women with pathologies from CCM1 to CCM3.
Задачи изобретенияObjectives of the invention
Основная задача настоящего изобретения относится к биомаркерам для раннего выявления и диагностики рака шейки матки у человека.The main object of the present invention relates to biomarkers for the early detection and diagnosis of cervical cancer in humans.
Другая задача настоящего изобретения относится к раскрытому здесь in vitro способу, называемому «анализ прогрессирующих изменений метилирования ДНК (APDMA)», который включает в себя этапы изучения полногеномных профилей метилирования ДНК образцов, полученных от женщин с различными степенями патологии ДШМ (от ДШМ1 до ДШМ3), по сравнению с контрольными образцами, полученными от здоровых женщин, для получения CG-идентификаторов (CGID) в качестве биомаркеров метилирования ДНК, которые при объединении предсказывают, используя описанную здесь модель линейной регрессии, рак шейки матки с чувствительностью и специфичностью > 95% в общедоступных профилях метилирования рака шейки матки.Another object of the present invention relates to the in vitro method disclosed herein, called "progressive DNA methylation change analysis (APDMA)", which includes the steps of studying genome-wide DNA methylation profiles of samples obtained from women with various degrees of DSM pathology (DSM1 to DSM3). , compared with control samples obtained from healthy women, to obtain CG identifiers (CGIDs) as DNA methylation biomarkers that, when combined, predict, using the linear regression model described here, cervical cancer with sensitivity and specificity >95% in publicly available methylation profiles of cervical cancer.
Другая задача настоящего изобретения относится к молекулярным биомаркерам в качестве индикаторов популяционного скрининга женщин для раннего выявления рака шейки матки, а также для оценки риска развития рака шейки матки у женщин с патологиями от ДШМ1 до ДШМ3.Another objective of the present invention relates to molecular biomarkers as indicators of population screening of women for the early detection of cervical cancer, as well as for assessing the risk of developing cervical cancer in women with pathologies from DSM1 to DSM3.
Еще одна задача настоящего изобретения относится к чипу/матрице, пригодному для раннего выявления и диагностики рака шейки матки.Another object of the present invention relates to a chip/array suitable for early detection and diagnosis of cervical cancer.
Еще одна задача настоящего изобретения относится к более дешевому, точному, надежному, высокочувствительному, специфичному и высокопроизводительному диагностическому набору для точной ранней диагностики рака шейки матки человека, пригодному для применения любым специалистом в данной области техники.Another object of the present invention relates to a lower cost, accurate, reliable, highly sensitive, specific and high throughput diagnostic kit for accurate early diagnosis of human cervical cancer, suitable for use by any person skilled in the art.
Сущность изобретенияThe essence of the invention
Соответственно, настоящее изобретение относится к способам и материалам, пригодным для изучения изменений метилирования ДНК, и относится к CGID биомаркерам метилирования ДНК для раннего выявления и диагностики рака шейки матки, при котором прогрессирование предраковых поражений шейки матки (дисплазия шейки матки, ДШМ 1-3 степени) коррелирует с повышенной частотой метилирования ДНК в положениях CG в геноме человека, в форме зонда-идентификатора Illumina или числа метилирования ДНК или CG-идентификаторов (CGID), которые получают с использованием раскрытого в настоящем изобретении in vitro способа «анализа прогрессирующих изменений метилирования ДНК» (APDMA), как описано в настоящем изобретении. Как подробно обсуждается ниже, обычно эти биомаркеры основаны на переменных, которые позволяют прогнозировать риск у женщин с патологиями от ДШМ1 до ДШМ3, а также в популяционных скринингах на развитие рака шейки матки и, в свою очередь, пригодны в качестве биомаркеров раннего выявления и диагностики. Настоящее изобретение предусматривает, что указанные положения биомаркеров CGID почти однородно метилированы при раке шейки матки и почти однородно неметилированы в образцах из нормальной шейки матки. Таким образом, настоящее изобретение относится к указанному набору «однозначно» различных профилей метилирования ДНК, которые создают бинарную дифференциацию между раком шейки матки и доброкачественными тканями по профилю метилирования ДНК в этих сайтах CGID, в результате чего эти сайты метилированы только при раке шейки матки и полностью неметилирован в незлокачественной ткани. Более того, как раскрыто в настоящем изобретении, эти сайты биомаркеров показывают возрастающую частоту метилирования ДНК по мере прогрессирования предраковых поражений шейки матки, переходящих от ДШМ1 к ДШМ3. Таким образом, настоящее изобретение относится к способу раннего выявления и диагностики in vitro с использованием направленной амплификации указанных биомаркеров CGID и глубокого бисульфитного секвенирования следующего поколения для обнаружения даже нескольких молекул клеток рака шейки матки или даже клеток из предраковых поражений на пути к превращению в рак шейки матки на фоне преимущественно нормального клеточного профиля шейки матки. Таким образом, настоящее изобретение применимо для пока еще недоступного раннего обнаружения клеток рака шейки матки на высоком фоне незлокачественной ткани, в частности, с использованием цервикальных образцов, таких как мазки по Папаниколау, в качестве простого и удобного метода раннего обнаружения, пригодного для использования любым специалистом в данной области техники.Accordingly, the present invention relates to methods and materials suitable for studying changes in DNA methylation, and relates to CGID DNA methylation biomarkers for the early detection and diagnosis of cervical cancer in which the progression of precancerous lesions of the cervix (cervical dysplasia, grade 1-3 ) correlates with an increased frequency of DNA methylation at CG positions in the human genome, in the form of an Illumina identifier probe or DNA methylation number or CG identifiers (CGID), which are obtained using the in vitro method disclosed in the present invention for “assaying progressive changes in DNA methylation” (APDMA) as described in the present invention. As discussed in detail below, these biomarkers are typically based on variables that predict risk in women with CCM1 to CCM3, as well as in population-based cervical cancer screenings, and are in turn useful as biomarkers for early detection and diagnosis. The present invention provides that these CGID biomarker positions are nearly uniformly methylated in cervical cancer and nearly uniformly unmethylated in normal cervical samples. Thus, the present invention relates to a specified set of “unambiguously” different DNA methylation profiles that create a binary differentiation between cervical cancer and benign tissues based on the DNA methylation profile at these CGID sites, whereby these sites are methylated only in cervical cancer and completely unmethylated in non-malignant tissue. Moreover, as disclosed herein, these biomarker sites show an increasing frequency of DNA methylation as cervical precancerous lesions progress from DSM1 to DSM3. Thus, the present invention relates to a method for early detection and diagnosis in vitro using targeted amplification of specified CGID biomarkers and deep bisulfite next generation sequencing to detect even a few molecules of cervical cancer cells or even cells from precancerous lesions on the way to becoming cervical cancer against the background of a predominantly normal cellular profile of the cervix. Thus, the present invention is applicable to the as yet unavailable early detection of cervical cancer cells in a high background of non-cancerous tissue, in particular using cervical samples such as Pap smears, as a simple and convenient early detection method suitable for use by any specialist in this field of technology.
Вариант осуществления настоящего изобретения относится к in vitro способу получения высокопрогнозируемых сайтов для рака шейки матки для его раннего выявления даже на бессимптомных и предраковых стадиях, называемому «способ анализа прогрессирующих изменений метилирования ДНК (APDMA)», с использованием различных источников данных о метилировании ДНК по всему геному, полученных с помощью секвенирования следующего поколения, включая чипы MeDIP, секвенирование MeDIP и т.д., полученные в виде сигнатур CGID биомаркеров метилирования ДНК. Настоящее изобретение относится к комбинации «однозначных» CGID биомаркеров для выявления рака шейки матки в исследуемом наборе данных со всего генома, полученных из образцов прогрессирующих предраковых поражений, переходящих от ДШМ1 к ДШМ3.An embodiment of the present invention relates to an in vitro method for obtaining highly predictive sites for cervical cancer for early detection even in asymptomatic and precancerous stages, called the "progressive DNA methylation change analysis (APDMA) method", using various sources of DNA methylation data throughout genome obtained through next generation sequencing, including MeDIP chips, MeDIP sequencing, etc., obtained in the form of CGID signatures of DNA methylation biomarkers. The present invention relates to a combination of “unambiguous” CGID biomarkers for the detection of cervical cancer in a genome-wide data set of interest obtained from samples of progressive precancerous lesions progressing from DSM1 to DSM3.
Предыдущие способы анализы, разработанные до настоящего изобретения, в которых использовался классический дизайн «случай-контроль» и логистическая регрессия, выявили CGID биомаркеры метилирования ДНК, которые обнаруживают рак с более низкой чувствительностью и специфичностью. Таким образом, другой вариант осуществления настоящего изобретения относится к реализованному на компьютере способу получения кандидатных биомаркеров метилирования ДНК для раннего выявления для диагностики рака шейки матки, называемому способ APDMA, который выявляет самые ранние профили метилирования рака, которые являются первичными и важными для ракового состояния и, таким образом, присутствуют во всех образцах рака шейки матки, протестированных при создании настоящего изобретения.Previous assays developed prior to the present invention, which used classical case-control designs and logistic regression, identified CGID DNA methylation biomarkers that detect cancer with lower sensitivity and specificity. Thus, another embodiment of the present invention relates to a computer-implemented method for obtaining DNA methylation biomarker candidates for early detection for the diagnosis of cervical cancer, called the APDMA method, which identifies the earliest cancer methylation profiles that are primary and important for the cancerous condition and, thus present in all cervical cancer samples tested during the making of the present invention.
Вариант осуществления настоящего изобретения относится к in vitro способу, который точно определяет рак шейки матки путём измерения метилирования ДНК в полигенном наборе CGID биомаркеров у сотен людей одновременно, путём последовательной амплификации с праймерами, специфичными для мишени, затем с праймерами, специфичными для «штрих-кодов» и мультиплексного секвенирования в одной реакции секвенирования нового поколения Miseq, с последующим извлечением данных и количественной оценки метилирования.An embodiment of the present invention relates to an in vitro method that accurately detects cervical cancer by measuring DNA methylation in a polygenic panel of CGID biomarkers in hundreds of individuals simultaneously, through sequential amplification with target-specific primers, then with barcode-specific primers ” and multiplex sequencing in a single Miseq next-generation sequencing reaction, followed by data extraction and methylation quantification.
Вариант осуществления настоящего изобретения относится к способу измерения метилирования указанных CGID биомаркеров метилирования ДНК in vitro с использованием метода пиросеквенирования или ПЦР, специфичной для метилирования. В настоящем изобретении раскрыт расчет полигенного взвешенного показателя метилирования, который позволяет прогнозировать рак шейки матки.An embodiment of the present invention relates to a method for measuring methylation of specified CGID DNA methylation biomarkers in vitro using a pyrosequencing or methylation-specific PCR method. The present invention discloses the calculation of a polygenic weighted methylation score that predicts cervical cancer.
Вариант осуществления настоящего изобретения относится к панели биомаркеров метилирования ДНК для скрининга, диагностики, раннего выявления и прогнозирования рака шейки матки в образце ДНК, выделенной из образца, взятого у женщины, включая женщин, не имеющих других клинических признаков рака шейки матки, из образцов шейки матки.An embodiment of the present invention relates to a panel of DNA methylation biomarkers for screening, diagnosis, early detection and prognosis of cervical cancer in a DNA sample isolated from a sample collected from a woman, including women with no other clinical evidence of cervical cancer, from cervical samples .
Вариант осуществления настоящего изобретения относится к панели биомаркеров метилирования ДНК в форме чипа для скрининга, диагностики, раннего выявления и прогнозирования рака шейки матки в образце ДНК, выделенной из образца, взятого у женщины, включая женщин, не имеющих других клинических признаков рака шейки матки, из образцов шейки матки.An embodiment of the present invention relates to a panel of DNA methylation biomarkers in the form of a chip for screening, diagnosis, early detection and prognosis of cervical cancer in a sample of DNA isolated from a sample taken from a woman, including women with no other clinical evidence of cervical cancer, from cervical samples.
Вариант осуществления настоящего изобретения относится к неинвазивному способу in vitro с использованием панели биомаркеров метилирования ДНК для скрининга, диагностики, раннего выявления и прогнозирования рака шейки матки в образце ДНК, выделенной из образца, взятого у женщины, включая женщин, не имеющих других клинических признаков рака шейки матки, из образцов шейки матки.An embodiment of the present invention relates to a non-invasive in vitro method using a panel of DNA methylation biomarkers for screening, diagnosis, early detection and prognosis of cervical cancer in a DNA sample isolated from a sample collected from a woman, including women who do not have other clinical signs of cervical cancer uterus, from cervical samples.
Вариант осуществления настоящего изобретения относится к применению описанных здесь биомаркеров метилирования ДНК для скрининга, диагностики, раннего выявления и прогнозирования рака шейки матки в образце ДНК, выделенной из образца, взятого у женщины, включая женщин, не имеющих других клинических признаков рака шейки матки, из образцов шейки матки.An embodiment of the present invention relates to the use of DNA methylation biomarkers described herein for screening, diagnosis, early detection and prognosis of cervical cancer in a sample of DNA isolated from a sample taken from a woman, including women who do not have other clinical signs of cervical cancer, from the samples cervix.
Настоящее изобретение относится к надежным биомаркерам метилирования ДНК, идентифицированным с использованием положений CGID в геноме человека, которые обеспечивают высокоточную, специфичную и чувствительную оценку риска, которая может определять раннее вмешательство и лечение рака шейки матки даже у женщин на бессимптомных и предраковых стадиях. Настоящее изобретение обеспечивает простой, но эффективноый способ, который может быть применен любым специалистом в данной области техники для обнаружения рака шейки матки. Настоящее изобретение относится к применению описанных здесь CGID биомаркеров метилирования ДНК для популяционного скрининга здоровых женщин на выявление у них рака шейки матки, а также для мониторинга и оценки риска рака у женщин с инфекцией ВПЧ и предраковыми поражениями ДШМ. Настоящее изобретение демонстрирует применимость раскрытых биомаркеров метилирования ДНК при выявлении рака шейки матки в образцах ДШМ с использованием полигенной оценки на основе описанных здесь способов измерения метилирования ДНК. Настоящее изобретение также раскрывает применимость раскрытого способа получения «полигенных» CGID биомаркеров метилирования ДНК для выявления рака шейки матки с использованием любого метода, доступного специалистам в данной области техники для полногеномного бисульфитного секвенирования, такого как бисульфитное секвенирование следующего поколения, секвенирование MeDip, ионное торрент-секвенирование, чипы Illumina 450 K и микрочипы Epic и т.д., с последующим применением описанного здесь способа APDMA для обнаружения специфичных и чувствительных маркеров, пригодных для раннего и очень раннего выявления рака шейки матки, благодаря наличию у них однозначных различий в профилях метилирования ДНК между контрольными образцами здоровых людей и образцами рака шейки матки с постепенным увеличением частоты при переходе от образцов от предраковых стадий ДШМ1 к ДШМ3.The present invention relates to reliable DNA methylation biomarkers identified using CGID positions in the human genome that provide a highly accurate, specific and sensitive risk assessment that can guide early intervention and treatment of cervical cancer even in women at asymptomatic and precancerous stages. The present invention provides a simple but effective method that can be used by anyone skilled in the art for detecting cervical cancer. The present invention relates to the use of the CGID DNA methylation biomarkers described herein for population-based screening of healthy women for cervical cancer, as well as for monitoring and assessing cancer risk in women with HPV infection and precancerous cervical cancer lesions. The present invention demonstrates the utility of the disclosed DNA methylation biomarkers in detecting cervical cancer in cervical cancer samples using a polygenic assessment based on the DNA methylation measurement methods described herein. The present invention also discloses the utility of the disclosed method for generating "polygenic" CGID DNA methylation biomarkers for the detection of cervical cancer using any method available to those skilled in the art for whole genome bisulfite sequencing, such as next generation bisulfite sequencing, MeDip sequencing, ion torrent sequencing , Illumina 450 K chips and Epic microarrays, etc., followed by the application of the APDMA method described here to detect specific and sensitive markers suitable for early and very early detection of cervical cancer, due to the presence of unambiguous differences in DNA methylation profiles between control samples of healthy people and cervical cancer samples with a gradual increase in frequency during the transition from samples from precancerous stages DSM1 to DSM3.
Другие задачи, признаки и преимущества настоящего изобретения станут очевидны специалистам в данной области техники из следующего подробного описания. Однако следует понимать, что подробное описание и конкретные примеры, указывающие на некоторые варианты осуществления настоящего изобретения, даны в качестве иллюстрации, а не ограничения. Многие изменения и модификации в пределах объема настоящего изобретения могут быть сделаны без отступления от его сущности, и настоящее изобретение включает в себя все такие модификации.Other objects, features and advantages of the present invention will become apparent to those skilled in the art from the following detailed description. However, it should be understood that the detailed description and specific examples indicating certain embodiments of the present invention are given by way of illustration and not limitation. Many changes and modifications may be made within the scope of the present invention without departing from its spirit, and the present invention includes all such modifications.
Краткое описание чертежейBrief description of drawings
Фигура 1. Блок-схема для разработки способа анализа прогрессирующих изменений метилирования ДНК (APDMA) для получения биомаркеров метилирования ДНК раннего выявления. Блок-схема описывает аналитическую процедуру для разработки способа APDMA на основе профиля метилирования ДНК с использованием идентификационного анализа с зондом Illumina (CGID), который однозначно дифференцирует нормальный профиль образцов шейки матки от профиля метилирования ДНК в образцах рака шейки матки для получения «однозначных» CGID биомаркеров метилирования ДНК для раннего выявления, диагностики, а также скрининга на рак шейки матки. На этапе 1 измерения метилирования ДНК проводят у образцов шейки матки с предраковыми поражениями на стадиях от ДШМ1 до ДШМ3 в сравнении со здоровыми контрольными образцами, указанные измерения метилирования ДНК получают либо путём проведения анализа выделенной из образцов ДНК на чипе Illumina Beadchip 450K или 850K, либо путём проведения пиросеквенирования выделенной из образца ДНК, либо с помощью масс-спектрометрии (Epityper™), либо с помощью анализа метилирования на основе ПЦР и целевой амплификации области, охватывающей целевые CGID, описанные здесь, из преобразованной бисульфитом ДНК, с последующим штрих-кодированием во втором раунде амплификации и индексированного мультиплексного секвенирования на секвенаторе нового поколения Illumina. На этапе 2 выполняется способ статистического анализа для измерений метилирования ДНК, сделанных на этапе 1, где статистический анализ включает в себя анализ соотношений правильного и ложного обнаружения сигналов (ROC), анализ иерархической кластеризации или анализ нейронной сети. На этапе 3 осуществляется разработанный и раскрытый в настоящем изобретении способ «анализа прогрессирующих изменений метилирования ДНК» (APDMA) для определения положений CGID, уровни метилирования которых являются ранним предиктором или биомаркером рака шейки матки. На этапе 4 настоящее изобретение предусматривает дополнительное сужение и сокращение списка комбинаций метилирования ДНК полигенных CGID до набора биомаркеров из 16 CGID. Этот способ позволяет получить «однозначные», а не количественные различия в профилях метилирования между нормальными клетками и клетками рака шейки матки, что, в свою очередь, позволяет проводить раннее выявление, благодаря характерному переключению профиля метилирования ДНК в выбранных CGID, которые служат в качестве биомаркеров метилирования ДНК для раннего выявления, диагностики и скрининга рака шейки матки. Они служат в качестве панели кандидатов на CGID биомаркеры для раннего выявления рака шейки матки у женщин, особенно тех, у которых нет симптомов или есть предраковые поражения. Figure 1. Flowchart for development of the Progressive DNA Methylation Change Analysis (APDMA) method to obtain early detection DNA methylation biomarkers. The flowchart describes the analytical procedure for developing a DNA methylation profile-based APDMA method using an Illumina probe identification (CGID) assay that unambiguously differentiates the normal profile of cervical samples from the DNA methylation profile of cervical cancer samples to obtain “unambiguous” CGID biomarkers DNA methylation for early detection, diagnosis, and screening for cervical cancer. In step 1, DNA methylation measurements are taken on cervical specimens with precancerous lesions at stages DSM1 to DSM3 compared with healthy controls, these DNA methylation measurements are obtained either by analyzing DNA extracted from the samples on an Illumina Beadchip 450K or 850K, or by performing pyrosequencing of sample-extracted DNA, either by mass spectrometry (Epityper™) or by PCR-based methylation analysis and targeted amplification of the region encompassing the target CGIDs described here from bisulfite-converted DNA, followed by barcoding in the second round of amplification and indexed multiplex sequencing on a next-generation Illumina sequencer. In step 2, a statistical analysis method is performed on the DNA methylation measurements made in step 1, where the statistical analysis includes ROC analysis, hierarchical clustering analysis, or neural network analysis. In step 3, the "progressive DNA methylation change analysis" (APDMA) method developed and disclosed herein is carried out to identify CGID positions whose methylation levels are an early predictor or biomarker of cervical cancer. In step 4, the present invention further narrows and reduces the list of DNA methylation combinations of polygenic CGIDs to a set of biomarkers of 16 CGIDs. This method allows for "unequivocal" rather than quantitative differences in methylation profiles between normal cells and cervical cancer cells, which in turn allows for early detection due to the characteristic switching of DNA methylation profiles in selected CGIDs that serve as biomarkers DNA methylation for early detection, diagnosis and screening of cervical cancer. They serve as a panel of candidate CGID biomarkers for the early detection of cervical cancer in women, especially those who are asymptomatic or have precancerous lesions.
Фигура 2. Способ получения сайтов, частота метилирования которых прогрессивно увеличивается у предраковых стадий ДШМ. ДНК, полученная из образцов шейки матки из гистологических образцов пациентов с ДШМ1, ДШМ2 и ДШМ3; и нетрансформированные контрольные образцы от здоровых людей подвергали полногеномному анализу метилирования ДНК на чипах Illumina Epic. Уровень метилирования 7715 CGID достоверно коррелировал (q> 0,05) с прогрессированием предраковых стадий ДШМ от ДШМ1 к ДШМ3. A. Представление в браузере IGV различий в метилировании этих сайтов по всему геному по сравнению с контрольными образцами шейки матки. Верхний трек показывает положение хромосом. Второй трек показывает положение референсных последовательностей генов в геноме. Следующие треки (ΔCIN1-Ctrl, ΔCIN2-Ctrl, ΔCIN3-Ctrl) показывают разницу в среднем уровне метилирования между каждой из стадий ДШМ и контролем. Наблюдается прогрессирующее стадийное гиперметилирование. Figure 2. Method for obtaining sites whose methylation frequency progressively increases in precancerous stages of DSM. DNA obtained from cervical histological specimens from patients with DSM1, DSM2 and DSM3; and untransformed control samples from healthy individuals were subjected to genome-wide DNA methylation analysis on Illumina Epic chips. The methylation level of 7715 CGID was significantly correlated (q>0.05) with the progression of precancerous stages of DSM from DSM1 to DSM3. A. IGV browser representation of genome-wide methylation differences at these sites compared to control cervical samples. The top track shows the position of the chromosomes. The second track shows the position of reference gene sequences in the genome. The following tracks (ΔCIN1-Ctrl, ΔCIN2-Ctrl, ΔCIN3-Ctrl) show the difference in the average methylation level between each of the stages of DSM and the control. Progressive staged hypermethylation is observed.
Фигура 3. Сайты, полученные с помощью способа APDMA, однозначно различаются у образцов нормальной шейки матки и образцов рака шейки матки. A. Карта интенсивности показывает, что 79 главных CGID, частота метилирования которых увеличивается во время прогрессирования предраковых стадий шейки матки, выявляют рак шейки матки с использованием данных о метилировании ДНК у 270 пациентов (GSE68339). CGID демонстрируют совершенно различные профили метилирования при раке шейки матки и у нормальной шейки матки. Они полностью неметилированы в нормальной ткани и сильно метилированы в раковой ткани. B. Среднее метилирование для каждой из групп нормальных тканей, предраковых стадий и рака шейки матки (от ДШМ1 до ДШМ3) (синий цвет означает 0% метилирования, а темно-красный означает 100% метилирования). Figure 3. Sites obtained using the APDMA method are clearly different between normal cervical samples and cervical cancer samples. A. Heat map shows that the top 79 CGIDs whose methylation frequency increases during the progression of cervical precancerous stages detect cervical cancer using DNA methylation data from 270 patients (GSE68339). CGIDs exhibit very different methylation profiles in cervical cancer and normal cervix. They are completely unmethylated in normal tissue and highly methylated in cancerous tissue. B. Average methylation for each of the normal tissue, precancerous, and cervical cancer groups (DSM1 to DSM3) (blue indicates 0% methylation and dark red indicates 100% methylation).
Фигура 4. Специфичность и специфичность показателя метилирования бигенной ДНК, полученного с использованием способа APDMA для выявления ДНК рака шейки матки в независимой когорте. A. Расчет величины эффекта, регрессия со штрафом и многомерная линейная регрессия кратко определили подмножество двух CGID, и было вычислено уравнение линейной регрессии для прогнозирования рака шейки матки. B. Порог обнаружения рака был рассчитан при помощи ROC. C. Используя этот порог, чувствительность и специфичность этого комбинированного набора маркеров равна 1, а AUC равна 1. Figure 4. Specificity and specificity of the bigenic DNA methylation score obtained using the APDMA method for detecting cervical cancer DNA in an independent cohort. A. Effect size calculation, penalized regression, and multivariate linear regression briefly identified a subset of the two CGIDs, and the linear regression equation for predicting cervical cancer was calculated. B. Cancer detection threshold was calculated using ROC. C. Using this threshold, the sensitivity and specificity of this combined marker set are 1 and the AUC is 1.
Фигура 5. Показатель метилирования рака в отдельных образцах от контрольных ДШМ1 до ДШМ3 и пациентов с раком шейки матки. A. Показатели метилирования (прогноз рака шейки матки), рассчитанные с использованием уравнения, представленного на Фигуре 4A, для каждого из отдельных образцов из контрольной группы, от ДШМ1 до ДШМ3 и рака шейки матки, демонстрирующие увеличение показателей метилирования при прогрессирующих предраковых поражениях. B. График разброса, показывающий средний показатель метилирования для контрольной, предраковой и раковой групп. Figure 5 . Cancer methylation score in selected samples from controls DSM1 to DSM3 and patients with cervical cancer. A. Methylation scores (prediction of cervical cancer) calculated using the equation presented in Figure 4A for each of the individual control samples, DSM1 to DSM3, and cervical cancer, showing increased methylation scores with progressive precancerous lesions. B. Scatter plot showing mean methylation score for control, precancerous, and cancer groups.
Фигура 6. Корреляция между оценкой бигенного метилирования и прогрессированием от контроля через предраковые стадии до рака шейки матки. Образцы рака шейки матки от GSE68339 ДШМ1 до ДШМ3 взяты из когорты Мак-Гилла, описанной в этой заявке (присвоенный ранг Спирмена: контроль: 0, от ДШМ1 до ДШМ3: 1-3, рак шейки матки: 4). Figure 6. Correlation between bigenic methylation scores and progression from controls through precancerous stages to cervical cancer. Cervical cancer samples GSE68339 DSM1 to DSM3 are from the McGill cohort described in this application (assigned Spearman rank: control: 0, DSM1 to DSM3: 1-3, cervical cancer: 4).
Фигура 7. Валидация маркера метилирования рака шейки матки с использованием данных о метилировании ДНК из TCGA (Атлас ракового генома) (n = 312). Поскольку данные для рака шейки матки были доступны в TCGA только для одного CGID (cg13944175), авторы настоящего изобретения провели оценку метилирования для рака шейки матки, используя уравнение линейной регрессии с данными метилирования ДНК только для CGID cg13944175. Корреляцию Пирсона рассчитывали между стадией прогрессирования рака и показателем метилирования (см. Статистику в A и диаграмму корреляции в B). ДШМ1 - ДШМ 3 относятся к когорте Мак-Гилла, описанной в этой заявке. Присвоенные шкалы: контроль: 0, от ДШМ1 до ДШМ3: 1-3, рак шейки матки: 4. Figure 7. Validation of cervical cancer methylation marker using DNA methylation data from TCGA (The Cancer Genome Atlas) (n = 312). Since data for cervical cancer were available in TCGA for only one CGID (cg13944175), we performed a methylation assessment for cervical cancer using a linear regression equation with DNA methylation data for CGID cg13944175 only. Pearson correlation was calculated between cancer progression stage and methylation score (see statistics in A and correlation chart in B). DShM1 - DShM 3 belong to the McGill cohort described in this application. Assigned scales: control: 0, from DShM1 to DShM3: 1-3, cervical cancer: 4.
Фигура 8. Применение настоящего изобретения: Прогнозирование рака шейки матки в образцах от ДШМ1 до ДШМ3. Не у всех пациентов с ДШМ-1-3 развивается рак шейки матки, хотя его доля у пациентов с ДШМ3 выше, чем у пациентов с ДШМ1. В настоящем изобретении проверяется, можно ли использовать показатель метилирования, представленный на Фигуре 3, для идентификации отдельных пациентов, которые имеют показатель метилирования рака шейки матки, как доказательство применимости настоящего изобретения. A. По оси X нанесены отдельные пациенты, группы обозначены линиями под осью X. Ось Y показывает прогноз развития рака (1) и отсутствие причин рака (0). B. Количество людей с прогнозом рака в каждой группе. Как и ожидалось, прогнозирование рака увеличивается с ДШМ1 до ДШМ3. Figure 8. Application of the present invention: Prediction of cervical cancer in samples from DSM1 to DSM3. Not all patients with DSM-1-3 develop cervical cancer, although its proportion in patients with DSM3 is higher than in patients with DSM1. The present invention tests whether the methylation score presented in Figure 3 can be used to identify individual patients who have a cervical cancer methylation score as evidence of the applicability of the present invention. A. Individual patients are plotted on the X-axis, with groups indicated by lines below the X-axis. The Y-axis shows cancer prognosis (1) and absence of cancer causes (0). B. Number of people predicted to have cancer in each group. As expected, cancer prediction increases from DSM1 to DSM3.
Подробное описание изобретенияDetailed Description of the Invention
В описании вариантов осуществления изобретения может быть сделана ссылка на прилагаемые чертежи, которые составляют его часть и на которых в качестве иллюстрации показан конкретный вариант осуществления изобретения, в котором изобретение может быть реализовано на практике. Следует понимать, что могут использоваться другие варианты осуществления изобретения и могут быть внесены структурные изменения, не выходящие за рамки объема настоящего изобретения. Многие из описанных или упомянутых здесь методик и процедур хорошо известны и обычно используются специалистами в данной области техники. Если не указано иное, то все термины из данной области техники, обозначения и другие научные термины или терминология, используемые в данном описании, имеют значения, обычно понятные специалистам в данной области, к которой относится настоящее изобретение. В некоторых случаях термины с общепринятыми значениями определены здесь для ясности и/или для удобства ссылок, и включение таких определений в настоящее изобретение не обязательно должно толковаться как представляющее существенное отличие от того, что обычно понимается в данной области техники.In the description of embodiments of the invention, reference may be made to the accompanying drawings, which form a part thereof and which show by way of illustration a particular embodiment of the invention in which the invention may be practiced. It should be understood that other embodiments of the invention may be used and structural changes may be made without departing from the scope of the present invention. Many of the techniques and procedures described or referred to herein are well known and commonly used by those skilled in the art. Unless otherwise indicated, all terms of the art, symbols and other scientific terms or terminology used in this description have the meanings commonly understood by those skilled in the art to which the present invention relates. In some cases, terms with generally accepted meanings are defined herein for clarity and/or ease of reference, and the inclusion of such definitions in the present invention should not necessarily be construed as representing a significant difference from what is commonly understood in the art.
Все иллюстрации чертежей предназначены для описания выбранных вариантов настоящего изобретения и не предназначены для ограничения объема настоящего изобретения.All drawing illustrations are intended to describe selected embodiments of the present invention and are not intended to limit the scope of the present invention.
Все упомянутые здесь публикации включены в настоящее изобретение путём ссылки для раскрытия и описания аспектов, способов и/или материалов в связи с процитированными публикациями.All publications mentioned herein are incorporated herein by reference to disclose and describe aspects, methods and/or materials in connection with the cited publications.
Метилирование ДНК относится к химическим модификациям молекулы ДНК. Было обнаружено, что технологические платформы, такие как микрочип Illumina Infinium или способы, основанные на секвенировании ДНК, позволяют проводить высоконадежные и воспроизводимые измерения уровней метилирования ДНК человека. В геноме человека более 28 миллионов локусов CpG. Следовательно, определенным локусам присваиваются уникальные идентификаторы, такие как те, что находятся в базе данных локусов CpG Illumina (см., например, Technical Note: Epigenetics, CpG Loci Identification ILLUMINA Inc. 2010). Эти идентификаторы обозначения локуса CG используются в настоящем изобретении.DNA methylation refers to chemical modifications of the DNA molecule. Technology platforms such as the Illumina Infinium microarray or DNA sequencing-based methods have been found to allow highly reliable and reproducible measurements of human DNA methylation levels. There are more than 28 million CpG loci in the human genome. Consequently, certain loci are assigned unique identifiers, such as those found in the Illumina CpG Loci Database (see, for example, Technical Note: Epigenetics, CpG Loci Identification ILLUMINA Inc. 2010). These CG locus designation identifiers are used in the present invention.
Определения:Definitions:
Используемый здесь термин «CG» или «CpG», используется взаимозаменяемо и относится к динуклеотидной последовательности в ДНК, содержащей основания цитозина и гуанозина. Эти динуклеотидные последовательности могут метилироваться в ДНК человека, а также других животных. CGID раскрывает свое положение в геноме человека, как это определено манифестом Illumina 450K или манифестом Illumina EPIC (аннотации перечисленных здесь CG общедоступны по адресу https://bioconductor.org/packages/release/data/annotation/html/ IlluminaHumanMethylation450k.db.html или https://bioconductor.org/packages/release/data/annotation/html/IlluminaHumanMethylationEPICmanifest.html и установлены как пакет R IlluminaHumanMethylation450k.db (пакет R версии 2.0.9.) или IlluminaHumanMethylationEPICmanifest (пакет R версия 0.3.0).As used herein, the term "CG" or "CpG" is used interchangeably and refers to a dinucleotide sequence in DNA containing the bases cytosine and guanosine. These dinucleotide sequences can be methylated in the DNA of humans as well as other animals. A CGID discloses its position in the human genome as defined by the Illumina 450K manifesto or the Illumina EPIC manifesto (the annotations of the CGs listed here are publicly available at https://bioconductor.org/packages/release/data/annotation/html/IlluminaHumanMethylation450k.db.html or https://bioconductor.org/packages/release/data/annotation/html/IlluminaHumanMethylationEPICmanifest.html and installed as the R package IlluminaHumanMethylation450k.db (R package version 2.0.9.) or IlluminaHumanMethylationEPICmanifest (R package version 0.3.0).
Используемый здесь термин «бета-значение» относится к вычислению уровня метилирования в положении CGID, полученного путём нормализации и количественной оценки чипов Illumina 450K или EPIC с использованием отношения интенсивностей между метилированными и неметилированными зондами и формулы: значение бета = Интенсивность метилированного C / (интенсивность метилированного C + интенсивность неметилированного C) от 0 до 1, где 0 - полностью неметилированный, а 1 - полностью метилированный.As used herein, the term "beta value" refers to the calculation of the level of methylation at a CGID position obtained by normalizing and quantifying Illumina 450K or EPIC chips using the ratio of intensities between methylated and unmethylated probes and the formula: beta value = Intensity of methylated C / (intensity of methylated C+ intensity of unmethylated C) from 0 to 1, where 0 is completely unmethylated and 1 is completely methylated.
Используемый здесь термин «регрессия со штрафом» относится к статистическому методу, направленному на выявление наименьшего количества предикторов, необходимых для прогнозирования результата из большего списка биомаркеров, как реализовано, например, в статистическом пакете R, «штрафуемому», как описано в Goeman, J. J., L1 penalized estimation in the Cox proportional hazards model. Biometrical Journal 52(1), 70-84.As used herein, the term "penalized regression" refers to a statistical method aimed at identifying the smallest number of predictors needed to predict an outcome from a larger list of biomarkers, as implemented, for example, in the statistical package R, "penalized" as described in Goeman, J. J., L1 penalized estimation in the Cox proportional hazards model. Biometrical Journal 52(1), 70-84.
Используемый здесь термин «кластеризация» относится к группировке набора объектов таким образом, что объекты в одной группе (называемой кластером) более похожи (в том или ином смысле) друг на друга, чем на объекты в других группах (кластерах).As used here, the term "clustering" refers to the grouping of a set of objects in such a way that objects in one group (called a cluster) are more similar (in one sense or another) to each other than to objects in other groups (clusters).
Используемый здесь термин «иерархическая кластеризация» относится к статистическому методу, который строит иерархию «кластеров» на основе того, насколько похожи (близки) или несходны (отдалены) кластеры друг от друга, как описано, например, в Kaufman, L.; Rousseeuw, P.J. (1990). Finding Groups in Data: An Introduction to Cluster Analysis (1 ed.). New York: John Wiley. ISBN 0-471-87876-6.As used herein, the term "hierarchical clustering" refers to a statistical method that constructs a hierarchy of "clusters" based on how similar (close) or dissimilar (distant) the clusters are to each other, as described, for example, in Kaufman, L.; Rousseeuw, P.J. (1990). Finding Groups in Data: An Introduction to Cluster Analysis (1 ed.). New York: John Wiley. ISBN 0-471-87876-6.
Используемый здесь термин «анализ соотношений правильного и ложного обнаружения сигналов (ROC)» относится к статистическому методу, который создает график, который иллюстрирует работу предиктора. Истинно-положительный показатель прогноза наносится на график против ложноположительного показателя при различных настройках порогового значения для предиктора (т.е. разный % метилирования), как описано, например, в Hanley, James A.; McNeil, Barbara J. (1982). «The Meaning and Use of the Area under a Receiver Operating Characteristic (ROC) Curve». Radiology 143 (1): 29-36.As used herein, the term ROC analysis refers to a statistical method that produces a graph that illustrates the performance of a predictor. The true positive predictive rate is plotted against the false positive rate at different threshold settings for the predictor (ie, different % methylation), as described, for example, in Hanley, James A.; McNeil, Barbara J. (1982). "The Meaning and Use of the Area under a Receiver Operating Characteristic (ROC) Curve." Radiology 143(1):29-36.
Используемый здесь термин «многомерная или полигенная линейная регрессия» относится к статистическому методу, который оценивает взаимосвязь между несколькими «независимыми переменными» или «предикторами», такими как процент метилирования в нескольких CGID, и «зависимой переменной», такой как рак. Этот метод определяет «вес» или коэффициент каждого CGID при прогнозировании «результата» (зависимой переменной, такой как рак), когда в модель включены несколько «независимых переменных», таких как CGID.As used herein, the term "multivariate or polygenic linear regression" refers to a statistical method that evaluates the relationship between several "independent variables" or "predictors", such as the percentage of methylation in several CGIDs, and a "dependent variable", such as cancer. This method determines the "weight" or coefficient of each CGID in predicting an "outcome" (dependent variable such as cancer) when multiple "independent variables" such as CGID are included in the model.
Используемый здесь термин «эпигенетический» означает относящийся к химической модификации молекулы ДНК, являющийся или включающий в себя химическую модификацию молекулы ДНК. Эпигенетические факторы включают в себя добавление или удаление метильной группы, что приводит к изменению уровней метилирования ДНК. Новые молекулярные биомаркеры раннего выявления, диагностики или прогнозирования рака шейки матки, которые основаны на выявлении паттернов метилирования в геномной ДНК, такие как те, которые описаны в настоящем изобретении как биомаркеры на основе CGID, позволяют прогнозировать риск и предрасположенность к раку шейки матки даже на очень ранних стадиях, когда у женщин отсутствуют симптомы или на предраковых стадиях, прогрессирующих от ДШМ1 до ДШМ3, и они могут применяться в клинической практике эпидемиологами, медицинскими работниками, и раскрытие настоящего изобретения сделано таким образом, чтобы оно было доступным и пригодным для применения любым специалистом в данной области техники. Исключительно клинические биомаркеры, такие как мазки по Папаниколау, гистологическая идентификация, имеют долгую и успешную историю в диагностике рака шейки матки, однако их недостатком является большая степень вариабельности, и они не могут использоваться для раннего выявления рака шейки матки. Напротив, молекулярные биомаркеры, такие как эпигенетические маркеры в форме биомаркеров метилирования ДНК, до сих пор применяются редко.As used herein, the term “epigenetic” means relating to, being or involving a chemical modification of a DNA molecule. Epigenetic factors involve the addition or removal of a methyl group, resulting in changes in DNA methylation levels. New molecular biomarkers for the early detection, diagnosis or prognosis of cervical cancer that are based on the detection of methylation patterns in genomic DNA, such as those described in the present invention as CGID-based biomarkers, allow the prediction of risk and susceptibility to cervical cancer even at very early stages. early stages when women are asymptomatic or in precancerous stages progressing from DSM1 to DSM3, and can be used in clinical practice by epidemiologists, medical professionals, and the disclosure of the present invention is made in such a way that it is accessible and suitable for use by any specialist in this field of technology. Purely clinical biomarkers, such as Pap smears and histological identification, have a long and successful history in diagnosing cervical cancer, but they have the disadvantage of being highly variable and cannot be used for early detection of cervical cancer. In contrast, molecular biomarkers, such as epigenetic markers in the form of DNA methylation biomarkers, are still rarely used.
Используемый здесь термин «биомаркер метилирования ДНК» относится к положению CpG, которое потенциально метилировано. Метилирование обычно происходит в CpG-содержащей нуклеиновой кислоте. CpG-содержащая нуклеиновая кислота может присутствовать, например, в CpG-островке, дублете CpG, промоторе, интроне или экзоне гена. Например, в предоставленных здесь генетических областях потенциальные сайты метилирования охватывают промоторные/энхансерные области указанных генов. Таким образом, области могут начинаться до промотора гена и распространяться дальше в транскрибируемую область.As used herein, the term “DNA methylation biomarker” refers to a CpG position that is potentially methylated. Methylation typically occurs on CpG-containing nucleic acid. The CpG-containing nucleic acid may be present, for example, in a CpG island, CpG doublet, promoter, intron or exon of a gene. For example, in the genetic regions provided here, potential methylation sites span the promoter/enhancer regions of the indicated genes. Thus, regions can start before the gene promoter and extend further into the transcribed region.
В соответствии со способом настоящего изобретения предполагается, что частота клеток, которые демонстрируют профиль метилирования ДНК рака шейки матки, увеличивается с прогрессированием от патологий ДШМ1 к ДШМ3, и что эти профили метилирования характерны для самого раннего рака шейки матки. Во-вторых, поскольку клетки, которые превращаются в рак, редко встречаются на ранних стадиях предракового развития, профиль метилирования ДНК должен однозначно отличаться от нормального профиля клеток шейки матки, чтобы его можно было обнаружить на фоне в основном незлокачественных клеток на самых ранних стадиях. В-третьих, эти профили метилирования ДНК должны присутствовать во всех образцах полностью развитого рака шейки матки, если они являются первичной и критической характеристикой рака шейки матки. Принимая во внимание три вышеупомянутых предварительных условия, способ in vitro настоящего изобретения, называемый «анализ прогрессирующих изменений метилирования ДНК (APDMA)», включает в себя этапы изучения полногеномных профилей метилирования ДНК образцов, выделенных и полученных от женщин с различными стадиями патологии ДШМ (от ДШМ1 до ДШМ3) по сравнению со здоровыми, нетрансформированными, здоровыми контрольными образцами шейки матки после хорошо охарактеризованного генотипирования ВПЧ с использованием чипов Infinium Methylation EPIC. Настоящее изобретение относится к способу in vitro для получения зонда-идентификатора Illumina, числа метилирования ДНК или CG-идентификаторов (CGID) в качестве биомаркеров метилирования ДНК, которые при объединении предсказывают, используя описанную здесь модель линейной регрессии, рак шейки матки с чувствительностью и специфичностью > 95% в общедоступных профилях метилирования рака шейки матки. Настоящее изобретение также обеспечивает панель биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, где панель включает в себя CGID, имеющие последовательности, выбранные из группы, состоящей из SEQ ID NO:1 - SEQ ID NO:79, как указано в Таблице 1, и их комбинации, такие как включенные в короткий список подмножества последовательностей Таблицы 1, перечисленные в Таблице 2, и более короткий список подмножества CGID, перечисленные в Таблице 3, соответственно, как раскрыто здесь ниже. Таким образом, настоящее изобретение относится к двум CGID, минимально достаточных для обнаружения рака шейки матки в общедоступных данных о метилировании ДНК с чувствительностью и специфичностью, приближающейся к 1. Настоящее изобретение также относится к наборам для измерения in vitro биомаркеров метилирования ДНК в качестве уровней метилирования ДНК раскрытых CGID в ДНК, выделенной из образцов шейки матки, которые будут использоваться для популяционного скрининга женщин для раннего выявления рака шейки матки, а также для оценки риска рака шейки матки у женщин с патологиями от ДШМ1 до ДШМ3.According to the method of the present invention, it is assumed that the frequency of cells that exhibit a cervical cancer DNA methylation profile increases with progression from DSM1 to DSM3 pathologies, and that these methylation profiles are characteristic of the earliest cervical cancer. Second, because cells that become cancerous are rare in the early stages of precancerous development, the DNA methylation profile must be uniquely different from the normal profile of cervical cells to be detected in a background of mostly noncancerous cells in the earliest stages. Third, these DNA methylation profiles must be present in all fully developed cervical cancer samples if they are a primary and critical characteristic of cervical cancer. Taking into account the above three prerequisites, the in vitro method of the present invention, called "progressive DNA methylation change analysis (APDMA)", includes the steps of studying genome-wide DNA methylation profiles of samples isolated and obtained from women with various stages of DSM pathology (from DSM1 pre-DSM3) compared with healthy, untransformed, healthy control cervical samples after well-characterized HPV genotyping using Infinium Methylation EPIC chips. The present invention relates to an in vitro method for producing Illumina probe identifier, DNA methylation number or CG identifiers (CGID) as DNA methylation biomarkers that when combined predict, using the linear regression model described herein, cervical cancer with sensitivity and specificity > 95% in publicly available cervical cancer methylation profiles. The present invention also provides a panel of DNA methylation biomarkers for screening and early detection of cervical cancer, where the panel includes CGIDs having sequences selected from the group consisting of SEQ ID NO:1 - SEQ ID NO:79, as indicated in Table 1 , and combinations thereof, such as the shortlisted subsets of Table 1 sequences listed in Table 2 and the shortlisted CGID subsets listed in Table 3, respectively, as disclosed herein below. Thus, the present invention provides two CGIDs minimally sufficient to detect cervical cancer in publicly available DNA methylation data with sensitivity and specificity approaching 1. The present invention also provides kits for in vitro measurement of DNA methylation biomarkers as DNA methylation levels disclosed CGIDs in DNA isolated from cervical samples, which will be used for population-based screening of women for early detection of cervical cancer, as well as for assessing the risk of cervical cancer in women with pathologies DSM1 to DSM3.
Настоящее изобретение имеет несколько вариантов осуществления. В одном из вариантов осуществления настоящее изобретение относится к биомаркерам CGID полигенного метилирования ДНК рака шейки матки в мазках из шейки матки для раннего выявления рака шейки матки, указанная панель биомаркеров полигенного метилирования ДНК получена с использованием «способа анализа прогрессирующих изменений метилирования ДНК (APDMA)», раскрытого в настоящем изобретении, на основе данных о метилировании ДНК по всему геному, полученных с помощью методов картирования, таких как чипы Illumina 450K или 850K, полногеномного бисульфитного секвенирования с использованием различных платформ секвенирования следующего поколения, секвенирования методом иммунопреципитации метилированной ДНК (MeDIP) или гибридизации с чипами олигонуклеотидов.The present invention has several embodiments. In one embodiment, the present invention relates to CGID polygenic DNA methylation biomarkers for cervical cancer in cervical smears for early detection of cervical cancer, said panel of polygenic DNA methylation biomarkers obtained using the "Progressive DNA Methylation Change Analysis (APDMA) method" disclosed in the present invention, based on genome-wide DNA methylation data obtained using mapping techniques such as Illumina 450K or 850K chips, whole-genome bisulfite sequencing using various next-generation sequencing platforms, methylated DNA immunoprecipitation (MeDIP) sequencing, or hybridization with oligonucleotide chips.
В одном из вариантов осуществления настоящее изобретение относится к способу получения биомаркеров метилирования ДНК для выявления рака шейки матки, включающему в себя этап выполнения статистического анализа и способ «анализа прогрессирующих изменений метилирования ДНК (APDMA)», раскрытый в настоящем изобретении для измерения метилирования ДНК, полученной из образцов шейки матки предраковых поражений от ДШМ1 до ДШМ3.In one embodiment, the present invention relates to a method for obtaining DNA methylation biomarkers for detecting cervical cancer, including the step of performing statistical analysis and the "progressive DNA methylation change analysis (APDMA)" method disclosed in the present invention for measuring the methylation of DNA obtained from cervical samples of precancerous lesions from DShM1 to DShM3.
В одном из вариантов осуществления изобретения раскрытый здесь способ включает в себя выполнение статистического анализа и способа «анализа прогрессирующих изменений метилирования ДНК (APDMA)» измерения метилирования ДНК, полученной из образцов шейки матки, указанное измерение метилирования ДНК получают путём выполнения анализа Illumina Beadchip 450K или 850K извлеченной из образцов ДНК. В другом варианте осуществления изобретения указанное измерение метилирования ДНК проводят путём выполнения пиросеквенирования ДНК, выделенной из образца, или с помощью масс-спектрометрии (Epityper™), или с помощью анализов метилирования на основе ПЦР и целевой амплификации области, охватывающей целевые CGID, описанные здесь, из преобразованной бисульфитом ДНК, с последующим штрих-кодированием во втором раунде амплификации и индексированного мультиплексного секвенирования на секвенаторе нового поколения Illumina. В дополнительном варианте осуществления изобретения указанный статистический анализ включает в себя анализ соотношений правильного и ложного обнаружения сигналов (ROC). В еще одном варианте осуществления изобретения указанный статистический анализ включает в себя анализ иерархической кластеризации. В дополнительном варианте осуществления изобретения указанный статистический анализ включает в себя нейросетевой анализ.In one embodiment of the invention, the method disclosed herein includes performing a statistical analysis and "progressive DNA methylation change analysis (APDMA)" method of measuring DNA methylation obtained from cervical samples, said DNA methylation measurement being obtained by performing an Illumina Beadchip 450K or 850K assay DNA extracted from samples. In another embodiment of the invention, said DNA methylation measurement is performed by performing pyrosequencing of DNA isolated from a sample, either by mass spectrometry (Epityper™), or by PCR-based methylation assays and targeted amplification of a region encompassing the target CGIDs described herein. from bisulfite-converted DNA, followed by barcoding in a second round of amplification and indexed multiplex sequencing on an Illumina next-generation sequencer. In a further embodiment of the invention, said statistical analysis includes analysis of ratios of correct and false detections of signals (ROC). In yet another embodiment of the invention, said statistical analysis includes hierarchical clustering analysis. In a further embodiment of the invention, said statistical analysis includes neural network analysis.
В одном из вариантов осуществления настоящее изобретение относится к in vitro способу получения ранних предикторов рака шейки матки, включающему в себя следующие этапы: (a) измерение метилирования образца ДНК, выделенного из образца шейки матки, (b) выполнение статистического анализа результатов измерения метилирования ДНК, полученных на этапе a, (c) определение статуса метилирования ДНК множества независимых геномных положений CG, называемых CG-идентификаторами (CGID), путём выполнения анализа прогрессивных изменений метилирования ДНК (APDMA) профилей метилирования ДНК всего генома, полученных на этапе b, (d) классификация CGID на основе частоты их метилирования ДНК, коррелирующей с прогрессированием предраковой стадии рака шейки матки, (e) получение кандидатных CGID из классификации на этапе d для получения ранних предикторов рака шейки матки в виде биомаркеров метилирования ДНК.In one embodiment, the present invention relates to an in vitro method for obtaining early predictors of cervical cancer, comprising the following steps: (a) measuring the methylation of a sample of DNA isolated from a sample of the cervix, (b) performing a statistical analysis of the results of the DNA methylation measurement, obtained in step a, (c) determining the DNA methylation status of multiple independent genomic CG positions, called CG identifiers (CGIDs), by performing progressive DNA methylation change analysis (APDMA) of the genome-wide DNA methylation profiles obtained in step b, (d) classification of CGIDs based on their DNA methylation frequency correlated with the progression of precancerous stage of cervical cancer, (e) derivation of candidate CGIDs from the classification in step d to obtain early predictors of cervical cancer in the form of DNA methylation biomarkers.
В другом варианте осуществления настоящее изобретение относится к in vitro способу получения ранних предикторов рака шейки матки, включающему в себя следующие этапы: (a) измерение метилирования образца ДНК, выделенного из образца шейки матки, (b) выполнение статистического анализа результатов измерения метилирования ДНК, полученных на этапе a, (c) определение статуса метилирования ДНК множества независимых геномных положений CG, называемых CG-идентификаторами (CGID), путём выполнения анализа прогрессивных изменений метилирования ДНК (APDMA) профилей метилирования ДНК всего генома, полученных на этапе b, (d) классификация CGID на основе частоты их метилирования ДНК, коррелирующей с прогрессированием предраковой стадии рака шейки матки, (e) получение кандидатных CGID из классификации на этапе d для получения ранних предикторов рака шейки матки в виде биомаркеров метилирования ДНК, где указанное измерение метилирования ДНК выполняется с использованием методов, включающих в себя чипы Illumina 27K, 450K или 850K, бисульфитное секвенирование всего генома на платформах, включающих в себя секвенаторы HiSeq, MiniSeq, MiSeq или NextSeq, торрент-секвенирование, секвенирование с помощью иммунопреципитации метилированной ДНК (MeDIP), гибридизацию с чипами олигонуклеотидов, пиросеквенирование ДНК, анализы метилирования на основе масс-спектрометрии (Epityper™) или ПЦР.In another embodiment, the present invention relates to an in vitro method for obtaining early predictors of cervical cancer, comprising the following steps: (a) measuring the methylation of a DNA sample isolated from a cervical sample, (b) performing a statistical analysis of the DNA methylation measurements obtained in step a, (c) determination of the DNA methylation status of multiple independent genomic CG positions, called CG identifiers (CGIDs), by performing progressive DNA methylation change analysis (APDMA) of the genome-wide DNA methylation profiles obtained in step b, (d) classification CGIDs based on their DNA methylation frequency correlated with the progression of precancerous stage of cervical cancer, (e) deriving candidate CGIDs from the classification in step d to obtain early predictors of cervical cancer in the form of DNA methylation biomarkers, where said DNA methylation measurement is performed using methods , including Illumina 27K, 450K or 850K chips, whole genome bisulfite sequencing on platforms including HiSeq, MiniSeq, MiSeq or NextSeq sequencers, torrent sequencing, methylated DNA immunoprecipitation (MeDIP) sequencing, hybridization with oligonucleotide chips, DNA pyrosequencing, mass spectrometry-based (Epityper™) or PCR-based methylation assays.
В еще одном варианте осуществления настоящее изобретение относится к in vitro способу получения ранних предикторов рака шейки матки, включающему в себя следующие этапы: (a) измерение метилирования образца ДНК, выделенного из образца шейки матки, (b) выполнение статистического анализа результатов измерения метилирования ДНК, полученных на этапе a, (c) определение статуса метилирования ДНК множества независимых геномных положений CG, называемых CG-идентификаторами (CGID), путём выполнения анализа прогрессивных изменений метилирования ДНК (APDMA) профилей метилирования ДНК всего генома, полученных на этапе b, (d) классификация CGID на основе частоты их метилирования ДНК, коррелирующей с прогрессированием предраковой стадии рака шейки матки, (e) получение кандидатных CGID из классификации на этапе d для получения ранних предикторов рака шейки матки в виде биомаркеров метилирования ДНК, где указанный статистический анализ результатов измерения метилирования ДНК включает в себя корреляцию Пирсона, анализ соотношений правильного и ложного обнаружения сигналов (ROC) и иерархический кластерный анализ.In yet another embodiment, the present invention relates to an in vitro method for obtaining early predictors of cervical cancer, comprising the following steps: (a) measuring the methylation of a DNA sample isolated from a cervical sample, (b) performing a statistical analysis of the results of the DNA methylation measurement, obtained in step a, (c) determining the DNA methylation status of multiple independent genomic CG positions, called CG identifiers (CGIDs), by performing progressive DNA methylation change analysis (APDMA) of the genome-wide DNA methylation profiles obtained in step b, (d) classification of CGIDs based on their DNA methylation frequency correlated with the progression of precancerous stage of cervical cancer, (e) derivation of candidate CGIDs from the classification in step d to obtain early predictors of cervical cancer in the form of DNA methylation biomarkers, where specified statistical analysis of DNA methylation measurement results includes Pearson correlation, ROC analysis, and hierarchical cluster analysis.
В другом варианте осуществления настоящее изобретение относится к in vitro способу получения ранних предикторов рака шейки матки, включающему в себя следующие этапы: (a) измерение метилирования образца ДНК, выделенного из образца шейки матки, (b) выполнение статистического анализа результатов измерения метилирования ДНК, полученных на этапе a, (c) определение статуса метилирования ДНК множества независимых геномных положений CG, называемых CG-идентификаторами (CGID), путём выполнения анализа прогрессивных изменений метилирования ДНК (APDMA) профилей метилирования ДНК всего генома, полученных на этапе b, (d) классификация CGID на основе частоты их метилирования ДНК, коррелирующей с прогрессированием предраковой стадии рака шейки матки, (e) получение кандидатных CGID из классификации на этапе d для получения ранних предикторов рака шейки матки в виде биомаркеров метилирования ДНК, где указанное прогрессирование предраковой стадии рака шейки матки включает в себя поражения при дисплазии шейки матки на стадиях ДШМ, ДШМ2 и ДШМ3.In another embodiment, the present invention relates to an in vitro method for obtaining early predictors of cervical cancer, comprising the following steps: (a) measuring the methylation of a DNA sample isolated from a cervical sample, (b) performing a statistical analysis of the DNA methylation measurements obtained in step a, (c) determination of the DNA methylation status of multiple independent genomic CG positions, called CG identifiers (CGIDs), by performing progressive DNA methylation change analysis (APDMA) of the genome-wide DNA methylation profiles obtained in step b, (d) classification CGIDs based on the frequency of their DNA methylation correlated with the progression of the precancerous stage of cervical cancer, (e) deriving candidate CGIDs from the classification in step d to obtain early predictors of cervical cancer in the form of DNA methylation biomarkers, where the specified progression of the precancerous stage of cervical cancer includes includes lesions in cervical dysplasia at the stages of DSM, DSM2 and DSM3.
В альтернативном варианте осуществления настоящее изобретение относится к in vitro способу получения ранних предикторов рака шейки матки, включающему в себя следующие этапы: (a) измерение метилирования образца ДНК, выделенного из образца шейки матки, (b) выполнение статистического анализа результатов измерения метилирования ДНК, полученных на этапе a, (c) определение статуса метилирования ДНК множества независимых геномных положений CG, называемых CG-идентификаторами (CGID), путём выполнения анализа прогрессивных изменений метилирования ДНК (APDMA) профилей метилирования ДНК всего генома, полученных на этапе b, (d) классификация CGID на основе частоты их метилирования ДНК, коррелирующей с прогрессированием предраковой стадии рака шейки матки, (e) получение кандидатных CGID из классификации на этапе d для получения ранних предикторов рака шейки матки в виде биомаркеров метилирования ДНК, где указанные CGID на основе частоты их метилирования ДНК, коррелирующей с прогрессированием предраковой стадии рака шейки матки, выбраны из группы CGID, как указано в SEQ ID NO:1 - SEQ ID NO:79, и их комбинации. В дополнительном варианте осуществления настоящего изобретения 79 сайтов CGID применимы по отдельности или в комбинации, в качестве ранних предикторов рака шейки матки, они обозначены как биомаркеры метилирования ДНК для раннего выявления рака шейки матки.In an alternative embodiment, the present invention relates to an in vitro method for obtaining early predictors of cervical cancer, comprising the following steps: (a) measuring the methylation of a DNA sample isolated from a cervical sample, (b) performing a statistical analysis of the DNA methylation measurements obtained in step a, (c) determination of the DNA methylation status of multiple independent genomic CG positions, called CG identifiers (CGIDs), by performing progressive DNA methylation change analysis (APDMA) of the genome-wide DNA methylation profiles obtained in step b, (d) classification CGIDs based on their DNA methylation frequency correlated with the progression of precancerous stage of cervical cancer, (e) obtaining candidate CGIDs from the classification in step d to obtain early predictors of cervical cancer in the form of DNA methylation biomarkers, where the specified CGIDs based on their DNA methylation frequency , correlating with the progression of the precancerous stage of cervical cancer, selected from the group CGID, as indicated in SEQ ID NO:1 to SEQ ID NO:79, and combinations thereof. In a further embodiment of the present invention, the 79 CGID sites are useful individually or in combination as early predictors of cervical cancer and are designated as DNA methylation biomarkers for early detection of cervical cancer.
Таблица 1: Выбранные 79 полинуклеотидов, имеющих сайты метилирования CG (CGID), применимые в вариантах осуществления настоящего изобретения. Table 1: Selected 79 polynucleotides having CG methylation sites (CGID) useful in embodiments of the present invention .
Последовательности для зонда-идентификатора Illumina для выбранных 79 CGID, используемых в различных вариантах осуществления настоящего изобретения, находятся в Таблице 1, которая включена в настоящую заявку, и включают The sequences for the Illumina probe identifier for the selected 79 CGIDs used in various embodiments of the present invention are found in Table 1, which is included herein, and include
Указанные биомаркеры были включены в окончательный список как прогрессивно метилированные CGID со средним увеличением метилирования на 10% или снижением более чем на 10% во время перехода от стадии ДШМ1 к стадии ДШМ3 и с фоновым метилированием в нормальных клетках (менее 10%) с использованием расчетов, полученных способом APDMA, раскрытым в настоящем изобретении. Метод Illumina использует преимущества последовательностей, фланкирующих локус CG, для генерации уникального идентификатора кластера локуса CG с той же стратегией, что и идентификаторы refSNP NCBI (rs#) в dbSNP.These biomarkers were shortlisted as progressively methylated CGIDs with an average increase in methylation of 10% or a decrease of more than 10% during the transition from stage DSM1 to stage DSM3 and with background methylation in normal cells (less than 10%) using calculations obtained by the APDMA method disclosed in the present invention. The Illumina method takes advantage of sequences flanking the CG locus to generate a unique CG locus cluster identifier with the same strategy as NCBI refSNP identifiers (rs#) in dbSNP.
В одном варианте осуществления настоящее изобретение относится к панели биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, где панель включает в себя CGID, полученные способом APDMA, с последовательностями, выбранными из группы, состоящей из SEQ ID NO:1 - SEQ ID NO:79 и их комбинаций, и, необязательно, указанная панель применяется в комбинации с другими биомаркерами в качестве ранних предикторов рака шейки матки.In one embodiment, the present invention relates to a panel of DNA methylation biomarkers for screening and early detection of cervical cancer, where the panel includes CGIDs obtained by the APDMA method with sequences selected from the group consisting of SEQ ID NO:1 - SEQ ID NO :79 and combinations thereof, and optionally the panel is used in combination with other biomarkers as early predictors of cervical cancer.
В одном варианте осуществления настоящего изобретения биомаркеры метилирования полигенной ДНК представляют собой комбинацию CGID из списка, приведенного ниже в Таблице 2, или короткого подмножества этого списка, такого как пример, приведенный ниже в Таблице 3, для раннего выявления рака шейки матки и риска рак шейки матки у женщин с предраковыми поражениями от ДШМ1 до ДШМ3.In one embodiment of the present invention, the polygenic DNA methylation biomarkers are a combination of CGIDs from the list shown below in Table 2, or a short subset of this list, such as the example shown below in Table 3, for early detection of cervical cancer and risk of cervical cancer in women with precancerous lesions from DSM1 to DSM3.
Таким образом, в дополнительном варианте осуществления настоящее изобретение относится к in vitro способу для получения ранних предикторов рака шейки матки, этот способ включает в себя следующие этапы: (a) измерение метилирования образца ДНК, выделенного из образца шейки матки, (b) выполнение статистического анализа результатов измерения метилирования ДНК, полученных на этапе a, (c) определение статуса метилирования ДНК множества независимых геномных положений CG, называемых CG-идентификаторами (CGID), путём выполнения анализа прогрессивных изменений метилирования ДНК (APDMA) профилей метилирования ДНК всего генома, полученных на этапе b, (d) классификация CGID на основе частоты их метилирования ДНК, коррелирующей с прогрессированием предраковой стадии рака шейки матки, (e) получение кандидатных CGID из классификации на этапе d для получения ранних предикторов рака шейки матки в виде биомаркеров метилирования ДНК, где указанные кандидатные CGID в качестве ранних предикторов рака шейки матки в виде биомаркеров метилирования ДНК, где CGID выбраны из группы, как указано в Thus, in a further embodiment, the present invention relates to an in vitro method for obtaining early predictors of cervical cancer, this method includes the following steps: (a) measuring the methylation of a DNA sample isolated from a cervical sample, (b) performing statistical analysis DNA methylation measurement results obtained in step a, (c) determining the DNA methylation status of multiple independent genomic CG positions, called CG identifiers (CGIDs), by performing progressive DNA methylation change analysis (APDMA) of genome-wide DNA methylation profiles obtained in step b, (d) classification of CGIDs based on their DNA methylation frequency, which correlates with the progression of the precancerous stage of cervical cancer, (e) deriving candidate CGIDs from the classification in step d to obtain early predictors of cervical cancer in the form of DNA methylation biomarkers, where the specified candidate CGIDs as early predictors of cervical cancer in the form of DNA methylation biomarkers, where CGIDs are selected from the group as stated in
Таблица 2: Выбранное подмножество полинуклеотидов из Таблицы 1, имеющих сайты метилирования CpG, применимые в вариантах осуществления настоящего изобретения.Table 2: Selected subset of polynucleotides from Table 1 having CpG methylation sites useful in embodiments of the present invention.
Обсуждаемые здесь 16 биомаркеров CGID находятся в Таблице 2, которая включена в данную заявку. Эти включенные в короткий список 16 биомаркеров метилирования ДНК были гиперметилированы на стадиях ДШМ3 и ДШМ1 по сравнению контролем, с наивысшей величиной эффекта (Cohen D> 1,3) между ДШМ3 и контролем и наивысшей корреляцией Спирмена с прогрессированием фаз ДШМ r > 0,4.The 16 CGID biomarkers discussed here are found in Table 2, which is included in this application. These shortlisted 16 DNA methylation biomarkers were hypermethylated in DSM3 and DSM1 stages compared with control, with the highest effect size (Cohen's D > 1.3) between DSM3 and control and the highest Spearman correlation with progression of DSM phases r > 0.4.
В одном из вариантов осуществления настоящее изобретение относится к комбинации биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, указанная комбинация включает в себя CGID, полученные с использованием способа APDMA, для выявления рака шейки матки путём измерения уровней метилирования ДНК указанных CGID в ДНК, выделенной из образцов шейки матки, и получение «предиктора метилирования рака шейки матки» с использованием уравнений линейной регрессии и анализа соотношений правильного и ложного обнаружения сигналов (ROC), где CGID выбраны из группы, указанной в SEQ ID NO: 3, SEQ NO: 4, SEQ ID NO: 7, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 31, SEQ ID NO: 34, SEQ ID NO: 39, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 49, SEQ ID NO: 56, SEQ ID NO: 57, SEQ ID NO: 58, SEQ ID NO: 65, SEQ ID NO: 70 и их комбинации.In one embodiment, the present invention relates to a combination of DNA methylation biomarkers for screening and early detection of cervical cancer, said combination includes CGIDs obtained using the APDMA method for detecting cervical cancer by measuring DNA methylation levels of said CGIDs in DNA, isolated from cervical samples, and obtaining a “cervical cancer methylation predictor” using linear regression equations and ROC (ROC) ratio analysis, where the CGIDs are selected from the group specified in SEQ ID NO: 3, SEQ NO: 4 , SEQ ID NO: 7, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 31, SEQ ID NO: 34, SEQ ID NO: 39, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 49, SEQ ID NO: 56, SEQ ID NO: 57, SEQ ID NO: 58, SEQ ID NO: 65, SEQ ID NO: 70 and combinations thereof.
Таблица 3: Выбранное подмножество полинуклеотидов из Таблицы 2, имеющих сайты метилирования CpG, используемые в вариантах осуществления изобретения.Table 3: Selected subset of polynucleotides from Table 2 having CpG methylation sites used in embodiments of the invention.
Два биомаркера CGID, а именно Two CGID biomarkers viz.
как обсуждается здесь, находятся в Таблице 3, которая включена в настоящую заявку. Подмножество в Таблице 3 представляет минимальное количество биомаркеров CGID, которые отличают предраковые поражения ДШМ3 от контроля, идентифицированные с использованием регрессия со штрафом, которая уменьшила количество CGID до 5, с последующей многомерной линейной регрессией с этими 5 CGID в качестве независимых переменных и состоянием ДШМ3 в качестве зависимой переменной. Уравнение линейной регрессии, составленное из взвешенных уровней метилирования этих двух сайтов, было очень значимым для предсказания ДШМ3 (p < 5x10-15).as discussed herein are found in Table 3, which is included herein. The subset in Table 3 represents the minimum number of CGID biomarkers that distinguish DSM3 precancerous lesions from controls, identified using penalized regression that reduced the number of CGIDs to 5, followed by multivariate linear regression with these 5 CGIDs as independent variables and DSM3 status as dependent variable. A linear regression equation constructed from the weighted methylation levels of these two sites was highly significant for predicting DSM3 (p < 5x10 -15 ).
В одном варианте осуществления настоящее изобретение относится к комбинации биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, указанная комбинация включает в себя CGID, полученные с использованием способа APDMA, для выявления рака шейки матки путём измерения уровней метилирования ДНК указанных CGID в ДНК, выделенной из образцов шейки матки, и получение «предиктора метилирования рака шейки матки» с использованием уравнений линейной регрессии и анализа соотношений правильного и ложного обнаружения сигналов (ROC), где, где указанные CGID приведены в SEQ ID NO: 3 и SEQ ID NO: 31.In one embodiment, the present invention relates to a combination of DNA methylation biomarkers for screening and early detection of cervical cancer, said combination including CGIDs obtained using the APDMA method for detecting cervical cancer by measuring DNA methylation levels of said CGIDs in DNA isolated from cervical samples, and obtaining a “cervical cancer methylation predictor” using linear regression equations and ROC (ROC) analysis, where, where the specified CGIDs are given in SEQ ID NO: 3 and SEQ ID NO: 31.
В одном из вариантов осуществления настоящее изобретение относится к набору и способу для выявления рака шейки матки, содержащему средства и реагенты для обнаружения измерений метилирования ДНК панели полигенных биомаркеров метилирования ДНК для рака шейки матки.In one embodiment, the present invention relates to a kit and method for detecting cervical cancer, comprising tools and reagents for detecting DNA methylation measurements of a panel of polygenic DNA methylation biomarkers for cervical cancer.
В одном из вариантов осуществления настоящее изобретение относится к набору для выявления рака шейки матки, содержащему средства и реагенты для измерения метилирования ДНК биомаркеров CGID из Таблицы 1 и их комбинаций.In one embodiment, the present invention provides a cervical cancer detection kit containing tools and reagents for measuring DNA methylation of the CGID biomarkers of Table 1 and combinations thereof.
В одном из вариантов осуществления настоящее изобретение относится к набору для выявления рака шейки матки, содержащему средства и реагенты для измерения метилирования ДНК CGID и получения предиктора метилирования ДНК рака шейки матки, и инструкцию по применению, где CGID представляют собой SEQ ID NO:1 - SEQ ID NO:79 и их комбинации.In one embodiment, the present invention provides a cervical cancer detection kit containing tools and reagents for measuring CGID DNA methylation and obtaining a cervical cancer DNA methylation predictor, and instructions for use, wherein the CGIDs are SEQ ID NO:1 - SEQ ID NO:79 and their combinations.
В одном из вариантов осуществления настоящее изобретение относится к набору, состоящему из панели CGID в форме чипа для выявления рака шейки матки, где панель CGID представляют собой последовательности, указанные в SEQ ID NO:1 - SEQ ID NO:79, и их комбинации.In one embodiment, the present invention provides a kit consisting of a CGID panel in the form of a chip for detecting cervical cancer, wherein the CGID panel is the sequences set forth in SEQ ID NO:1 through SEQ ID NO:79, and combinations thereof.
В одном из вариантов осуществления настоящее изобретение относится к набору, в котором используются биомаркеры CGID, раскрытые в настоящем изобретении.In one embodiment, the present invention provides a kit that uses the CGID biomarkers disclosed in the present invention.
В одном из вариантов осуществления настоящее изобретение относится к набору, использующему анализ метилирования ДНК путём пиросеквенирования для прогнозирования рака шейки матки путём измерения метилирования ДНК CGID, где CGID представляют собой последовательности, указанные в SEQ ID NO:1 - SEQ ID NO:79 и их комбинации.In one embodiment, the present invention provides a kit using DNA methylation analysis by pyrosequencing to predict cervical cancer by measuring CGID DNA methylation, wherein the CGIDs are the sequences set forth in SEQ ID NO:1 through SEQ ID NO:79 and combinations thereof .
В одном из вариантов осуществления настоящее изобретение относится к набору, использующему анализ метилирования ДНК путём пиросеквенирования для прогнозирования рака шейки матки с использованием биомаркеров CGID, перечисленных выше, например, с использованием описанных ниже праймеров и стандартных условий реакций пиросеквенирования, рекомендованных производителем (Pyromark, Qiagen):In one embodiment, the present invention provides a kit using DNA methylation analysis by pyrosequencing to predict cervical cancer using the CGID biomarkers listed above, for example, using the primers described below and standard pyrosequencing reaction conditions recommended by the manufacturer (Pyromark, Qiagen) :
Для cg03419058:For cg03419058:
Прямой (биотинилированный) праймер, указанный в SEQ ID NO:80, с полинуклеотидной последовательностью Forward (biotinylated) primer specified in SEQ ID NO:80, with polynucleotide sequence
GGTTTTTGGGTAGGAAGGATAGTAG.GGTTTTTGGGTAGGAAGGATAGTAG.
Обратный праймер, указанный в SEQ ID NO:81, с полинуклеотидной последовательностью Reverse primer specified in SEQ ID NO:81 with polynucleotide sequence
AAACAAATCTAACCCCTAAAAAAAC.AAACAAATCTAACCCCTAAAAAAAC.
Праймер для пиросеквенирования, указанный в SEQ ID NO:82, с полинуклеотидной последовательностью Pyrosequencing primer specified in SEQ ID NO:82 with polynucleotide sequence
CAAACTAAACACACTAAACC.CAAACTAAACACACTAAACC.
Для cg13944175:For cg13944175:
Прямой праймер, указанный в SEQ ID NO:83, с полинуклеотидной последовательностью Forward primer specified in SEQ ID NO:83 with polynucleotide sequence
GGGTTTTTAGGGTTGGTGGTA.GGGTTTTTAGGGTTGGTGGTA.
Обратный (биотинилированный) праймер, указанный в SEQ ID NO:84, с полинуклеотидной последовательностью Reverse (biotinylated) primer specified in SEQ ID NO:84, with polynucleotide sequence
TCCTCATAATAAATAACAACC.TCCTCATAATAAATAACAACC.
Праймер для пиросеквенирования, указанный в SEQ ID NO:85, с полинуклеотидной последовательностью Pyrosequencing primer as set forth in SEQ ID NO:85 with polynucleotide sequence
TATGTATGTGGTGGGGTT.TATGTATGTGGTGGGGTT.
В одном из вариантов осуществления настоящее изобретение относится к набору, использующему анализ метилирования ДНК путём пиросеквенирования для прогнозирования рака шейки матки путём измерения метилирования ДНК комбинаций CGID, где прямой биотинилированный праймер имеет последовательность, приведенную в SEQ ID NO:80, обратный праймер имеет последовательность, приведенную в SEQ ID NO:81, и праймер для пиросеквенирования имеет последовательность, приведенную в SEQ ID NO:82.In one embodiment, the present invention provides a kit using DNA methylation analysis by pyrosequencing to predict cervical cancer by measuring DNA methylation of CGID combinations, wherein the forward biotinylated primer has the sequence shown in SEQ ID NO:80, the reverse primer has the sequence shown in in SEQ ID NO:81, and the pyrosequencing primer has the sequence shown in SEQ ID NO:82.
В одном из вариантов осуществления настоящее изобретение относится к набору, использующему анализ метилирования ДНК путём пиросеквенирования для прогнозирования рака шейки матки путём измерения метилирования ДНК комбинаций CGID, где прямой биотинилированный праймер имеет последовательность, приведенную в SEQ ID NO:83, обратный праймер имеет последовательность, приведенную в SEQ ID NO: 84, и праймер для пиросеквенирования имеет последовательность, приведенную в SEQ ID NO:85.In one embodiment, the present invention provides a kit using DNA methylation analysis by pyrosequencing to predict cervical cancer by measuring DNA methylation of CGID combinations, wherein the forward biotinylated primer has the sequence shown in SEQ ID NO:83, the reverse primer has the sequence shown in in SEQ ID NO: 84, and the pyrosequencing primer has the sequence shown in SEQ ID NO: 85.
В одном из вариантов осуществления настоящее изобретение относится к набору, использующему анализ метилирования ДНК с секвенированием полигенных мультиплексных бисульфитных ампликонов для прогнозирования рака шейки матки в ДНК, выделенной из образцов шейки матки, с использованием биомаркеров CGID, перечисленных выше. Например, с использованием описанных ниже праймеров и стандартных условий, которые включают в себя превращение бисульфита, последовательную амплификацию с праймерами, специфичными для мишени (ПЦР1), с последующими штрих-кодирующими праймерами (ПЦР2) и мультиплексное секвенирование в одном секвенаторе Miseq следующего поколения (Illumina), демультиплексирование с использованием программного обеспечения Illumina, извлечение данных и количественную оценку метилирования с использованием стандартных методов анализа метилирования, таких как Methylkit, с последующим расчетом взвешенной оценки метилирования ДНК и прогнозированием рака.In one embodiment, the present invention provides a kit using DNA methylation analysis with polygenic multiplex bisulfite amplicon sequencing to predict cervical cancer in DNA isolated from cervical samples using the CGID biomarkers listed above. For example, using the primers described below and standard conditions that include bisulfite conversion, sequential amplification with target-specific primers (PCR1) followed by barcoding primers (PCR2), and multiplex sequencing on a single next-generation Miseq sequencer (Illumina ), demultiplexing using Illumina software, data extraction and methylation quantification using standard methylation analysis methods such as Methylkit, followed by calculation of a weighted DNA methylation score and cancer prediction.
Первую ПЦР проводят следующим образом:The first PCR is carried out as follows:
Для CGID cg03419058:For CGID cg03419058:
Прямой праймер, указанный в SEQ ID NO:80, с полинуклеотидной последовательностью Forward primer specified in SEQ ID NO:80 with polynucleotide sequence
Обратный праймер, указанный в SEQ ID NO:81, с полинуклеотидной последовательностью Reverse primer specified in SEQ ID NO:81 with polynucleotide sequence
Для CGID cg13944175:For CGID cg13944175:
Прямой праймер, указанный в SEQ ID NO:83, с полинуклеотидной последовательностью Forward primer specified in SEQ ID NO:83 with polynucleotide sequence
Обратный праймер, указанный в SEQ ID NO:84, с полинуклеотидной последовательностью Reverse primer specified in SEQ ID NO:84 with polynucleotide sequence
Для штрих-кодирования (индексации) образцов в настоящем изобретении использовали вторую реакция ПЦР со следующими праймерами:To barcode (index) samples in the present invention, a second PCR reaction was used with the following primers:
Прямой праймер, указанный в SEQ ID NO:86, с полинуклеотидной последовательностью Forward primer specified in SEQ ID NO:86, with polynucleotide sequence
Штрих-кодирующий (обратный) праймер, указанный в SEQ ID NO:87, с полинуклеотидной последовательностьюBarcoding (reverse) primer specified in SEQ ID NO:87 with polynucleotide sequence
(где красные основания являются индексом; и используется 1200 вариантов этого индекса).(where the red bases are the index; and there are 1200 variations of this index used).
В одном из вариантов осуществления настоящее изобретение относится к набору, использующему анализ метилирования с помощью бисульфитного секвенирования с мультиплексной целевой амплификацией на секвенаторе следующего поколения для выявления рака шейки матки путём измерения уровней метилирования ДНК комбинаций CGID, где CGID указаны в SEQ ID NO:1 - SEQ ID NO:79 и их комбинации.In one embodiment, the present invention provides a kit using bisulfite sequencing methylation analysis with multiplex targeted amplification on a next generation sequencer to detect cervical cancer by measuring DNA methylation levels of CGID combinations, where the CGIDs are specified in SEQ ID NO:1 - SEQ ID NO:79 and their combinations.
В другом варианте осуществления настоящее изобретение относится к набору, использующему анализ метилирования с помощью бисульфитного секвенирования с мультиплексной целевой амплификацией на секвенаторе следующего поколения для выявления рака шейки матки путём измерения уровней метилирования ДНК комбинаций CGID, где CGID, как указано в SEQ ID NO:3 содержит праймеры, указанный в SEQ ID NO:88, с полинуклеотидной последовательностью In another embodiment, the present invention provides a kit using bisulfite sequencing methylation analysis with multiplex targeted amplification on a next generation sequencer to detect cervical cancer by measuring the DNA methylation levels of CGID combinations, where the CGID as defined in SEQ ID NO:3 contains primers specified in SEQ ID NO:88, with a polynucleotide sequence
для прямого праймера и указанный в SEQ ID NO:89 с полинуклеотидной последовательностью for the forward primer and specified in SEQ ID NO:89 with the polynucleotide sequence
для обратного праймера.for reverse primer.
В другом варианте осуществления настоящее изобретение относится к набору, использующему анализ метилирования с помощью бисульфитного секвенирования с мультиплексной целевой амплификацией на секвенаторе следующего поколения для выявления рака шейки матки путём измерения уровней метилирования ДНК комбинаций CGID, где CGID, как указано в SEQ ID NO:31 содержит праймеры, указанный в SEQ ID NO:90 с полинуклеотидной последовательностью In another embodiment, the present invention provides a kit using bisulfite sequencing methylation analysis with multiplex targeted amplification on a next generation sequencer to detect cervical cancer by measuring the DNA methylation levels of CGID combinations, where the CGID as defined in SEQ ID NO:31 contains primers specified in SEQ ID NO:90 with polynucleotide sequence
для прямого праймера и указанный в SEQ ID NO:91 с полинуклеотидной последовательностью for the forward primer and specified in SEQ ID NO:91 with the polynucleotide sequence
для обратного праймера.for reverse primer.
В одном из вариантов осуществления настоящее изобретение относится к применению анализа соотношений правильного и ложного обнаружения сигналов (ROC) для выявления рака путём определения порогового значения между раком шейки матки и нормальной шейкой матки с использованием взвешенных измерений метилирования ДНК биомаркеров CGID, приведенных в Таблице 1, и их комбинаций или подмножества этих идентификаторов CGID, такие например, как приведенные в Таблице 2 и их комбинации. Образцы выше порогового значения классифицируются как раковые.In one embodiment, the present invention relates to the use of ROC analysis for cancer detection by determining the threshold between cervical cancer and normal cervix using weighted DNA methylation measurements of the CGID biomarkers shown in Table 1, and combinations thereof or subsets of these CGIDs, such as those shown in Table 2 and combinations thereof. Samples above the threshold are classified as cancerous.
В одном из вариантов осуществления настоящее изобретение относится к применению иерархического кластерного анализа для прогнозирования рака с использованием в получении положительного результата раннего обнаружения рака с использованием измерений метилирования биомаркеров CGID, перечисленных в Таблице 1, и их комбинаций.In one embodiment, the present invention relates to the use of hierarchical cluster analysis for cancer prediction using in obtaining a positive early detection of cancer using methylation measurements of the CGID biomarkers listed in Table 1, and combinations thereof.
В одном из вариантов осуществления настоящее изобретение относится к набору, использующему анализ метилирования выделенной из образца ДНК на основе масс-спектрометрии (Epityper™) или ПЦР для выявления рака путём измерения уровней метилирования ДНК комбинаций CGID в панели биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, где панель включает в себя CGID, полученные способом APDMA, имеющие последовательности, выбранные из группы, состоящей из SEQ ID NO:1 - SEQ ID NO:79 и их комбинаций, и, необязательно, указанная панель используется в комбинации с другими биомаркерами в качестве ранних предикторов рака шейки матки.In one embodiment, the present invention provides a kit using mass spectrometry-based (Epityper™) or PCR-based DNA methylation analysis of sample-extracted DNA to detect cancer by measuring DNA methylation levels of CGID combinations in a panel of DNA methylation biomarkers for cancer screening and early detection. cervix, where the panel includes CGIDs obtained by the APDMA method having sequences selected from the group consisting of SEQ ID NO:1 to SEQ ID NO:79 and combinations thereof, and optionally, said panel is used in combination with other biomarkers as early predictors of cervical cancer.
В одном из вариантов осуществления настоящее изобретение относится к применению уравнения многомерной линейной регрессии или нейросетевого анализа для расчета показателя метилирования, прогнозирующего рак шейки матки, с использованием измерений метилирования ДНК комбинаций CGID в панели биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, где панель включает в себя CGID, полученные способом APDMA, с последовательностями, выбранными из группы, состоящей из SEQ ID NO:1 - SEQ ID NO:79 и их комбинаций, и, необязательно, указанная панель используется в комбинации с другими биомаркерами в качестве ранних предикторов рака шейки матки.In one embodiment, the present invention relates to the use of a multivariate linear regression equation or neural network analysis to calculate a methylation score predictive of cervical cancer using DNA methylation measurements of CGID combinations in a panel of DNA methylation biomarkers for screening and early detection of cervical cancer, wherein the panel includes CGIDs obtained by the APDMA method with sequences selected from the group consisting of SEQ ID NO:1 to SEQ ID NO:79 and combinations thereof, and optionally said panel is used in combination with other biomarkers as early predictors of cancer cervix.
В одном из вариантов осуществления настоящее изобретение относится к применению уравнения многомерной линейной регрессии или нейросетевого анализа для расчета показателя метилирования, прогнозирующего рак шейки матки, с использованием измерений метилирования ДНК комбинаций CGID в комбинации биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, указанная комбинация включает в себя CGID, полученные с использованием способа APDMA, для выявления рака шейки матки путём измерения уровней метилирования ДНК указанных CGID в ДНК, выделенной из образцов шейки матки, и получения «предиктора метилирования рака шейки матки» с использованием уравнений линейной регрессии и анализа соотношений правильного и ложного обнаружения сигналов (ROC), где CGID выбраны из группы, состоящей из SEQ ID NO:3, SEQ NO:4, SEQ ID NO:7, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:31, SEQ ID NO:34, SEQ ID NO:39, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:49, SEQ ID NO:56, SEQ ID NO:57, SEQ ID NO:58, SEQ ID NO:65, SEQ ID NO:70 и их комбинаций.In one embodiment, the present invention relates to the use of a multivariate linear regression equation or neural network analysis to calculate a methylation score predictive of cervical cancer using DNA methylation measurements of CGID combinations in a combination of DNA methylation biomarkers for screening and early detection of cervical cancer, said combination includes CGIDs obtained using the APDMA method to detect cervical cancer by measuring the DNA methylation levels of the specified CGIDs in DNA isolated from cervical samples and obtaining a “cervical cancer methylation predictor” using linear regression equations and correlation analysis of the correct and false detection (ROC), wherein the CGIDs are selected from the group consisting of SEQ ID NO:3, SEQ NO:4, SEQ ID NO:7, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:31 , SEQ ID NO:34, SEQ ID NO:39, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:49, SEQ ID NO:56, SEQ ID NO:57, SEQ ID NO:58, SEQ ID NO:65, SEQ ID NO:70 and combinations thereof.
В альтернативном варианте осуществления настоящее изобретение относится к применению уравнения многомерной линейной регрессии или нейросетевого анализа для расчета показателя метилирования, прогнозирующего рак шейки матки, с использованием измерений метилирования ДНК комбинаций CGID в комбинации биомаркеров метилирования ДНК, где указанные CGID имеют последователности, указанные в SEQ ID NO:3 и SEQ ID NO: 31.In an alternative embodiment, the present invention relates to the use of a multivariate linear regression equation or neural network analysis to calculate a methylation score predictive of cervical cancer using DNA methylation measurements of CGID combinations in a combination of DNA methylation biomarkers, wherein said CGIDs have the sequences specified in SEQ ID NO :3 and SEQ ID NO: 31.
В одном из вариантов осуществления настоящее изобретение относится к применению анализа соотношений правильного и ложного обнаружения сигналов (ROC) для определения порога «показателя метилирования», позволяющего дифференцировать рак шейки матки от нераковой ткани шейки матки с использованием измерений комбинаций метилирования ДНК в панели биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, где панель включает в себя CGID, полученные способом APDMA, имеющие последовательности, выбранные из группы, состоящей из SEQ ID NO:1 - SEQ ID NO:79 и их комбинаций, и, необязательно, указанная панель используется в комбинация с другими биомаркерами в качестве ранних предикторов рака шейки матки.In one embodiment, the present invention relates to the use of ROC analysis to determine a "methylation score" threshold to differentiate cervical cancer from non-cancerous cervical tissue using measurements of combinations of DNA methylation in a panel of DNA methylation biomarkers for screening and early detection of cervical cancer, where the panel includes CGIDs obtained by the APDMA method having sequences selected from the group consisting of SEQ ID NO:1 to SEQ ID NO:79 and combinations thereof, and optionally said panel is used in combination with other biomarkers as early predictors of cervical cancer.
В одном из вариантов осуществления настоящее изобретение относится к применению анализа соотношений правильного и ложного обнаружения сигналов (ROC) для определения порогового значения «показателя метилирования», позволяющего дифференцировать рак шейки матки от нераковой ткани шейки матки с использованием измерений комбинаций метилирования ДНК в комбинации биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, указанная комбинация включает в себя CGID, полученные с использованием способа APDMA, для выявления рака шейки матки путём измерения уровней метилирования ДНК указанных CGID в ДНК, выделенной из образцов шейки матки, и получения «предиктора метилирования рака шейки матки» с использованием уравнения линейной регрессии и анализа соотношений правильного и ложного обнаружения сигналов (ROC), где идентификаторы CGID выбраны из группы, состоящей из SEQ ID NO:3, SEQ NO:4, SEQ ID NO:7, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:31, SEQ ID NO:34, SEQ ID NO:39, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:49, SEQ ID NO:56, SEQ ID NO:57, SEQ ID NO:58, SEQ ID NO:65, SEQ ID NO:70 и их комбинаций.In one embodiment, the present invention relates to the use of ROC analysis to determine a "methylation score" threshold value for differentiating cervical cancer from non-cancerous cervical tissue using measurements of combinations of DNA methylation in combinations of DNA methylation biomarkers for screening and early detection of cervical cancer, the said combination includes CGIDs obtained using the APDMA method for detecting cervical cancer by measuring DNA methylation levels of said CGIDs in DNA isolated from cervical samples and obtaining a “cervical cancer methylation predictor” uterus" using a linear regression equation and ROC analysis, where the CGIDs are selected from the group consisting of SEQ ID NO:3, SEQ NO:4, SEQ ID NO:7, SEQ ID NO:17 , SEQ ID NO:19, SEQ ID NO:31, SEQ ID NO:34, SEQ ID NO:39, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:49, SEQ ID NO:56, SEQ ID NO:57, SEQ ID NO:58, SEQ ID NO:65, SEQ ID NO:70 and combinations thereof.
В альтернативном варианте осуществления настоящее изобретение относится к применению анализа соотношений правильного и ложного обнаружения сигналов (ROC) для определения порогового значения «показателя метилирования», позволяющего дифференцировать рак шейки матки от нераковой ткани шейки матки с использованием измерений комбинаций метилирования ДНК в комбинации биомаркеров метилирования ДНК, где указанные CGID имеют последовательности, указанные в SEQ ID NO:3 и SEQ ID NO:31.In an alternative embodiment, the present invention relates to the use of ROC analysis to determine a "methylation score" threshold value for differentiating cervical cancer from non-cancerous cervical tissue using measurements of combinations of DNA methylation in combinations of DNA methylation biomarkers, wherein said CGIDs have the sequences shown in SEQ ID NO:3 and SEQ ID NO:31.
В одном из вариантов осуществления настоящее изобретение относится к реализованному на компьютере способу получения кандидатных биомаркеров метилирования ДНК для раннего выявления для диагностики рака шейки матки, данный способ включает в себя: предоставление данных о метилировании ДНК по всему геному для множества независимых геномных положений CG, CGID генома человека; обработку данных о метилировании ДНК по всему геному путём нормализации и получения нормализованных бета-значений метилирования ДНК; вычисление корреляции Спирмена с нормализованными бета-значениями метилирования ДНК между стадиями прогрессирования предраковых состояний и неизмененными клетками шейки матки; получение кандидатных CGID при помощи анализа прогрессирующих изменений метилирования ДНК (APDMA) для получения кандидатных биомаркеров метилирования ДНК для ранней диагностики рака шейки матки.In one embodiment, the present invention relates to a computer-implemented method for obtaining candidate DNA methylation biomarkers for early detection for the diagnosis of cervical cancer, the method comprising: providing genome-wide DNA methylation data for multiple independent genomic CG, CGID positions of the genome person; processing genome-wide DNA methylation data by normalizing and obtaining normalized DNA methylation beta values; calculation of Spearman's correlation with normalized DNA methylation beta values between stages of precancerous progression and intact cervical cells; obtaining candidate CGIDs using progressive DNA methylation change analysis (APDMA) to obtain candidate DNA methylation biomarkers for early diagnosis of cervical cancer.
ПримерыExamples
Следующие ниже примеры приводятся для иллюстрации настоящего изобретения, и не должны рассматриваться как ограничивающие объем настоящего изобретения.The following examples are provided to illustrate the present invention, and should not be construed as limiting the scope of the present invention.
Пример 1: Способ анализа прогрессирующих изменений метилирования ДНК (APDMA) для идентификации и получения положений CG (CGID), уровень метилирования которых является ранним предиктором рака шейки матки. Example 1 : Progressive DNA Methylation Change Analysis (APDMA) method to identify and obtain CG positions (CGIDs) whose methylation level is an early predictor of cervical cancer.
Настоящее изобретение направлено на решение одной из важнейших задач скрининга рака шейки матки, заключающейся в нахождении надежных биомаркеров, которые обеспечивают высокоточную и чувствительную оценку риска, которая может служить ориентиром для раннего вмешательства и лечения. Обычные подходы заключаются в использовании логистической регрессии случай-контроль данных метилирования ДНК в масштабе всего генома для выявления участков, которые либо более, либо менее метилированы в раковых клетках по сравнению с контрольными. Однако хорошо известно, что многие статистически значимые изменения метилирования ДНК при раке, обнаруженные этими методами, являются гетерогенными, и многие из них развиваются на поздних стадиях прогрессирования рака и, следовательно, имеют очень ограниченную ценность для раннего выявления, поскольку они уменьшаются, когда частота раковых клеток в образце является низкой. Более того, количественные различия в профилях метилирования, а не однозначные различия могут быть стерты в смеси нормальных и раковых клеток. Как хорошо известно, метилирование ДНК является бинарным свойством, что означает, что данная клетка либо метилирована, либо у нее в определенном положении в геноме не находится CG.The present invention addresses one of the critical challenges in cervical cancer screening, which is to find reliable biomarkers that provide highly accurate and sensitive risk assessments that can guide early intervention and treatment. Common approaches are to use case-control logistic regression of genome-wide DNA methylation data to identify regions that are either more or less methylated in cancer cells compared to controls. However, it is well known that many of the statistically significant DNA methylation changes in cancer detected by these methods are heterogeneous, and many of them develop late in cancer progression and therefore have very limited value for early detection since they decrease as the incidence of cancers increases. cells in the sample is low. Moreover, quantitative differences in methylation profiles, rather than unequivocal differences, may be attenuated in mixtures of normal and cancer cells. As is well known, DNA methylation is a binary property, which means that a given cell is either methylated or does not have CG at a certain position in the genome.
В этом примере настоящее изобретение относится к выбранным метилированным CGID как фундаментальной характеристике рака шейки матки, которые почти равномерно метилированы в образцах рака шейки матки, но никогда не метилируются в нормальной ткани, и, несмотря на то, что они однозначны для рака шейки матки, они возникают очень рано на предраковых стадиях в среде нормальных клеток, и их частота постепенно увеличивается от стадий ДШМ1 к ДШМ3, прогрессирующих к раку шейки матки. Было обнаружено, что метилированные CGID, которые однозначно различаются между нормальными и раковыми тканями, обнаруживаются даже тогда, когда раковые клетки обнаруживаются с низкой частотой в образце, путём глубокого секвенирования ДНК, преобразованной бисульфитом, которое обеспечивает разрешение одной молекулы ДНК. Частота молекул с метилированным CGID представляет собой долю раковых клеток в образце. Измерения метилирования таких CGID другими методами также могут определять частоту раковых клеток в образце и могут использоваться в качестве биомаркеров метилирования ДНК для оценки риска и прогнозирования рака шейки матки в образце.In this example, the present invention relates to selected methylated CGIDs as a fundamental characteristic of cervical cancer, which are almost uniformly methylated in cervical cancer samples but are never methylated in normal tissue, and despite being unique for cervical cancer, they arise very early in the precancerous stages in the environment of normal cells, and their frequency gradually increases from stages DSM1 to DSM3, progressing to cervical cancer. Methylated CGIDs, which uniquely differ between normal and cancerous tissues, were found to be detected even when cancer cells were found at low frequency in the sample by deep sequencing of bisulfite-converted DNA, which provides single-DNA molecule resolution. The frequency of molecules with methylated CGID represents the proportion of cancer cells in the sample. Measurements of methylation of such CGIDs by other methods can also determine the frequency of cancer cells in a sample and can be used as DNA methylation biomarkers to assess risk and predict cervical cancer in a sample.
Клинически известно, что часть предраковых поражений ДШМ перерастает в рак шейки матки, поэтому они являются особенно уникальным моментом для обнаружения ранних изменений метилирования ДНК при раке. Раннее прогнозирование того, у кого разовьется рак шейки матки, имеет огромное клиническое значение. Настоящее изобретение относится к способу получения таких биомаркеров метилирования ДНК для раннего выявления, характеризующихся следующими техническими признаками: во-первых, метилированные CGID, которые были однозначно характерны для ранних раковых клеток, были однородно неметилированы в нормальной ткани шейки матки; во-вторых, эти CGID нечасто метилировались в ранних предраковых образцах; в-третьих, частота этих первичных метилированных CGID должна увеличиваться с прогрессированием предраковых стадий от ДШМ1 до ДШМ3, так как это связано с повышенным риском рака шейки матки у женщин с поражениями ДШМ3; и в-четвертых, поскольку метилирование этих CGID является основной характеристикой рака шейки матки, эти CGID должны быть равномерно многочисленными в образцах рака шейки матки. В этом примере было обнаружено, что определенные CGID, метилирование которых увеличивается с прогрессированием стадий ДШМ от ДШМ1 к ДШМ3, повсеместно метилированы в образцах рака шейки матки, в то время как было обнаружено, что они однородно неметилированы в нормальной ткани, как описано здесь. Таким образом, раскрытый здесь способ настоящего изобретения относится к панели кандидатных биомаркеров CGID для раннего выявления рака шейки матки у женщин, особенно с предраковыми поражениями.It is clinically known that a proportion of precancerous cervical cancer lesions develop into cervical cancer, making them a particularly unique time point for detecting early DNA methylation changes in cancer. Early prediction of who will develop cervical cancer is of great clinical importance. The present invention relates to a method for producing such DNA methylation biomarkers for early detection, characterized by the following technical features: first, methylated CGIDs that were uniquely characteristic of early cancer cells were uniformly unmethylated in normal cervical tissue; second, these CGIDs were infrequently methylated in early precancerous samples; third, the frequency of these primary methylated CGIDs should increase with the progression of precancerous stages from DSM1 to DSM3, as this is associated with an increased risk of cervical cancer in women with DSM3 lesions; and fourth, since methylation of these CGIDs is a core characteristic of cervical cancer, these CGIDs should be uniformly abundant in cervical cancer samples. In this example, certain CGIDs whose methylation increases with the progression of DSM stages from DSM1 to DSM3 were found to be ubiquitously methylated in cervical cancer samples, while they were found to be uniformly unmethylated in normal tissue as described here. Thus, the method of the present invention disclosed herein relates to a panel of candidate CGID biomarkers for the early detection of cervical cancer in women, especially those with precancerous lesions.
Следующие этапы способа прогрессивных изменений метилирования ДНК (APDMA) были выполнены для определения биомаркеров CGID, состояние метилирования которых выявляет ранний рак шейки матки, как показано на Фигуре 1.The following steps of the progressive DNA methylation change method (APDMA) were performed to identify CGID biomarkers whose methylation status identifies early cervical cancer, as shown in Figure 1.
Образцы шейки маткиCervical samples
В настоящем изобретении использовались образцы шейки матки, взятые у женщин, направленных на кольпоскопическое обследование в больницу Университета Мак-Гилла из-за аномального результата скрининга на рак шейки матки или для начального лечения поражения шейки матки (19). В кратком изложении, в период с июня 2015 г. по апрель 2016 г. были обследованы 643 женщины в возрасте 16-70 лет. Образцы были протестированы на наличие ДНК ВПЧ канцерогенных типов с помощью теста Roche cobas® 4800 HPV Test, который выявляет ВПЧ1 и ВПЧ18 по отдельности, а также 12 других типов, связанных с высоким риском рака шейки матки (ВПЧ 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, 66 и 68) с получением объединенного результата. Результаты цитологического исследования классифицировали в соответствии с классификацией Bethesda как NILM: внутриэпителиальные поражения и злокачественные образования отсутствуют; ASC-US: атипичные клетки плоского эпителия неясного значения; ASC-H атипичные клетки плоского эпителия, нельзя исключить высокую степень плоскоклеточного интраэпителиального поражения (HSIL); LSIL: низкая степень плоскоклеточного интраэпителиального поражения; HSIL: высокая степень плоскоклеточного интраэпителиального поражения; AGC: атипичные клетки железистого эпителия; и рак (20). Делали биопсию патологических тканей шейки матки, и гистологические результаты старшие патологоанатомы Университета Мак-Гилла оценивали как нормальные, ДШМ1, ДШМ2, ДШМ3 или инвазивный рак. Исследование получило этическое одобрение институциональных наблюдательных советов Университета Макгилла и Еврейской больницы общего профиля. Участники исследования предоставили письменное информированное согласие.The present invention used cervical samples collected from women referred for colposcopic examination at McGill University Hospital because of an abnormal screening result for cervical cancer or for initial treatment of cervical lesions (19). Briefly, 643 women aged 16–70 years were studied between June 2015 and April 2016. Samples were tested for HPV DNA of carcinogenic types using the Roche cobas® 4800 HPV Test, which detects HPV1 and HPV18 individually, as well as 12 other types associated with a high risk of cervical cancer (HPV 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, 66 and 68) to obtain a combined result. The results of the cytological examination were classified according to the Bethesda classification as NILM: no intraepithelial lesions or malignancies; ASC-US: atypical squamous epithelial cells of unknown significance; ASC-H atypical squamous cells, high grade squamous intraepithelial lesion (HSIL) cannot be excluded; LSIL: low grade squamous intraepithelial lesion; HSIL: high grade squamous intraepithelial lesion; AGC: atypical glandular epithelial cells; and cancer (20). Abnormal cervical tissue was biopsied and histological results were graded as normal, DSM1, DSM2, DSM3, or invasive cancer by senior McGill University pathologists. The study received ethical approval from the institutional review boards of McGill University and the Jewish General Hospital. Study participants provided written informed consent.
Набор образцов включал в себя 186 случайно выбранных образцов женщин, собранных врачом. Из этих образцов 50 были ДШМ1, 40 ДШМ2 и 42 ДШМ3 и 54 образцов с нормальным результатом биопсии.The sample set included 186 randomly selected female samples collected by a physician. Of these samples, 50 were DSM1, 40 DSM2 and 42 DSM3 and 54 samples had a normal biopsy result.
Выделение ДНК и анализ метилирования геномаDNA extraction and genome methylation analysis
ДНК выделяли из исходных образцов расслоенных цервикальных клеток, суспендированных в жидком цитологическом растворе PreservCyt (PreservCyt, Hologic Inc., Миссиссауга).DNA was isolated from stock samples of dissected cervical cells suspended in PreservCyt liquid cytology solution (PreservCyt, Hologic Inc., Mississauga).
ДНК, выделенную с использованием набора для экстракции ДНК Qiagen, подвергали обработке бисульфитом и гибридизации с чипами Illumina Epic с использованием стандартных процедур, описанных производителем в инновационном центре Genome Quebec в Монреале. Чипы Epic обеспечивают превосходное покрытие репертуара промоторов и энхансеров человека, охватывая все известные области, регулирующие транскрипцию (21).DNA isolated using the Qiagen DNA extraction kit was bisulfite treated and hybridized to Illumina Epic chips using standard procedures described by the manufacturer at the Genome Quebec Innovation Center in Montreal. Epic chips provide excellent coverage of the human promoter and enhancer repertoire, covering all known transcriptional regulatory regions ( 21 ).
Нормализация и получение нормализованных показателей метилирования ДНК (бета) для всех образцовNormalization and obtaining normalized DNA methylation (beta) scores for all samples
Образцы рандомизировали по препарату и положению на чипах, и все образцы гибридизовали и сканировали одновременно для смягчения групповых эффектов, как рекомендовано инновационным центром McGill Genome в Квебеке в соответствии с руководством пользователя технологии Illumina Infinium HD. Гибридизация и сканирование чипов Illumina были выполнены инновационном центре McGill Genome в Квебеке в соответствии с инструкциями производителя. Чипы Illumina проанализировали с использованием пакета ChAMP Bioconductor в версии R Morris et al., 2014 (25). Файлы IDAT использовали в качестве входных данных в функции champ.load с использованием параметров контроля качества и нормализации minfi. Необработанные данные были отфильтрованы для зондов со значением обнаружения P > 0,01 как минимум в одном образце. Настоящий метод отфильтровывает зонды на X- или Y-хромосоме для смягчения половых эффектов и зонды с ОНП, как указано в Marzouka et al., 2015 (24), а также зонды, которые выравниваются по нескольким местоположениям, как указано в Marzouka et al., 2015 (24). Групповые эффекты анализировали на ненормализованных данных с помощью функции champ.svd. Пять из первых 6 основных компонентов были связаны с группой и серией (препараты). Нормализация внутри чипа для корректировки данных на предмет погрешности, вносимой конструкцией зонда Infinium типа 2, была выполнена с использованием квантильной нормализации бета-смеси (BMIQ) с функцией champ.norm (norm = «BMIQ») (25). Затем групповые эффекты корректировали после нормализации BMIQ с использованием функции champ.runcombat.Samples were randomized by drug and chip position, and all samples were hybridized and scanned simultaneously to mitigate group effects, as recommended by the McGill Genome Innovation Center in Quebec according to the Illumina Infinium HD technology user manual. Hybridization and scanning of Illumina chips were performed at the McGill Genome Innovation Center in Quebec according to the manufacturer's instructions. Illumina chips were analyzed using the ChAMP Bioconductor package in R version Morris et al., 2014 ( 25 ). IDAT files were used as input to the champ.load function using minfi quality control and normalization parameters. Raw data were filtered for probes with a detection value of P > 0.01 in at least one sample. The present method filters out probes on the X or Y chromosome to mitigate sex effects and probes with SNPs, as reported in Marzouka et al., 2015 (24), as well as probes that align to multiple locations, as reported in Marzouka et al. , 2015 (24). Group effects were analyzed on non-normalized data using the champ.svd function. Five of the first 6 principal components were related to group and series (drugs). On-chip normalization to correct the data for bias introduced by the Infinium type 2 probe design was performed using beta mixture quantile (BMIQ) normalization with the function champ.norm (norm = “BMIQ”) ( 25 ). Group effects were then adjusted after BMIQ normalization using the champ.runcombat function.
Выявление CGID, частота метилирования которых коррелирует с прогрессированием ДШМIdentification of CGIDs whose methylation frequency correlates with the progression of DSM
Затем в настоящем способе использовали бета-значения нормализованных данных, скорректированных по группам, для вычисления корреляции Спирмена между стадиями ДШМ (с кодами стадий 0 для нетрансформированных здоровых контрольных клеток шейки матки и 1-3 для стадий ДШМ от ДШМ1 до ДШМ3) с использованием скорректированной функции Спирмена в версии R и корректировки для множественных испытаний с использованием метода «fdr» Бенджамини Хохберга (скорректированное значение P (Q) < 0,05). Уровни метилирования 7715 CGID достоверно коррелировали (q > 0,05) с прогрессированием предраковых стадий ДШМ от 1 до 3 (см. Фигуру 2). Большинство сайтов были гиперметилированы, когда предраковые поражения прогрессировали от нормального до стадии ДШМ1 и ДШМ3, в то время как небольшая часть была гипометилирована (см. фиг. 2).The present method then used the beta values of the normalized group-adjusted data to calculate the Spearman correlation between DSM stages (with stage codes 0 for untransformed healthy cervical controls and 1-3 for DSM stages DSM1 to DSM3) using the adjusted function Spearman's version of R and adjustment for multiple testing using Benjamini Hochberg's “fdr” method (adjusted P (Q) < 0.05). 7715 CGID methylation levels were significantly correlated (q > 0.05) with the progression of precancerous stages of DSM from 1 to 3 (see Figure 2). Most sites were hypermethylated as premalignant lesions progressed from normal to stage DSM1 and DSM3, while a small proportion were hypomethylated (see Fig. 2).
Составление короткого списка кандидатных CGIDShortlisting candidate CGIDs
Чтобы определить положения CGID, которые соответствуют предположениям способа APDMA, 79 прогрессивно метилированных CGID были включены в короткий список со средним увеличением метилирования на 10% или снижением более чем на 10% во время перехода от ДШМ1 к ДШМ3 и фоновым метилированием в нормальных клетках (менее 10%) (см. Таблицу 1 выше). При помощи настоящего способа затем проверяли, одинаково ли эти CGID идентифицируют рак шейки матки в общедоступных данных о метилировании ДНК по всему геному Illumina 450K из 270 образцов рака шейки матки (см. GSE68339). На основе протестированного метилирования ДНК CGID, при помощи настоящего способа затем сгенерировали карту интенсивности с этими 79 CGID, частота метилирования которых увеличивалась во время прогрессирования предраковых стадий шейки матки, которые были получены с помощью описанного здесь способа APDMA. Указанная карта интенсивности показала, что эти 79 CGID демонстрируют совершенно разные профили метилирования ДНК при раке шейки матки и в нормальной шейке матки. Явное большинство сайтов были полностью неметилированы в нормальной ткани и сильно метилированы в раковой ткани, в то время как небольшое количество сайтов было метилировано в нормальной ткани и неметилировано при раке шейки матки (см. Фигуру 3). Таким образом, настоящий способ относится к этим гиперметилированным CGID в качестве предпочтительных биомаркеров, поскольку даже низкая частота метилирования четко выявляется на фоне полностью неметилированных молекул.To identify CGID positions that meet the assumptions of the APDMA method, 79 progressively methylated CGIDs were shortlisted with an average increase in methylation of 10% or a decrease of more than 10% during the transition from DSM1 to DSM3 and background methylation in normal cells (less than 10 %) (see Table 1 above). Using the present method, we then tested whether these CGIDs identically identified cervical cancer in publicly available genome-wide Illumina 450K DNA methylation data from 270 cervical cancer samples (see GSE68339). Based on the tested DNA methylation of CGIDs, the present method then generated a heat map of these 79 CGIDs whose methylation frequency increased during the progression of cervical precancerous stages, which were obtained using the APDMA method described herein. The indicated heat map showed that these 79 CGIDs exhibit completely different DNA methylation profiles in cervical cancer and normal cervix. A clear majority of sites were completely unmethylated in normal tissue and highly methylated in cancer tissue, while a small number of sites were methylated in normal tissue and unmethylated in cervical cancer (see Figure 3). Thus, the present method treats these hypermethylated CGIDs as preferred biomarkers, since even low methylation frequencies are clearly detected against completely unmethylated molecules.
Пример 2: Выявление набора биомаркеров полигенного метилирования ДНК для раннего выявления рака шейки матки. Example 2 : Identification of a set of polygenic DNA methylation biomarkers for early detection of cervical cancer.
В настоящем описании дополнительно включены 16 CGID из списка, полученного и раскрытого в первом примере и в Таблице 1, где указанные 16 CGID были гиперметилированы при стадиях ДШМ3 и ДШМ1 по сравнению с контролем, имели наибольшую величину эффекта (Cohen D > 1,3) между ДШМ3 и контролем и наивысшую корреляцию Спирмена с прогрессированием фаз ДШМ r>0,4. (см. Таблицу 2 выше).The present description additionally includes 16 CGIDs from the list obtained and disclosed in the first example and in Table 1, where these 16 CGIDs were hypermethylated in stages DSM3 and DSM1 compared to control, had the largest effect size (Cohen's D > 1.3) between DSM3 and control and the highest Spearman correlation with the progression of DSM phases r>0.4. (See Table 2 above).
Затем, чтобы получить минимальное количество CGID, необходимое для дифференциации предраковых поражений ДШМ3 от контроля, в настоящем способе была применена регрессия со штрафом, которая уменьшила количество CGID до 5. В соответствии с настоящим способом затем проводили многомерную линейную регрессию с этими 5 CGID в качестве независимых переменных и стадией ДШМ3 в качестве зависимой переменной. Два CGID оставались значимыми (см. Таблицу 3 выше). Уравнение линейной регрессии, составленное из взвешенных уровней метилирования этих двух сайтов, было очень значимым для прогнозирования ДШМ3 (p <5x10-15).Then, to obtain the minimum number of CGIDs required to differentiate DSM3 precancerous lesions from controls, the present method applied penalized regression, which reduced the number of CGIDs to 5. In accordance with the present method, multivariate linear regression was then performed with these 5 CGIDs as independent variables and DSM3 stage as the dependent variable. Two CGIDs remained significant (see Table 3 above). A linear regression equation constructed from the weighted methylation levels of these two sites was highly significant for predicting DSM3 (p < 5x10 -15 ).
Пример 3: Применение бигенных маркеров метилирования ДНК для выявления рака шейки матки. Example 3 : Use of bigenic DNA methylation markers to detect cervical cancer.
Затем в настоящем изобретении впервые был валидирован бигенный маркер метилирования ДНК (cg03419058; cg13944175) в общедоступной базе данных метилирования ДНК 450K рака шейки матки (см. GSE68339). Модель двухвариантной линейной регрессии с раком шейки матки в качестве зависимой переменной и уровнем метилирования двух CGID (cg03419058; cg13944175) в качестве независимых переменных оказалась очень значимой (p <2,2x10-16, F = 8703, R = 0,9873). ROC для показателей метилирования (рассчитанных с использованием уравнения линейной регрессии, как показано на Фигуре 4A) сравнивали путём вычисления их площади под кривой (AUC) (см. Фигуре 4B). Чувствительность и специфичность показателя бигенного метилирования для различения рака шейки матки и нормальной ткани шейки матки составила 1 (см. Фигуру 4C).The present invention then validated for the first time a bigenic DNA methylation marker (cg03419058; cg13944175) in the public 450K cervical cancer DNA methylation database (see GSE68339). A bivariate linear regression model with cervical cancer as the dependent variable and methylation level of the two CGIDs (cg03419058; cg13944175) as independent variables was highly significant (p < 2.2x10 -16 , F = 8703, R = 0.9873). The ROCs for methylation scores (calculated using the linear regression equation as shown in Figure 4A) were compared by calculating their area under the curve (AUC) (see Figure 4B). The sensitivity and specificity of the bigenic methylation score for distinguishing cervical cancer from normal cervical tissue was 1 (see Figure 4C).
Таким образом, описанные выше биомаркеры метилирования ДНК и рассчитанный показатель метилирования применимы для скрининга и раннего выявления рака шейки матки у женщин из группы риска, а также в целом здоровой популяции женщин с использованием образцов шейки матки, взятых при рутинном гинекологическом осмотре из мазков по Папаниколау.Thus, the DNA methylation biomarkers described above and the calculated methylation score are applicable for screening and early detection of cervical cancer in women at risk, as well as in the general healthy population of women, using cervical samples obtained from routine gynecological examinations from Pap smears.
Пример 4: Применение бигенных биомаркеров метилирования ДНК для измерения показателей метилирования рака шейки матки в отдельных образцах, полученных от здоровых пациентов (контроль), пациентов со стадиями ДШМ от ДШМ1 до ДШМ3 и пациентов с раком шейки матки. Example 4 : Use of bigenic DNA methylation biomarkers to measure cervical cancer methylation indices in selected samples obtained from healthy controls, patients with DSM stages DSM1 to DSM3, and patients with cervical cancer.
Показатель метилирования (прогноз рака шейки матки) рассчитывали с использованием уравнения, представленного на Фигуре 4A, для каждого из отдельных образцов из контроля, стадий от ДШМ1 до ДШМ3 (из когорты Мак-Гилла, описанной выше в Примере 1) и рака шейки матки (см. GSE68339) (см. Фигуру 5A), (средние значения для различных групп см. на Фигуре 5B). Результаты демонстрируют увеличение показателей метилирования при распространенных предраковых поражениях, как ожидалось на основании клинических наблюдений повышенного риска рака шейки матки с прогрессированием стадий ДШМ. Показатели метилирования могут использоваться для скрининга женщин с поражениями ДШМ на предмет риска развития рака шейки матки.Methylation score (prediction of cervical cancer) was calculated using the equation presented in Figure 4A for each of the individual samples from controls, stages DSM1 to DSM3 (from the McGill cohort described in Example 1 above), and cervical cancer (see . GSE68339) (see Figure 5A), (see Figure 5B for mean values for different groups). The results demonstrate an increase in methylation scores in common precancerous lesions, as expected based on clinical observations of an increased risk of cervical cancer with progression of stages of cervical cancer. Methylation indices can be used to screen women with DSM lesions for risk of developing cervical cancer.
Пример 5: Корреляция Спирмена показателя метилирования и прогрессирования предракового состояния шейки матки в рак шейки матки. Example 5 : Spearman correlation of methylation score and progression of cervical precancerous condition to cervical cancer.
Проводили корреляционный анализ Спирмена между показателями метилирования образцов шейки матки, полученных от здоровых пациентов, пациентов с предраковыми стадиями от ДШМ1 до ДШМ3 и пациентов с раком шейки матки (контроль, n = 54; ДШМ1, n = 50; ДШМ2, n = 40; ДШМ3, n = 42; рак шейки матки, n = 270). Результаты демонстрируют очень значимую корреляцию (p<2,2x10-16 и r = 0,88) между показателем метилирования бигенного маркера и прогрессированием от предракового состояния к злокачественному состоянию (см. Фигуру 6).Spearman correlation analysis was performed between methylation indices of cervical samples obtained from healthy patients, patients with precancerous stages from DSM1 to DSM3 and patients with cervical cancer (control, n = 54; DSM1, n = 50; DSM2, n = 40; DSM3 , n = 42; cervical cancer, n = 270). The results demonstrate a highly significant correlation (p<2.2x10 -16 and r = 0.88) between the bigenic marker methylation score and progression from precancerous to malignant (see Figure 6).
Пример 6: Валидация биомаркера метилирования (cg13944175) для выявления рака шейки матки. Example 6 : Validation of a methylation biomarker (cg13944175) for cervical cancer detection.
Поскольку данные только для одного биомаркера CGID были доступны в базе данных о раке шейки матки TCGA, в настоящем изобретении рассчитывали показатель метилирования для рака шейки матки с использованием уравнения линейной регрессии с данными метилирования ДНК только для указанного CGID, cg13944175. Корреляция Спирмена была рассчитана между стадией прогрессирования рака и показателем метилирования (см. статистику на Фигуре 7A и график корреляции на Фигуре 7B). В настоящем изобретении образцы ДШМ1-ДШМ3 были получены из когорты Мак-Гилла, как уже было описано в настоящей заявке в Примере 1, и значение показателя основано на присвоенной шкале: Контроль: 0, ДШМ1-3: 1-3, соответственно, и рак шейки матки: 4.Since data for only one CGID biomarker was available in the TCGA cervical cancer database, the present invention calculated a methylation score for cervical cancer using a linear regression equation with DNA methylation data for only the specified CGID, cg13944175. Spearman correlation was calculated between cancer progression stage and methylation score (see statistics in Figure 7A and correlation plot in Figure 7B). In the present invention, samples DSM1-DSM3 were obtained from the McGill cohort, as already described herein in Example 1, and the value of the indicator is based on the assigned scale: Control: 0, DSM1-3: 1-3, respectively, and cancer cervix: 4.
Пример 7: Применение бигенного биомаркера метилирования для выявления рака шейки матки в предраковых образцах шейки матки. Example 7 : Use of a bigenic methylation biomarker to detect cervical cancer in precancerous cervical samples.
Бигенный биомаркер метилирования использовали для прогнозирования того, в каких образцах со стадиями ДШМ от ДШМ1 до ДШМ3 ДШМ будет прогрессировать до рака шейки матки. Показатели метилирования рассчитывали для каждого образца на основе значений метилирования для двух сайтов CG, полученных из данных чипов Epic. Используя пороговое значение для рака, вычисленное из сравнения образцов рака шейки матки и здоровых образцов шейки матки (см. Фигуру 3), делали прогноз для каждого из образцов (см. Фигуру 8A). Доля образцов, которые, по прогнозам, станут злокачественными, как и ожидалось, увеличивалась с нескольких образцов в образцах ДШМ1 до 60% в образцах ДШМ3, (см. Фигуру 8B).A bigenic methylation biomarker was used to predict which samples with DSM stages DSM1 to DSM3 would progress to cervical cancer. Methylation scores were calculated for each sample based on the methylation values for the two CG sites obtained from the Epic chip data. Using the cancer threshold calculated from the comparison of cervical cancer samples and healthy cervical samples (see Figure 3), a prediction was made for each of the samples (see Figure 8A). The proportion of samples predicted to become malignant, as expected, increased from a few samples in the DSM1 samples to 60% in the DSM3 samples (see Figure 8B).
Хотя настоящее изобретение было объяснено на примере его предпочтительного варианта осуществления, следует понимать, что можно сделать множество других возможных модификаций и изменений, не выходящих за рамки сущности и объема настоящего изобретения.Although the present invention has been explained by way of example of its preferred embodiment, it should be understood that many other possible modifications and changes can be made without departing from the spirit and scope of the present invention.
ПреимуществаAdvantages
Эти новые биомаркеры метилирования ДНК могут быть разработаны в качестве диагностического набора для ранней и точной диагностики рака шейки матки человека. Они являются прямыми индикаторами клеточных изменений во время инициации и развития рака шейки матки и представляют фундаментальную характеристику рака шейки матки, являясь почти однородно метилироваными в образцах рака шейки матки, но никогда не метилируясь в нормальной ткани, и их частота метилирования прогрессивно увеличивается от стадий ДШМ1 до ДШМ3 и до злокачественной стадии. Эти биомаркеры дополняют патологоанатомическую оценку для точного раннего выявления рака шейки матки при поражениях ДШМ, а также служат в качестве биомаркера для раннего выявления и прогнозирования риска развития рака шейки матки у бессимптомных женщин. Эти биомаркеры являются полезным дополнением для уже существующих эпигенетических маркеров метилирования ДНК, которые играют важную роль в регуляции генов, и могут использоваться в форме CGID в качестве инструмента диагностики. Эти биомаркеры могут обеспечить быстрый, дешевый, точный, надежный и высокопроизводительный диагностический набор для точной, ранней и пока еще не осуществимой диагностики рака шейки матки человека на еще недоступных предраковых стадиях.These new DNA methylation biomarkers can be developed as a diagnostic kit for early and accurate diagnosis of human cervical cancer. They are direct indicators of cellular changes during the initiation and development of cervical cancer and represent a fundamental characteristic of cervical cancer, being almost uniformly methylated in cervical cancer specimens but never methylated in normal tissue, and their methylation frequency increases progressively from stages DCM1 to DShM3 and up to the malignant stage. These biomarkers complement pathological assessment for accurate early detection of cervical cancer in DSM lesions and also serve as a biomarker for early detection and risk prediction of cervical cancer in asymptomatic women. These biomarkers are a useful complement to pre-existing epigenetic DNA methylation markers that play important roles in gene regulation and can be used in the form of CGID as a diagnostic tool. These biomarkers can provide a fast, low-cost, accurate, reliable, and high-throughput diagnostic kit for accurate, early, and as yet unfeasible diagnosis of human cervical cancer at yet inaccessible precancerous stages.
СсылкиLinks
1. El-Zein M, Richardson L, Franco EL. Cervical cancer screening of HPV vaccinated populations: Cytology, molecular testing, both or none. J. Clin. Virol. 2015;76:S62 - S68. doi:10.1016/j.jcv.2015.11.020.1. El-Zein M, Richardson L, Franco EL. Cervical cancer screening of HPV infected populations: Cytology, molecular testing, both or none. J. Clin. Virol. 2015;76:S62 - S68. doi:10.1016/j.jcv.2015.11.020.
2. Boers A, Wang R, van Leeuwen RW, et al. Discovery of new methylation markers to improve screening for cervical intraepithelial neoplasia grade 2/3. Clin. Epigenetics 2016;8(29). doi:10.1186/s13148-016-0196-3.2. Boers A, Wang R, van Leeuwen RW, et al. Discovery of new methylation markers to improve screening for cervical intraepithelial neoplasia grade 2/3. Clin. Epigenetics 2016;8(29). doi:10.1186/s13148-016-0196-3.
3. van Baars R, van der Marel J, Snijders PJF, et al. CADM1 and MAL methylation status in cervical scrapes is representative of the most severe underlying lesion in women with multiple cervical biopsies. Int. J. Cancer 2016;138:463 - 471. doi:10.1002/ijc.29706.3. van Baars R, van der Marel J, Snijders PJF, et al. CADM1 and MAL methylation status in cervical scrapes is representative of the most severe underlying lesion in women with multiple cervical biopsies. Int. J Cancer 2016;138:463 - 471. doi:10.1002/ijc.29706.
4. Verhoef VMJ, Van Kemenade FJ, Rozendaal L, et al. Follow-up of high-risk HPV positive women by combined cytology and bi-marker CADM1/MAL methylation analysis on cervical scrapes. Gynecol. Oncol. 2015;137(1):55 - 59. doi:10.1016/j.ygyno.2015.01.550.4. Verhoef VMJ, Van Kemenade FJ, Rozendaal L, et al. Follow-up of high-risk HPV positive women by combined cytology and bi-marker CADM1/MAL methylation analysis on cervical scrapes. Gynecol. Oncol. 2015;137(1):55 - 59. doi:10.1016/j.ygyno.2015.01.550.
5. Louvanto K, Franco EL, Ramanakumar A V, et al. Methylation of viral and host genes and severity of cervical lesions associated with human papillomavirus type 16. Int. J. Cancer 2014;00(6):1 - 8. doi:10.1002/ijc.29196.5. Louvanto K, Franco EL, Ramanakumar AV, et al. Methylation of viral and host genes and severity of cervical lesions associated with human papillomavirus type 16. Int. J Cancer 2014;00(6):1 - 8. doi:10.1002/ijc.29196.
6. Simanaviciene V, Popendikyte V, Gudleviciene Z, Zvirbliene A. Different DNA methylation pattern of HPV16, HPV18 and HPV51 genomes in asymptomatic HPV infection as compared to cervical neoplasia. Virology 2015;484:227 - 233. doi:10.1016/j.virol.2015.06.008.6. Simanaviciene V, Popendikyte V, Gudleviciene Z, Zvirbliene A. Different DNA methylation pattern of HPV16, HPV18 and HPV51 genomes in asymptomatic HPV infection as compared to cervical neoplasia. Virology 2015;484:227 - 233. doi:10.1016/j.virol.2015.06.008.
7. De Strooper LMA, Meijer CJLM, Berkhof J, et al. Methylation analysis of the FAM19A4 gene in cervical scrapes is highly efficient in detecting cervical carcinomas and advanced CIN2/3 lesions. Cancer Prev. Res. 2014;7(6):1251 - 1257. doi:10.1158/1940-6207.CAPR-14-0237.7. De Strooper LMA, Meijer CJLM, Berkhof J, et al. Methylation analysis of the FAM19A4 gene in cervical scrapes is highly efficient in detecting cervical carcinomas and advanced CIN2/3 lesions. Cancer Prev. Res. 2014;7(6):1251 - 1257. doi:10.1158/1940-6207.CAPR-14-0237.
8. Mersakova S, Nachajova M, Szepe P, Kasajova PS, Halasova E. DNA methylation and detection of cervical cancer and precancerous lesions using molecular methods. Tumor Biol. 2015. doi:10.1007/s13277-015-4197-1.8. Mersakova S, Nachajova M, Szepe P, Kasajova PS, Halasova E. DNA methylation and detection of cervical cancer and precancerous lesions using molecular methods. Tumor Biol. 2015. doi:10.1007/s13277-015-4197-1.
9. Nikolaidis C, Nena E, Panagopoulou M, et al. PAX1 methylation as an auxiliary biomarker for cervical cancer screening: a meta-analysis. Cancer Epidemiol. 2015;39(5):682 - 686. doi:10.1016/j.canep.2015.07.008.9. Nikolaidis C, Nena E, Panagopoulou M, et al. PAX1 methylation as an auxiliary biomarker for cervical cancer screening: a meta-analysis. Cancer Epidemiol. 2015;39(5):682 - 686. doi:10.1016/j.canep.2015.07.008.
10. De Strooper LMA, Hesselink AT, Berkhof J, et al. Combined CADM1/MAL methylation and cytology testing for colposcopy triage of high-risk HPV-positive women. Cancer Epidemiol. Biomarkers Prev. 2014;23(9):1933 - 1937. doi:10.1158/1055-9965.EPI-14-0347.10. De Strooper LMA, Hesselink AT, Berkhof J, et al. Combined CADM1/MAL methylation and cytology testing for colposcopy triage of high-risk HPV-positive women. Cancer Epidemiol. Biomarkers Prev. 2014;23(9):1933 - 1937. doi:10.1158/1055-9965.EPI-14-0347.
11. De Strooper LMA, Verhoef VMJ, Berkhof J, et al. Validation of the FAM19A4/mir124-2 DNA methylation test for both lavage- and brush-based self-samples to detect cervical (pre)cancer in HPV-positive women. Gynecol. Oncol. 2016. doi:10.1016/j.ygyno.2016.02.012.11. De Strooper LMA, Verhoef VMJ, Berkhof J, et al. Validation of the FAM19A4/mir124-2 DNA methylation test for both lavage- and brush-based self-samples to detect cervical (pre)cancer in HPV-positive women. Gynecol. Oncol. 2016. doi:10.1016/j.ygyno.2016.02.012.
12. Louvanto K, Franco EL, Ramanakumar A V, et al. Methylation of viral and host genes and severity of cervical lesions associated with human papillomavirus type 16. Int. J. cancer 2015;136(6):E638-45. doi:10.1002/ijc.29196.12. Louvanto K, Franco EL, Ramanakumar AV, et al. Methylation of viral and host genes and severity of cervical lesions associated with human papillomavirus type 16. Int. J. cancer 2015;136(6):E638-45. doi:10.1002/ijc.29196.
13. De Strooper LM a, van Zummeren M, Steenbergen RDM, et al. CADM1, MAL and miR124-2 methylation analysis in cervical scrapes to detect cervical and endometrial cancer. J. Clin. Pathol. 2014;67:1067 - 1071. doi:10.1136/jclinpath-2014-202616.13. De Strooper LM a, van Zummeren M, Steenbergen RDM, et al. CADM1, MAL and miR124-2 methylation analysis in cervical scrapes to detect cervical and endometrial cancer. J. Clin. Pathol. 2014;67:1067 - 1071. doi:10.1136/jclinpath-2014-202616.
14. Feng C, Dong J, Chang W, Cui M, Xu T. The Progress of Methylation Regulation in Gene Expression of Cervical Cancer. Int. J. Genomics 2018;2018.14. Feng C, Dong J, Chang W, Cui M, Xu T. The Progress of Methylation Regulation in Gene Expression of Cervical Cancer. Int. J Genomics 2018;2018.
15. Del Mistro A, Frayle H, Rizzi M, et al. Methylation analysis and HPV genotyping of self-collected cervical samples from women not responding to screening invitation and review of the literature. PLoS One 2017;12(3):1 - 13. doi:10.1371/journal.pone.0172226.15. Del Mistro A, Frayle H, Rizzi M, et al. Methylation analysis and HPV genotyping of self-collected cervical samples from women not responding to screening invitation and review of the literature. PLoS One 2017;12(3):1 - 13. doi:10.1371/journal.pone.0172226.
16. Eijsink JJH, Lendvai A, Deregowski V, et al. A four-gene methylation marker panel as triage test in high-risk human papillomavirus positive patients. Int. J. Cancer 2012;130(8):1861 - 1869. doi:10.1002/ijc.26326.16. Eijsink JJH, Lendvai A, Deregowski V, et al. A four-gene methylation marker panel as triage test in high-risk human papillomavirus positive patients. Int. J Cancer 2012;130(8):1861 - 1869. doi:10.1002/ijc.26326.
17. Verlaat W, Snoek BC, Heideman DAM, et al. Identification and validation of a 3-gene methylation classifier for HPV-based cervical screening on self-samples. Clin. Cancer Res. 2018:clincanres.3615.2017. doi:10.1158/1078-0432.CCR-17-3615.17. Verlaat W, Snoek BC, Heideman DAM, et al. Identification and validation of a 3-gene methylation classifier for HPV-based cervical screening on self-samples. Clin. Cancer Res. 2018:clincanres.3615.2017. doi:10.1158/1078-0432.CCR-17-3615.
18. Cuzick J, Bergeron C, von Knebel Doeberitz M, et al. New technologies and procedures for cervical cancer screening. Vaccine 2012;30(SUPPL.5):F107 - F116. doi:10.1016/j.vaccine.2012.05.088.18. Cuzick J, Bergeron C, von Knebel Doeberitz M, et al. New technologies and procedures for cervical cancer screening. Vaccine 2012;30(SUPPL.5):F107 - F116. doi:10.1016/j.vaccine.2012.05.088.
19. El-Zein M, Bouten S, Louvanto K, et al. Validation of a new HPV self-sampling device for cervical cancer screening: The Cervical and Self-Sample In Screening (CASSIS) study. Gynecol. Oncol. 2018. doi:https://doi.org/10.1016/j.ygyno.2018.04.004.19. El-Zein M, Bouten S, Louvanto K, et al. Validation of a new HPV self-sampling device for cervical cancer screening: The Cervical and Self-Sample In Screening (CASSIS) study. Gynecol. Oncol. 2018. doi:https://doi.org/10.1016/j.ygyno.2018.04.004.
20. Smith JHF. Bethesda 2001. Cytopathology 2002;13(1):4 - 10.20. Smith JHF. Bethesda 2001. Cytopathology 2002;13(1):4 - 10.
21. Moran S, Arribas C, Esteller M. Validation of a DNA methylation microarray for 850,000 CpG sites of the human genome enriched in enhancer sequences. Epigenomics 2016;8(3):389 - 399. doi:10.2217/epi.15.114.21. Moran S, Arribas C, Esteller M. Validation of a DNA methylation microarray for 850,000 CpG sites of the human genome enriched in enhancer sequences. Epigenomics 2016;8(3):389 - 399. doi:10.2217/epi.15.114.
22. Morris TJ, Butcher LM, Feber A, et al. ChAMP: 450k Chip Analysis Methylation Pipeline. Bioinformatics 2014;30(3):428 - 430. doi:10.1093/bioinformatics/btt684.22. Morris TJ, Butcher LM, Feber A, et al. ChAMP: 450k Chip Analysis Methylation Pipeline. Bioinformatics 2014;30(3):428 - 430. doi:10.1093/bioinformatics/btt684.
23. Luttmer R, De Strooper LMA, Berkhof J, et al. Comparing the performance of FAM19A4 methylation analysis, cytology and HPV16/18 genotyping for the detection of cervical (pre)cancer in high-risk HPV-positive women of a gynecologic outpatient population (COMETH study). Int. J. Cancer 2015;138(May 2015):992 - 1002. doi:10.1002/ijc.29824.23. Luttmer R, De Strooper LMA, Berkhof J, et al. Comparing the performance of FAM19A4 methylation analysis, cytology and HPV16/18 genotyping for the detection of cervical (pre)cancer in high-risk HPV-positive women of a gynecologic outpatient population (COMETH study). Int. J Cancer 2015;138(May 2015):992 - 1002. doi:10.1002/ijc.29824.
24. Wentzensen N, Schiffman M, Palmer T, Arbyn M. Triage of HPV positive women in cervical cancer screening. J. Clin. Virol. 2016;76:S49 - S55. doi:10.1016/j.jcv.2015.11.015.24. Wentzensen N, Schiffman M, Palmer T, Arbyn M. Triage of HPV positive women in cervical cancer screening. J. Clin. Virol. 2016;76:S49 - S55. doi:10.1016/j.jcv.2015.11.015.
25. Marzouka, N. A., Nordlund, J., Backlin, C. L., Lonnerholm, G., Syvanen, A. C., & Carlsson Almlof, J. (2015). CopyNumber450kCancer: baseline correction for accurate copy number calling from the 450k methylation array. Bioinformatics. doi:10.1093/bioinformatics/btv652.25. Marzouka, N. A., Nordlund, J., Backlin, C. L., Lonnerholm, G., Syvanen, A. C., & Carlsson Almlof, J. (2015). CopyNumber450kCancer: baseline correction for accurate copy number calling from the 450k methylation array. Bioinformatics. doi:10.1093/bioinformatics/btv652.
26. Morris, T. J., Butcher, L. M., Feber, A., Teschendorff, A. E., Chakravarthy, A. R., WojdaczT.K., & Beck, S. (2014). ChAMP: 450k Chip Analysis Methylation Pipeline. Bioinformatics, 30(3), 428-430. doi:10.1093/bioinformatics/btt684.26. Morris, T. J., Butcher, L. M., Feber, A., Teschendorff, A. E., Chakravarthy, A. R., Wojdacz T. K., & Beck, S. (2014). ChAMP: 450k Chip Analysis Methylation Pipeline. Bioinformatics , 30(3), 428-430. doi:10.1093/bioinformatics/btt684.
--->--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙLIST OF SEQUENCES
<110> ЭйчКейДжи ЭПИТЕРАПЬЮТИКС ЛИМИТЕД<110> HKG EPITHERAPUTICS LIMITED
<120> Биомаркеры метилирования ДНК для раннего выявления рака шейки <120> DNA methylation biomarkers for early detection of cervical cancer
маткиuterus
<130> TPC53811<130> TPC53811
<150> US 62/774,994<150>US 62/774,994
<151> 2018-12-04<151> 2018-12-04
<160> 91<160> 91
<170> Патентная версия 3.5<170> Patent version 3.5
<210> 1<210> 1
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 1<400> 1
gaaggaggct gcgcgccagc ccgcccgcgg cgcccgggct caggcgccgt gacggctgca gaaggaggct gcgcgccagc ccgcccgcgg cgcccgggct caggcgccgt gacggctgca
60 60
cgcgctgccc cgcactctga gggccttcat tagctcgctc cccgcgccga ggctggggcg cgcgctgccc cgcactctga gggccttcat tagctcgctc cccgcgccga ggctggggcg
120 120
gg gg
122 122
<210> 2<210> 2
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 2<400> 2
cctcccgcag ctcattgcag ccccgaggaa atcaccgggg gagggctcgg gagtgcggcg cctcccgcag ctcattgcag ccccgaggaa atcaccgggg gagggctcgg gagtgcggcg
60 60
cggcagcccc ataatttcca gggcccttct cctacactga cacgtaattg tcagattgtt cggcagcccc ataatttcca gggcccttct cctacactga cacgtaattg tcagattgtt
120 120
tt tt
122 122
<210> 3<210> 3
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 3<400> 3
ccgccgcggg ttcccagggc tggtggtagt tgccgtccca cacgtacgtg gcggggtcct ccgccgcggg ttcccagggc tggtggtagt tgccgtccca cacgtacgtg gcggggtcct
60 60
cgtcagcgaa gacctcgcgg aacatgtcga ccatgtagag gtcctcggcg cggttgccat cgtcagcgaa gacctcgcgg aacatgtcga ccatgtagag gtcctcggcg cggttgccat
120 120
cc cc
122 122
<210> 4<210> 4
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 4<400> 4
ggggaggaat attagactcg gaggagtctg cgcgcttttc tcctccccgc gcctcccggt ggggaggaat attagactcg gaggagtctg cgcgcttttc tcctccccgc gcctcccggt
60 60
cgccgcgggt tcaccgctca gtccccgcgc tcgctccgca ccccacccac ttcctgtgct cgccgcgggt tcaccgctca gtccccgcgc tcgctccgca ccccacccac ttcctgtgct
120 120
cg cg
122 122
<210> 5<210> 5
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 5<400> 5
caggccggtc ccagccgccc ggagccccag tgcgcgatgg cggccggcaa actgcgcctg caggccggtc ccagccgccc ggagccccag tgcgcgatgg cggccggcaa actgcgcctg
60 60
cgcactgggc ctcaccgcgg actacgactc ccacaatgcc gcgaggctgt gccgcgcacc cgcactgggc ctcaccgcgg actacgactc ccacaatgcc gcgaggctgt gccgcgcacc
120 120
gg gg
122 122
<210> 6<210> 6
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 6<400> 6
gtgacgcgcg gccgcagctg cccgcgggcg gagcgctctc agaccccgga gcgcacaccg gtgacgcgcg gccgcagctg cccgcgggcg gagcgctctc agaccccgga gcgcacaccg
60 60
cggggccatc ggtgccatcg cggatctcca ggctcctcat cagtccgccg gggccgcagc cggggccatc ggtgccatcg cggatctcca ggctcctcat cagtccgccg gggccgcagc
120 120
ag ag
122 122
<210> 7<210> 7
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 7<400> 7
gaggaatatt agactcggag gagtctgcgc gcttttctcc tccccgcgcc tcccggtcgc gaggaatatt agactcggag gagtctgcgc gcttttctcc tccccgcgcc tcccggtcgc
60 60
cgcgggttca ccgctcagtc cccgcgctcg ctccgcaccc cacccacttc ctgtgctcgc cgcgggttca ccgctcagtc cccgcgctcg ctccgcaccc cacccacttc ctgtgctcgc
120 120
cc cc
122 122
<210> 8<210> 8
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 8<400> 8
atctaccgtc tccaatctcc atctccgaag ttatgcccac ttcctcgaag tttggagcca atctaccgtc tccaatctcc atctccgaag ttatgcccac ttcctcgaag tttggagcca
60 60
cgcgaactac actgcccaga aggcgccgcg ccgtgagccg cgatgcttgg ccaatgaaaa cgcgaactac actgcccaga aggcgccgcg ccgtgagccg cgatgcttgg ccaatgaaaa
120 120
ga ga
122 122
<210> 9<210> 9
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 9<400> 9
gggagggctc gtgagagcca atgagagcgc ggaaggcggc gagcgagcca atggacgcgg gggagggctc gtgagagcca atgagagcgc ggaaggcggc gagcgagcca atggacgcgg
60 60
cggtggggca gggggcgggg cctgggcgag gccgggggcg gaatgggctg agtgccctgt cggtggggca gggggcgggg cctgggcgag gccggggggcg gaatgggctg agtgccctgt
120 120
ct ct
122 122
<210> 10<210> 10
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 10<400> 10
cggcaagcgg agcagcgagg cagggtagct tcatcacact cgcggcggat gcggattccg cggcaagcgg agcagcgagg cagggtagct tcatcacact cgcggcggat gcggattccg
60 60
cgccgccccg gctctagctg ctcaggcgac cgccaccctc gcctcgccgc cgcccgtgca cgccgccccg gctctagctg ctcaggcgac cgccaccctc gcctcgccgc cgcccgtgca
120 120
ca ca
122 122
<210> 11<210> 11
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 11<400> 11
gcggacggcg gctccatccg cggcaatcac cgtagtgctt gtttgtggaa gccgagcgtg gcggacggcg gctccatccg cggcaatcac cgtagtgctt gtttgtggaa gccgagcgtg
60 60
cgtgcgccgc gcgcgcaccc agtccagcgc ggagtgggcg tctacccgag gaggggtgtc cgtgcgccgc gcgcgcaccc agtccagcgc ggagtgggcg tctacccgag gaggggtgtc
120 120
tg tg
122 122
<210> 12<210> 12
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 12<400> 12
tggggaatta gctcaggcgg tggagcgctc gcttagctat gcgagaggta gcgagatcga tggggaatta gctcaggcgg tggagcgctc gcttagctat gcgagaggta gcgagatcga
60 60
cgcccgcatt ctccagtttc ttgtctggtt tatgtctctt agtttgtatt ccccgttgtt cgcccgcatt ctccagtttc ttgtctggtt tatgtctctt agtttgtatt ccccgttgtt
120 120
tc tc
122 122
<210> 13<210> 13
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 13<400> 13
gaagtcccag ggacctgcgg agcgcagaca taacacaaca cagagcaaaa ctcaccgctg gaagtcccag ggacctgcgg agcgcagaca taacacaaca cagagcaaaa ctcaccgctg
60 60
cggtgacttt cactccacgc gatccgcttc ccggtttacg ctaaactggg cgctcgggac cggtgacttt cactccacgc gatccgcttc ccggtttacg ctaaactggg cgctcgggac
120 120
ag ag
122 122
<210> 14<210> 14
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 14<400> 14
ggctgcggac ggcggctcca tccgcggcaa tcaccgtagt gcttgtttgt ggaagccgag ggctgcggac ggcggctcca tccgcggcaa tcaccgtagt gcttgtttgt ggaagccgag
60 60
cgtgcgtgcg ccgcgcgcgc acccagtcca gcgcggagtg ggcgtctacc cgaggagggg cgtgcgtgcg ccgcgcgcgc acccagtcca gcgcggagtg ggcgtctacc cgaggagggg
120 120
tg tg
122 122
<210> 15<210> 15
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 15<400> 15
cccccgccgg ccgccggccg cgctccccgc cttcattctg tgatctgcgg atttgccagt cccccgccgg ccgccggccg cgctccccgc cttcattctg tgatctgcgg atttgccagt
60 60
cgccaacctc cgcgcccaga gtcaccatcg cgcagggttg ggcaaaccat ggagctcggg cgccaacctc cgcgcccaga gtcaccatcg cgcagggttg ggcaaaccat ggagctcggg
120 120
gc gc
122 122
<210> 16<210> 16
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 16<400> 16
aactcctgca caaatcattt caaacgcggt cggcttctaa tcgggaagta atctcagtga aactcctgca caaatcattt caaacgcggt cggcttctaa tcgggaagta atctcagtga
60 60
cgctggcggt gcagagaacc gagtctggac gcacacacac aaacacaccg cgggcctccg cgctggcggt gcagagaacc gagtctggac gcacacacac aaacacaccg cgggcctccg
120 120
ca ca
122 122
<210> 17<210> 17
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 17<400> 17
gtgtgctcag cctcagcgtg aggggcacct gctcgtctgg gctcacagcg aaggcagcct gtgtgctcag cctcagcgtg aggggcacct gctcgtctgg gctcacagcg aaggcagcct
60 60
cgccgcgagc tgccgctgcc gctgctgccg ccactggtgt tgccgctctc aggcgccagg cgccgcgagc tgccgctgcc gctgctgccg ccactggtgt tgccgctctc aggcgccagg
120 120
ct ct
122 122
<210> 18<210> 18
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 18<400> 18
gccgggagcc tgacgtcacc acgccctgcc tgtcaatctg cagcgcgcgc cgctcgcagc gccgggagcc tgacgtcacc acgccctgcc tgtcaatctg cagcgcgcgc cgctcgcagc
60 60
cgccttttct gccaccaact gtatctctca ctcgcggagc cggcacagcg acaggcgccc cgccttttct gccaccaact gtatctctca ctcgcggagc cggcacagcg acaggcgccc
120 120
cg cg
122 122
<210> 19<210> 19
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 19<400> 19
gcggcggcgg gcggggagcc aggcccgagc tgcgttctgc gcagccattg gtgggcgccg gcggcggcgg gcggggagcc aggcccgagc tgcgttctgc gcagccattg gtgggcgccg
60 60
cgctctgcac tgagcatgtt cgcgccccgc cggcccctag ccgcagccgc agccgcagcg cgctctgcac tgagcatgtt cgcgccccgc cggcccctag ccgcagccgc agccgcagcg
120 120
ac ac
122 122
<210> 20<210> 20
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 20<400> 20
caaccggttc cgccgcgttt gtgggctggt agcccggaat acatttccca gaggccttcg caaccggttc cgccgcgttt gtgggctggt agcccggaat acatttccca gaggccttcg
60 60
cggccgacgt gcttcgcgca ggaacgcagc cgcctcccga ctggaggacg cggtagcgga cggccgacgt gcttcgcgca ggaacgcagc cgcctcccga ctggagggacg cggtagcgga
120 120
gc gc
122 122
<210> 21<210> 21
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 21<400> 21
gctgcccgtg gtcaaactgg agtcgctgaa gcgctggaac gaagagcggg gcctctggtg gctgcccgtg gtcaaactgg agtcgctgaa gcgctggaac gaagagcggg gcctctggtg
60 60
cgagaagggg gtgcaggtgc tgctgacgac ggtgggcgcc ttcgccgcct tcggcctcat cgagaagggg gtgcaggtgc tgctgacgac ggtgggcgcc ttcgccgcct tcggcctcat
120 120
ga ga
122 122
<210> 22<210> 22
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 22<400> 22
cttcccggct ccccgcggtg cgcacccgct ggccactctg cgcacgcgcg ccgggtgccc cttcccggct ccccgcggtg cgcacccgct ggccactctg cgcacgcgcg ccgggtgccc
60 60
cggcctaagg ccgttgacct cgggttctcc ccggcacagt cgaatccacg ccagggccct cggcctaagg ccgttgacct cgggttctcc ccggcacagt cgaatccacg ccagggccct
120 120
ca ca
122 122
<210> 23<210> 23
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 23<400> 23
gcgggggagg ttgcggggga ggctcggcgt ccccgctctc cgccccgcga caccgactgc gcgggggagg ttgcggggga ggctcggcgt ccccgctctc cgccccgcga caccgactgc
60 60
cgccgtggcc gccctcaaag ctcatggttg tgccgccgcc gccctcctgc cggcccggct cgccgtggcc gccctcaaag ctcatggttg tgccgccgcc gccctcctgc cggcccggct
120 120
gg gg
122 122
<210> 24<210> 24
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 24<400> 24
tgtactactt cctctgccac ctggccttgg tagacgcggg cttcactact agcgtggtgc tgtactactt cctctgccac ctggccttgg tagacgcggg cttcactact agcgtggtgc
60 60
cgccgctgct ggccaacctg cgcggaccag cgctctggct gccgcgcagc cactgcacgg cgccgctgct ggccaacctg cgcggaccag cgctctggct gccgcgcagc cactgcacgg
120 120
cc cc
122 122
<210> 25<210> 25
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 25<400> 25
aaaaaaaaaa aaaagcaatg agccgcaagc cttggactcg cagagctgcc ggtgcccgtc aaaaaaaaaa aaaagcaatg agccgcaagc cttggactcg cagagctgcc ggtgcccgtc
60 60
cgagagcccc accagcgcgg ctcacgcctc agtctcgccg ccccaaggtg ggatccgacg cgagagcccc accagcgcgg ctcacgcctc agtctcgccg ccccaaggtg ggatccgacg
120 120
cc cc
122 122
<210> 26<210> 26
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 26<400> 26
cgagagggcc cggtccagca gcctctgggg cccagtgcgc agggcactgc gggccgattg cgagagggcc cggtccagca gcctctgggg cccagtgcgc agggcactgc gggccgattg
60 60
cgccccgggg ccaggaggcg ccgagaaagc aaaagcaaaa gccggcggcg ggtggaggtc cgccccgggg ccaggaggcg ccgagaaagc aaaagcaaaa gccggcggcg ggtggaggtc
120 120
aa aa
122 122
<210> 27<210> 27
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 27<400> 27
cggccgcagt gtgccgcccg ctgcgctatg cggggctcgt ctccccgcgc ctatgtcgca cggccgcagt gtgccgcccg ctgcgctatg cggggctcgt ctccccgcgc ctatgtcgca
60 60
cgctggccag cgcctcctgg ctaagcggcc tcaccaactc ggttgcgcaa accgcgctcc cgctggccag cgcctcctgg ctaagcggcc tcaccaactc ggttgcgcaa accgcgctcc
120 120
tg tg
122 122
<210> 28<210> 28
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 28<400> 28
cctggcgcga ccgccagcag cacccagcgc ggggccggga gctgctgggg gcccaggctc cctggcgcga ccgccagcag cacccagcgc ggggccggga gctgctgggg gcccaggctc
60 60
cgctctcccc accgctctgc accgctgccg gctgcggaca gacccgatgc gccaccacca cgctctcccc accgctctgc accgctgccg gctgcggaca gacccgatgc gccaccacca
120 120
cc cc
122 122
<210> 29<210> 29
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 29<400> 29
ccggagcgcg ctgctgccct ctaccggtca tccgtgcggc cggacaccgt gtcaggcccg ccggagcgcg ctgctgccct ctaccggtca tccgtgcggc cggacaccgt gtcaggcccg
60 60
cgaggagggc tctgccgcag tcccggggaa cagcacccag cagcgccact gggagaggaa cgaggagggc tctgccgcag tcccggggaa cagcacccag cagcgccact gggagaggaa
120 120
ac ac
122 122
<210> 30<210> 30
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 30<400> 30
agtccagagc ggcgctgtgc agctggaagg gcgcgcgata gctcaagtta gaggcggccc agtccagagc ggcgctgtgc agctggaagg gcgcgcgata gctcaagtta gaggcggccc
60 60
cggggcgcgg cgcaggacac aagacctcaa actggtactt gcacaggtag ccgttggcgc cggggcgcgg cgcaggacac aagacctcaa actggtactt gcacaggtag ccgttggcgc
120 120
gc gc
122 122
<210> 31<210> 31
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 31<400> 31
ggcggtgcga gctccccgcc tgcgggacgc acggagaccg cggtcagcgc gccgcctggc ggcggtgcga gctccccgcc tgcgggacgc acggagaaccg cggtcagcgc gccgcctggc
60 60
cggcccagcg cgcccagccc gcgcccagcc ccgtccactc ccgtccagcc ccgccgcccg cggcccagcg cgcccagccc gcgcccagcc ccgtccactc ccgtccagcc ccgccgcccg
120 120
gc gc
122 122
<210> 32<210> 32
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 32<400> 32
cggtagagtt tccaacacga aagcccgtgt ggtcgcgccg ggagctcacg gcgttccaag cggtagagtt tccaacacga aagcccgtgt ggtcgcgccg ggagctcacg gcgttccaag
60 60
cggcacttat cccgcgttga tgcccaggca ccccgcgcgc cctgtttcac caggcccagt cggcacttat cccgcgttga tgcccaggca ccccgcgcgc cctgtttcac caggcccagt
120 120
ca ca
122 122
<210> 33<210> 33
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 33<400> 33
ccagcggcag tagctgtagc agcttcagcg aagccggaga tgggcagaga gcgcgcgcgg ccagcggcag tagctgtagc agcttcagcg aagccggaga tgggcagaga gcgcgcgcgg
60 60
cgcagcagct ccagattcac tgctctcccc tgcagctccc cgcgcccccg ccgctgtcgc cgcagcagct ccagattcac tgctctcccc tgcagctccc cgcgcccccg ccgctgtcgc
120 120
tg tg
122 122
<210> 34<210> 34
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 34<400> 34
gtgttctctg cggcgggccg cgtccccgct gagcctcgcg gtgacagccg cctttggcag gtgttctctg cggcgggccg cgtccccgct gagcctcgcg gtgacagccg cctttggcag
60 60
cgagcgctcg gggcacttct atccccgcct ctcaaagggt ggggacagcc gtttccagat cgagcgctcg gggcacttct atccccgcct ctcaaagggt ggggacagcc gtttccagat
120 120
tt tt
122 122
<210> 35<210> 35
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 35<400> 35
cggccgcgcc cccggcagcc cagggcgcgc ttccaccacg gtaccggtgg attcgccgtg cggccgcgcc cccggcagcc cagggcgcgc ttccaccacg gtaccggtgg attcgccgtg
60 60
cgcagccgga agatggcgca gacgcacaaa gcacaccgat gctgcgccat gatagggccg cgcagccgga agatggcgca gacgcacaaa gcacaccgat gctgcgccat gataggccg
120 120
gc gc
122 122
<210> 36<210> 36
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 36<400> 36
tctcgcggcg caggcggcgg cggcagaggt ggggtcgcgc agcggaggca gctcgagctt tctcgcggcg caggcggcgg cggcagaggt ggggtcgcgc agcggaggca gctcgagctt
60 60
cgggatgcgc gctcgcttct tgggctcctc gctcgatctt actgccccct tttttctctc cgggatgcgc gctcgcttct tgggctcctc gctcgatctt actgccccct tttttctctc
120 120
cc cc
122 122
<210> 37<210> 37
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 37<400> 37
tcctccagcc agagtcggtg ggactggctg cgctgccctg aagtggttct ccaagcagcg tcctccagcc agagtcggtg ggactggctg cgctgccctg aagtggttct ccaagcagcg
60 60
cggagggtgg cggacggcgg acggagccca ggggccgcgt cgggtgggga aacccgaact cggagggtgg cggacggcgg acggagccca ggggccgcgt cgggtgggga aacccgaact
120 120
cg cg
122 122
<210> 38<210> 38
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 38<400> 38
tgcgcatcgc tggctctggg ttccgccgaa tgcgtcctcc tggcggtgat ggctctggac tgcgcatcgc tggctctggg ttccgccgaa tgcgtcctcc tggcggtgat ggctctggac
60 60
cgcgcggccg cagtgtgccg cccgctgcgc tatgcggggc tcgtctcccc gcgcctatgt cgcgcggccg cagtgtgccg cccgctgcgc tatgcggggc tcgtctcccc gcgcctatgt
120 120
cg cg
122 122
<210> 39<210> 39
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 39<400> 39
aggggagctg cgaggcgaag tgttcttcag ggaagcgggc tcgagtctcc gcagctgcgg aggggagctg cgaggcgaag tgttcttcag ggaagcgggc tcgagtctcc gcagctgcgg
60 60
cggcggcggc ggcgcgctgg gccggcggcg ggcgcgggca gggggccggg ggtgccgcgc cggcggcggc ggcgcgctgg gccggcggcg ggcgcgggca gggggccggg ggtgccgcgc
120 120
gg gg
122 122
<210> 40<210> 40
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 40<400> 40
cctccacccc cggggggttc ctgcgcactg aaagaccgtt ctccggcagg ttttgggatc cctccacccc cggggggttc ctgcgcactg aaagaccgtt ctccggcagg ttttgggatc
60 60
cggcgacggc tgaccgcgcg ccgcccccac gcccggttcc acgatgctgc aatacagaaa cggcgacggc tgaccgcgcg ccgcccccac gcccggttcc acgatgctgc aatacagaaa
120 120
gt GT
122 122
<210> 41<210> 41
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 41<400> 41
agagaggggt cccagaacga aggtggcggc acgagctctg cgctggcggc tgtggggggc agagaggggt cccagaacga aggtggcggc acgagctctg cgctggcggc tgtggggggc
60 60
cggcgctcag gaccccaact ccatccaagt tgcgccgcgg tgggggcggg cggaggcggc cggcgctcag gaccccaact ccatccaagt tgcgccgcgg tgggggcggg cggaggcggc
120 120
gc gc
122 122
<210> 42<210> 42
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 42<400> 42
aatctcccct cgggctcgac ggatgtgcgc cccagatgtg ctgacacatg tccgatgcct aatctcccct cgggctcgac ggatgtgcgc cccagatgtg ctgacacatg tccgatgcct
60 60
cgctgccttg gaggtctccc cgctcgcgtg tctcttctct tcgcaccagc ggcggaaacc cgctgccttg gaggtctccc cgctcgcgtg tctcttctct tcgcaccagc ggcggaaacc
120 120
gc gc
122 122
<210> 43<210> 43
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 43<400> 43
gctccgcttc tccgggtttt agcggaagcc tgcggggggc ggggtaaccg cggaagccgg gctccgcttc tccgggtttt agcggaagcc tgcggggggc ggggtaaccg cggaagccgg
60 60
cggccgtggg cgcgcgggtt gggggctctc gcgccgctcc gggctctccc cccccccggc cggccgtggg cgcgcgggtt gggggctctc gcgccgctcc gggctctccc cccccccggc
120 120
tg tg
122 122
<210> 44<210> 44
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 44<400> 44
cgcgctccgc ttctccgggt tttagcggaa gcctgcgggg ggcggggtaa ccgcggaagc cgcgctccgc ttctccgggt tttagcggaa gcctgcgggg ggcggggtaa ccgcggaagc
60 60
cggcggccgt gggcgcgcgg gttgggggct ctcgcgccgc tccgggctct cccccccccc cggcggccgt gggcgcgcgg gttggggggct ctcgcgccgc tccgggctct cccccccccc
120 120
gg gg
122 122
<210> 45<210> 45
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 45<400> 45
gcgagggatc tctgtgcgtc ctcactggcc catgcaccca gcacctgcga ctcccgccgt gcgagggatc tctgtgcgtc ctcactggcc catgcaccca gcacctgcga ctcccgccgt
60 60
cgggctgcgt ggccccgcgc ccacacctgc ccgtcccttc cgtcgtccct cgctcgcgca cgggctgcgt ggccccgcgc ccacacctgc ccgtcccttc cgtcgtccct cgctcgcgca
120 120
ga ga
122 122
<210> 46<210> 46
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 46<400> 46
ggggaggtgt ggggagcgga aggccgcagg agcatctttg cggagaaagt actttggctg ggggagaggtgt ggggagcgga aggccgcagg agcatctttg cggagaaagt actttggctg
60 60
cggcgggcgc agggcgggcc ggctagcccc gcgccccacc tgttctgtgc gtcgcgctcg cggcgggcgc agggcgggcc ggctagcccc gcgccccacc tgttctgtgc gtcgcgctcg
120 120
cc cc
122 122
<210> 47<210> 47
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 47<400> 47
tagggctgga aacccgccgc cacagcgggc tagaggtcgt ccccgcccgc aacatatgcg tagggctgga aacccgccgc cacagcgggc tagaggtcgt ccccgcccgc aacatatgcg
60 60
cgaaggaaag tgctacgaac gtcaaatggc cgccccccgc cgacgccatc tgctctgcga cgaaggaaag tgctacgaac gtcaaatggc cgccccccgc cgacgccatc tgctctgcga
120 120
ag ag
122 122
<210> 48<210> 48
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 48<400> 48
cgcccgcaac atatgcgcga aggaaagtgc tacgaacgtc aaatggccgc cccccgccga cgcccgcaac atatgcgcga aggaaagtgc tacgaacgtc aaatggccgc cccccgccga
60 60
cgccatctgc tctgcgaagc agaaacggcg gcagctgcgc gcccagtccc tccgcccgcg cgccatctgc tctgcgaagc agaaacggcg gcagctgcgc gcccagtccc tccgcccgcg
120 120
cc cc
122 122
<210> 49<210> 49
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 49<400> 49
ccccctgttc aaggtctgtc accgtagggg gcgggggggc gcgtggagcc gctgggggtt ccccctgttc aaggtctgtc accgtagggg gcgggggggc gcgtggagcc gctgggggtt
60 60
cggcccaccc cgcgaaccga gctcccggcc ctgtgcgccc tcagctctgc cgcgggcgtt cggcccaccc cgcgaaccga gctcccggcc ctgtgcgccc tcagctctgc cgcgggcgtt
120 120
gg gg
122 122
<210> 50<210> 50
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 50<400> 50
gctgtggccg cagctgaggc ccgacgagct tccggccggg tctttgccct tcactggccg gctgtggccg cagctgaggc ccgacgagct tccggccggg tctttgccct tcactggccg
60 60
cgtgaacatc acggtgcgct gcacggtggc cacctctcga ctgctgctgc atagcctctt cgtgaacatc acggtgcgct gcacggtggc cacctctcga ctgctgctgc atagcctctt
120 120
cc cc
122 122
<210> 51<210> 51
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 51<400> 51
gtgtgcgtgt gcgtgtgctc agcctcagcg tgaggggcac ctgctcgtct gggctcacag gtgtgcgtgt gcgtgtgctc agcctcagcg tgaggggcac ctgctcgtct gggctcacag
60 60
cgaaggcagc ctcgccgcga gctgccgctg ccgctgctgc cgccactggt gttgccgctc cgaaggcagc ctcgccgcga gctgccgctg ccgctgctgc cgccactggt gttgccgctc
120 120
tc tc
122 122
<210> 52<210> 52
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 52<400> 52
tggggcagcg gcgttgcagg agatgagctc agcgcaaagg gaaccccgca gcggcgagtg tggggcagcg gcgttgcagg agatgagctc agcgcaaagg gaaccccgca gcggcgagtg
60 60
cggctgctgg cctgcgcgct gtggccccaa caggctggca gggcgcgggc gggtggcggg cggctgctgg cctgcgcgct gtggccccaa caggctggca gggcgcgggc gggtggcggg
120 120
gt GT
122 122
<210> 53<210> 53
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 53<400> 53
agagtcggtg ggactggctg cgctgccctg aagtggttct ccaagcagcg cggagggtgg agagtcggtg ggactggctg cgctgccctg aagtggttct ccaagcagcg cggagggtgg
60 60
cggacggcgg acggagccca ggggccgcgt cgggtgggga aacccgaact cgcggagggg cggacggcgg acggagccca ggggccgcgt cgggtgggga aacccgaact cgcggagggg
120 120
aa aa
122 122
<210> 54<210> 54
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 54<400> 54
aaagccctgg caggtaaaga gaggacccgc gcaggctggg agctcccact cctcctccag aaagccctgg caggtaaaga gaggacccgc gcaggctggg agctcccact cctcctccag
60 60
cgtcacgctc gccctccgcc gctgcctcgc gtccgggtct gtttatatag cgtctggagg cgtcacgctc gccctccgcc gctgcctcgc gtccgggtct gtttatatag cgtctggagg
120 120
cc cc
122 122
<210> 55<210> 55
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 55<400> 55
ctggccaagt gccggcccat cgcggtgcgc agcggagacg ccttccacga gatccggccg ctggccaagt gccggcccat cgcggtgcgc agcggagacg ccttccacga gatccggccg
60 60
cgcgccgagg tggccaacct cagcgcgcac agcgccagcc ccatccagga tgcggtcctg cgcgccgagg tggccaacct cagcgcgcac agcgccagcc ccatccagga tgcggtcctg
120 120
aa aa
122 122
<210> 56<210> 56
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 56<400> 56
ggcgccggca gcttcgcgcc ggcggctgga agcgggcggg ctgcacgggc ggctcgagtg ggcgccggca gcttcgcgcc ggcggctgga agcgggcggg ctgcacgggc ggctcgagtg
60 60
cggggacccc agcccctcgc cctcgtgagc gccgcccctg ccacctgctg ccaagtcacc cggggacccc agcccctcgc cctcgtgagc gccgcccctg ccacctgctg ccaagtcacc
120 120
gg gg
122 122
<210> 57<210> 57
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 57<400> 57
ccccggccgc gccgggcgcg gggctcggga ttcgggagac cgcgcggcgc cgaagccacg ccccggccgc gccgggcgcg gggctcggga ttcgggagac cgcgcggcgc cgaagccacg
60 60
cgtcagcccc actgtcccgc gcgcctcgcc ccaggcctcg ggctcttcct ccgcacctcg cgtcagcccc actgtcccgc gcgcctcgcc ccaggcctcg ggctcttcct ccgcacctcg
120 120
ta ta
122 122
<210> 58<210> 58
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 58<400> 58
acgcggggac tggaaagggc gcctgggtgg gaagaggcgc tggcgggtga tcgtccccac acgcggggac tggaaagggc gcctgggtgg gaagaggcgc tggcgggtga tcgtccccac
60 60
cgggccagtc cccgggatct gctgccgccc ctctccgaaa ttcacagcca gagcgggcgc cggggccagtc cccgggatct gctgccgccc ctctccgaaa ttcacagcca gagcgggcgc
120 120
ac ac
122 122
<210> 59<210> 59
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 59<400> 59
tctgagaagt gtcctcctcg ctctcttata aaaacaggac ttgttgccga ggtcagcgcg tctgagaagt gtcctcctcg ctctcttata aaaacaggac ttgttgccga ggtcagcgcg
60 60
cgcatcgagt gtgccaggcg tgtgcgtggt ttctgctgtg tcattgcttt cacggaaggt cgcatcgagt gtgccaggcg tgtgcgtggt ttctgctgtg tcattgcttt cacggaaggt
120 120
gg gg
122 122
<210> 60<210> 60
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 60<400> 60
gcgcccagac tgcgcgccgc gccgctgcgc ccaacattcc cgaggacggc ttcgcgggcg gcgcccagac tgcgcgccgc gccgctgcgc ccaacattcc cgaggacggc ttcgcgggcg
60 60
cgtatcgtcc agaccggagc accgccccac cgctagcgca ggagacctgc cggggaagtc cgtatcgtcc agaccggagc accgccccac cgctagcgca ggagacctgc cggggaagtc
120 120
gc gc
122 122
<210> 61<210> 61
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 61<400> 61
aaaggccgta ctctgccccc cgcgggaccc aggtccccgc ctgctgcaga gcgcactctg aaaggccgta ctctgccccc cgcgggaccc aggtccccgc ctgctgcaga gcgcactctg
60 60
cgcacgtcga gccgcgaaag gttcacagaa gaaaacaaga gaaagaagta gcaggcactg cgcacgtcga gccgcgaaag gttcacagaa gaaaacaaga gaaagaagta gcaggcactg
120 120
ag ag
122 122
<210> 62<210> 62
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 62<400> 62
ggaatccatt cttttaagcc agggtttaaa actcttcaag caagtcatct gcaaaggtac ggaatccatt cttttaagcc agggtttaaa actcttcaag caagtcatct gcaaaggtac
60 60
cgcttctacc attttaaaga taggattatg ttccctagga caactggatg agccctagga cgcttctacc attttaaaga taggattatg ttccctagga caactggatg agccctagga
120 120
ac ac
122 122
<210> 63<210> 63
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 63<400> 63
gaggagcgcg ccgctgcctc tggcgggctt tcggcttgag gggcaaggtg aagagcgcac gaggagcgcg ccgctgcctc tggcgggctt tcggcttgag gggcaaggtg aagagcgcac
60 60
cggccgtggg gtttaccgag ctggatttgt atgttgcacc atgccttctt ggatcggggc cggccgtggg gtttaccgag ctggatttgt atgttgcacc atgccttctt ggatcggggc
120 120
tg tg
122 122
<210> 64<210> 64
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 64<400> 64
ccctgtgcgt gccgccgcgc tgttgctcgc agtgtgctgg cgccgagctc ggtggacacg ccctgtgcgt gccgccgcgc tgttgctcgc agtgtgctgg cgccgagctc ggtggacacg
60 60
cgcgcagtca gagctgcctc tcgccctcgc tagctgggct cgcagcctct tcctccctcc cgcgcagtca gagctgcctc tcgccctcgc tagctgggct cgcagcctct tcctccctcc
120 120
ct ct
122 122
<210> 65<210> 65
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 65<400> 65
ctctttggca agtggtttgt gcatcaggag aaactttcca cctgcgagcc gaaccggcgc ctctttggca agtggtttgt gcatcaggag aaactttcca cctgcgagcc gaaccggcgc
60 60
cgagtgcgtg tgtttctgcc tttttttgtt gtcgttgcct ccacccctcc ccattcttct cgagtgcgtg tgtttctgcc tttttttgtt gtcgttgcct ccacccctcc ccattcttct
120 120
ct ct
122 122
<210> 66<210> 66
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 66<400> 66
tggctgccag agcgagtgag gggcgcagag gcggcagaga gcggagagcc ccggtgtctc tggctgccag agcgagtgag gggcgcagag gcggcagaga gcggagagcc ccggtgtctc
60 60
cgcgagggcg gcggcggcca gcagacggcg atcgaggcgc gcgccacggc acggccagcg cgcgaggcg gcggcggcca gcagacggcg atcgaggcgc gcgccacggc acggccagcg
120 120
ca ca
122 122
<210> 67<210> 67
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 67<400> 67
aagcgcgtgg agagccgaaa ggtgcggtgg gcgcagaggg cgggctggct gcggggcgac aagcgcgtgg agagccgaaa ggtgcggtgg gcgcagagg cgggctggct gcggggcgac
60 60
cgcgcgccgg ggccatgccg cgctccttcc tggtggactc gctagtgctg cgcgaggcgg cgcgcgccgg ggccatgccg cgctccttcc tggtggactc gctagtgctg cgcgaggcgg
120 120
gc gc
122 122
<210> 68<210> 68
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 68<400> 68
ggggtcgcca tgaccgagtg gcccaggccc gagcgaagcc cgcgcgcggt gagtccgccg ggggtcgcca tgaccgagtg gcccaggccc gagcgaagcc cgcgcgcggt gagtccgccg
60 60
cggcccatcc gtccctccgc ccgccagagc gtccatcggg acgcccaccc gggagggtct cggcccatcc gtccctccgc ccgccagagc gtccatcggg acgcccaccc gggagggtct
120 120
cg cg
122 122
<210> 69<210> 69
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 69<400> 69
ccgagcgctg cccccgccgg cccgcggctg ccagccggcc ctgcccgcgc ccgggccccg ccgagcgctg cccccgccgg cccgcggctg ccagccggcc ctgcccgcgc ccgggccccg
60 60
cgagcggccg cacttcacct tacggagggg agataatgag atcaattaga ggcgccgtca cgagcggccg cacttcacct tacggagggg agataatgag atcaattaga ggcgccgtca
120 120
cc cc
122 122
<210> 70<210> 70
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 70<400> 70
ggcaaccctg actcggaccg ctcgggagag ccccaggaga ggccagcgcc gcgcagcagc ggcaaccctg actcggaccg ctcgggagag ccccaggaga ggccagcgcc gcgcagcagc
60 60
cgccccgctg cgcccacctc cccggctgct cccggagggc tcacaaaggc ggtggccgcc cgccccgctg cgcccacctc cccggctgct cccggagggc tcacaaaggc ggtggccgcc
120 120
cg cg
122 122
<210> 71<210> 71
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 71<400> 71
gcgggcggca gccgcaagcg aggaatccag cgcagggaaa gtagccccag tggggcccgg gcgggcggca gccgcaagcg aggaatccag cgcagggaaa gtagccccag tggggcccgg
60 60
cgcgtcagcc ccactcgcgt ggcaaaactt gcgggggccc ccgcgtgccg cgcctcagcc cgcgtcagcc ccactcgcgt ggcaaaactt gcggggggccc ccgcgtgccg cgcctcagcc
120 120
ca ca
122 122
<210> 72<210> 72
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 72<400> 72
tcctcgccgt cggggtcctc ctcctctgcc gacgagttgt cactgggcga ggcgtagctg tcctcgccgt cggggtcctc ctcctctgcc gacgagttgt cactgggcga ggcgtagctg
60 60
cgctctacgc cgcggagggg cggcctcttg gaggcgggga ccgggtactc ccgctgcagc cgctctacgc cgcggagggg cggcctcttg gaggcgggga ccgggtactc ccgctgcagc
120 120
cc cc
122 122
<210> 73<210> 73
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 73<400> 73
gctgctcgcg ctccgccgcc cgggagatgc ttcctcgcgc ggcgcagcgc tgaggccgtg gctgctcgcg ctccgccgcc cgggagatgc ttcctcgcgc ggcgcagcgc tgaggccgtg
60 60
cgtgcgcccc ggctgcgctg cgcgctcccc acatacacaa gctctccatg tgagctgaca cgtgcgcccc ggctgcgctg cgcgctcccc acatacacaa gctctccatg tgagctgaca
120 120
gg gg
122 122
<210> 74<210> 74
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 74<400> 74
cttctcttga aaaggaggag aatcaacact gggctcacaa ctcatcagag ctgagtcata cttctcttga aaaggaggag aatcaacact gggctcacaa ctcatcagag ctgagtcata
60 60
cgtacatcag caggacctac gtgggaacca aatagcaaac tcaaattggg aaatttgagg cgtacatcag caggacctac gtgggaacca aatagcaaac tcaaattggg aaatttgagg
120 120
aa aa
122 122
<210> 75<210> 75
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 75<400> 75
ccgagagccc cgcctgcagg cggtgtagat acatgtagat actgtagata ctgtagatac ccgagagccc cgcctgcagg cggtgtagat acatgtagat actgtagata ctgtagatac
60 60
cgccccggcg ccgacttgat aaacggtttc gcctcttttg gaagccgcct gcgtgtccat cgccccggcg ccgacttgat aaacggtttc gcctcttttg gaagccgcct gcgtgtccat
120 120
tt tt
122 122
<210> 76<210> 76
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 76<400> 76
tgaggagtga ggaggcagaa aggaccgaga acaaggggac ccggttccat ttctggaccc tgaggagtga ggaggcagaa aggaccgaga acaaggggac ccggttccat ttctggaccc
60 60
cgtccgcagg ctgctcgccc gacttggggt cgctctgccc cggacgatca ggacagctgc cgtccgcagg ctgctcgccc gacttggggt cgctctgccc cggacgatca ggacagctgc
120 120
gt GT
122 122
<210> 77<210> 77
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 77<400> 77
caaatctata tgaaggatcg aattgcattg aactagcaaa cacacacaca cacacgcaca caaatctata tgaaggatcg aattgcattg aactagcaaa cacacacaca cacacgcaca
60 60
cgcaaaaact gatgaaagct gaacaaggtc tgtagtctag tcaacagtac tgcactatgt cgcaaaaact gatgaaagct gaacaaggtc tgtagtctag tcaacagtac tgcactatgt
120 120
ga ga
122 122
<210> 78<210> 78
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 78<400> 78
acagtctctc gcctcaaaga tctccgccat tagtggtagc catttaagaa aacagaatta acagtctctc gcctcaaaga tctccgccat tagtggtagc catttaagaa aacagaatta
60 60
cgatgaataa tgatttgaag ccaaaaagtc aaaatatctt atttcgcaac tgtaattgct cgatgaataa tgatttgaag ccaaaaagtc aaaatatctt atttcgcaac tgtaattgct
120 120
gg gg
122 122
<210> 79<210> 79
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 79<400> 79
ccacacaggc ctctccctcg gtgcggtagc gagggttgcg ggcccaaacg cccgcgccca ccacacaggc ctctccctcg gtgcggtagc gagggttgcg ggcccaaacg cccgcgccca
60 60
cggaggcgcc tgcgacgact agaagcttcc acagccatat gggggcaaag acggcccagt cggaggcgcc tgcgacgact agaagcttcc acagccatat gggggcaaag acggcccagt
120 120
ag ag
122 122
<210> 80<210> 80
<211> 25<211> 25
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 80<400> 80
ggtttttggg taggaaggat agtag ggtttttggg taggaaggat agtag
25 25
<210> 81<210> 81
<211> 25<211> 25
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 81<400> 81
aaacaaatct aacccctaaa aaaac aaacaaatct aacccctaaa aaaac
25 25
<210> 82<210> 82
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 82<400> 82
caaactaaac acactaaacc caaactaaac acactaaacc
20 20
<210> 83<210> 83
<211> 21<211> 21
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 83<400> 83
gggtttttag ggttggtggt a gggtttttag ggttggtggt a
21 21
<210> 84<210> 84
<211> 24<211> 24
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 84<400> 84
tcctcataat aataaataac aacc tcctcataat aataaataac aacc
24 24
<210> 85<210> 85
<211> 18<211> 18
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 85<400> 85
tatgtatgtg gtggggtt tatgtatgtg gtggggtt
18 18
<210> 86<210> 86
<211> 45<211> 45
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 86<400> 86
aatgatacgg cgaccaccga gatctacact ctttccctac acgac aatgatacgg cgaccaccga gatctacact ctttccctac acgac
45 45
<210> 87<210> 87
<211> 52<211> 52
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<220><220>
<221> AGTCATCG<221>AGTCATCG
<222> (25)..(32)<222> (25)..(32)
<400> 87<400> 87
caagcagaag acggcatacg agatagtcat cggtgactgg agttcagacg tg caagcagaag acggcatacg agatagtcat cggtgactgg agttcagacg tg
52 52
<210> 88<210> 88
<211> 59<211> 59
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<220><220>
<221> прочий_признак<221> other_sign
<222> (34)..(38)<222> (34)..(38)
<223> n представляет собой a, c, g, или t<223> n represents a, c, g, or t
<400> 88<400> 88
acactctttc cctacacgac gctcttccga tctnnnnngg gtttttaggg ttggtggta acactctttc cctacacgac gctcttccga tctnnnnngg gtttttaggg ttggtggta
59 59
<210> 89<210> 89
<211> 58<211> 58
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 89<400> 89
gtgactggag ttcagacgtg tgctcttccg atcttcctca taataataaa taacaacc gtgactggag ttcagacgtg tgctcttccg atcttcctca taataataaa taacaacc
58 58
<210> 90<210> 90
<211> 67<211> 67
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<220><220>
<221> прочий_признак<221> other_sign
<222> (34)..(38)<222> (34)..(38)
<223> n представляет собой a, c, g, или t<223> n represents a, c, g, or t
<400> 90<400> 90
acactctttc cctacacgac gctcttccga tctnnnnngg taggtttttg ggtaggaagg acactctttc cctacacgac gctcttccga tctnnnnngg taggtttttg ggtaggaagg
60 60
atagtag atagtag
67 67
<210> 91<210> 91
<211> 59<211> 59
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic
полинуклеотидpolynucleotide
<400> 91<400> 91
gtgactggag ttcagacgtg tgctcttccg atctaaacaa atctaacccc taaaaaaac gtgactggag ttcagacgtg tgctcttccg atctaaacaa atctaacccc taaaaaaac
59 59
<---<---
Claims (3)
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US62/774,994 | 2018-12-04 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2021112399A RU2021112399A (en) | 2023-01-09 |
| RU2817569C2 true RU2817569C2 (en) | 2024-04-16 |
Family
ID=
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017219312A1 (en) * | 2016-06-23 | 2017-12-28 | Beijing Youan Hospital, Capital Medical University | Dna methylation signatures of cancer in host peripheral blood mononuclear cells and t cells |
| WO2018158589A1 (en) * | 2017-03-02 | 2018-09-07 | Ucl Business Plc | Diagnostic and prognostic methods |
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017219312A1 (en) * | 2016-06-23 | 2017-12-28 | Beijing Youan Hospital, Capital Medical University | Dna methylation signatures of cancer in host peripheral blood mononuclear cells and t cells |
| WO2018158589A1 (en) * | 2017-03-02 | 2018-09-07 | Ucl Business Plc | Diagnostic and prognostic methods |
Non-Patent Citations (2)
| Title |
|---|
| ESTELLER, M. Epigenetics in Cancer. N ENGL J MED. 2008, v. 358, n.11, pp.1148-1159. WENTZENSEN, N. et al. Utility of methylation markers in cervical cancer early detection: appraisal of the state-of-the-science. GYNECOL ONCOL. 2009, v.112, n.2, pp.1-18. FARKAS, S. A. et al. Genome-wide DNA methylation assay reveals novel candidate biomarker genes in cervical cancer. EPIGENETICS. 2013, v. 8, n. 11, pp.1213-1225. * |
| KANAI, Y. Genome-wide DNA methylation profiles in precancerous conditions and cancers. CANCER SCI. 2010, v.101, n.1, pp.36-45. КОЗЛОВ В.А. Метилирование ДНК клетки и патология организма. МЕДИЦИНСКАЯ ИММУНОЛОГИЯ. 2008, т. 10, н. 4-5, сс.307-318. * |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7759974B2 (en) | DNA methylation biomarkers for early detection of cervical cancer | |
| TWI797095B (en) | Methods and systems for tumor detection | |
| US20250137071A1 (en) | Enhancement of cancer screening using cell-free viral nucleic acids | |
| Vasiljević et al. | Credentialing of DNA methylation assays for human genes as diagnostic biomarkers of cervical intraepithelial neoplasia in high-risk HPV positive women | |
| JP2024105502A (en) | DNA methylation markers for non-invasive detection of cancer and their uses - Patents.com | |
| RU2817569C2 (en) | Dna methylation biomarkers for early detection of cervical cancer | |
| US20250109445A1 (en) | Dna methylation biomarkers for early detection of cervical cancer | |
| HK40056257A (en) | Dna methylation biomarkers for early detection of cervical cancer | |
| KR102889224B1 (en) | Augmenting cancer screening using cell-free viral nucleic acids | |
| Meyer et al. | Nanopore sequencing-derived methylation biomarker prediction for methylation-specific PCR in patients with head and neck squamous cell carcinoma | |
| HK40023330A (en) | Enhancement of cancer screening using cell-free viral nucleic acids | |
| HK40029037B (en) | Enhancement of cancer screening using cell-free viral nucleic acids | |
| HK40029037A (en) | Enhancement of cancer screening using cell-free viral nucleic acids | |
| EP3921441A1 (en) | A method for determining the severity or grade of human papillomavirus (hpv)-induced dysplasia | |
| HK1207124A1 (en) | Non-invasive determination of methylome of fetus or tumor from plasma |