[go: up one dir, main page]

RU2817569C2 - Dna methylation biomarkers for early detection of cervical cancer - Google Patents

Dna methylation biomarkers for early detection of cervical cancer Download PDF

Info

Publication number
RU2817569C2
RU2817569C2 RU2021112399A RU2021112399A RU2817569C2 RU 2817569 C2 RU2817569 C2 RU 2817569C2 RU 2021112399 A RU2021112399 A RU 2021112399A RU 2021112399 A RU2021112399 A RU 2021112399A RU 2817569 C2 RU2817569 C2 RU 2817569C2
Authority
RU
Russia
Prior art keywords
dna
methylation
cervical cancer
artificial sequence
dna methylation
Prior art date
Application number
RU2021112399A
Other languages
Russian (ru)
Other versions
RU2021112399A (en
Inventor
Моше ШИФ
Давид ЧЕЙШВИЛИ
Эдуардо ФРАНКО
Мариам ЭЛЬ-ЗЕЙН
Original Assignee
ЭйчКейДжи ЭПИТЕРАПЬЮТИКС ЛИМИТЕД
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ЭйчКейДжи ЭПИТЕРАПЬЮТИКС ЛИМИТЕД filed Critical ЭйчКейДжи ЭПИТЕРАПЬЮТИКС ЛИМИТЕД
Publication of RU2021112399A publication Critical patent/RU2021112399A/en
Application granted granted Critical
Publication of RU2817569C2 publication Critical patent/RU2817569C2/en

Links

Abstract

FIELD: biotechnology; medicine.
SUBSTANCE: kit is proposed for the detection of cervical cancer using CG identifier (CGID) methylation analysis via bisulfite sequencing with multiplex targeted amplification. The specified kit includes the reagents necessary to perform the specified CGID assay with SEQ ID NO: 3 and 31 and measuring their methylation levels.
EFFECT: expanding the scope of DNA methylation biomarkers for the early detection of cervical cancer.
3 cl, 8 dwg, 3 tbl, 7 ex

Description

Перекрестная ссылка на родственные заявкиCross reference to related applications

Настоящая заявка испрашивает приоритет в соответствии с разделом 119(e) предварительной заявки на патент США No.62/774,994, поданной 4 декабря 2018 г., с названием «DNA METHYLATION MARKERS FOR EARLY DETECTION OF CERVICAL CANCER», содержание которой включено в настоящее изобретение путём ссылки.This application claims benefit under section 119(e) of U.S. Provisional Patent Application No. 62/774,994, filed December 4, 2018, entitled "DNA METHYLATION MARKERS FOR EARLY DETECTION OF CERVICAL CANCER", the contents of which are included in the present invention by reference.

Перечень последовательностейList of sequences

Настоящая заявка содержит Перечень последовательностей, который был подан в электронном виде в формате ASCII и полностью включен в настоящее изобретение путём ссылки. Указанная копия ASCII, созданная 12 января 2020 г., называется TPC53811 Seq List_ST25.txt и имеет размер 36 864 байта.This application contains a Sequence Listing which was filed electronically in ASCII format and is incorporated herein by reference in its entirety. The specified ASCII copy, created on January 12, 2020, is called TPC53811 Seq List_ST25.txt and is 36,864 bytes in size.

Область техники, к которой относится изобретениеField of technology to which the invention relates

Настоящее изобретение в основном относится к сигнатурам метилирования ДНК в ДНК человека, особенно в области молекулярной диагностики. Более конкретно, настоящее изобретение относится к биомаркерам метилирования ДНК в виде панели, индивидуальных, а также комбинации полигенных биомаркеров метилирования ДНК для раннего выявления, а также скрининга рака шейки матки, и их применению в качестве диагностического набора для раннего и точного выявления рака шейки матки.The present invention generally relates to DNA methylation signatures in human DNA, especially in the field of molecular diagnostics. More specifically, the present invention relates to DNA methylation biomarkers in the form of a panel, individual, and combination of polygenic DNA methylation biomarkers for early detection as well as screening of cervical cancer, and their use as a diagnostic kit for early and accurate detection of cervical cancer.

Уровень техники изобретенияBACKGROUND OF THE INVENTION

Рак остается основной причиной смерти у людей. Раннее выявление рака может значительно улучшить показатели излечения и снизить огромные личные и финансовые затраты пациентов, их семей и системы здравоохранения. В то же время, скрининг здоровых людей для оценки экспрессии биомаркеров на предраковой стадии и их изменений применим в методологии скрининга в масштабах всей популяции и помогает выявлять здоровых людей, подверженных риску развития рака, восприимчивых к раку. Рак шейки матки не является исключением. Скрининг может выявить рак на ранней стадии - до того, как он вызовет симптомы. Если рак шейки матки обнаружен на самой ранней стадии, шанс выживания составляет примерно 93%, а на последних стадиях он снижается до 15% https://www.cancer.org/cancer/cervical-cancer/detection-diagnosis-staging/survival.html. Современные методы скрининга включают мазки по Папаниколау, жидкостную цитологию, тестирование на ВПЧ и визуальный осмотр, однако надежный высокоточный и чувствительный способ раннего выявления рака шейки матки отсутствует.Cancer remains the leading cause of death in humans. Early detection of cancer can significantly improve cure rates and reduce enormous personal and financial costs for patients, their families and the healthcare system. At the same time, screening healthy individuals to evaluate the expression of biomarkers at the precancerous stage and their changes is applicable in population-wide screening methodology and helps to identify healthy individuals at risk of developing cancer who are susceptible to cancer. Cervical cancer is no exception. Screening can detect cancer early - before it causes symptoms. If cervical cancer is detected at the earliest stage, the chance of survival is approximately 93%, which drops to 15% in the later stages https://www.cancer.org/cancer/cervical-cancer/detection-diagnosis-staging/survival. html. Current screening methods include Pap smears, liquid-based cytology, HPV testing, and visual inspection, but there is no reliable, highly accurate and sensitive method for early detection of cervical cancer.

Биомаркеры составляют одну из важнейших областей диагностики рака. Биомаркеры рака особенно полезны для раннего выявления или диагностики заболевания. Биомаркеры можно использовать для скрининга пациентов, для классификации различных стадий или степеней рака и для составления прогноза и прогнозирования устойчивости к терапии.Biomarkers constitute one of the most important areas of cancer diagnosis. Cancer biomarkers are particularly useful for early detection or diagnosis of the disease. Biomarkers can be used to screen patients, to classify different stages or grades of cancer, and to provide prognosis and predict treatment resistance.

Общепризнанное открытие того, что вирус папилломы человека (ВПЧ) является возбудителем неоплазии шейки матки, произвело революцию в методах предотвращения и лечения этого гинекологического заболевания с вспомогательных позиций (молекулярное тестирование на ВПЧ) (1). Знание генотипа ВПЧ действительно полезно для клинического прогнозирования, поскольку ВПЧ типов 16 и/или 18 связан с большим риском прогрессирования поражения, чем другие канцерогенные типы. Однако стойкая инфекция канцерогенными генотипами ВПЧ является необходимым предшественником и движущей силой канцерогенеза шейки матки. Последний представляет собой поэтапное прогрессирование от предраковых стадий (дисплазия шейки матки, ДШМ) к инвазивному раку шейки матки. ДШМ низкой степени (ДШМ1) в высшей степени обратима, тогда как ДШМ высокой степени 2 и 3 (то есть ДШМ2 и ДШМ3, соответственно) имеет высокий риск прогрессирования инвазии, то есть рака шейки матки. Это особенно верно для ДШМ3.The widely accepted discovery that human papillomavirus (HPV) is the causative agent of cervical neoplasia has revolutionized the prevention and treatment of this gynecological disease from a supportive perspective (molecular testing for HPV) (1). Knowledge of HPV genotype is indeed useful for clinical prognosis, since HPV types 16 and/or 18 are associated with a greater risk of disease progression than other carcinogenic types. However, persistent infection with carcinogenic HPV genotypes is a necessary precursor and driving force for cervical carcinogenesis. The latter represents a stepwise progression from precancerous stages (cervical dysplasia, CDM) to invasive cervical cancer. Low-grade DSM (DSM1) is highly reversible, whereas high-grade DSM 2 and 3 (i.e., DSM2 and DSM3, respectively) have a high risk of progression to invasion, i.e., cervical cancer. This is especially true for DShM3.

Ведение женщин с патологиями ДШМ в клинике по-прежнему представляет собой серьезную дилемму для гинекологов, поскольку агрессивное абляционное или эксцизионное лечение может вызвать немедленные осложнения или повысить риск выкидыша или преждевременных родов в более позднем возрасте, когда пациентка решит забеременеть. Недавние данные свидетельствуют о том, что эпигенетические изменения в определенных генах могут опосредовать или предсказать канцерогенное прогрессирование. Биомаркер раннего выявления рака может однозначно дифференцировать редкие клетки с поражениями на бессимптомной и предраковой стадиях, благодаря значительным изменениям, которые включают в себя биохимические изменения на эпигенетическом уровне. Эти эпигенетические изменения в качестве биомаркеров довольно часто вырабатываются в аномально больших количествах в раковых тканях и часто препятствуют проявлению самого заболевания. Для выявления молекулярных изменений, происходящих задолго до начала и прогрессирования заболевания, чрезвычайно важна разработка молекулярных биомаркеров. Было показано, что уровни одного из таких эпигенетических биомаркеров - уровни метилирования ДНК определенных сайтов CpG в вирусных генах и генах хозяина - увеличиваются с тяжестью первичных поражений шейки матки (2-7).Clinical management of women with DSM pathology continues to pose a major dilemma for gynecologists, as aggressive ablative or excisional treatment may cause immediate complications or increase the risk of miscarriage or preterm birth later in life when the patient decides to become pregnant. Recent evidence suggests that epigenetic changes in certain genes may mediate or predict carcinogenic progression. The early cancer detection biomarker can uniquely differentiate rare cells with lesions at the asymptomatic and precancerous stages due to significant changes that include biochemical changes at the epigenetic level. These epigenetic changes, as biomarkers, are quite often produced in abnormally high quantities in cancerous tissues and often interfere with the expression of the disease itself. To identify molecular changes that occur long before disease onset and progression, the development of molecular biomarkers is critical. Levels of one such epigenetic biomarker—DNA methylation levels of specific CpG sites in viral and host genes—have been shown to increase with the severity of primary cervical lesions (2–7).

К числу наиболее изученных и целевых генов хозяина с эпигенетическими изменениями, связанными с раком шейки матки и его предшественниками, относятся молекула клеточной адгезии 1 (CADM1); ассоциированная со смертью протеинкиназа 1 (DAPK1); миелин и лимфоциты, белок дифференцировки Т-клеток (MAL); парный бокс 1 (PAX1); теломеразная обратная транскриптаза (TERT); белок 3, подобный полосе 4.1 белка мембраны эритроцитов (EPB41L3), член 1 семейства доменов ассоциации Ras (RASSF1); SRY-box 1 (SOX1); кадгерин 1 (CDH1); LIM гомеобоксный фактор транскрипции 1 альфа (LMX); циклин A1 (CCNA1); семейство со сходством последовательностей из 19 членов A4, хемокиноподобный мотив C-C (FAM19A4); и рецептор ретиноевой кислоты бета (RARβ)8. Были исследованы одиночные (9) маркеры метилирования в дополнение к тем, которые включали два (т.е., CADM1 и MAL (3,4,10); MAL и miR124-2 (11-14), три (т.е., CADM1, MAL и miR124-2) (13,15), четыре (т.е., JAM3, EPB41L3, TERT и C13ORF18) (16,17) и пять (т.е., PAX1, DAPK1, RARβ, WIF1 и SLIT2) (14) маркеров в панели, а также панели, включающие различные комбинации маркеров SOX1, PAX1, LMX1A и NKX6-1 для достижения достаточно высокой чувствительности для запущенных поражений (18).Some of the most studied and targeted host genes with epigenetic changes associated with cervical cancer and its precursors include cell adhesion molecule 1 (CADM1); death associated protein kinase 1 (DAPK1); myelin and lymphocytes, T-cell differentiation protein (MAL); pair box 1 (PAX1); telomerase reverse transcriptase (TERT); erythrocyte membrane protein band 4.1-like protein 3 (EPB41L3), Ras association domain family member 1 (RASSF1); SRY-box 1 (SOX1); cadherin 1 (CDH1); LIM homeobox transcription factor 1 alpha (LMX); cyclin A1 (CCNA1); the 19-member sequence similarity family A4, C-C chemokine-like motif (FAM19A4); and retinoic acid receptor beta (RARβ)8. Single (9) methylation markers were examined in addition to those that included two (i.e., CADM1 and MAL (3,4,10); MAL and miR124-2 (11–14), three (i.e., , CADM1, MAL, and miR124-2) (13,15), four (i.e., JAM3, EPB41L3, TERT, and C13ORF18) (16,17) and five (i.e., PAX1, DAPK1, RARβ, WIF1 and SLIT2) (14) markers in a panel, as well as panels including various combinations of SOX1, PAX1, LMX1A, and NKX6-1 markers to achieve sufficiently high sensitivity for advanced lesions (18).

Однако только одно предыдущее исследование с использованием подхода изучения метилирования по всему геному выявило три панели метилирования (JAM3/ANKRD18CP, C13ORF18/JAM3/ANKRD18CP и JAM3/GFRA1/ANKRD18CP) с самой высокой комбинированной диагностической точностью для обнаружения ДШМ2+ в образцах шейки матки; и их чувствительность составила 72%, 74% и 73%, соответственно, с соответствующей специфичностью 79%, 76% и 77% (2). Соответственно, существует потребность в улучшенных способах идентификации биомаркеров метилирования ДНК, панели биомаркеров метилирования ДНК, связанных с ранним выявлением и прогнозированием риска рака шейки матки, а также в наборах реагентов, основанных на таких биомаркерах, для скрининга в масштабах популяции клинически здоровых женщин с целью раннего выявления рака шейки матки и предрасположенности к нему, а также для оценки риска его развития у женщин с предраковыми патологиями.However, only one previous study using a genome-wide methylation approach identified three methylation panels (JAM3/ANKRD18CP, C13ORF18/JAM3/ANKRD18CP, and JAM3/GFRA1/ANKRD18CP) with the highest combined diagnostic accuracy for detecting DSM2+ in cervical samples; and their sensitivity was 72%, 74%, and 73%, respectively, with corresponding specificity of 79%, 76%, and 77% (2). Accordingly, there is a need for improved methods for identifying DNA methylation biomarkers, a panel of DNA methylation biomarkers associated with early detection and risk prediction of cervical cancer, and reagent kits based on such biomarkers for population-wide screening of clinically healthy women for early detection of cervical cancer and predisposition to it, as well as to assess the risk of its development in women with precancerous pathologies.

Настоящее изобретение относится к решению проблемы, связанной с отсутствием маркеров раннего выявления рака шейки матки, путём использования биомаркеров метилирования ДНК в качестве единичных, комбинированных, а также панельных биомаркеров, поскольку отсутствует один или комбинированный маркер метилирования, который обладает соответствующими диагностическими характеристиками для прогнозирования риска рака шейки матки на ранней стадии в настоящее время. Настоящее изобретение относится к способу получения ранних биомаркеров прогрессирования предракового поражения до рака шейки матки, которые можно использовать для общего скрининга у женщин без симптомов, а также у женщин с патологиями от ДШМ1 до ДШМ3.The present invention relates to solving the problem associated with the lack of markers for early detection of cervical cancer by using DNA methylation biomarkers as single, combined, and panel biomarkers, since there is no single or combined methylation marker that has the appropriate diagnostic characteristics for predicting cancer risk cervix at an early stage at present. The present invention relates to a method for obtaining early biomarkers of progression of a precancerous lesion to cervical cancer, which can be used for general screening in women without symptoms, as well as in women with pathologies from CCM1 to CCM3.

Задачи изобретенияObjectives of the invention

Основная задача настоящего изобретения относится к биомаркерам для раннего выявления и диагностики рака шейки матки у человека.The main object of the present invention relates to biomarkers for the early detection and diagnosis of cervical cancer in humans.

Другая задача настоящего изобретения относится к раскрытому здесь in vitro способу, называемому «анализ прогрессирующих изменений метилирования ДНК (APDMA)», который включает в себя этапы изучения полногеномных профилей метилирования ДНК образцов, полученных от женщин с различными степенями патологии ДШМ (от ДШМ1 до ДШМ3), по сравнению с контрольными образцами, полученными от здоровых женщин, для получения CG-идентификаторов (CGID) в качестве биомаркеров метилирования ДНК, которые при объединении предсказывают, используя описанную здесь модель линейной регрессии, рак шейки матки с чувствительностью и специфичностью > 95% в общедоступных профилях метилирования рака шейки матки.Another object of the present invention relates to the in vitro method disclosed herein, called "progressive DNA methylation change analysis (APDMA)", which includes the steps of studying genome-wide DNA methylation profiles of samples obtained from women with various degrees of DSM pathology (DSM1 to DSM3). , compared with control samples obtained from healthy women, to obtain CG identifiers (CGIDs) as DNA methylation biomarkers that, when combined, predict, using the linear regression model described here, cervical cancer with sensitivity and specificity >95% in publicly available methylation profiles of cervical cancer.

Другая задача настоящего изобретения относится к молекулярным биомаркерам в качестве индикаторов популяционного скрининга женщин для раннего выявления рака шейки матки, а также для оценки риска развития рака шейки матки у женщин с патологиями от ДШМ1 до ДШМ3.Another objective of the present invention relates to molecular biomarkers as indicators of population screening of women for the early detection of cervical cancer, as well as for assessing the risk of developing cervical cancer in women with pathologies from DSM1 to DSM3.

Еще одна задача настоящего изобретения относится к чипу/матрице, пригодному для раннего выявления и диагностики рака шейки матки.Another object of the present invention relates to a chip/array suitable for early detection and diagnosis of cervical cancer.

Еще одна задача настоящего изобретения относится к более дешевому, точному, надежному, высокочувствительному, специфичному и высокопроизводительному диагностическому набору для точной ранней диагностики рака шейки матки человека, пригодному для применения любым специалистом в данной области техники.Another object of the present invention relates to a lower cost, accurate, reliable, highly sensitive, specific and high throughput diagnostic kit for accurate early diagnosis of human cervical cancer, suitable for use by any person skilled in the art.

Сущность изобретенияThe essence of the invention

Соответственно, настоящее изобретение относится к способам и материалам, пригодным для изучения изменений метилирования ДНК, и относится к CGID биомаркерам метилирования ДНК для раннего выявления и диагностики рака шейки матки, при котором прогрессирование предраковых поражений шейки матки (дисплазия шейки матки, ДШМ 1-3 степени) коррелирует с повышенной частотой метилирования ДНК в положениях CG в геноме человека, в форме зонда-идентификатора Illumina или числа метилирования ДНК или CG-идентификаторов (CGID), которые получают с использованием раскрытого в настоящем изобретении in vitro способа «анализа прогрессирующих изменений метилирования ДНК» (APDMA), как описано в настоящем изобретении. Как подробно обсуждается ниже, обычно эти биомаркеры основаны на переменных, которые позволяют прогнозировать риск у женщин с патологиями от ДШМ1 до ДШМ3, а также в популяционных скринингах на развитие рака шейки матки и, в свою очередь, пригодны в качестве биомаркеров раннего выявления и диагностики. Настоящее изобретение предусматривает, что указанные положения биомаркеров CGID почти однородно метилированы при раке шейки матки и почти однородно неметилированы в образцах из нормальной шейки матки. Таким образом, настоящее изобретение относится к указанному набору «однозначно» различных профилей метилирования ДНК, которые создают бинарную дифференциацию между раком шейки матки и доброкачественными тканями по профилю метилирования ДНК в этих сайтах CGID, в результате чего эти сайты метилированы только при раке шейки матки и полностью неметилирован в незлокачественной ткани. Более того, как раскрыто в настоящем изобретении, эти сайты биомаркеров показывают возрастающую частоту метилирования ДНК по мере прогрессирования предраковых поражений шейки матки, переходящих от ДШМ1 к ДШМ3. Таким образом, настоящее изобретение относится к способу раннего выявления и диагностики in vitro с использованием направленной амплификации указанных биомаркеров CGID и глубокого бисульфитного секвенирования следующего поколения для обнаружения даже нескольких молекул клеток рака шейки матки или даже клеток из предраковых поражений на пути к превращению в рак шейки матки на фоне преимущественно нормального клеточного профиля шейки матки. Таким образом, настоящее изобретение применимо для пока еще недоступного раннего обнаружения клеток рака шейки матки на высоком фоне незлокачественной ткани, в частности, с использованием цервикальных образцов, таких как мазки по Папаниколау, в качестве простого и удобного метода раннего обнаружения, пригодного для использования любым специалистом в данной области техники.Accordingly, the present invention relates to methods and materials suitable for studying changes in DNA methylation, and relates to CGID DNA methylation biomarkers for the early detection and diagnosis of cervical cancer in which the progression of precancerous lesions of the cervix (cervical dysplasia, grade 1-3 ) correlates with an increased frequency of DNA methylation at CG positions in the human genome, in the form of an Illumina identifier probe or DNA methylation number or CG identifiers (CGID), which are obtained using the in vitro method disclosed in the present invention for “assaying progressive changes in DNA methylation” (APDMA) as described in the present invention. As discussed in detail below, these biomarkers are typically based on variables that predict risk in women with CCM1 to CCM3, as well as in population-based cervical cancer screenings, and are in turn useful as biomarkers for early detection and diagnosis. The present invention provides that these CGID biomarker positions are nearly uniformly methylated in cervical cancer and nearly uniformly unmethylated in normal cervical samples. Thus, the present invention relates to a specified set of “unambiguously” different DNA methylation profiles that create a binary differentiation between cervical cancer and benign tissues based on the DNA methylation profile at these CGID sites, whereby these sites are methylated only in cervical cancer and completely unmethylated in non-malignant tissue. Moreover, as disclosed herein, these biomarker sites show an increasing frequency of DNA methylation as cervical precancerous lesions progress from DSM1 to DSM3. Thus, the present invention relates to a method for early detection and diagnosis in vitro using targeted amplification of specified CGID biomarkers and deep bisulfite next generation sequencing to detect even a few molecules of cervical cancer cells or even cells from precancerous lesions on the way to becoming cervical cancer against the background of a predominantly normal cellular profile of the cervix. Thus, the present invention is applicable to the as yet unavailable early detection of cervical cancer cells in a high background of non-cancerous tissue, in particular using cervical samples such as Pap smears, as a simple and convenient early detection method suitable for use by any specialist in this field of technology.

Вариант осуществления настоящего изобретения относится к in vitro способу получения высокопрогнозируемых сайтов для рака шейки матки для его раннего выявления даже на бессимптомных и предраковых стадиях, называемому «способ анализа прогрессирующих изменений метилирования ДНК (APDMA)», с использованием различных источников данных о метилировании ДНК по всему геному, полученных с помощью секвенирования следующего поколения, включая чипы MeDIP, секвенирование MeDIP и т.д., полученные в виде сигнатур CGID биомаркеров метилирования ДНК. Настоящее изобретение относится к комбинации «однозначных» CGID биомаркеров для выявления рака шейки матки в исследуемом наборе данных со всего генома, полученных из образцов прогрессирующих предраковых поражений, переходящих от ДШМ1 к ДШМ3.An embodiment of the present invention relates to an in vitro method for obtaining highly predictive sites for cervical cancer for early detection even in asymptomatic and precancerous stages, called the "progressive DNA methylation change analysis (APDMA) method", using various sources of DNA methylation data throughout genome obtained through next generation sequencing, including MeDIP chips, MeDIP sequencing, etc., obtained in the form of CGID signatures of DNA methylation biomarkers. The present invention relates to a combination of “unambiguous” CGID biomarkers for the detection of cervical cancer in a genome-wide data set of interest obtained from samples of progressive precancerous lesions progressing from DSM1 to DSM3.

Предыдущие способы анализы, разработанные до настоящего изобретения, в которых использовался классический дизайн «случай-контроль» и логистическая регрессия, выявили CGID биомаркеры метилирования ДНК, которые обнаруживают рак с более низкой чувствительностью и специфичностью. Таким образом, другой вариант осуществления настоящего изобретения относится к реализованному на компьютере способу получения кандидатных биомаркеров метилирования ДНК для раннего выявления для диагностики рака шейки матки, называемому способ APDMA, который выявляет самые ранние профили метилирования рака, которые являются первичными и важными для ракового состояния и, таким образом, присутствуют во всех образцах рака шейки матки, протестированных при создании настоящего изобретения.Previous assays developed prior to the present invention, which used classical case-control designs and logistic regression, identified CGID DNA methylation biomarkers that detect cancer with lower sensitivity and specificity. Thus, another embodiment of the present invention relates to a computer-implemented method for obtaining DNA methylation biomarker candidates for early detection for the diagnosis of cervical cancer, called the APDMA method, which identifies the earliest cancer methylation profiles that are primary and important for the cancerous condition and, thus present in all cervical cancer samples tested during the making of the present invention.

Вариант осуществления настоящего изобретения относится к in vitro способу, который точно определяет рак шейки матки путём измерения метилирования ДНК в полигенном наборе CGID биомаркеров у сотен людей одновременно, путём последовательной амплификации с праймерами, специфичными для мишени, затем с праймерами, специфичными для «штрих-кодов» и мультиплексного секвенирования в одной реакции секвенирования нового поколения Miseq, с последующим извлечением данных и количественной оценки метилирования.An embodiment of the present invention relates to an in vitro method that accurately detects cervical cancer by measuring DNA methylation in a polygenic panel of CGID biomarkers in hundreds of individuals simultaneously, through sequential amplification with target-specific primers, then with barcode-specific primers ” and multiplex sequencing in a single Miseq next-generation sequencing reaction, followed by data extraction and methylation quantification.

Вариант осуществления настоящего изобретения относится к способу измерения метилирования указанных CGID биомаркеров метилирования ДНК in vitro с использованием метода пиросеквенирования или ПЦР, специфичной для метилирования. В настоящем изобретении раскрыт расчет полигенного взвешенного показателя метилирования, который позволяет прогнозировать рак шейки матки.An embodiment of the present invention relates to a method for measuring methylation of specified CGID DNA methylation biomarkers in vitro using a pyrosequencing or methylation-specific PCR method. The present invention discloses the calculation of a polygenic weighted methylation score that predicts cervical cancer.

Вариант осуществления настоящего изобретения относится к панели биомаркеров метилирования ДНК для скрининга, диагностики, раннего выявления и прогнозирования рака шейки матки в образце ДНК, выделенной из образца, взятого у женщины, включая женщин, не имеющих других клинических признаков рака шейки матки, из образцов шейки матки.An embodiment of the present invention relates to a panel of DNA methylation biomarkers for screening, diagnosis, early detection and prognosis of cervical cancer in a DNA sample isolated from a sample collected from a woman, including women with no other clinical evidence of cervical cancer, from cervical samples .

Вариант осуществления настоящего изобретения относится к панели биомаркеров метилирования ДНК в форме чипа для скрининга, диагностики, раннего выявления и прогнозирования рака шейки матки в образце ДНК, выделенной из образца, взятого у женщины, включая женщин, не имеющих других клинических признаков рака шейки матки, из образцов шейки матки.An embodiment of the present invention relates to a panel of DNA methylation biomarkers in the form of a chip for screening, diagnosis, early detection and prognosis of cervical cancer in a sample of DNA isolated from a sample taken from a woman, including women with no other clinical evidence of cervical cancer, from cervical samples.

Вариант осуществления настоящего изобретения относится к неинвазивному способу in vitro с использованием панели биомаркеров метилирования ДНК для скрининга, диагностики, раннего выявления и прогнозирования рака шейки матки в образце ДНК, выделенной из образца, взятого у женщины, включая женщин, не имеющих других клинических признаков рака шейки матки, из образцов шейки матки.An embodiment of the present invention relates to a non-invasive in vitro method using a panel of DNA methylation biomarkers for screening, diagnosis, early detection and prognosis of cervical cancer in a DNA sample isolated from a sample collected from a woman, including women who do not have other clinical signs of cervical cancer uterus, from cervical samples.

Вариант осуществления настоящего изобретения относится к применению описанных здесь биомаркеров метилирования ДНК для скрининга, диагностики, раннего выявления и прогнозирования рака шейки матки в образце ДНК, выделенной из образца, взятого у женщины, включая женщин, не имеющих других клинических признаков рака шейки матки, из образцов шейки матки.An embodiment of the present invention relates to the use of DNA methylation biomarkers described herein for screening, diagnosis, early detection and prognosis of cervical cancer in a sample of DNA isolated from a sample taken from a woman, including women who do not have other clinical signs of cervical cancer, from the samples cervix.

Настоящее изобретение относится к надежным биомаркерам метилирования ДНК, идентифицированным с использованием положений CGID в геноме человека, которые обеспечивают высокоточную, специфичную и чувствительную оценку риска, которая может определять раннее вмешательство и лечение рака шейки матки даже у женщин на бессимптомных и предраковых стадиях. Настоящее изобретение обеспечивает простой, но эффективноый способ, который может быть применен любым специалистом в данной области техники для обнаружения рака шейки матки. Настоящее изобретение относится к применению описанных здесь CGID биомаркеров метилирования ДНК для популяционного скрининга здоровых женщин на выявление у них рака шейки матки, а также для мониторинга и оценки риска рака у женщин с инфекцией ВПЧ и предраковыми поражениями ДШМ. Настоящее изобретение демонстрирует применимость раскрытых биомаркеров метилирования ДНК при выявлении рака шейки матки в образцах ДШМ с использованием полигенной оценки на основе описанных здесь способов измерения метилирования ДНК. Настоящее изобретение также раскрывает применимость раскрытого способа получения «полигенных» CGID биомаркеров метилирования ДНК для выявления рака шейки матки с использованием любого метода, доступного специалистам в данной области техники для полногеномного бисульфитного секвенирования, такого как бисульфитное секвенирование следующего поколения, секвенирование MeDip, ионное торрент-секвенирование, чипы Illumina 450 K и микрочипы Epic и т.д., с последующим применением описанного здесь способа APDMA для обнаружения специфичных и чувствительных маркеров, пригодных для раннего и очень раннего выявления рака шейки матки, благодаря наличию у них однозначных различий в профилях метилирования ДНК между контрольными образцами здоровых людей и образцами рака шейки матки с постепенным увеличением частоты при переходе от образцов от предраковых стадий ДШМ1 к ДШМ3.The present invention relates to reliable DNA methylation biomarkers identified using CGID positions in the human genome that provide a highly accurate, specific and sensitive risk assessment that can guide early intervention and treatment of cervical cancer even in women at asymptomatic and precancerous stages. The present invention provides a simple but effective method that can be used by anyone skilled in the art for detecting cervical cancer. The present invention relates to the use of the CGID DNA methylation biomarkers described herein for population-based screening of healthy women for cervical cancer, as well as for monitoring and assessing cancer risk in women with HPV infection and precancerous cervical cancer lesions. The present invention demonstrates the utility of the disclosed DNA methylation biomarkers in detecting cervical cancer in cervical cancer samples using a polygenic assessment based on the DNA methylation measurement methods described herein. The present invention also discloses the utility of the disclosed method for generating "polygenic" CGID DNA methylation biomarkers for the detection of cervical cancer using any method available to those skilled in the art for whole genome bisulfite sequencing, such as next generation bisulfite sequencing, MeDip sequencing, ion torrent sequencing , Illumina 450 K chips and Epic microarrays, etc., followed by the application of the APDMA method described here to detect specific and sensitive markers suitable for early and very early detection of cervical cancer, due to the presence of unambiguous differences in DNA methylation profiles between control samples of healthy people and cervical cancer samples with a gradual increase in frequency during the transition from samples from precancerous stages DSM1 to DSM3.

Другие задачи, признаки и преимущества настоящего изобретения станут очевидны специалистам в данной области техники из следующего подробного описания. Однако следует понимать, что подробное описание и конкретные примеры, указывающие на некоторые варианты осуществления настоящего изобретения, даны в качестве иллюстрации, а не ограничения. Многие изменения и модификации в пределах объема настоящего изобретения могут быть сделаны без отступления от его сущности, и настоящее изобретение включает в себя все такие модификации.Other objects, features and advantages of the present invention will become apparent to those skilled in the art from the following detailed description. However, it should be understood that the detailed description and specific examples indicating certain embodiments of the present invention are given by way of illustration and not limitation. Many changes and modifications may be made within the scope of the present invention without departing from its spirit, and the present invention includes all such modifications.

Краткое описание чертежейBrief description of drawings

Фигура 1. Блок-схема для разработки способа анализа прогрессирующих изменений метилирования ДНК (APDMA) для получения биомаркеров метилирования ДНК раннего выявления. Блок-схема описывает аналитическую процедуру для разработки способа APDMA на основе профиля метилирования ДНК с использованием идентификационного анализа с зондом Illumina (CGID), который однозначно дифференцирует нормальный профиль образцов шейки матки от профиля метилирования ДНК в образцах рака шейки матки для получения «однозначных» CGID биомаркеров метилирования ДНК для раннего выявления, диагностики, а также скрининга на рак шейки матки. На этапе 1 измерения метилирования ДНК проводят у образцов шейки матки с предраковыми поражениями на стадиях от ДШМ1 до ДШМ3 в сравнении со здоровыми контрольными образцами, указанные измерения метилирования ДНК получают либо путём проведения анализа выделенной из образцов ДНК на чипе Illumina Beadchip 450K или 850K, либо путём проведения пиросеквенирования выделенной из образца ДНК, либо с помощью масс-спектрометрии (Epityper™), либо с помощью анализа метилирования на основе ПЦР и целевой амплификации области, охватывающей целевые CGID, описанные здесь, из преобразованной бисульфитом ДНК, с последующим штрих-кодированием во втором раунде амплификации и индексированного мультиплексного секвенирования на секвенаторе нового поколения Illumina. На этапе 2 выполняется способ статистического анализа для измерений метилирования ДНК, сделанных на этапе 1, где статистический анализ включает в себя анализ соотношений правильного и ложного обнаружения сигналов (ROC), анализ иерархической кластеризации или анализ нейронной сети. На этапе 3 осуществляется разработанный и раскрытый в настоящем изобретении способ «анализа прогрессирующих изменений метилирования ДНК» (APDMA) для определения положений CGID, уровни метилирования которых являются ранним предиктором или биомаркером рака шейки матки. На этапе 4 настоящее изобретение предусматривает дополнительное сужение и сокращение списка комбинаций метилирования ДНК полигенных CGID до набора биомаркеров из 16 CGID. Этот способ позволяет получить «однозначные», а не количественные различия в профилях метилирования между нормальными клетками и клетками рака шейки матки, что, в свою очередь, позволяет проводить раннее выявление, благодаря характерному переключению профиля метилирования ДНК в выбранных CGID, которые служат в качестве биомаркеров метилирования ДНК для раннего выявления, диагностики и скрининга рака шейки матки. Они служат в качестве панели кандидатов на CGID биомаркеры для раннего выявления рака шейки матки у женщин, особенно тех, у которых нет симптомов или есть предраковые поражения. Figure 1. Flowchart for development of the Progressive DNA Methylation Change Analysis (APDMA) method to obtain early detection DNA methylation biomarkers. The flowchart describes the analytical procedure for developing a DNA methylation profile-based APDMA method using an Illumina probe identification (CGID) assay that unambiguously differentiates the normal profile of cervical samples from the DNA methylation profile of cervical cancer samples to obtain “unambiguous” CGID biomarkers DNA methylation for early detection, diagnosis, and screening for cervical cancer. In step 1, DNA methylation measurements are taken on cervical specimens with precancerous lesions at stages DSM1 to DSM3 compared with healthy controls, these DNA methylation measurements are obtained either by analyzing DNA extracted from the samples on an Illumina Beadchip 450K or 850K, or by performing pyrosequencing of sample-extracted DNA, either by mass spectrometry (Epityper™) or by PCR-based methylation analysis and targeted amplification of the region encompassing the target CGIDs described here from bisulfite-converted DNA, followed by barcoding in the second round of amplification and indexed multiplex sequencing on a next-generation Illumina sequencer. In step 2, a statistical analysis method is performed on the DNA methylation measurements made in step 1, where the statistical analysis includes ROC analysis, hierarchical clustering analysis, or neural network analysis. In step 3, the "progressive DNA methylation change analysis" (APDMA) method developed and disclosed herein is carried out to identify CGID positions whose methylation levels are an early predictor or biomarker of cervical cancer. In step 4, the present invention further narrows and reduces the list of DNA methylation combinations of polygenic CGIDs to a set of biomarkers of 16 CGIDs. This method allows for "unequivocal" rather than quantitative differences in methylation profiles between normal cells and cervical cancer cells, which in turn allows for early detection due to the characteristic switching of DNA methylation profiles in selected CGIDs that serve as biomarkers DNA methylation for early detection, diagnosis and screening of cervical cancer. They serve as a panel of candidate CGID biomarkers for the early detection of cervical cancer in women, especially those who are asymptomatic or have precancerous lesions.

Фигура 2. Способ получения сайтов, частота метилирования которых прогрессивно увеличивается у предраковых стадий ДШМ. ДНК, полученная из образцов шейки матки из гистологических образцов пациентов с ДШМ1, ДШМ2 и ДШМ3; и нетрансформированные контрольные образцы от здоровых людей подвергали полногеномному анализу метилирования ДНК на чипах Illumina Epic. Уровень метилирования 7715 CGID достоверно коррелировал (q> 0,05) с прогрессированием предраковых стадий ДШМ от ДШМ1 к ДШМ3. A. Представление в браузере IGV различий в метилировании этих сайтов по всему геному по сравнению с контрольными образцами шейки матки. Верхний трек показывает положение хромосом. Второй трек показывает положение референсных последовательностей генов в геноме. Следующие треки (ΔCIN1-Ctrl, ΔCIN2-Ctrl, ΔCIN3-Ctrl) показывают разницу в среднем уровне метилирования между каждой из стадий ДШМ и контролем. Наблюдается прогрессирующее стадийное гиперметилирование. Figure 2. Method for obtaining sites whose methylation frequency progressively increases in precancerous stages of DSM. DNA obtained from cervical histological specimens from patients with DSM1, DSM2 and DSM3; and untransformed control samples from healthy individuals were subjected to genome-wide DNA methylation analysis on Illumina Epic chips. The methylation level of 7715 CGID was significantly correlated (q>0.05) with the progression of precancerous stages of DSM from DSM1 to DSM3. A. IGV browser representation of genome-wide methylation differences at these sites compared to control cervical samples. The top track shows the position of the chromosomes. The second track shows the position of reference gene sequences in the genome. The following tracks (ΔCIN1-Ctrl, ΔCIN2-Ctrl, ΔCIN3-Ctrl) show the difference in the average methylation level between each of the stages of DSM and the control. Progressive staged hypermethylation is observed.

Фигура 3. Сайты, полученные с помощью способа APDMA, однозначно различаются у образцов нормальной шейки матки и образцов рака шейки матки. A. Карта интенсивности показывает, что 79 главных CGID, частота метилирования которых увеличивается во время прогрессирования предраковых стадий шейки матки, выявляют рак шейки матки с использованием данных о метилировании ДНК у 270 пациентов (GSE68339). CGID демонстрируют совершенно различные профили метилирования при раке шейки матки и у нормальной шейки матки. Они полностью неметилированы в нормальной ткани и сильно метилированы в раковой ткани. B. Среднее метилирование для каждой из групп нормальных тканей, предраковых стадий и рака шейки матки (от ДШМ1 до ДШМ3) (синий цвет означает 0% метилирования, а темно-красный означает 100% метилирования). Figure 3. Sites obtained using the APDMA method are clearly different between normal cervical samples and cervical cancer samples. A. Heat map shows that the top 79 CGIDs whose methylation frequency increases during the progression of cervical precancerous stages detect cervical cancer using DNA methylation data from 270 patients (GSE68339). CGIDs exhibit very different methylation profiles in cervical cancer and normal cervix. They are completely unmethylated in normal tissue and highly methylated in cancerous tissue. B. Average methylation for each of the normal tissue, precancerous, and cervical cancer groups (DSM1 to DSM3) (blue indicates 0% methylation and dark red indicates 100% methylation).

Фигура 4. Специфичность и специфичность показателя метилирования бигенной ДНК, полученного с использованием способа APDMA для выявления ДНК рака шейки матки в независимой когорте. A. Расчет величины эффекта, регрессия со штрафом и многомерная линейная регрессия кратко определили подмножество двух CGID, и было вычислено уравнение линейной регрессии для прогнозирования рака шейки матки. B. Порог обнаружения рака был рассчитан при помощи ROC. C. Используя этот порог, чувствительность и специфичность этого комбинированного набора маркеров равна 1, а AUC равна 1. Figure 4. Specificity and specificity of the bigenic DNA methylation score obtained using the APDMA method for detecting cervical cancer DNA in an independent cohort. A. Effect size calculation, penalized regression, and multivariate linear regression briefly identified a subset of the two CGIDs, and the linear regression equation for predicting cervical cancer was calculated. B. Cancer detection threshold was calculated using ROC. C. Using this threshold, the sensitivity and specificity of this combined marker set are 1 and the AUC is 1.

Фигура 5. Показатель метилирования рака в отдельных образцах от контрольных ДШМ1 до ДШМ3 и пациентов с раком шейки матки. A. Показатели метилирования (прогноз рака шейки матки), рассчитанные с использованием уравнения, представленного на Фигуре 4A, для каждого из отдельных образцов из контрольной группы, от ДШМ1 до ДШМ3 и рака шейки матки, демонстрирующие увеличение показателей метилирования при прогрессирующих предраковых поражениях. B. График разброса, показывающий средний показатель метилирования для контрольной, предраковой и раковой групп. Figure 5 . Cancer methylation score in selected samples from controls DSM1 to DSM3 and patients with cervical cancer. A. Methylation scores (prediction of cervical cancer) calculated using the equation presented in Figure 4A for each of the individual control samples, DSM1 to DSM3, and cervical cancer, showing increased methylation scores with progressive precancerous lesions. B. Scatter plot showing mean methylation score for control, precancerous, and cancer groups.

Фигура 6. Корреляция между оценкой бигенного метилирования и прогрессированием от контроля через предраковые стадии до рака шейки матки. Образцы рака шейки матки от GSE68339 ДШМ1 до ДШМ3 взяты из когорты Мак-Гилла, описанной в этой заявке (присвоенный ранг Спирмена: контроль: 0, от ДШМ1 до ДШМ3: 1-3, рак шейки матки: 4). Figure 6. Correlation between bigenic methylation scores and progression from controls through precancerous stages to cervical cancer. Cervical cancer samples GSE68339 DSM1 to DSM3 are from the McGill cohort described in this application (assigned Spearman rank: control: 0, DSM1 to DSM3: 1-3, cervical cancer: 4).

Фигура 7. Валидация маркера метилирования рака шейки матки с использованием данных о метилировании ДНК из TCGA (Атлас ракового генома) (n = 312). Поскольку данные для рака шейки матки были доступны в TCGA только для одного CGID (cg13944175), авторы настоящего изобретения провели оценку метилирования для рака шейки матки, используя уравнение линейной регрессии с данными метилирования ДНК только для CGID cg13944175. Корреляцию Пирсона рассчитывали между стадией прогрессирования рака и показателем метилирования (см. Статистику в A и диаграмму корреляции в B). ДШМ1 - ДШМ 3 относятся к когорте Мак-Гилла, описанной в этой заявке. Присвоенные шкалы: контроль: 0, от ДШМ1 до ДШМ3: 1-3, рак шейки матки: 4. Figure 7. Validation of cervical cancer methylation marker using DNA methylation data from TCGA (The Cancer Genome Atlas) (n = 312). Since data for cervical cancer were available in TCGA for only one CGID (cg13944175), we performed a methylation assessment for cervical cancer using a linear regression equation with DNA methylation data for CGID cg13944175 only. Pearson correlation was calculated between cancer progression stage and methylation score (see statistics in A and correlation chart in B). DShM1 - DShM 3 belong to the McGill cohort described in this application. Assigned scales: control: 0, from DShM1 to DShM3: 1-3, cervical cancer: 4.

Фигура 8. Применение настоящего изобретения: Прогнозирование рака шейки матки в образцах от ДШМ1 до ДШМ3. Не у всех пациентов с ДШМ-1-3 развивается рак шейки матки, хотя его доля у пациентов с ДШМ3 выше, чем у пациентов с ДШМ1. В настоящем изобретении проверяется, можно ли использовать показатель метилирования, представленный на Фигуре 3, для идентификации отдельных пациентов, которые имеют показатель метилирования рака шейки матки, как доказательство применимости настоящего изобретения. A. По оси X нанесены отдельные пациенты, группы обозначены линиями под осью X. Ось Y показывает прогноз развития рака (1) и отсутствие причин рака (0). B. Количество людей с прогнозом рака в каждой группе. Как и ожидалось, прогнозирование рака увеличивается с ДШМ1 до ДШМ3. Figure 8. Application of the present invention: Prediction of cervical cancer in samples from DSM1 to DSM3. Not all patients with DSM-1-3 develop cervical cancer, although its proportion in patients with DSM3 is higher than in patients with DSM1. The present invention tests whether the methylation score presented in Figure 3 can be used to identify individual patients who have a cervical cancer methylation score as evidence of the applicability of the present invention. A. Individual patients are plotted on the X-axis, with groups indicated by lines below the X-axis. The Y-axis shows cancer prognosis (1) and absence of cancer causes (0). B. Number of people predicted to have cancer in each group. As expected, cancer prediction increases from DSM1 to DSM3.

Подробное описание изобретенияDetailed Description of the Invention

В описании вариантов осуществления изобретения может быть сделана ссылка на прилагаемые чертежи, которые составляют его часть и на которых в качестве иллюстрации показан конкретный вариант осуществления изобретения, в котором изобретение может быть реализовано на практике. Следует понимать, что могут использоваться другие варианты осуществления изобретения и могут быть внесены структурные изменения, не выходящие за рамки объема настоящего изобретения. Многие из описанных или упомянутых здесь методик и процедур хорошо известны и обычно используются специалистами в данной области техники. Если не указано иное, то все термины из данной области техники, обозначения и другие научные термины или терминология, используемые в данном описании, имеют значения, обычно понятные специалистам в данной области, к которой относится настоящее изобретение. В некоторых случаях термины с общепринятыми значениями определены здесь для ясности и/или для удобства ссылок, и включение таких определений в настоящее изобретение не обязательно должно толковаться как представляющее существенное отличие от того, что обычно понимается в данной области техники.In the description of embodiments of the invention, reference may be made to the accompanying drawings, which form a part thereof and which show by way of illustration a particular embodiment of the invention in which the invention may be practiced. It should be understood that other embodiments of the invention may be used and structural changes may be made without departing from the scope of the present invention. Many of the techniques and procedures described or referred to herein are well known and commonly used by those skilled in the art. Unless otherwise indicated, all terms of the art, symbols and other scientific terms or terminology used in this description have the meanings commonly understood by those skilled in the art to which the present invention relates. In some cases, terms with generally accepted meanings are defined herein for clarity and/or ease of reference, and the inclusion of such definitions in the present invention should not necessarily be construed as representing a significant difference from what is commonly understood in the art.

Все иллюстрации чертежей предназначены для описания выбранных вариантов настоящего изобретения и не предназначены для ограничения объема настоящего изобретения.All drawing illustrations are intended to describe selected embodiments of the present invention and are not intended to limit the scope of the present invention.

Все упомянутые здесь публикации включены в настоящее изобретение путём ссылки для раскрытия и описания аспектов, способов и/или материалов в связи с процитированными публикациями.All publications mentioned herein are incorporated herein by reference to disclose and describe aspects, methods and/or materials in connection with the cited publications.

Метилирование ДНК относится к химическим модификациям молекулы ДНК. Было обнаружено, что технологические платформы, такие как микрочип Illumina Infinium или способы, основанные на секвенировании ДНК, позволяют проводить высоконадежные и воспроизводимые измерения уровней метилирования ДНК человека. В геноме человека более 28 миллионов локусов CpG. Следовательно, определенным локусам присваиваются уникальные идентификаторы, такие как те, что находятся в базе данных локусов CpG Illumina (см., например, Technical Note: Epigenetics, CpG Loci Identification ILLUMINA Inc. 2010). Эти идентификаторы обозначения локуса CG используются в настоящем изобретении.DNA methylation refers to chemical modifications of the DNA molecule. Technology platforms such as the Illumina Infinium microarray or DNA sequencing-based methods have been found to allow highly reliable and reproducible measurements of human DNA methylation levels. There are more than 28 million CpG loci in the human genome. Consequently, certain loci are assigned unique identifiers, such as those found in the Illumina CpG Loci Database (see, for example, Technical Note: Epigenetics, CpG Loci Identification ILLUMINA Inc. 2010). These CG locus designation identifiers are used in the present invention.

Определения:Definitions:

Используемый здесь термин «CG» или «CpG», используется взаимозаменяемо и относится к динуклеотидной последовательности в ДНК, содержащей основания цитозина и гуанозина. Эти динуклеотидные последовательности могут метилироваться в ДНК человека, а также других животных. CGID раскрывает свое положение в геноме человека, как это определено манифестом Illumina 450K или манифестом Illumina EPIC (аннотации перечисленных здесь CG общедоступны по адресу https://bioconductor.org/packages/release/data/annotation/html/ IlluminaHumanMethylation450k.db.html или https://bioconductor.org/packages/release/data/annotation/html/IlluminaHumanMethylationEPICmanifest.html и установлены как пакет R IlluminaHumanMethylation450k.db (пакет R версии 2.0.9.) или IlluminaHumanMethylationEPICmanifest (пакет R версия 0.3.0).As used herein, the term "CG" or "CpG" is used interchangeably and refers to a dinucleotide sequence in DNA containing the bases cytosine and guanosine. These dinucleotide sequences can be methylated in the DNA of humans as well as other animals. A CGID discloses its position in the human genome as defined by the Illumina 450K manifesto or the Illumina EPIC manifesto (the annotations of the CGs listed here are publicly available at https://bioconductor.org/packages/release/data/annotation/html/IlluminaHumanMethylation450k.db.html or https://bioconductor.org/packages/release/data/annotation/html/IlluminaHumanMethylationEPICmanifest.html and installed as the R package IlluminaHumanMethylation450k.db (R package version 2.0.9.) or IlluminaHumanMethylationEPICmanifest (R package version 0.3.0).

Используемый здесь термин «бета-значение» относится к вычислению уровня метилирования в положении CGID, полученного путём нормализации и количественной оценки чипов Illumina 450K или EPIC с использованием отношения интенсивностей между метилированными и неметилированными зондами и формулы: значение бета = Интенсивность метилированного C / (интенсивность метилированного C + интенсивность неметилированного C) от 0 до 1, где 0 - полностью неметилированный, а 1 - полностью метилированный.As used herein, the term "beta value" refers to the calculation of the level of methylation at a CGID position obtained by normalizing and quantifying Illumina 450K or EPIC chips using the ratio of intensities between methylated and unmethylated probes and the formula: beta value = Intensity of methylated C / (intensity of methylated C+ intensity of unmethylated C) from 0 to 1, where 0 is completely unmethylated and 1 is completely methylated.

Используемый здесь термин «регрессия со штрафом» относится к статистическому методу, направленному на выявление наименьшего количества предикторов, необходимых для прогнозирования результата из большего списка биомаркеров, как реализовано, например, в статистическом пакете R, «штрафуемому», как описано в Goeman, J. J., L1 penalized estimation in the Cox proportional hazards model. Biometrical Journal 52(1), 70-84.As used herein, the term "penalized regression" refers to a statistical method aimed at identifying the smallest number of predictors needed to predict an outcome from a larger list of biomarkers, as implemented, for example, in the statistical package R, "penalized" as described in Goeman, J. J., L1 penalized estimation in the Cox proportional hazards model. Biometrical Journal 52(1), 70-84.

Используемый здесь термин «кластеризация» относится к группировке набора объектов таким образом, что объекты в одной группе (называемой кластером) более похожи (в том или ином смысле) друг на друга, чем на объекты в других группах (кластерах).As used here, the term "clustering" refers to the grouping of a set of objects in such a way that objects in one group (called a cluster) are more similar (in one sense or another) to each other than to objects in other groups (clusters).

Используемый здесь термин «иерархическая кластеризация» относится к статистическому методу, который строит иерархию «кластеров» на основе того, насколько похожи (близки) или несходны (отдалены) кластеры друг от друга, как описано, например, в Kaufman, L.; Rousseeuw, P.J. (1990). Finding Groups in Data: An Introduction to Cluster Analysis (1 ed.). New York: John Wiley. ISBN 0-471-87876-6.As used herein, the term "hierarchical clustering" refers to a statistical method that constructs a hierarchy of "clusters" based on how similar (close) or dissimilar (distant) the clusters are to each other, as described, for example, in Kaufman, L.; Rousseeuw, P.J. (1990). Finding Groups in Data: An Introduction to Cluster Analysis (1 ed.). New York: John Wiley. ISBN 0-471-87876-6.

Используемый здесь термин «анализ соотношений правильного и ложного обнаружения сигналов (ROC)» относится к статистическому методу, который создает график, который иллюстрирует работу предиктора. Истинно-положительный показатель прогноза наносится на график против ложноположительного показателя при различных настройках порогового значения для предиктора (т.е. разный % метилирования), как описано, например, в Hanley, James A.; McNeil, Barbara J. (1982). «The Meaning and Use of the Area under a Receiver Operating Characteristic (ROC) Curve». Radiology 143 (1): 29-36.As used herein, the term ROC analysis refers to a statistical method that produces a graph that illustrates the performance of a predictor. The true positive predictive rate is plotted against the false positive rate at different threshold settings for the predictor (ie, different % methylation), as described, for example, in Hanley, James A.; McNeil, Barbara J. (1982). "The Meaning and Use of the Area under a Receiver Operating Characteristic (ROC) Curve." Radiology 143(1):29-36.

Используемый здесь термин «многомерная или полигенная линейная регрессия» относится к статистическому методу, который оценивает взаимосвязь между несколькими «независимыми переменными» или «предикторами», такими как процент метилирования в нескольких CGID, и «зависимой переменной», такой как рак. Этот метод определяет «вес» или коэффициент каждого CGID при прогнозировании «результата» (зависимой переменной, такой как рак), когда в модель включены несколько «независимых переменных», таких как CGID.As used herein, the term "multivariate or polygenic linear regression" refers to a statistical method that evaluates the relationship between several "independent variables" or "predictors", such as the percentage of methylation in several CGIDs, and a "dependent variable", such as cancer. This method determines the "weight" or coefficient of each CGID in predicting an "outcome" (dependent variable such as cancer) when multiple "independent variables" such as CGID are included in the model.

Используемый здесь термин «эпигенетический» означает относящийся к химической модификации молекулы ДНК, являющийся или включающий в себя химическую модификацию молекулы ДНК. Эпигенетические факторы включают в себя добавление или удаление метильной группы, что приводит к изменению уровней метилирования ДНК. Новые молекулярные биомаркеры раннего выявления, диагностики или прогнозирования рака шейки матки, которые основаны на выявлении паттернов метилирования в геномной ДНК, такие как те, которые описаны в настоящем изобретении как биомаркеры на основе CGID, позволяют прогнозировать риск и предрасположенность к раку шейки матки даже на очень ранних стадиях, когда у женщин отсутствуют симптомы или на предраковых стадиях, прогрессирующих от ДШМ1 до ДШМ3, и они могут применяться в клинической практике эпидемиологами, медицинскими работниками, и раскрытие настоящего изобретения сделано таким образом, чтобы оно было доступным и пригодным для применения любым специалистом в данной области техники. Исключительно клинические биомаркеры, такие как мазки по Папаниколау, гистологическая идентификация, имеют долгую и успешную историю в диагностике рака шейки матки, однако их недостатком является большая степень вариабельности, и они не могут использоваться для раннего выявления рака шейки матки. Напротив, молекулярные биомаркеры, такие как эпигенетические маркеры в форме биомаркеров метилирования ДНК, до сих пор применяются редко.As used herein, the term “epigenetic” means relating to, being or involving a chemical modification of a DNA molecule. Epigenetic factors involve the addition or removal of a methyl group, resulting in changes in DNA methylation levels. New molecular biomarkers for the early detection, diagnosis or prognosis of cervical cancer that are based on the detection of methylation patterns in genomic DNA, such as those described in the present invention as CGID-based biomarkers, allow the prediction of risk and susceptibility to cervical cancer even at very early stages. early stages when women are asymptomatic or in precancerous stages progressing from DSM1 to DSM3, and can be used in clinical practice by epidemiologists, medical professionals, and the disclosure of the present invention is made in such a way that it is accessible and suitable for use by any specialist in this field of technology. Purely clinical biomarkers, such as Pap smears and histological identification, have a long and successful history in diagnosing cervical cancer, but they have the disadvantage of being highly variable and cannot be used for early detection of cervical cancer. In contrast, molecular biomarkers, such as epigenetic markers in the form of DNA methylation biomarkers, are still rarely used.

Используемый здесь термин «биомаркер метилирования ДНК» относится к положению CpG, которое потенциально метилировано. Метилирование обычно происходит в CpG-содержащей нуклеиновой кислоте. CpG-содержащая нуклеиновая кислота может присутствовать, например, в CpG-островке, дублете CpG, промоторе, интроне или экзоне гена. Например, в предоставленных здесь генетических областях потенциальные сайты метилирования охватывают промоторные/энхансерные области указанных генов. Таким образом, области могут начинаться до промотора гена и распространяться дальше в транскрибируемую область.As used herein, the term “DNA methylation biomarker” refers to a CpG position that is potentially methylated. Methylation typically occurs on CpG-containing nucleic acid. The CpG-containing nucleic acid may be present, for example, in a CpG island, CpG doublet, promoter, intron or exon of a gene. For example, in the genetic regions provided here, potential methylation sites span the promoter/enhancer regions of the indicated genes. Thus, regions can start before the gene promoter and extend further into the transcribed region.

В соответствии со способом настоящего изобретения предполагается, что частота клеток, которые демонстрируют профиль метилирования ДНК рака шейки матки, увеличивается с прогрессированием от патологий ДШМ1 к ДШМ3, и что эти профили метилирования характерны для самого раннего рака шейки матки. Во-вторых, поскольку клетки, которые превращаются в рак, редко встречаются на ранних стадиях предракового развития, профиль метилирования ДНК должен однозначно отличаться от нормального профиля клеток шейки матки, чтобы его можно было обнаружить на фоне в основном незлокачественных клеток на самых ранних стадиях. В-третьих, эти профили метилирования ДНК должны присутствовать во всех образцах полностью развитого рака шейки матки, если они являются первичной и критической характеристикой рака шейки матки. Принимая во внимание три вышеупомянутых предварительных условия, способ in vitro настоящего изобретения, называемый «анализ прогрессирующих изменений метилирования ДНК (APDMA)», включает в себя этапы изучения полногеномных профилей метилирования ДНК образцов, выделенных и полученных от женщин с различными стадиями патологии ДШМ (от ДШМ1 до ДШМ3) по сравнению со здоровыми, нетрансформированными, здоровыми контрольными образцами шейки матки после хорошо охарактеризованного генотипирования ВПЧ с использованием чипов Infinium Methylation EPIC. Настоящее изобретение относится к способу in vitro для получения зонда-идентификатора Illumina, числа метилирования ДНК или CG-идентификаторов (CGID) в качестве биомаркеров метилирования ДНК, которые при объединении предсказывают, используя описанную здесь модель линейной регрессии, рак шейки матки с чувствительностью и специфичностью > 95% в общедоступных профилях метилирования рака шейки матки. Настоящее изобретение также обеспечивает панель биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, где панель включает в себя CGID, имеющие последовательности, выбранные из группы, состоящей из SEQ ID NO:1 - SEQ ID NO:79, как указано в Таблице 1, и их комбинации, такие как включенные в короткий список подмножества последовательностей Таблицы 1, перечисленные в Таблице 2, и более короткий список подмножества CGID, перечисленные в Таблице 3, соответственно, как раскрыто здесь ниже. Таким образом, настоящее изобретение относится к двум CGID, минимально достаточных для обнаружения рака шейки матки в общедоступных данных о метилировании ДНК с чувствительностью и специфичностью, приближающейся к 1. Настоящее изобретение также относится к наборам для измерения in vitro биомаркеров метилирования ДНК в качестве уровней метилирования ДНК раскрытых CGID в ДНК, выделенной из образцов шейки матки, которые будут использоваться для популяционного скрининга женщин для раннего выявления рака шейки матки, а также для оценки риска рака шейки матки у женщин с патологиями от ДШМ1 до ДШМ3.According to the method of the present invention, it is assumed that the frequency of cells that exhibit a cervical cancer DNA methylation profile increases with progression from DSM1 to DSM3 pathologies, and that these methylation profiles are characteristic of the earliest cervical cancer. Second, because cells that become cancerous are rare in the early stages of precancerous development, the DNA methylation profile must be uniquely different from the normal profile of cervical cells to be detected in a background of mostly noncancerous cells in the earliest stages. Third, these DNA methylation profiles must be present in all fully developed cervical cancer samples if they are a primary and critical characteristic of cervical cancer. Taking into account the above three prerequisites, the in vitro method of the present invention, called "progressive DNA methylation change analysis (APDMA)", includes the steps of studying genome-wide DNA methylation profiles of samples isolated and obtained from women with various stages of DSM pathology (from DSM1 pre-DSM3) compared with healthy, untransformed, healthy control cervical samples after well-characterized HPV genotyping using Infinium Methylation EPIC chips. The present invention relates to an in vitro method for producing Illumina probe identifier, DNA methylation number or CG identifiers (CGID) as DNA methylation biomarkers that when combined predict, using the linear regression model described herein, cervical cancer with sensitivity and specificity > 95% in publicly available cervical cancer methylation profiles. The present invention also provides a panel of DNA methylation biomarkers for screening and early detection of cervical cancer, where the panel includes CGIDs having sequences selected from the group consisting of SEQ ID NO:1 - SEQ ID NO:79, as indicated in Table 1 , and combinations thereof, such as the shortlisted subsets of Table 1 sequences listed in Table 2 and the shortlisted CGID subsets listed in Table 3, respectively, as disclosed herein below. Thus, the present invention provides two CGIDs minimally sufficient to detect cervical cancer in publicly available DNA methylation data with sensitivity and specificity approaching 1. The present invention also provides kits for in vitro measurement of DNA methylation biomarkers as DNA methylation levels disclosed CGIDs in DNA isolated from cervical samples, which will be used for population-based screening of women for early detection of cervical cancer, as well as for assessing the risk of cervical cancer in women with pathologies DSM1 to DSM3.

Настоящее изобретение имеет несколько вариантов осуществления. В одном из вариантов осуществления настоящее изобретение относится к биомаркерам CGID полигенного метилирования ДНК рака шейки матки в мазках из шейки матки для раннего выявления рака шейки матки, указанная панель биомаркеров полигенного метилирования ДНК получена с использованием «способа анализа прогрессирующих изменений метилирования ДНК (APDMA)», раскрытого в настоящем изобретении, на основе данных о метилировании ДНК по всему геному, полученных с помощью методов картирования, таких как чипы Illumina 450K или 850K, полногеномного бисульфитного секвенирования с использованием различных платформ секвенирования следующего поколения, секвенирования методом иммунопреципитации метилированной ДНК (MeDIP) или гибридизации с чипами олигонуклеотидов.The present invention has several embodiments. In one embodiment, the present invention relates to CGID polygenic DNA methylation biomarkers for cervical cancer in cervical smears for early detection of cervical cancer, said panel of polygenic DNA methylation biomarkers obtained using the "Progressive DNA Methylation Change Analysis (APDMA) method" disclosed in the present invention, based on genome-wide DNA methylation data obtained using mapping techniques such as Illumina 450K or 850K chips, whole-genome bisulfite sequencing using various next-generation sequencing platforms, methylated DNA immunoprecipitation (MeDIP) sequencing, or hybridization with oligonucleotide chips.

В одном из вариантов осуществления настоящее изобретение относится к способу получения биомаркеров метилирования ДНК для выявления рака шейки матки, включающему в себя этап выполнения статистического анализа и способ «анализа прогрессирующих изменений метилирования ДНК (APDMA)», раскрытый в настоящем изобретении для измерения метилирования ДНК, полученной из образцов шейки матки предраковых поражений от ДШМ1 до ДШМ3.In one embodiment, the present invention relates to a method for obtaining DNA methylation biomarkers for detecting cervical cancer, including the step of performing statistical analysis and the "progressive DNA methylation change analysis (APDMA)" method disclosed in the present invention for measuring the methylation of DNA obtained from cervical samples of precancerous lesions from DShM1 to DShM3.

В одном из вариантов осуществления изобретения раскрытый здесь способ включает в себя выполнение статистического анализа и способа «анализа прогрессирующих изменений метилирования ДНК (APDMA)» измерения метилирования ДНК, полученной из образцов шейки матки, указанное измерение метилирования ДНК получают путём выполнения анализа Illumina Beadchip 450K или 850K извлеченной из образцов ДНК. В другом варианте осуществления изобретения указанное измерение метилирования ДНК проводят путём выполнения пиросеквенирования ДНК, выделенной из образца, или с помощью масс-спектрометрии (Epityper™), или с помощью анализов метилирования на основе ПЦР и целевой амплификации области, охватывающей целевые CGID, описанные здесь, из преобразованной бисульфитом ДНК, с последующим штрих-кодированием во втором раунде амплификации и индексированного мультиплексного секвенирования на секвенаторе нового поколения Illumina. В дополнительном варианте осуществления изобретения указанный статистический анализ включает в себя анализ соотношений правильного и ложного обнаружения сигналов (ROC). В еще одном варианте осуществления изобретения указанный статистический анализ включает в себя анализ иерархической кластеризации. В дополнительном варианте осуществления изобретения указанный статистический анализ включает в себя нейросетевой анализ.In one embodiment of the invention, the method disclosed herein includes performing a statistical analysis and "progressive DNA methylation change analysis (APDMA)" method of measuring DNA methylation obtained from cervical samples, said DNA methylation measurement being obtained by performing an Illumina Beadchip 450K or 850K assay DNA extracted from samples. In another embodiment of the invention, said DNA methylation measurement is performed by performing pyrosequencing of DNA isolated from a sample, either by mass spectrometry (Epityper™), or by PCR-based methylation assays and targeted amplification of a region encompassing the target CGIDs described herein. from bisulfite-converted DNA, followed by barcoding in a second round of amplification and indexed multiplex sequencing on an Illumina next-generation sequencer. In a further embodiment of the invention, said statistical analysis includes analysis of ratios of correct and false detections of signals (ROC). In yet another embodiment of the invention, said statistical analysis includes hierarchical clustering analysis. In a further embodiment of the invention, said statistical analysis includes neural network analysis.

В одном из вариантов осуществления настоящее изобретение относится к in vitro способу получения ранних предикторов рака шейки матки, включающему в себя следующие этапы: (a) измерение метилирования образца ДНК, выделенного из образца шейки матки, (b) выполнение статистического анализа результатов измерения метилирования ДНК, полученных на этапе a, (c) определение статуса метилирования ДНК множества независимых геномных положений CG, называемых CG-идентификаторами (CGID), путём выполнения анализа прогрессивных изменений метилирования ДНК (APDMA) профилей метилирования ДНК всего генома, полученных на этапе b, (d) классификация CGID на основе частоты их метилирования ДНК, коррелирующей с прогрессированием предраковой стадии рака шейки матки, (e) получение кандидатных CGID из классификации на этапе d для получения ранних предикторов рака шейки матки в виде биомаркеров метилирования ДНК.In one embodiment, the present invention relates to an in vitro method for obtaining early predictors of cervical cancer, comprising the following steps: (a) measuring the methylation of a sample of DNA isolated from a sample of the cervix, (b) performing a statistical analysis of the results of the DNA methylation measurement, obtained in step a, (c) determining the DNA methylation status of multiple independent genomic CG positions, called CG identifiers (CGIDs), by performing progressive DNA methylation change analysis (APDMA) of the genome-wide DNA methylation profiles obtained in step b, (d) classification of CGIDs based on their DNA methylation frequency correlated with the progression of precancerous stage of cervical cancer, (e) derivation of candidate CGIDs from the classification in step d to obtain early predictors of cervical cancer in the form of DNA methylation biomarkers.

В другом варианте осуществления настоящее изобретение относится к in vitro способу получения ранних предикторов рака шейки матки, включающему в себя следующие этапы: (a) измерение метилирования образца ДНК, выделенного из образца шейки матки, (b) выполнение статистического анализа результатов измерения метилирования ДНК, полученных на этапе a, (c) определение статуса метилирования ДНК множества независимых геномных положений CG, называемых CG-идентификаторами (CGID), путём выполнения анализа прогрессивных изменений метилирования ДНК (APDMA) профилей метилирования ДНК всего генома, полученных на этапе b, (d) классификация CGID на основе частоты их метилирования ДНК, коррелирующей с прогрессированием предраковой стадии рака шейки матки, (e) получение кандидатных CGID из классификации на этапе d для получения ранних предикторов рака шейки матки в виде биомаркеров метилирования ДНК, где указанное измерение метилирования ДНК выполняется с использованием методов, включающих в себя чипы Illumina 27K, 450K или 850K, бисульфитное секвенирование всего генома на платформах, включающих в себя секвенаторы HiSeq, MiniSeq, MiSeq или NextSeq, торрент-секвенирование, секвенирование с помощью иммунопреципитации метилированной ДНК (MeDIP), гибридизацию с чипами олигонуклеотидов, пиросеквенирование ДНК, анализы метилирования на основе масс-спектрометрии (Epityper™) или ПЦР.In another embodiment, the present invention relates to an in vitro method for obtaining early predictors of cervical cancer, comprising the following steps: (a) measuring the methylation of a DNA sample isolated from a cervical sample, (b) performing a statistical analysis of the DNA methylation measurements obtained in step a, (c) determination of the DNA methylation status of multiple independent genomic CG positions, called CG identifiers (CGIDs), by performing progressive DNA methylation change analysis (APDMA) of the genome-wide DNA methylation profiles obtained in step b, (d) classification CGIDs based on their DNA methylation frequency correlated with the progression of precancerous stage of cervical cancer, (e) deriving candidate CGIDs from the classification in step d to obtain early predictors of cervical cancer in the form of DNA methylation biomarkers, where said DNA methylation measurement is performed using methods , including Illumina 27K, 450K or 850K chips, whole genome bisulfite sequencing on platforms including HiSeq, MiniSeq, MiSeq or NextSeq sequencers, torrent sequencing, methylated DNA immunoprecipitation (MeDIP) sequencing, hybridization with oligonucleotide chips, DNA pyrosequencing, mass spectrometry-based (Epityper™) or PCR-based methylation assays.

В еще одном варианте осуществления настоящее изобретение относится к in vitro способу получения ранних предикторов рака шейки матки, включающему в себя следующие этапы: (a) измерение метилирования образца ДНК, выделенного из образца шейки матки, (b) выполнение статистического анализа результатов измерения метилирования ДНК, полученных на этапе a, (c) определение статуса метилирования ДНК множества независимых геномных положений CG, называемых CG-идентификаторами (CGID), путём выполнения анализа прогрессивных изменений метилирования ДНК (APDMA) профилей метилирования ДНК всего генома, полученных на этапе b, (d) классификация CGID на основе частоты их метилирования ДНК, коррелирующей с прогрессированием предраковой стадии рака шейки матки, (e) получение кандидатных CGID из классификации на этапе d для получения ранних предикторов рака шейки матки в виде биомаркеров метилирования ДНК, где указанный статистический анализ результатов измерения метилирования ДНК включает в себя корреляцию Пирсона, анализ соотношений правильного и ложного обнаружения сигналов (ROC) и иерархический кластерный анализ.In yet another embodiment, the present invention relates to an in vitro method for obtaining early predictors of cervical cancer, comprising the following steps: (a) measuring the methylation of a DNA sample isolated from a cervical sample, (b) performing a statistical analysis of the results of the DNA methylation measurement, obtained in step a, (c) determining the DNA methylation status of multiple independent genomic CG positions, called CG identifiers (CGIDs), by performing progressive DNA methylation change analysis (APDMA) of the genome-wide DNA methylation profiles obtained in step b, (d) classification of CGIDs based on their DNA methylation frequency correlated with the progression of precancerous stage of cervical cancer, (e) derivation of candidate CGIDs from the classification in step d to obtain early predictors of cervical cancer in the form of DNA methylation biomarkers, where specified statistical analysis of DNA methylation measurement results includes Pearson correlation, ROC analysis, and hierarchical cluster analysis.

В другом варианте осуществления настоящее изобретение относится к in vitro способу получения ранних предикторов рака шейки матки, включающему в себя следующие этапы: (a) измерение метилирования образца ДНК, выделенного из образца шейки матки, (b) выполнение статистического анализа результатов измерения метилирования ДНК, полученных на этапе a, (c) определение статуса метилирования ДНК множества независимых геномных положений CG, называемых CG-идентификаторами (CGID), путём выполнения анализа прогрессивных изменений метилирования ДНК (APDMA) профилей метилирования ДНК всего генома, полученных на этапе b, (d) классификация CGID на основе частоты их метилирования ДНК, коррелирующей с прогрессированием предраковой стадии рака шейки матки, (e) получение кандидатных CGID из классификации на этапе d для получения ранних предикторов рака шейки матки в виде биомаркеров метилирования ДНК, где указанное прогрессирование предраковой стадии рака шейки матки включает в себя поражения при дисплазии шейки матки на стадиях ДШМ, ДШМ2 и ДШМ3.In another embodiment, the present invention relates to an in vitro method for obtaining early predictors of cervical cancer, comprising the following steps: (a) measuring the methylation of a DNA sample isolated from a cervical sample, (b) performing a statistical analysis of the DNA methylation measurements obtained in step a, (c) determination of the DNA methylation status of multiple independent genomic CG positions, called CG identifiers (CGIDs), by performing progressive DNA methylation change analysis (APDMA) of the genome-wide DNA methylation profiles obtained in step b, (d) classification CGIDs based on the frequency of their DNA methylation correlated with the progression of the precancerous stage of cervical cancer, (e) deriving candidate CGIDs from the classification in step d to obtain early predictors of cervical cancer in the form of DNA methylation biomarkers, where the specified progression of the precancerous stage of cervical cancer includes includes lesions in cervical dysplasia at the stages of DSM, DSM2 and DSM3.

В альтернативном варианте осуществления настоящее изобретение относится к in vitro способу получения ранних предикторов рака шейки матки, включающему в себя следующие этапы: (a) измерение метилирования образца ДНК, выделенного из образца шейки матки, (b) выполнение статистического анализа результатов измерения метилирования ДНК, полученных на этапе a, (c) определение статуса метилирования ДНК множества независимых геномных положений CG, называемых CG-идентификаторами (CGID), путём выполнения анализа прогрессивных изменений метилирования ДНК (APDMA) профилей метилирования ДНК всего генома, полученных на этапе b, (d) классификация CGID на основе частоты их метилирования ДНК, коррелирующей с прогрессированием предраковой стадии рака шейки матки, (e) получение кандидатных CGID из классификации на этапе d для получения ранних предикторов рака шейки матки в виде биомаркеров метилирования ДНК, где указанные CGID на основе частоты их метилирования ДНК, коррелирующей с прогрессированием предраковой стадии рака шейки матки, выбраны из группы CGID, как указано в SEQ ID NO:1 - SEQ ID NO:79, и их комбинации. В дополнительном варианте осуществления настоящего изобретения 79 сайтов CGID применимы по отдельности или в комбинации, в качестве ранних предикторов рака шейки матки, они обозначены как биомаркеры метилирования ДНК для раннего выявления рака шейки матки.In an alternative embodiment, the present invention relates to an in vitro method for obtaining early predictors of cervical cancer, comprising the following steps: (a) measuring the methylation of a DNA sample isolated from a cervical sample, (b) performing a statistical analysis of the DNA methylation measurements obtained in step a, (c) determination of the DNA methylation status of multiple independent genomic CG positions, called CG identifiers (CGIDs), by performing progressive DNA methylation change analysis (APDMA) of the genome-wide DNA methylation profiles obtained in step b, (d) classification CGIDs based on their DNA methylation frequency correlated with the progression of precancerous stage of cervical cancer, (e) obtaining candidate CGIDs from the classification in step d to obtain early predictors of cervical cancer in the form of DNA methylation biomarkers, where the specified CGIDs based on their DNA methylation frequency , correlating with the progression of the precancerous stage of cervical cancer, selected from the group CGID, as indicated in SEQ ID NO:1 to SEQ ID NO:79, and combinations thereof. In a further embodiment of the present invention, the 79 CGID sites are useful individually or in combination as early predictors of cervical cancer and are designated as DNA methylation biomarkers for early detection of cervical cancer.

Таблица 1: Выбранные 79 полинуклеотидов, имеющих сайты метилирования CG (CGID), применимые в вариантах осуществления настоящего изобретения. Table 1: Selected 79 polynucleotides having CG methylation sites (CGID) useful in embodiments of the present invention .

Последовательности для зонда-идентификатора Illumina для выбранных 79 CGID, используемых в различных вариантах осуществления настоящего изобретения, находятся в Таблице 1, которая включена в настоящую заявку, и включают The sequences for the Illumina probe identifier for the selected 79 CGIDs used in various embodiments of the present invention are found in Table 1, which is included herein, and include

Указанные биомаркеры были включены в окончательный список как прогрессивно метилированные CGID со средним увеличением метилирования на 10% или снижением более чем на 10% во время перехода от стадии ДШМ1 к стадии ДШМ3 и с фоновым метилированием в нормальных клетках (менее 10%) с использованием расчетов, полученных способом APDMA, раскрытым в настоящем изобретении. Метод Illumina использует преимущества последовательностей, фланкирующих локус CG, для генерации уникального идентификатора кластера локуса CG с той же стратегией, что и идентификаторы refSNP NCBI (rs#) в dbSNP.These biomarkers were shortlisted as progressively methylated CGIDs with an average increase in methylation of 10% or a decrease of more than 10% during the transition from stage DSM1 to stage DSM3 and with background methylation in normal cells (less than 10%) using calculations obtained by the APDMA method disclosed in the present invention. The Illumina method takes advantage of sequences flanking the CG locus to generate a unique CG locus cluster identifier with the same strategy as NCBI refSNP identifiers (rs#) in dbSNP.

В одном варианте осуществления настоящее изобретение относится к панели биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, где панель включает в себя CGID, полученные способом APDMA, с последовательностями, выбранными из группы, состоящей из SEQ ID NO:1 - SEQ ID NO:79 и их комбинаций, и, необязательно, указанная панель применяется в комбинации с другими биомаркерами в качестве ранних предикторов рака шейки матки.In one embodiment, the present invention relates to a panel of DNA methylation biomarkers for screening and early detection of cervical cancer, where the panel includes CGIDs obtained by the APDMA method with sequences selected from the group consisting of SEQ ID NO:1 - SEQ ID NO :79 and combinations thereof, and optionally the panel is used in combination with other biomarkers as early predictors of cervical cancer.

В одном варианте осуществления настоящего изобретения биомаркеры метилирования полигенной ДНК представляют собой комбинацию CGID из списка, приведенного ниже в Таблице 2, или короткого подмножества этого списка, такого как пример, приведенный ниже в Таблице 3, для раннего выявления рака шейки матки и риска рак шейки матки у женщин с предраковыми поражениями от ДШМ1 до ДШМ3.In one embodiment of the present invention, the polygenic DNA methylation biomarkers are a combination of CGIDs from the list shown below in Table 2, or a short subset of this list, such as the example shown below in Table 3, for early detection of cervical cancer and risk of cervical cancer in women with precancerous lesions from DSM1 to DSM3.

Таким образом, в дополнительном варианте осуществления настоящее изобретение относится к in vitro способу для получения ранних предикторов рака шейки матки, этот способ включает в себя следующие этапы: (a) измерение метилирования образца ДНК, выделенного из образца шейки матки, (b) выполнение статистического анализа результатов измерения метилирования ДНК, полученных на этапе a, (c) определение статуса метилирования ДНК множества независимых геномных положений CG, называемых CG-идентификаторами (CGID), путём выполнения анализа прогрессивных изменений метилирования ДНК (APDMA) профилей метилирования ДНК всего генома, полученных на этапе b, (d) классификация CGID на основе частоты их метилирования ДНК, коррелирующей с прогрессированием предраковой стадии рака шейки матки, (e) получение кандидатных CGID из классификации на этапе d для получения ранних предикторов рака шейки матки в виде биомаркеров метилирования ДНК, где указанные кандидатные CGID в качестве ранних предикторов рака шейки матки в виде биомаркеров метилирования ДНК, где CGID выбраны из группы, как указано в Thus, in a further embodiment, the present invention relates to an in vitro method for obtaining early predictors of cervical cancer, this method includes the following steps: (a) measuring the methylation of a DNA sample isolated from a cervical sample, (b) performing statistical analysis DNA methylation measurement results obtained in step a, (c) determining the DNA methylation status of multiple independent genomic CG positions, called CG identifiers (CGIDs), by performing progressive DNA methylation change analysis (APDMA) of genome-wide DNA methylation profiles obtained in step b, (d) classification of CGIDs based on their DNA methylation frequency, which correlates with the progression of the precancerous stage of cervical cancer, (e) deriving candidate CGIDs from the classification in step d to obtain early predictors of cervical cancer in the form of DNA methylation biomarkers, where the specified candidate CGIDs as early predictors of cervical cancer in the form of DNA methylation biomarkers, where CGIDs are selected from the group as stated in

Таблица 2: Выбранное подмножество полинуклеотидов из Таблицы 1, имеющих сайты метилирования CpG, применимые в вариантах осуществления настоящего изобретения.Table 2: Selected subset of polynucleotides from Table 1 having CpG methylation sites useful in embodiments of the present invention.

Обсуждаемые здесь 16 биомаркеров CGID находятся в Таблице 2, которая включена в данную заявку. Эти включенные в короткий список 16 биомаркеров метилирования ДНК были гиперметилированы на стадиях ДШМ3 и ДШМ1 по сравнению контролем, с наивысшей величиной эффекта (Cohen D> 1,3) между ДШМ3 и контролем и наивысшей корреляцией Спирмена с прогрессированием фаз ДШМ r > 0,4.The 16 CGID biomarkers discussed here are found in Table 2, which is included in this application. These shortlisted 16 DNA methylation biomarkers were hypermethylated in DSM3 and DSM1 stages compared with control, with the highest effect size (Cohen's D > 1.3) between DSM3 and control and the highest Spearman correlation with progression of DSM phases r > 0.4.

В одном из вариантов осуществления настоящее изобретение относится к комбинации биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, указанная комбинация включает в себя CGID, полученные с использованием способа APDMA, для выявления рака шейки матки путём измерения уровней метилирования ДНК указанных CGID в ДНК, выделенной из образцов шейки матки, и получение «предиктора метилирования рака шейки матки» с использованием уравнений линейной регрессии и анализа соотношений правильного и ложного обнаружения сигналов (ROC), где CGID выбраны из группы, указанной в SEQ ID NO: 3, SEQ NO: 4, SEQ ID NO: 7, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 31, SEQ ID NO: 34, SEQ ID NO: 39, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 49, SEQ ID NO: 56, SEQ ID NO: 57, SEQ ID NO: 58, SEQ ID NO: 65, SEQ ID NO: 70 и их комбинации.In one embodiment, the present invention relates to a combination of DNA methylation biomarkers for screening and early detection of cervical cancer, said combination includes CGIDs obtained using the APDMA method for detecting cervical cancer by measuring DNA methylation levels of said CGIDs in DNA, isolated from cervical samples, and obtaining a “cervical cancer methylation predictor” using linear regression equations and ROC (ROC) ratio analysis, where the CGIDs are selected from the group specified in SEQ ID NO: 3, SEQ NO: 4 , SEQ ID NO: 7, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 31, SEQ ID NO: 34, SEQ ID NO: 39, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 49, SEQ ID NO: 56, SEQ ID NO: 57, SEQ ID NO: 58, SEQ ID NO: 65, SEQ ID NO: 70 and combinations thereof.

Таблица 3: Выбранное подмножество полинуклеотидов из Таблицы 2, имеющих сайты метилирования CpG, используемые в вариантах осуществления изобретения.Table 3: Selected subset of polynucleotides from Table 2 having CpG methylation sites used in embodiments of the invention.

Два биомаркера CGID, а именно Two CGID biomarkers viz.

как обсуждается здесь, находятся в Таблице 3, которая включена в настоящую заявку. Подмножество в Таблице 3 представляет минимальное количество биомаркеров CGID, которые отличают предраковые поражения ДШМ3 от контроля, идентифицированные с использованием регрессия со штрафом, которая уменьшила количество CGID до 5, с последующей многомерной линейной регрессией с этими 5 CGID в качестве независимых переменных и состоянием ДШМ3 в качестве зависимой переменной. Уравнение линейной регрессии, составленное из взвешенных уровней метилирования этих двух сайтов, было очень значимым для предсказания ДШМ3 (p < 5x10-15).as discussed herein are found in Table 3, which is included herein. The subset in Table 3 represents the minimum number of CGID biomarkers that distinguish DSM3 precancerous lesions from controls, identified using penalized regression that reduced the number of CGIDs to 5, followed by multivariate linear regression with these 5 CGIDs as independent variables and DSM3 status as dependent variable. A linear regression equation constructed from the weighted methylation levels of these two sites was highly significant for predicting DSM3 (p < 5x10 -15 ).

В одном варианте осуществления настоящее изобретение относится к комбинации биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, указанная комбинация включает в себя CGID, полученные с использованием способа APDMA, для выявления рака шейки матки путём измерения уровней метилирования ДНК указанных CGID в ДНК, выделенной из образцов шейки матки, и получение «предиктора метилирования рака шейки матки» с использованием уравнений линейной регрессии и анализа соотношений правильного и ложного обнаружения сигналов (ROC), где, где указанные CGID приведены в SEQ ID NO: 3 и SEQ ID NO: 31.In one embodiment, the present invention relates to a combination of DNA methylation biomarkers for screening and early detection of cervical cancer, said combination including CGIDs obtained using the APDMA method for detecting cervical cancer by measuring DNA methylation levels of said CGIDs in DNA isolated from cervical samples, and obtaining a “cervical cancer methylation predictor” using linear regression equations and ROC (ROC) analysis, where, where the specified CGIDs are given in SEQ ID NO: 3 and SEQ ID NO: 31.

В одном из вариантов осуществления настоящее изобретение относится к набору и способу для выявления рака шейки матки, содержащему средства и реагенты для обнаружения измерений метилирования ДНК панели полигенных биомаркеров метилирования ДНК для рака шейки матки.In one embodiment, the present invention relates to a kit and method for detecting cervical cancer, comprising tools and reagents for detecting DNA methylation measurements of a panel of polygenic DNA methylation biomarkers for cervical cancer.

В одном из вариантов осуществления настоящее изобретение относится к набору для выявления рака шейки матки, содержащему средства и реагенты для измерения метилирования ДНК биомаркеров CGID из Таблицы 1 и их комбинаций.In one embodiment, the present invention provides a cervical cancer detection kit containing tools and reagents for measuring DNA methylation of the CGID biomarkers of Table 1 and combinations thereof.

В одном из вариантов осуществления настоящее изобретение относится к набору для выявления рака шейки матки, содержащему средства и реагенты для измерения метилирования ДНК CGID и получения предиктора метилирования ДНК рака шейки матки, и инструкцию по применению, где CGID представляют собой SEQ ID NO:1 - SEQ ID NO:79 и их комбинации.In one embodiment, the present invention provides a cervical cancer detection kit containing tools and reagents for measuring CGID DNA methylation and obtaining a cervical cancer DNA methylation predictor, and instructions for use, wherein the CGIDs are SEQ ID NO:1 - SEQ ID NO:79 and their combinations.

В одном из вариантов осуществления настоящее изобретение относится к набору, состоящему из панели CGID в форме чипа для выявления рака шейки матки, где панель CGID представляют собой последовательности, указанные в SEQ ID NO:1 - SEQ ID NO:79, и их комбинации.In one embodiment, the present invention provides a kit consisting of a CGID panel in the form of a chip for detecting cervical cancer, wherein the CGID panel is the sequences set forth in SEQ ID NO:1 through SEQ ID NO:79, and combinations thereof.

В одном из вариантов осуществления настоящее изобретение относится к набору, в котором используются биомаркеры CGID, раскрытые в настоящем изобретении.In one embodiment, the present invention provides a kit that uses the CGID biomarkers disclosed in the present invention.

В одном из вариантов осуществления настоящее изобретение относится к набору, использующему анализ метилирования ДНК путём пиросеквенирования для прогнозирования рака шейки матки путём измерения метилирования ДНК CGID, где CGID представляют собой последовательности, указанные в SEQ ID NO:1 - SEQ ID NO:79 и их комбинации.In one embodiment, the present invention provides a kit using DNA methylation analysis by pyrosequencing to predict cervical cancer by measuring CGID DNA methylation, wherein the CGIDs are the sequences set forth in SEQ ID NO:1 through SEQ ID NO:79 and combinations thereof .

В одном из вариантов осуществления настоящее изобретение относится к набору, использующему анализ метилирования ДНК путём пиросеквенирования для прогнозирования рака шейки матки с использованием биомаркеров CGID, перечисленных выше, например, с использованием описанных ниже праймеров и стандартных условий реакций пиросеквенирования, рекомендованных производителем (Pyromark, Qiagen):In one embodiment, the present invention provides a kit using DNA methylation analysis by pyrosequencing to predict cervical cancer using the CGID biomarkers listed above, for example, using the primers described below and standard pyrosequencing reaction conditions recommended by the manufacturer (Pyromark, Qiagen) :

Для cg03419058:For cg03419058:

Прямой (биотинилированный) праймер, указанный в SEQ ID NO:80, с полинуклеотидной последовательностью Forward (biotinylated) primer specified in SEQ ID NO:80, with polynucleotide sequence

GGTTTTTGGGTAGGAAGGATAGTAG.GGTTTTTGGGTAGGAAGGATAGTAG.

Обратный праймер, указанный в SEQ ID NO:81, с полинуклеотидной последовательностью Reverse primer specified in SEQ ID NO:81 with polynucleotide sequence

AAACAAATCTAACCCCTAAAAAAAC.AAACAAATCTAACCCCTAAAAAAAC.

Праймер для пиросеквенирования, указанный в SEQ ID NO:82, с полинуклеотидной последовательностью Pyrosequencing primer specified in SEQ ID NO:82 with polynucleotide sequence

CAAACTAAACACACTAAACC.CAAACTAAACACACTAAACC.

Для cg13944175:For cg13944175:

Прямой праймер, указанный в SEQ ID NO:83, с полинуклеотидной последовательностью Forward primer specified in SEQ ID NO:83 with polynucleotide sequence

GGGTTTTTAGGGTTGGTGGTA.GGGTTTTTAGGGTTGGTGGTA.

Обратный (биотинилированный) праймер, указанный в SEQ ID NO:84, с полинуклеотидной последовательностью Reverse (biotinylated) primer specified in SEQ ID NO:84, with polynucleotide sequence

TCCTCATAATAAATAACAACC.TCCTCATAATAAATAACAACC.

Праймер для пиросеквенирования, указанный в SEQ ID NO:85, с полинуклеотидной последовательностью Pyrosequencing primer as set forth in SEQ ID NO:85 with polynucleotide sequence

TATGTATGTGGTGGGGTT.TATGTATGTGGTGGGGTT.

В одном из вариантов осуществления настоящее изобретение относится к набору, использующему анализ метилирования ДНК путём пиросеквенирования для прогнозирования рака шейки матки путём измерения метилирования ДНК комбинаций CGID, где прямой биотинилированный праймер имеет последовательность, приведенную в SEQ ID NO:80, обратный праймер имеет последовательность, приведенную в SEQ ID NO:81, и праймер для пиросеквенирования имеет последовательность, приведенную в SEQ ID NO:82.In one embodiment, the present invention provides a kit using DNA methylation analysis by pyrosequencing to predict cervical cancer by measuring DNA methylation of CGID combinations, wherein the forward biotinylated primer has the sequence shown in SEQ ID NO:80, the reverse primer has the sequence shown in in SEQ ID NO:81, and the pyrosequencing primer has the sequence shown in SEQ ID NO:82.

В одном из вариантов осуществления настоящее изобретение относится к набору, использующему анализ метилирования ДНК путём пиросеквенирования для прогнозирования рака шейки матки путём измерения метилирования ДНК комбинаций CGID, где прямой биотинилированный праймер имеет последовательность, приведенную в SEQ ID NO:83, обратный праймер имеет последовательность, приведенную в SEQ ID NO: 84, и праймер для пиросеквенирования имеет последовательность, приведенную в SEQ ID NO:85.In one embodiment, the present invention provides a kit using DNA methylation analysis by pyrosequencing to predict cervical cancer by measuring DNA methylation of CGID combinations, wherein the forward biotinylated primer has the sequence shown in SEQ ID NO:83, the reverse primer has the sequence shown in in SEQ ID NO: 84, and the pyrosequencing primer has the sequence shown in SEQ ID NO: 85.

В одном из вариантов осуществления настоящее изобретение относится к набору, использующему анализ метилирования ДНК с секвенированием полигенных мультиплексных бисульфитных ампликонов для прогнозирования рака шейки матки в ДНК, выделенной из образцов шейки матки, с использованием биомаркеров CGID, перечисленных выше. Например, с использованием описанных ниже праймеров и стандартных условий, которые включают в себя превращение бисульфита, последовательную амплификацию с праймерами, специфичными для мишени (ПЦР1), с последующими штрих-кодирующими праймерами (ПЦР2) и мультиплексное секвенирование в одном секвенаторе Miseq следующего поколения (Illumina), демультиплексирование с использованием программного обеспечения Illumina, извлечение данных и количественную оценку метилирования с использованием стандартных методов анализа метилирования, таких как Methylkit, с последующим расчетом взвешенной оценки метилирования ДНК и прогнозированием рака.In one embodiment, the present invention provides a kit using DNA methylation analysis with polygenic multiplex bisulfite amplicon sequencing to predict cervical cancer in DNA isolated from cervical samples using the CGID biomarkers listed above. For example, using the primers described below and standard conditions that include bisulfite conversion, sequential amplification with target-specific primers (PCR1) followed by barcoding primers (PCR2), and multiplex sequencing on a single next-generation Miseq sequencer (Illumina ), demultiplexing using Illumina software, data extraction and methylation quantification using standard methylation analysis methods such as Methylkit, followed by calculation of a weighted DNA methylation score and cancer prediction.

Первую ПЦР проводят следующим образом:The first PCR is carried out as follows:

Для CGID cg03419058:For CGID cg03419058:

Прямой праймер, указанный в SEQ ID NO:80, с полинуклеотидной последовательностью Forward primer specified in SEQ ID NO:80 with polynucleotide sequence

Обратный праймер, указанный в SEQ ID NO:81, с полинуклеотидной последовательностью Reverse primer specified in SEQ ID NO:81 with polynucleotide sequence

Для CGID cg13944175:For CGID cg13944175:

Прямой праймер, указанный в SEQ ID NO:83, с полинуклеотидной последовательностью Forward primer specified in SEQ ID NO:83 with polynucleotide sequence

Обратный праймер, указанный в SEQ ID NO:84, с полинуклеотидной последовательностью Reverse primer specified in SEQ ID NO:84 with polynucleotide sequence

Для штрих-кодирования (индексации) образцов в настоящем изобретении использовали вторую реакция ПЦР со следующими праймерами:To barcode (index) samples in the present invention, a second PCR reaction was used with the following primers:

Прямой праймер, указанный в SEQ ID NO:86, с полинуклеотидной последовательностью Forward primer specified in SEQ ID NO:86, with polynucleotide sequence

Штрих-кодирующий (обратный) праймер, указанный в SEQ ID NO:87, с полинуклеотидной последовательностьюBarcoding (reverse) primer specified in SEQ ID NO:87 with polynucleotide sequence

(где красные основания являются индексом; и используется 1200 вариантов этого индекса).(where the red bases are the index; and there are 1200 variations of this index used).

В одном из вариантов осуществления настоящее изобретение относится к набору, использующему анализ метилирования с помощью бисульфитного секвенирования с мультиплексной целевой амплификацией на секвенаторе следующего поколения для выявления рака шейки матки путём измерения уровней метилирования ДНК комбинаций CGID, где CGID указаны в SEQ ID NO:1 - SEQ ID NO:79 и их комбинации.In one embodiment, the present invention provides a kit using bisulfite sequencing methylation analysis with multiplex targeted amplification on a next generation sequencer to detect cervical cancer by measuring DNA methylation levels of CGID combinations, where the CGIDs are specified in SEQ ID NO:1 - SEQ ID NO:79 and their combinations.

В другом варианте осуществления настоящее изобретение относится к набору, использующему анализ метилирования с помощью бисульфитного секвенирования с мультиплексной целевой амплификацией на секвенаторе следующего поколения для выявления рака шейки матки путём измерения уровней метилирования ДНК комбинаций CGID, где CGID, как указано в SEQ ID NO:3 содержит праймеры, указанный в SEQ ID NO:88, с полинуклеотидной последовательностью In another embodiment, the present invention provides a kit using bisulfite sequencing methylation analysis with multiplex targeted amplification on a next generation sequencer to detect cervical cancer by measuring the DNA methylation levels of CGID combinations, where the CGID as defined in SEQ ID NO:3 contains primers specified in SEQ ID NO:88, with a polynucleotide sequence

для прямого праймера и указанный в SEQ ID NO:89 с полинуклеотидной последовательностью for the forward primer and specified in SEQ ID NO:89 with the polynucleotide sequence

для обратного праймера.for reverse primer.

В другом варианте осуществления настоящее изобретение относится к набору, использующему анализ метилирования с помощью бисульфитного секвенирования с мультиплексной целевой амплификацией на секвенаторе следующего поколения для выявления рака шейки матки путём измерения уровней метилирования ДНК комбинаций CGID, где CGID, как указано в SEQ ID NO:31 содержит праймеры, указанный в SEQ ID NO:90 с полинуклеотидной последовательностью In another embodiment, the present invention provides a kit using bisulfite sequencing methylation analysis with multiplex targeted amplification on a next generation sequencer to detect cervical cancer by measuring the DNA methylation levels of CGID combinations, where the CGID as defined in SEQ ID NO:31 contains primers specified in SEQ ID NO:90 with polynucleotide sequence

для прямого праймера и указанный в SEQ ID NO:91 с полинуклеотидной последовательностью for the forward primer and specified in SEQ ID NO:91 with the polynucleotide sequence

для обратного праймера.for reverse primer.

В одном из вариантов осуществления настоящее изобретение относится к применению анализа соотношений правильного и ложного обнаружения сигналов (ROC) для выявления рака путём определения порогового значения между раком шейки матки и нормальной шейкой матки с использованием взвешенных измерений метилирования ДНК биомаркеров CGID, приведенных в Таблице 1, и их комбинаций или подмножества этих идентификаторов CGID, такие например, как приведенные в Таблице 2 и их комбинации. Образцы выше порогового значения классифицируются как раковые.In one embodiment, the present invention relates to the use of ROC analysis for cancer detection by determining the threshold between cervical cancer and normal cervix using weighted DNA methylation measurements of the CGID biomarkers shown in Table 1, and combinations thereof or subsets of these CGIDs, such as those shown in Table 2 and combinations thereof. Samples above the threshold are classified as cancerous.

В одном из вариантов осуществления настоящее изобретение относится к применению иерархического кластерного анализа для прогнозирования рака с использованием в получении положительного результата раннего обнаружения рака с использованием измерений метилирования биомаркеров CGID, перечисленных в Таблице 1, и их комбинаций.In one embodiment, the present invention relates to the use of hierarchical cluster analysis for cancer prediction using in obtaining a positive early detection of cancer using methylation measurements of the CGID biomarkers listed in Table 1, and combinations thereof.

В одном из вариантов осуществления настоящее изобретение относится к набору, использующему анализ метилирования выделенной из образца ДНК на основе масс-спектрометрии (Epityper™) или ПЦР для выявления рака путём измерения уровней метилирования ДНК комбинаций CGID в панели биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, где панель включает в себя CGID, полученные способом APDMA, имеющие последовательности, выбранные из группы, состоящей из SEQ ID NO:1 - SEQ ID NO:79 и их комбинаций, и, необязательно, указанная панель используется в комбинации с другими биомаркерами в качестве ранних предикторов рака шейки матки.In one embodiment, the present invention provides a kit using mass spectrometry-based (Epityper™) or PCR-based DNA methylation analysis of sample-extracted DNA to detect cancer by measuring DNA methylation levels of CGID combinations in a panel of DNA methylation biomarkers for cancer screening and early detection. cervix, where the panel includes CGIDs obtained by the APDMA method having sequences selected from the group consisting of SEQ ID NO:1 to SEQ ID NO:79 and combinations thereof, and optionally, said panel is used in combination with other biomarkers as early predictors of cervical cancer.

В одном из вариантов осуществления настоящее изобретение относится к применению уравнения многомерной линейной регрессии или нейросетевого анализа для расчета показателя метилирования, прогнозирующего рак шейки матки, с использованием измерений метилирования ДНК комбинаций CGID в панели биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, где панель включает в себя CGID, полученные способом APDMA, с последовательностями, выбранными из группы, состоящей из SEQ ID NO:1 - SEQ ID NO:79 и их комбинаций, и, необязательно, указанная панель используется в комбинации с другими биомаркерами в качестве ранних предикторов рака шейки матки.In one embodiment, the present invention relates to the use of a multivariate linear regression equation or neural network analysis to calculate a methylation score predictive of cervical cancer using DNA methylation measurements of CGID combinations in a panel of DNA methylation biomarkers for screening and early detection of cervical cancer, wherein the panel includes CGIDs obtained by the APDMA method with sequences selected from the group consisting of SEQ ID NO:1 to SEQ ID NO:79 and combinations thereof, and optionally said panel is used in combination with other biomarkers as early predictors of cancer cervix.

В одном из вариантов осуществления настоящее изобретение относится к применению уравнения многомерной линейной регрессии или нейросетевого анализа для расчета показателя метилирования, прогнозирующего рак шейки матки, с использованием измерений метилирования ДНК комбинаций CGID в комбинации биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, указанная комбинация включает в себя CGID, полученные с использованием способа APDMA, для выявления рака шейки матки путём измерения уровней метилирования ДНК указанных CGID в ДНК, выделенной из образцов шейки матки, и получения «предиктора метилирования рака шейки матки» с использованием уравнений линейной регрессии и анализа соотношений правильного и ложного обнаружения сигналов (ROC), где CGID выбраны из группы, состоящей из SEQ ID NO:3, SEQ NO:4, SEQ ID NO:7, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:31, SEQ ID NO:34, SEQ ID NO:39, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:49, SEQ ID NO:56, SEQ ID NO:57, SEQ ID NO:58, SEQ ID NO:65, SEQ ID NO:70 и их комбинаций.In one embodiment, the present invention relates to the use of a multivariate linear regression equation or neural network analysis to calculate a methylation score predictive of cervical cancer using DNA methylation measurements of CGID combinations in a combination of DNA methylation biomarkers for screening and early detection of cervical cancer, said combination includes CGIDs obtained using the APDMA method to detect cervical cancer by measuring the DNA methylation levels of the specified CGIDs in DNA isolated from cervical samples and obtaining a “cervical cancer methylation predictor” using linear regression equations and correlation analysis of the correct and false detection (ROC), wherein the CGIDs are selected from the group consisting of SEQ ID NO:3, SEQ NO:4, SEQ ID NO:7, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:31 , SEQ ID NO:34, SEQ ID NO:39, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:49, SEQ ID NO:56, SEQ ID NO:57, SEQ ID NO:58, SEQ ID NO:65, SEQ ID NO:70 and combinations thereof.

В альтернативном варианте осуществления настоящее изобретение относится к применению уравнения многомерной линейной регрессии или нейросетевого анализа для расчета показателя метилирования, прогнозирующего рак шейки матки, с использованием измерений метилирования ДНК комбинаций CGID в комбинации биомаркеров метилирования ДНК, где указанные CGID имеют последователности, указанные в SEQ ID NO:3 и SEQ ID NO: 31.In an alternative embodiment, the present invention relates to the use of a multivariate linear regression equation or neural network analysis to calculate a methylation score predictive of cervical cancer using DNA methylation measurements of CGID combinations in a combination of DNA methylation biomarkers, wherein said CGIDs have the sequences specified in SEQ ID NO :3 and SEQ ID NO: 31.

В одном из вариантов осуществления настоящее изобретение относится к применению анализа соотношений правильного и ложного обнаружения сигналов (ROC) для определения порога «показателя метилирования», позволяющего дифференцировать рак шейки матки от нераковой ткани шейки матки с использованием измерений комбинаций метилирования ДНК в панели биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, где панель включает в себя CGID, полученные способом APDMA, имеющие последовательности, выбранные из группы, состоящей из SEQ ID NO:1 - SEQ ID NO:79 и их комбинаций, и, необязательно, указанная панель используется в комбинация с другими биомаркерами в качестве ранних предикторов рака шейки матки.In one embodiment, the present invention relates to the use of ROC analysis to determine a "methylation score" threshold to differentiate cervical cancer from non-cancerous cervical tissue using measurements of combinations of DNA methylation in a panel of DNA methylation biomarkers for screening and early detection of cervical cancer, where the panel includes CGIDs obtained by the APDMA method having sequences selected from the group consisting of SEQ ID NO:1 to SEQ ID NO:79 and combinations thereof, and optionally said panel is used in combination with other biomarkers as early predictors of cervical cancer.

В одном из вариантов осуществления настоящее изобретение относится к применению анализа соотношений правильного и ложного обнаружения сигналов (ROC) для определения порогового значения «показателя метилирования», позволяющего дифференцировать рак шейки матки от нераковой ткани шейки матки с использованием измерений комбинаций метилирования ДНК в комбинации биомаркеров метилирования ДНК для скрининга и раннего выявления рака шейки матки, указанная комбинация включает в себя CGID, полученные с использованием способа APDMA, для выявления рака шейки матки путём измерения уровней метилирования ДНК указанных CGID в ДНК, выделенной из образцов шейки матки, и получения «предиктора метилирования рака шейки матки» с использованием уравнения линейной регрессии и анализа соотношений правильного и ложного обнаружения сигналов (ROC), где идентификаторы CGID выбраны из группы, состоящей из SEQ ID NO:3, SEQ NO:4, SEQ ID NO:7, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:31, SEQ ID NO:34, SEQ ID NO:39, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:49, SEQ ID NO:56, SEQ ID NO:57, SEQ ID NO:58, SEQ ID NO:65, SEQ ID NO:70 и их комбинаций.In one embodiment, the present invention relates to the use of ROC analysis to determine a "methylation score" threshold value for differentiating cervical cancer from non-cancerous cervical tissue using measurements of combinations of DNA methylation in combinations of DNA methylation biomarkers for screening and early detection of cervical cancer, the said combination includes CGIDs obtained using the APDMA method for detecting cervical cancer by measuring DNA methylation levels of said CGIDs in DNA isolated from cervical samples and obtaining a “cervical cancer methylation predictor” uterus" using a linear regression equation and ROC analysis, where the CGIDs are selected from the group consisting of SEQ ID NO:3, SEQ NO:4, SEQ ID NO:7, SEQ ID NO:17 , SEQ ID NO:19, SEQ ID NO:31, SEQ ID NO:34, SEQ ID NO:39, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:49, SEQ ID NO:56, SEQ ID NO:57, SEQ ID NO:58, SEQ ID NO:65, SEQ ID NO:70 and combinations thereof.

В альтернативном варианте осуществления настоящее изобретение относится к применению анализа соотношений правильного и ложного обнаружения сигналов (ROC) для определения порогового значения «показателя метилирования», позволяющего дифференцировать рак шейки матки от нераковой ткани шейки матки с использованием измерений комбинаций метилирования ДНК в комбинации биомаркеров метилирования ДНК, где указанные CGID имеют последовательности, указанные в SEQ ID NO:3 и SEQ ID NO:31.In an alternative embodiment, the present invention relates to the use of ROC analysis to determine a "methylation score" threshold value for differentiating cervical cancer from non-cancerous cervical tissue using measurements of combinations of DNA methylation in combinations of DNA methylation biomarkers, wherein said CGIDs have the sequences shown in SEQ ID NO:3 and SEQ ID NO:31.

В одном из вариантов осуществления настоящее изобретение относится к реализованному на компьютере способу получения кандидатных биомаркеров метилирования ДНК для раннего выявления для диагностики рака шейки матки, данный способ включает в себя: предоставление данных о метилировании ДНК по всему геному для множества независимых геномных положений CG, CGID генома человека; обработку данных о метилировании ДНК по всему геному путём нормализации и получения нормализованных бета-значений метилирования ДНК; вычисление корреляции Спирмена с нормализованными бета-значениями метилирования ДНК между стадиями прогрессирования предраковых состояний и неизмененными клетками шейки матки; получение кандидатных CGID при помощи анализа прогрессирующих изменений метилирования ДНК (APDMA) для получения кандидатных биомаркеров метилирования ДНК для ранней диагностики рака шейки матки.In one embodiment, the present invention relates to a computer-implemented method for obtaining candidate DNA methylation biomarkers for early detection for the diagnosis of cervical cancer, the method comprising: providing genome-wide DNA methylation data for multiple independent genomic CG, CGID positions of the genome person; processing genome-wide DNA methylation data by normalizing and obtaining normalized DNA methylation beta values; calculation of Spearman's correlation with normalized DNA methylation beta values between stages of precancerous progression and intact cervical cells; obtaining candidate CGIDs using progressive DNA methylation change analysis (APDMA) to obtain candidate DNA methylation biomarkers for early diagnosis of cervical cancer.

ПримерыExamples

Следующие ниже примеры приводятся для иллюстрации настоящего изобретения, и не должны рассматриваться как ограничивающие объем настоящего изобретения.The following examples are provided to illustrate the present invention, and should not be construed as limiting the scope of the present invention.

Пример 1: Способ анализа прогрессирующих изменений метилирования ДНК (APDMA) для идентификации и получения положений CG (CGID), уровень метилирования которых является ранним предиктором рака шейки матки. Example 1 : Progressive DNA Methylation Change Analysis (APDMA) method to identify and obtain CG positions (CGIDs) whose methylation level is an early predictor of cervical cancer.

Настоящее изобретение направлено на решение одной из важнейших задач скрининга рака шейки матки, заключающейся в нахождении надежных биомаркеров, которые обеспечивают высокоточную и чувствительную оценку риска, которая может служить ориентиром для раннего вмешательства и лечения. Обычные подходы заключаются в использовании логистической регрессии случай-контроль данных метилирования ДНК в масштабе всего генома для выявления участков, которые либо более, либо менее метилированы в раковых клетках по сравнению с контрольными. Однако хорошо известно, что многие статистически значимые изменения метилирования ДНК при раке, обнаруженные этими методами, являются гетерогенными, и многие из них развиваются на поздних стадиях прогрессирования рака и, следовательно, имеют очень ограниченную ценность для раннего выявления, поскольку они уменьшаются, когда частота раковых клеток в образце является низкой. Более того, количественные различия в профилях метилирования, а не однозначные различия могут быть стерты в смеси нормальных и раковых клеток. Как хорошо известно, метилирование ДНК является бинарным свойством, что означает, что данная клетка либо метилирована, либо у нее в определенном положении в геноме не находится CG.The present invention addresses one of the critical challenges in cervical cancer screening, which is to find reliable biomarkers that provide highly accurate and sensitive risk assessments that can guide early intervention and treatment. Common approaches are to use case-control logistic regression of genome-wide DNA methylation data to identify regions that are either more or less methylated in cancer cells compared to controls. However, it is well known that many of the statistically significant DNA methylation changes in cancer detected by these methods are heterogeneous, and many of them develop late in cancer progression and therefore have very limited value for early detection since they decrease as the incidence of cancers increases. cells in the sample is low. Moreover, quantitative differences in methylation profiles, rather than unequivocal differences, may be attenuated in mixtures of normal and cancer cells. As is well known, DNA methylation is a binary property, which means that a given cell is either methylated or does not have CG at a certain position in the genome.

В этом примере настоящее изобретение относится к выбранным метилированным CGID как фундаментальной характеристике рака шейки матки, которые почти равномерно метилированы в образцах рака шейки матки, но никогда не метилируются в нормальной ткани, и, несмотря на то, что они однозначны для рака шейки матки, они возникают очень рано на предраковых стадиях в среде нормальных клеток, и их частота постепенно увеличивается от стадий ДШМ1 к ДШМ3, прогрессирующих к раку шейки матки. Было обнаружено, что метилированные CGID, которые однозначно различаются между нормальными и раковыми тканями, обнаруживаются даже тогда, когда раковые клетки обнаруживаются с низкой частотой в образце, путём глубокого секвенирования ДНК, преобразованной бисульфитом, которое обеспечивает разрешение одной молекулы ДНК. Частота молекул с метилированным CGID представляет собой долю раковых клеток в образце. Измерения метилирования таких CGID другими методами также могут определять частоту раковых клеток в образце и могут использоваться в качестве биомаркеров метилирования ДНК для оценки риска и прогнозирования рака шейки матки в образце.In this example, the present invention relates to selected methylated CGIDs as a fundamental characteristic of cervical cancer, which are almost uniformly methylated in cervical cancer samples but are never methylated in normal tissue, and despite being unique for cervical cancer, they arise very early in the precancerous stages in the environment of normal cells, and their frequency gradually increases from stages DSM1 to DSM3, progressing to cervical cancer. Methylated CGIDs, which uniquely differ between normal and cancerous tissues, were found to be detected even when cancer cells were found at low frequency in the sample by deep sequencing of bisulfite-converted DNA, which provides single-DNA molecule resolution. The frequency of molecules with methylated CGID represents the proportion of cancer cells in the sample. Measurements of methylation of such CGIDs by other methods can also determine the frequency of cancer cells in a sample and can be used as DNA methylation biomarkers to assess risk and predict cervical cancer in a sample.

Клинически известно, что часть предраковых поражений ДШМ перерастает в рак шейки матки, поэтому они являются особенно уникальным моментом для обнаружения ранних изменений метилирования ДНК при раке. Раннее прогнозирование того, у кого разовьется рак шейки матки, имеет огромное клиническое значение. Настоящее изобретение относится к способу получения таких биомаркеров метилирования ДНК для раннего выявления, характеризующихся следующими техническими признаками: во-первых, метилированные CGID, которые были однозначно характерны для ранних раковых клеток, были однородно неметилированы в нормальной ткани шейки матки; во-вторых, эти CGID нечасто метилировались в ранних предраковых образцах; в-третьих, частота этих первичных метилированных CGID должна увеличиваться с прогрессированием предраковых стадий от ДШМ1 до ДШМ3, так как это связано с повышенным риском рака шейки матки у женщин с поражениями ДШМ3; и в-четвертых, поскольку метилирование этих CGID является основной характеристикой рака шейки матки, эти CGID должны быть равномерно многочисленными в образцах рака шейки матки. В этом примере было обнаружено, что определенные CGID, метилирование которых увеличивается с прогрессированием стадий ДШМ от ДШМ1 к ДШМ3, повсеместно метилированы в образцах рака шейки матки, в то время как было обнаружено, что они однородно неметилированы в нормальной ткани, как описано здесь. Таким образом, раскрытый здесь способ настоящего изобретения относится к панели кандидатных биомаркеров CGID для раннего выявления рака шейки матки у женщин, особенно с предраковыми поражениями.It is clinically known that a proportion of precancerous cervical cancer lesions develop into cervical cancer, making them a particularly unique time point for detecting early DNA methylation changes in cancer. Early prediction of who will develop cervical cancer is of great clinical importance. The present invention relates to a method for producing such DNA methylation biomarkers for early detection, characterized by the following technical features: first, methylated CGIDs that were uniquely characteristic of early cancer cells were uniformly unmethylated in normal cervical tissue; second, these CGIDs were infrequently methylated in early precancerous samples; third, the frequency of these primary methylated CGIDs should increase with the progression of precancerous stages from DSM1 to DSM3, as this is associated with an increased risk of cervical cancer in women with DSM3 lesions; and fourth, since methylation of these CGIDs is a core characteristic of cervical cancer, these CGIDs should be uniformly abundant in cervical cancer samples. In this example, certain CGIDs whose methylation increases with the progression of DSM stages from DSM1 to DSM3 were found to be ubiquitously methylated in cervical cancer samples, while they were found to be uniformly unmethylated in normal tissue as described here. Thus, the method of the present invention disclosed herein relates to a panel of candidate CGID biomarkers for the early detection of cervical cancer in women, especially those with precancerous lesions.

Следующие этапы способа прогрессивных изменений метилирования ДНК (APDMA) были выполнены для определения биомаркеров CGID, состояние метилирования которых выявляет ранний рак шейки матки, как показано на Фигуре 1.The following steps of the progressive DNA methylation change method (APDMA) were performed to identify CGID biomarkers whose methylation status identifies early cervical cancer, as shown in Figure 1.

Образцы шейки маткиCervical samples

В настоящем изобретении использовались образцы шейки матки, взятые у женщин, направленных на кольпоскопическое обследование в больницу Университета Мак-Гилла из-за аномального результата скрининга на рак шейки матки или для начального лечения поражения шейки матки (19). В кратком изложении, в период с июня 2015 г. по апрель 2016 г. были обследованы 643 женщины в возрасте 16-70 лет. Образцы были протестированы на наличие ДНК ВПЧ канцерогенных типов с помощью теста Roche cobas® 4800 HPV Test, который выявляет ВПЧ1 и ВПЧ18 по отдельности, а также 12 других типов, связанных с высоким риском рака шейки матки (ВПЧ 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, 66 и 68) с получением объединенного результата. Результаты цитологического исследования классифицировали в соответствии с классификацией Bethesda как NILM: внутриэпителиальные поражения и злокачественные образования отсутствуют; ASC-US: атипичные клетки плоского эпителия неясного значения; ASC-H атипичные клетки плоского эпителия, нельзя исключить высокую степень плоскоклеточного интраэпителиального поражения (HSIL); LSIL: низкая степень плоскоклеточного интраэпителиального поражения; HSIL: высокая степень плоскоклеточного интраэпителиального поражения; AGC: атипичные клетки железистого эпителия; и рак (20). Делали биопсию патологических тканей шейки матки, и гистологические результаты старшие патологоанатомы Университета Мак-Гилла оценивали как нормальные, ДШМ1, ДШМ2, ДШМ3 или инвазивный рак. Исследование получило этическое одобрение институциональных наблюдательных советов Университета Макгилла и Еврейской больницы общего профиля. Участники исследования предоставили письменное информированное согласие.The present invention used cervical samples collected from women referred for colposcopic examination at McGill University Hospital because of an abnormal screening result for cervical cancer or for initial treatment of cervical lesions (19). Briefly, 643 women aged 16–70 years were studied between June 2015 and April 2016. Samples were tested for HPV DNA of carcinogenic types using the Roche cobas® 4800 HPV Test, which detects HPV1 and HPV18 individually, as well as 12 other types associated with a high risk of cervical cancer (HPV 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, 66 and 68) to obtain a combined result. The results of the cytological examination were classified according to the Bethesda classification as NILM: no intraepithelial lesions or malignancies; ASC-US: atypical squamous epithelial cells of unknown significance; ASC-H atypical squamous cells, high grade squamous intraepithelial lesion (HSIL) cannot be excluded; LSIL: low grade squamous intraepithelial lesion; HSIL: high grade squamous intraepithelial lesion; AGC: atypical glandular epithelial cells; and cancer (20). Abnormal cervical tissue was biopsied and histological results were graded as normal, DSM1, DSM2, DSM3, or invasive cancer by senior McGill University pathologists. The study received ethical approval from the institutional review boards of McGill University and the Jewish General Hospital. Study participants provided written informed consent.

Набор образцов включал в себя 186 случайно выбранных образцов женщин, собранных врачом. Из этих образцов 50 были ДШМ1, 40 ДШМ2 и 42 ДШМ3 и 54 образцов с нормальным результатом биопсии.The sample set included 186 randomly selected female samples collected by a physician. Of these samples, 50 were DSM1, 40 DSM2 and 42 DSM3 and 54 samples had a normal biopsy result.

Выделение ДНК и анализ метилирования геномаDNA extraction and genome methylation analysis

ДНК выделяли из исходных образцов расслоенных цервикальных клеток, суспендированных в жидком цитологическом растворе PreservCyt (PreservCyt, Hologic Inc., Миссиссауга).DNA was isolated from stock samples of dissected cervical cells suspended in PreservCyt liquid cytology solution (PreservCyt, Hologic Inc., Mississauga).

ДНК, выделенную с использованием набора для экстракции ДНК Qiagen, подвергали обработке бисульфитом и гибридизации с чипами Illumina Epic с использованием стандартных процедур, описанных производителем в инновационном центре Genome Quebec в Монреале. Чипы Epic обеспечивают превосходное покрытие репертуара промоторов и энхансеров человека, охватывая все известные области, регулирующие транскрипцию (21).DNA isolated using the Qiagen DNA extraction kit was bisulfite treated and hybridized to Illumina Epic chips using standard procedures described by the manufacturer at the Genome Quebec Innovation Center in Montreal. Epic chips provide excellent coverage of the human promoter and enhancer repertoire, covering all known transcriptional regulatory regions ( 21 ).

Нормализация и получение нормализованных показателей метилирования ДНК (бета) для всех образцовNormalization and obtaining normalized DNA methylation (beta) scores for all samples

Образцы рандомизировали по препарату и положению на чипах, и все образцы гибридизовали и сканировали одновременно для смягчения групповых эффектов, как рекомендовано инновационным центром McGill Genome в Квебеке в соответствии с руководством пользователя технологии Illumina Infinium HD. Гибридизация и сканирование чипов Illumina были выполнены инновационном центре McGill Genome в Квебеке в соответствии с инструкциями производителя. Чипы Illumina проанализировали с использованием пакета ChAMP Bioconductor в версии R Morris et al., 2014 (25). Файлы IDAT использовали в качестве входных данных в функции champ.load с использованием параметров контроля качества и нормализации minfi. Необработанные данные были отфильтрованы для зондов со значением обнаружения P > 0,01 как минимум в одном образце. Настоящий метод отфильтровывает зонды на X- или Y-хромосоме для смягчения половых эффектов и зонды с ОНП, как указано в Marzouka et al., 2015 (24), а также зонды, которые выравниваются по нескольким местоположениям, как указано в Marzouka et al., 2015 (24). Групповые эффекты анализировали на ненормализованных данных с помощью функции champ.svd. Пять из первых 6 основных компонентов были связаны с группой и серией (препараты). Нормализация внутри чипа для корректировки данных на предмет погрешности, вносимой конструкцией зонда Infinium типа 2, была выполнена с использованием квантильной нормализации бета-смеси (BMIQ) с функцией champ.norm (norm = «BMIQ») (25). Затем групповые эффекты корректировали после нормализации BMIQ с использованием функции champ.runcombat.Samples were randomized by drug and chip position, and all samples were hybridized and scanned simultaneously to mitigate group effects, as recommended by the McGill Genome Innovation Center in Quebec according to the Illumina Infinium HD technology user manual. Hybridization and scanning of Illumina chips were performed at the McGill Genome Innovation Center in Quebec according to the manufacturer's instructions. Illumina chips were analyzed using the ChAMP Bioconductor package in R version Morris et al., 2014 ( 25 ). IDAT files were used as input to the champ.load function using minfi quality control and normalization parameters. Raw data were filtered for probes with a detection value of P > 0.01 in at least one sample. The present method filters out probes on the X or Y chromosome to mitigate sex effects and probes with SNPs, as reported in Marzouka et al., 2015 (24), as well as probes that align to multiple locations, as reported in Marzouka et al. , 2015 (24). Group effects were analyzed on non-normalized data using the champ.svd function. Five of the first 6 principal components were related to group and series (drugs). On-chip normalization to correct the data for bias introduced by the Infinium type 2 probe design was performed using beta mixture quantile (BMIQ) normalization with the function champ.norm (norm = “BMIQ”) ( 25 ). Group effects were then adjusted after BMIQ normalization using the champ.runcombat function.

Выявление CGID, частота метилирования которых коррелирует с прогрессированием ДШМIdentification of CGIDs whose methylation frequency correlates with the progression of DSM

Затем в настоящем способе использовали бета-значения нормализованных данных, скорректированных по группам, для вычисления корреляции Спирмена между стадиями ДШМ (с кодами стадий 0 для нетрансформированных здоровых контрольных клеток шейки матки и 1-3 для стадий ДШМ от ДШМ1 до ДШМ3) с использованием скорректированной функции Спирмена в версии R и корректировки для множественных испытаний с использованием метода «fdr» Бенджамини Хохберга (скорректированное значение P (Q) < 0,05). Уровни метилирования 7715 CGID достоверно коррелировали (q > 0,05) с прогрессированием предраковых стадий ДШМ от 1 до 3 (см. Фигуру 2). Большинство сайтов были гиперметилированы, когда предраковые поражения прогрессировали от нормального до стадии ДШМ1 и ДШМ3, в то время как небольшая часть была гипометилирована (см. фиг. 2).The present method then used the beta values of the normalized group-adjusted data to calculate the Spearman correlation between DSM stages (with stage codes 0 for untransformed healthy cervical controls and 1-3 for DSM stages DSM1 to DSM3) using the adjusted function Spearman's version of R and adjustment for multiple testing using Benjamini Hochberg's “fdr” method (adjusted P (Q) < 0.05). 7715 CGID methylation levels were significantly correlated (q > 0.05) with the progression of precancerous stages of DSM from 1 to 3 (see Figure 2). Most sites were hypermethylated as premalignant lesions progressed from normal to stage DSM1 and DSM3, while a small proportion were hypomethylated (see Fig. 2).

Составление короткого списка кандидатных CGIDShortlisting candidate CGIDs

Чтобы определить положения CGID, которые соответствуют предположениям способа APDMA, 79 прогрессивно метилированных CGID были включены в короткий список со средним увеличением метилирования на 10% или снижением более чем на 10% во время перехода от ДШМ1 к ДШМ3 и фоновым метилированием в нормальных клетках (менее 10%) (см. Таблицу 1 выше). При помощи настоящего способа затем проверяли, одинаково ли эти CGID идентифицируют рак шейки матки в общедоступных данных о метилировании ДНК по всему геному Illumina 450K из 270 образцов рака шейки матки (см. GSE68339). На основе протестированного метилирования ДНК CGID, при помощи настоящего способа затем сгенерировали карту интенсивности с этими 79 CGID, частота метилирования которых увеличивалась во время прогрессирования предраковых стадий шейки матки, которые были получены с помощью описанного здесь способа APDMA. Указанная карта интенсивности показала, что эти 79 CGID демонстрируют совершенно разные профили метилирования ДНК при раке шейки матки и в нормальной шейке матки. Явное большинство сайтов были полностью неметилированы в нормальной ткани и сильно метилированы в раковой ткани, в то время как небольшое количество сайтов было метилировано в нормальной ткани и неметилировано при раке шейки матки (см. Фигуру 3). Таким образом, настоящий способ относится к этим гиперметилированным CGID в качестве предпочтительных биомаркеров, поскольку даже низкая частота метилирования четко выявляется на фоне полностью неметилированных молекул.To identify CGID positions that meet the assumptions of the APDMA method, 79 progressively methylated CGIDs were shortlisted with an average increase in methylation of 10% or a decrease of more than 10% during the transition from DSM1 to DSM3 and background methylation in normal cells (less than 10 %) (see Table 1 above). Using the present method, we then tested whether these CGIDs identically identified cervical cancer in publicly available genome-wide Illumina 450K DNA methylation data from 270 cervical cancer samples (see GSE68339). Based on the tested DNA methylation of CGIDs, the present method then generated a heat map of these 79 CGIDs whose methylation frequency increased during the progression of cervical precancerous stages, which were obtained using the APDMA method described herein. The indicated heat map showed that these 79 CGIDs exhibit completely different DNA methylation profiles in cervical cancer and normal cervix. A clear majority of sites were completely unmethylated in normal tissue and highly methylated in cancer tissue, while a small number of sites were methylated in normal tissue and unmethylated in cervical cancer (see Figure 3). Thus, the present method treats these hypermethylated CGIDs as preferred biomarkers, since even low methylation frequencies are clearly detected against completely unmethylated molecules.

Пример 2: Выявление набора биомаркеров полигенного метилирования ДНК для раннего выявления рака шейки матки. Example 2 : Identification of a set of polygenic DNA methylation biomarkers for early detection of cervical cancer.

В настоящем описании дополнительно включены 16 CGID из списка, полученного и раскрытого в первом примере и в Таблице 1, где указанные 16 CGID были гиперметилированы при стадиях ДШМ3 и ДШМ1 по сравнению с контролем, имели наибольшую величину эффекта (Cohen D > 1,3) между ДШМ3 и контролем и наивысшую корреляцию Спирмена с прогрессированием фаз ДШМ r>0,4. (см. Таблицу 2 выше).The present description additionally includes 16 CGIDs from the list obtained and disclosed in the first example and in Table 1, where these 16 CGIDs were hypermethylated in stages DSM3 and DSM1 compared to control, had the largest effect size (Cohen's D > 1.3) between DSM3 and control and the highest Spearman correlation with the progression of DSM phases r>0.4. (See Table 2 above).

Затем, чтобы получить минимальное количество CGID, необходимое для дифференциации предраковых поражений ДШМ3 от контроля, в настоящем способе была применена регрессия со штрафом, которая уменьшила количество CGID до 5. В соответствии с настоящим способом затем проводили многомерную линейную регрессию с этими 5 CGID в качестве независимых переменных и стадией ДШМ3 в качестве зависимой переменной. Два CGID оставались значимыми (см. Таблицу 3 выше). Уравнение линейной регрессии, составленное из взвешенных уровней метилирования этих двух сайтов, было очень значимым для прогнозирования ДШМ3 (p <5x10-15).Then, to obtain the minimum number of CGIDs required to differentiate DSM3 precancerous lesions from controls, the present method applied penalized regression, which reduced the number of CGIDs to 5. In accordance with the present method, multivariate linear regression was then performed with these 5 CGIDs as independent variables and DSM3 stage as the dependent variable. Two CGIDs remained significant (see Table 3 above). A linear regression equation constructed from the weighted methylation levels of these two sites was highly significant for predicting DSM3 (p < 5x10 -15 ).

Пример 3: Применение бигенных маркеров метилирования ДНК для выявления рака шейки матки. Example 3 : Use of bigenic DNA methylation markers to detect cervical cancer.

Затем в настоящем изобретении впервые был валидирован бигенный маркер метилирования ДНК (cg03419058; cg13944175) в общедоступной базе данных метилирования ДНК 450K рака шейки матки (см. GSE68339). Модель двухвариантной линейной регрессии с раком шейки матки в качестве зависимой переменной и уровнем метилирования двух CGID (cg03419058; cg13944175) в качестве независимых переменных оказалась очень значимой (p <2,2x10-16, F = 8703, R = 0,9873). ROC для показателей метилирования (рассчитанных с использованием уравнения линейной регрессии, как показано на Фигуре 4A) сравнивали путём вычисления их площади под кривой (AUC) (см. Фигуре 4B). Чувствительность и специфичность показателя бигенного метилирования для различения рака шейки матки и нормальной ткани шейки матки составила 1 (см. Фигуру 4C).The present invention then validated for the first time a bigenic DNA methylation marker (cg03419058; cg13944175) in the public 450K cervical cancer DNA methylation database (see GSE68339). A bivariate linear regression model with cervical cancer as the dependent variable and methylation level of the two CGIDs (cg03419058; cg13944175) as independent variables was highly significant (p < 2.2x10 -16 , F = 8703, R = 0.9873). The ROCs for methylation scores (calculated using the linear regression equation as shown in Figure 4A) were compared by calculating their area under the curve (AUC) (see Figure 4B). The sensitivity and specificity of the bigenic methylation score for distinguishing cervical cancer from normal cervical tissue was 1 (see Figure 4C).

Таким образом, описанные выше биомаркеры метилирования ДНК и рассчитанный показатель метилирования применимы для скрининга и раннего выявления рака шейки матки у женщин из группы риска, а также в целом здоровой популяции женщин с использованием образцов шейки матки, взятых при рутинном гинекологическом осмотре из мазков по Папаниколау.Thus, the DNA methylation biomarkers described above and the calculated methylation score are applicable for screening and early detection of cervical cancer in women at risk, as well as in the general healthy population of women, using cervical samples obtained from routine gynecological examinations from Pap smears.

Пример 4: Применение бигенных биомаркеров метилирования ДНК для измерения показателей метилирования рака шейки матки в отдельных образцах, полученных от здоровых пациентов (контроль), пациентов со стадиями ДШМ от ДШМ1 до ДШМ3 и пациентов с раком шейки матки. Example 4 : Use of bigenic DNA methylation biomarkers to measure cervical cancer methylation indices in selected samples obtained from healthy controls, patients with DSM stages DSM1 to DSM3, and patients with cervical cancer.

Показатель метилирования (прогноз рака шейки матки) рассчитывали с использованием уравнения, представленного на Фигуре 4A, для каждого из отдельных образцов из контроля, стадий от ДШМ1 до ДШМ3 (из когорты Мак-Гилла, описанной выше в Примере 1) и рака шейки матки (см. GSE68339) (см. Фигуру 5A), (средние значения для различных групп см. на Фигуре 5B). Результаты демонстрируют увеличение показателей метилирования при распространенных предраковых поражениях, как ожидалось на основании клинических наблюдений повышенного риска рака шейки матки с прогрессированием стадий ДШМ. Показатели метилирования могут использоваться для скрининга женщин с поражениями ДШМ на предмет риска развития рака шейки матки.Methylation score (prediction of cervical cancer) was calculated using the equation presented in Figure 4A for each of the individual samples from controls, stages DSM1 to DSM3 (from the McGill cohort described in Example 1 above), and cervical cancer (see . GSE68339) (see Figure 5A), (see Figure 5B for mean values for different groups). The results demonstrate an increase in methylation scores in common precancerous lesions, as expected based on clinical observations of an increased risk of cervical cancer with progression of stages of cervical cancer. Methylation indices can be used to screen women with DSM lesions for risk of developing cervical cancer.

Пример 5: Корреляция Спирмена показателя метилирования и прогрессирования предракового состояния шейки матки в рак шейки матки. Example 5 : Spearman correlation of methylation score and progression of cervical precancerous condition to cervical cancer.

Проводили корреляционный анализ Спирмена между показателями метилирования образцов шейки матки, полученных от здоровых пациентов, пациентов с предраковыми стадиями от ДШМ1 до ДШМ3 и пациентов с раком шейки матки (контроль, n = 54; ДШМ1, n = 50; ДШМ2, n = 40; ДШМ3, n = 42; рак шейки матки, n = 270). Результаты демонстрируют очень значимую корреляцию (p<2,2x10-16 и r = 0,88) между показателем метилирования бигенного маркера и прогрессированием от предракового состояния к злокачественному состоянию (см. Фигуру 6).Spearman correlation analysis was performed between methylation indices of cervical samples obtained from healthy patients, patients with precancerous stages from DSM1 to DSM3 and patients with cervical cancer (control, n = 54; DSM1, n = 50; DSM2, n = 40; DSM3 , n = 42; cervical cancer, n = 270). The results demonstrate a highly significant correlation (p<2.2x10 -16 and r = 0.88) between the bigenic marker methylation score and progression from precancerous to malignant (see Figure 6).

Пример 6: Валидация биомаркера метилирования (cg13944175) для выявления рака шейки матки. Example 6 : Validation of a methylation biomarker (cg13944175) for cervical cancer detection.

Поскольку данные только для одного биомаркера CGID были доступны в базе данных о раке шейки матки TCGA, в настоящем изобретении рассчитывали показатель метилирования для рака шейки матки с использованием уравнения линейной регрессии с данными метилирования ДНК только для указанного CGID, cg13944175. Корреляция Спирмена была рассчитана между стадией прогрессирования рака и показателем метилирования (см. статистику на Фигуре 7A и график корреляции на Фигуре 7B). В настоящем изобретении образцы ДШМ1-ДШМ3 были получены из когорты Мак-Гилла, как уже было описано в настоящей заявке в Примере 1, и значение показателя основано на присвоенной шкале: Контроль: 0, ДШМ1-3: 1-3, соответственно, и рак шейки матки: 4.Since data for only one CGID biomarker was available in the TCGA cervical cancer database, the present invention calculated a methylation score for cervical cancer using a linear regression equation with DNA methylation data for only the specified CGID, cg13944175. Spearman correlation was calculated between cancer progression stage and methylation score (see statistics in Figure 7A and correlation plot in Figure 7B). In the present invention, samples DSM1-DSM3 were obtained from the McGill cohort, as already described herein in Example 1, and the value of the indicator is based on the assigned scale: Control: 0, DSM1-3: 1-3, respectively, and cancer cervix: 4.

Пример 7: Применение бигенного биомаркера метилирования для выявления рака шейки матки в предраковых образцах шейки матки. Example 7 : Use of a bigenic methylation biomarker to detect cervical cancer in precancerous cervical samples.

Бигенный биомаркер метилирования использовали для прогнозирования того, в каких образцах со стадиями ДШМ от ДШМ1 до ДШМ3 ДШМ будет прогрессировать до рака шейки матки. Показатели метилирования рассчитывали для каждого образца на основе значений метилирования для двух сайтов CG, полученных из данных чипов Epic. Используя пороговое значение для рака, вычисленное из сравнения образцов рака шейки матки и здоровых образцов шейки матки (см. Фигуру 3), делали прогноз для каждого из образцов (см. Фигуру 8A). Доля образцов, которые, по прогнозам, станут злокачественными, как и ожидалось, увеличивалась с нескольких образцов в образцах ДШМ1 до 60% в образцах ДШМ3, (см. Фигуру 8B).A bigenic methylation biomarker was used to predict which samples with DSM stages DSM1 to DSM3 would progress to cervical cancer. Methylation scores were calculated for each sample based on the methylation values for the two CG sites obtained from the Epic chip data. Using the cancer threshold calculated from the comparison of cervical cancer samples and healthy cervical samples (see Figure 3), a prediction was made for each of the samples (see Figure 8A). The proportion of samples predicted to become malignant, as expected, increased from a few samples in the DSM1 samples to 60% in the DSM3 samples (see Figure 8B).

Хотя настоящее изобретение было объяснено на примере его предпочтительного варианта осуществления, следует понимать, что можно сделать множество других возможных модификаций и изменений, не выходящих за рамки сущности и объема настоящего изобретения.Although the present invention has been explained by way of example of its preferred embodiment, it should be understood that many other possible modifications and changes can be made without departing from the spirit and scope of the present invention.

ПреимуществаAdvantages

Эти новые биомаркеры метилирования ДНК могут быть разработаны в качестве диагностического набора для ранней и точной диагностики рака шейки матки человека. Они являются прямыми индикаторами клеточных изменений во время инициации и развития рака шейки матки и представляют фундаментальную характеристику рака шейки матки, являясь почти однородно метилироваными в образцах рака шейки матки, но никогда не метилируясь в нормальной ткани, и их частота метилирования прогрессивно увеличивается от стадий ДШМ1 до ДШМ3 и до злокачественной стадии. Эти биомаркеры дополняют патологоанатомическую оценку для точного раннего выявления рака шейки матки при поражениях ДШМ, а также служат в качестве биомаркера для раннего выявления и прогнозирования риска развития рака шейки матки у бессимптомных женщин. Эти биомаркеры являются полезным дополнением для уже существующих эпигенетических маркеров метилирования ДНК, которые играют важную роль в регуляции генов, и могут использоваться в форме CGID в качестве инструмента диагностики. Эти биомаркеры могут обеспечить быстрый, дешевый, точный, надежный и высокопроизводительный диагностический набор для точной, ранней и пока еще не осуществимой диагностики рака шейки матки человека на еще недоступных предраковых стадиях.These new DNA methylation biomarkers can be developed as a diagnostic kit for early and accurate diagnosis of human cervical cancer. They are direct indicators of cellular changes during the initiation and development of cervical cancer and represent a fundamental characteristic of cervical cancer, being almost uniformly methylated in cervical cancer specimens but never methylated in normal tissue, and their methylation frequency increases progressively from stages DCM1 to DShM3 and up to the malignant stage. These biomarkers complement pathological assessment for accurate early detection of cervical cancer in DSM lesions and also serve as a biomarker for early detection and risk prediction of cervical cancer in asymptomatic women. These biomarkers are a useful complement to pre-existing epigenetic DNA methylation markers that play important roles in gene regulation and can be used in the form of CGID as a diagnostic tool. These biomarkers can provide a fast, low-cost, accurate, reliable, and high-throughput diagnostic kit for accurate, early, and as yet unfeasible diagnosis of human cervical cancer at yet inaccessible precancerous stages.

СсылкиLinks

1. El-Zein M, Richardson L, Franco EL. Cervical cancer screening of HPV vaccinated populations: Cytology, molecular testing, both or none. J. Clin. Virol. 2015;76:S62 - S68. doi:10.1016/j.jcv.2015.11.020.1. El-Zein M, Richardson L, Franco EL. Cervical cancer screening of HPV infected populations: Cytology, molecular testing, both or none. J. Clin. Virol. 2015;76:S62 - S68. doi:10.1016/j.jcv.2015.11.020.

2. Boers A, Wang R, van Leeuwen RW, et al. Discovery of new methylation markers to improve screening for cervical intraepithelial neoplasia grade 2/3. Clin. Epigenetics 2016;8(29). doi:10.1186/s13148-016-0196-3.2. Boers A, Wang R, van Leeuwen RW, et al. Discovery of new methylation markers to improve screening for cervical intraepithelial neoplasia grade 2/3. Clin. Epigenetics 2016;8(29). doi:10.1186/s13148-016-0196-3.

3. van Baars R, van der Marel J, Snijders PJF, et al. CADM1 and MAL methylation status in cervical scrapes is representative of the most severe underlying lesion in women with multiple cervical biopsies. Int. J. Cancer 2016;138:463 - 471. doi:10.1002/ijc.29706.3. van Baars R, van der Marel J, Snijders PJF, et al. CADM1 and MAL methylation status in cervical scrapes is representative of the most severe underlying lesion in women with multiple cervical biopsies. Int. J Cancer 2016;138:463 - 471. doi:10.1002/ijc.29706.

4. Verhoef VMJ, Van Kemenade FJ, Rozendaal L, et al. Follow-up of high-risk HPV positive women by combined cytology and bi-marker CADM1/MAL methylation analysis on cervical scrapes. Gynecol. Oncol. 2015;137(1):55 - 59. doi:10.1016/j.ygyno.2015.01.550.4. Verhoef VMJ, Van Kemenade FJ, Rozendaal L, et al. Follow-up of high-risk HPV positive women by combined cytology and bi-marker CADM1/MAL methylation analysis on cervical scrapes. Gynecol. Oncol. 2015;137(1):55 - 59. doi:10.1016/j.ygyno.2015.01.550.

5. Louvanto K, Franco EL, Ramanakumar A V, et al. Methylation of viral and host genes and severity of cervical lesions associated with human papillomavirus type 16. Int. J. Cancer 2014;00(6):1 - 8. doi:10.1002/ijc.29196.5. Louvanto K, Franco EL, Ramanakumar AV, et al. Methylation of viral and host genes and severity of cervical lesions associated with human papillomavirus type 16. Int. J Cancer 2014;00(6):1 - 8. doi:10.1002/ijc.29196.

6. Simanaviciene V, Popendikyte V, Gudleviciene Z, Zvirbliene A. Different DNA methylation pattern of HPV16, HPV18 and HPV51 genomes in asymptomatic HPV infection as compared to cervical neoplasia. Virology 2015;484:227 - 233. doi:10.1016/j.virol.2015.06.008.6. Simanaviciene V, Popendikyte V, Gudleviciene Z, Zvirbliene A. Different DNA methylation pattern of HPV16, HPV18 and HPV51 genomes in asymptomatic HPV infection as compared to cervical neoplasia. Virology 2015;484:227 - 233. doi:10.1016/j.virol.2015.06.008.

7. De Strooper LMA, Meijer CJLM, Berkhof J, et al. Methylation analysis of the FAM19A4 gene in cervical scrapes is highly efficient in detecting cervical carcinomas and advanced CIN2/3 lesions. Cancer Prev. Res. 2014;7(6):1251 - 1257. doi:10.1158/1940-6207.CAPR-14-0237.7. De Strooper LMA, Meijer CJLM, Berkhof J, et al. Methylation analysis of the FAM19A4 gene in cervical scrapes is highly efficient in detecting cervical carcinomas and advanced CIN2/3 lesions. Cancer Prev. Res. 2014;7(6):1251 - 1257. doi:10.1158/1940-6207.CAPR-14-0237.

8. Mersakova S, Nachajova M, Szepe P, Kasajova PS, Halasova E. DNA methylation and detection of cervical cancer and precancerous lesions using molecular methods. Tumor Biol. 2015. doi:10.1007/s13277-015-4197-1.8. Mersakova S, Nachajova M, Szepe P, Kasajova PS, Halasova E. DNA methylation and detection of cervical cancer and precancerous lesions using molecular methods. Tumor Biol. 2015. doi:10.1007/s13277-015-4197-1.

9. Nikolaidis C, Nena E, Panagopoulou M, et al. PAX1 methylation as an auxiliary biomarker for cervical cancer screening: a meta-analysis. Cancer Epidemiol. 2015;39(5):682 - 686. doi:10.1016/j.canep.2015.07.008.9. Nikolaidis C, Nena E, Panagopoulou M, et al. PAX1 methylation as an auxiliary biomarker for cervical cancer screening: a meta-analysis. Cancer Epidemiol. 2015;39(5):682 - 686. doi:10.1016/j.canep.2015.07.008.

10. De Strooper LMA, Hesselink AT, Berkhof J, et al. Combined CADM1/MAL methylation and cytology testing for colposcopy triage of high-risk HPV-positive women. Cancer Epidemiol. Biomarkers Prev. 2014;23(9):1933 - 1937. doi:10.1158/1055-9965.EPI-14-0347.10. De Strooper LMA, Hesselink AT, Berkhof J, et al. Combined CADM1/MAL methylation and cytology testing for colposcopy triage of high-risk HPV-positive women. Cancer Epidemiol. Biomarkers Prev. 2014;23(9):1933 - 1937. doi:10.1158/1055-9965.EPI-14-0347.

11. De Strooper LMA, Verhoef VMJ, Berkhof J, et al. Validation of the FAM19A4/mir124-2 DNA methylation test for both lavage- and brush-based self-samples to detect cervical (pre)cancer in HPV-positive women. Gynecol. Oncol. 2016. doi:10.1016/j.ygyno.2016.02.012.11. De Strooper LMA, Verhoef VMJ, Berkhof J, et al. Validation of the FAM19A4/mir124-2 DNA methylation test for both lavage- and brush-based self-samples to detect cervical (pre)cancer in HPV-positive women. Gynecol. Oncol. 2016. doi:10.1016/j.ygyno.2016.02.012.

12. Louvanto K, Franco EL, Ramanakumar A V, et al. Methylation of viral and host genes and severity of cervical lesions associated with human papillomavirus type 16. Int. J. cancer 2015;136(6):E638-45. doi:10.1002/ijc.29196.12. Louvanto K, Franco EL, Ramanakumar AV, et al. Methylation of viral and host genes and severity of cervical lesions associated with human papillomavirus type 16. Int. J. cancer 2015;136(6):E638-45. doi:10.1002/ijc.29196.

13. De Strooper LM a, van Zummeren M, Steenbergen RDM, et al. CADM1, MAL and miR124-2 methylation analysis in cervical scrapes to detect cervical and endometrial cancer. J. Clin. Pathol. 2014;67:1067 - 1071. doi:10.1136/jclinpath-2014-202616.13. De Strooper LM a, van Zummeren M, Steenbergen RDM, et al. CADM1, MAL and miR124-2 methylation analysis in cervical scrapes to detect cervical and endometrial cancer. J. Clin. Pathol. 2014;67:1067 - 1071. doi:10.1136/jclinpath-2014-202616.

14. Feng C, Dong J, Chang W, Cui M, Xu T. The Progress of Methylation Regulation in Gene Expression of Cervical Cancer. Int. J. Genomics 2018;2018.14. Feng C, Dong J, Chang W, Cui M, Xu T. The Progress of Methylation Regulation in Gene Expression of Cervical Cancer. Int. J Genomics 2018;2018.

15. Del Mistro A, Frayle H, Rizzi M, et al. Methylation analysis and HPV genotyping of self-collected cervical samples from women not responding to screening invitation and review of the literature. PLoS One 2017;12(3):1 - 13. doi:10.1371/journal.pone.0172226.15. Del Mistro A, Frayle H, Rizzi M, et al. Methylation analysis and HPV genotyping of self-collected cervical samples from women not responding to screening invitation and review of the literature. PLoS One 2017;12(3):1 - 13. doi:10.1371/journal.pone.0172226.

16. Eijsink JJH, Lendvai A, Deregowski V, et al. A four-gene methylation marker panel as triage test in high-risk human papillomavirus positive patients. Int. J. Cancer 2012;130(8):1861 - 1869. doi:10.1002/ijc.26326.16. Eijsink JJH, Lendvai A, Deregowski V, et al. A four-gene methylation marker panel as triage test in high-risk human papillomavirus positive patients. Int. J Cancer 2012;130(8):1861 - 1869. doi:10.1002/ijc.26326.

17. Verlaat W, Snoek BC, Heideman DAM, et al. Identification and validation of a 3-gene methylation classifier for HPV-based cervical screening on self-samples. Clin. Cancer Res. 2018:clincanres.3615.2017. doi:10.1158/1078-0432.CCR-17-3615.17. Verlaat W, Snoek BC, Heideman DAM, et al. Identification and validation of a 3-gene methylation classifier for HPV-based cervical screening on self-samples. Clin. Cancer Res. 2018:clincanres.3615.2017. doi:10.1158/1078-0432.CCR-17-3615.

18. Cuzick J, Bergeron C, von Knebel Doeberitz M, et al. New technologies and procedures for cervical cancer screening. Vaccine 2012;30(SUPPL.5):F107 - F116. doi:10.1016/j.vaccine.2012.05.088.18. Cuzick J, Bergeron C, von Knebel Doeberitz M, et al. New technologies and procedures for cervical cancer screening. Vaccine 2012;30(SUPPL.5):F107 - F116. doi:10.1016/j.vaccine.2012.05.088.

19. El-Zein M, Bouten S, Louvanto K, et al. Validation of a new HPV self-sampling device for cervical cancer screening: The Cervical and Self-Sample In Screening (CASSIS) study. Gynecol. Oncol. 2018. doi:https://doi.org/10.1016/j.ygyno.2018.04.004.19. El-Zein M, Bouten S, Louvanto K, et al. Validation of a new HPV self-sampling device for cervical cancer screening: The Cervical and Self-Sample In Screening (CASSIS) study. Gynecol. Oncol. 2018. doi:https://doi.org/10.1016/j.ygyno.2018.04.004.

20. Smith JHF. Bethesda 2001. Cytopathology 2002;13(1):4 - 10.20. Smith JHF. Bethesda 2001. Cytopathology 2002;13(1):4 - 10.

21. Moran S, Arribas C, Esteller M. Validation of a DNA methylation microarray for 850,000 CpG sites of the human genome enriched in enhancer sequences. Epigenomics 2016;8(3):389 - 399. doi:10.2217/epi.15.114.21. Moran S, Arribas C, Esteller M. Validation of a DNA methylation microarray for 850,000 CpG sites of the human genome enriched in enhancer sequences. Epigenomics 2016;8(3):389 - 399. doi:10.2217/epi.15.114.

22. Morris TJ, Butcher LM, Feber A, et al. ChAMP: 450k Chip Analysis Methylation Pipeline. Bioinformatics 2014;30(3):428 - 430. doi:10.1093/bioinformatics/btt684.22. Morris TJ, Butcher LM, Feber A, et al. ChAMP: 450k Chip Analysis Methylation Pipeline. Bioinformatics 2014;30(3):428 - 430. doi:10.1093/bioinformatics/btt684.

23. Luttmer R, De Strooper LMA, Berkhof J, et al. Comparing the performance of FAM19A4 methylation analysis, cytology and HPV16/18 genotyping for the detection of cervical (pre)cancer in high-risk HPV-positive women of a gynecologic outpatient population (COMETH study). Int. J. Cancer 2015;138(May 2015):992 - 1002. doi:10.1002/ijc.29824.23. Luttmer R, De Strooper LMA, Berkhof J, et al. Comparing the performance of FAM19A4 methylation analysis, cytology and HPV16/18 genotyping for the detection of cervical (pre)cancer in high-risk HPV-positive women of a gynecologic outpatient population (COMETH study). Int. J Cancer 2015;138(May 2015):992 - 1002. doi:10.1002/ijc.29824.

24. Wentzensen N, Schiffman M, Palmer T, Arbyn M. Triage of HPV positive women in cervical cancer screening. J. Clin. Virol. 2016;76:S49 - S55. doi:10.1016/j.jcv.2015.11.015.24. Wentzensen N, Schiffman M, Palmer T, Arbyn M. Triage of HPV positive women in cervical cancer screening. J. Clin. Virol. 2016;76:S49 - S55. doi:10.1016/j.jcv.2015.11.015.

25. Marzouka, N. A., Nordlund, J., Backlin, C. L., Lonnerholm, G., Syvanen, A. C., & Carlsson Almlof, J. (2015). CopyNumber450kCancer: baseline correction for accurate copy number calling from the 450k methylation array. Bioinformatics. doi:10.1093/bioinformatics/btv652.25. Marzouka, N. A., Nordlund, J., Backlin, C. L., Lonnerholm, G., Syvanen, A. C., & Carlsson Almlof, J. (2015). CopyNumber450kCancer: baseline correction for accurate copy number calling from the 450k methylation array. Bioinformatics. doi:10.1093/bioinformatics/btv652.

26. Morris, T. J., Butcher, L. M., Feber, A., Teschendorff, A. E., Chakravarthy, A. R., WojdaczT.K., & Beck, S. (2014). ChAMP: 450k Chip Analysis Methylation Pipeline. Bioinformatics, 30(3), 428-430. doi:10.1093/bioinformatics/btt684.26. Morris, T. J., Butcher, L. M., Feber, A., Teschendorff, A. E., Chakravarthy, A. R., Wojdacz T. K., & Beck, S. (2014). ChAMP: 450k Chip Analysis Methylation Pipeline. Bioinformatics , 30(3), 428-430. doi:10.1093/bioinformatics/btt684.

--->--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙLIST OF SEQUENCES

<110> ЭйчКейДжи ЭПИТЕРАПЬЮТИКС ЛИМИТЕД<110> HKG EPITHERAPUTICS LIMITED

<120> Биомаркеры метилирования ДНК для раннего выявления рака шейки <120> DNA methylation biomarkers for early detection of cervical cancer

маткиuterus

<130> TPC53811<130> TPC53811

<150> US 62/774,994<150>US 62/774,994

<151> 2018-12-04<151> 2018-12-04

<160> 91<160> 91

<170> Патентная версия 3.5<170> Patent version 3.5

<210> 1<210> 1

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 1<400> 1

gaaggaggct gcgcgccagc ccgcccgcgg cgcccgggct caggcgccgt gacggctgca gaaggaggct gcgcgccagc ccgcccgcgg cgcccgggct caggcgccgt gacggctgca

60 60

cgcgctgccc cgcactctga gggccttcat tagctcgctc cccgcgccga ggctggggcg cgcgctgccc cgcactctga gggccttcat tagctcgctc cccgcgccga ggctggggcg

120 120

gg gg

122 122

<210> 2<210> 2

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 2<400> 2

cctcccgcag ctcattgcag ccccgaggaa atcaccgggg gagggctcgg gagtgcggcg cctcccgcag ctcattgcag ccccgaggaa atcaccgggg gagggctcgg gagtgcggcg

60 60

cggcagcccc ataatttcca gggcccttct cctacactga cacgtaattg tcagattgtt cggcagcccc ataatttcca gggcccttct cctacactga cacgtaattg tcagattgtt

120 120

tt tt

122 122

<210> 3<210> 3

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 3<400> 3

ccgccgcggg ttcccagggc tggtggtagt tgccgtccca cacgtacgtg gcggggtcct ccgccgcggg ttcccagggc tggtggtagt tgccgtccca cacgtacgtg gcggggtcct

60 60

cgtcagcgaa gacctcgcgg aacatgtcga ccatgtagag gtcctcggcg cggttgccat cgtcagcgaa gacctcgcgg aacatgtcga ccatgtagag gtcctcggcg cggttgccat

120 120

cc cc

122 122

<210> 4<210> 4

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 4<400> 4

ggggaggaat attagactcg gaggagtctg cgcgcttttc tcctccccgc gcctcccggt ggggaggaat attagactcg gaggagtctg cgcgcttttc tcctccccgc gcctcccggt

60 60

cgccgcgggt tcaccgctca gtccccgcgc tcgctccgca ccccacccac ttcctgtgct cgccgcgggt tcaccgctca gtccccgcgc tcgctccgca ccccacccac ttcctgtgct

120 120

cg cg

122 122

<210> 5<210> 5

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 5<400> 5

caggccggtc ccagccgccc ggagccccag tgcgcgatgg cggccggcaa actgcgcctg caggccggtc ccagccgccc ggagccccag tgcgcgatgg cggccggcaa actgcgcctg

60 60

cgcactgggc ctcaccgcgg actacgactc ccacaatgcc gcgaggctgt gccgcgcacc cgcactgggc ctcaccgcgg actacgactc ccacaatgcc gcgaggctgt gccgcgcacc

120 120

gg gg

122 122

<210> 6<210> 6

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 6<400> 6

gtgacgcgcg gccgcagctg cccgcgggcg gagcgctctc agaccccgga gcgcacaccg gtgacgcgcg gccgcagctg cccgcgggcg gagcgctctc agaccccgga gcgcacaccg

60 60

cggggccatc ggtgccatcg cggatctcca ggctcctcat cagtccgccg gggccgcagc cggggccatc ggtgccatcg cggatctcca ggctcctcat cagtccgccg gggccgcagc

120 120

ag ag

122 122

<210> 7<210> 7

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 7<400> 7

gaggaatatt agactcggag gagtctgcgc gcttttctcc tccccgcgcc tcccggtcgc gaggaatatt agactcggag gagtctgcgc gcttttctcc tccccgcgcc tcccggtcgc

60 60

cgcgggttca ccgctcagtc cccgcgctcg ctccgcaccc cacccacttc ctgtgctcgc cgcgggttca ccgctcagtc cccgcgctcg ctccgcaccc cacccacttc ctgtgctcgc

120 120

cc cc

122 122

<210> 8<210> 8

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 8<400> 8

atctaccgtc tccaatctcc atctccgaag ttatgcccac ttcctcgaag tttggagcca atctaccgtc tccaatctcc atctccgaag ttatgcccac ttcctcgaag tttggagcca

60 60

cgcgaactac actgcccaga aggcgccgcg ccgtgagccg cgatgcttgg ccaatgaaaa cgcgaactac actgcccaga aggcgccgcg ccgtgagccg cgatgcttgg ccaatgaaaa

120 120

ga ga

122 122

<210> 9<210> 9

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 9<400> 9

gggagggctc gtgagagcca atgagagcgc ggaaggcggc gagcgagcca atggacgcgg gggagggctc gtgagagcca atgagagcgc ggaaggcggc gagcgagcca atggacgcgg

60 60

cggtggggca gggggcgggg cctgggcgag gccgggggcg gaatgggctg agtgccctgt cggtggggca gggggcgggg cctgggcgag gccggggggcg gaatgggctg agtgccctgt

120 120

ct ct

122 122

<210> 10<210> 10

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 10<400> 10

cggcaagcgg agcagcgagg cagggtagct tcatcacact cgcggcggat gcggattccg cggcaagcgg agcagcgagg cagggtagct tcatcacact cgcggcggat gcggattccg

60 60

cgccgccccg gctctagctg ctcaggcgac cgccaccctc gcctcgccgc cgcccgtgca cgccgccccg gctctagctg ctcaggcgac cgccaccctc gcctcgccgc cgcccgtgca

120 120

ca ca

122 122

<210> 11<210> 11

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 11<400> 11

gcggacggcg gctccatccg cggcaatcac cgtagtgctt gtttgtggaa gccgagcgtg gcggacggcg gctccatccg cggcaatcac cgtagtgctt gtttgtggaa gccgagcgtg

60 60

cgtgcgccgc gcgcgcaccc agtccagcgc ggagtgggcg tctacccgag gaggggtgtc cgtgcgccgc gcgcgcaccc agtccagcgc ggagtgggcg tctacccgag gaggggtgtc

120 120

tg tg

122 122

<210> 12<210> 12

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 12<400> 12

tggggaatta gctcaggcgg tggagcgctc gcttagctat gcgagaggta gcgagatcga tggggaatta gctcaggcgg tggagcgctc gcttagctat gcgagaggta gcgagatcga

60 60

cgcccgcatt ctccagtttc ttgtctggtt tatgtctctt agtttgtatt ccccgttgtt cgcccgcatt ctccagtttc ttgtctggtt tatgtctctt agtttgtatt ccccgttgtt

120 120

tc tc

122 122

<210> 13<210> 13

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 13<400> 13

gaagtcccag ggacctgcgg agcgcagaca taacacaaca cagagcaaaa ctcaccgctg gaagtcccag ggacctgcgg agcgcagaca taacacaaca cagagcaaaa ctcaccgctg

60 60

cggtgacttt cactccacgc gatccgcttc ccggtttacg ctaaactggg cgctcgggac cggtgacttt cactccacgc gatccgcttc ccggtttacg ctaaactggg cgctcgggac

120 120

ag ag

122 122

<210> 14<210> 14

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 14<400> 14

ggctgcggac ggcggctcca tccgcggcaa tcaccgtagt gcttgtttgt ggaagccgag ggctgcggac ggcggctcca tccgcggcaa tcaccgtagt gcttgtttgt ggaagccgag

60 60

cgtgcgtgcg ccgcgcgcgc acccagtcca gcgcggagtg ggcgtctacc cgaggagggg cgtgcgtgcg ccgcgcgcgc acccagtcca gcgcggagtg ggcgtctacc cgaggagggg

120 120

tg tg

122 122

<210> 15<210> 15

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 15<400> 15

cccccgccgg ccgccggccg cgctccccgc cttcattctg tgatctgcgg atttgccagt cccccgccgg ccgccggccg cgctccccgc cttcattctg tgatctgcgg atttgccagt

60 60

cgccaacctc cgcgcccaga gtcaccatcg cgcagggttg ggcaaaccat ggagctcggg cgccaacctc cgcgcccaga gtcaccatcg cgcagggttg ggcaaaccat ggagctcggg

120 120

gc gc

122 122

<210> 16<210> 16

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 16<400> 16

aactcctgca caaatcattt caaacgcggt cggcttctaa tcgggaagta atctcagtga aactcctgca caaatcattt caaacgcggt cggcttctaa tcgggaagta atctcagtga

60 60

cgctggcggt gcagagaacc gagtctggac gcacacacac aaacacaccg cgggcctccg cgctggcggt gcagagaacc gagtctggac gcacacacac aaacacaccg cgggcctccg

120 120

ca ca

122 122

<210> 17<210> 17

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 17<400> 17

gtgtgctcag cctcagcgtg aggggcacct gctcgtctgg gctcacagcg aaggcagcct gtgtgctcag cctcagcgtg aggggcacct gctcgtctgg gctcacagcg aaggcagcct

60 60

cgccgcgagc tgccgctgcc gctgctgccg ccactggtgt tgccgctctc aggcgccagg cgccgcgagc tgccgctgcc gctgctgccg ccactggtgt tgccgctctc aggcgccagg

120 120

ct ct

122 122

<210> 18<210> 18

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 18<400> 18

gccgggagcc tgacgtcacc acgccctgcc tgtcaatctg cagcgcgcgc cgctcgcagc gccgggagcc tgacgtcacc acgccctgcc tgtcaatctg cagcgcgcgc cgctcgcagc

60 60

cgccttttct gccaccaact gtatctctca ctcgcggagc cggcacagcg acaggcgccc cgccttttct gccaccaact gtatctctca ctcgcggagc cggcacagcg acaggcgccc

120 120

cg cg

122 122

<210> 19<210> 19

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 19<400> 19

gcggcggcgg gcggggagcc aggcccgagc tgcgttctgc gcagccattg gtgggcgccg gcggcggcgg gcggggagcc aggcccgagc tgcgttctgc gcagccattg gtgggcgccg

60 60

cgctctgcac tgagcatgtt cgcgccccgc cggcccctag ccgcagccgc agccgcagcg cgctctgcac tgagcatgtt cgcgccccgc cggcccctag ccgcagccgc agccgcagcg

120 120

ac ac

122 122

<210> 20<210> 20

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 20<400> 20

caaccggttc cgccgcgttt gtgggctggt agcccggaat acatttccca gaggccttcg caaccggttc cgccgcgttt gtgggctggt agcccggaat acatttccca gaggccttcg

60 60

cggccgacgt gcttcgcgca ggaacgcagc cgcctcccga ctggaggacg cggtagcgga cggccgacgt gcttcgcgca ggaacgcagc cgcctcccga ctggagggacg cggtagcgga

120 120

gc gc

122 122

<210> 21<210> 21

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 21<400> 21

gctgcccgtg gtcaaactgg agtcgctgaa gcgctggaac gaagagcggg gcctctggtg gctgcccgtg gtcaaactgg agtcgctgaa gcgctggaac gaagagcggg gcctctggtg

60 60

cgagaagggg gtgcaggtgc tgctgacgac ggtgggcgcc ttcgccgcct tcggcctcat cgagaagggg gtgcaggtgc tgctgacgac ggtgggcgcc ttcgccgcct tcggcctcat

120 120

ga ga

122 122

<210> 22<210> 22

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 22<400> 22

cttcccggct ccccgcggtg cgcacccgct ggccactctg cgcacgcgcg ccgggtgccc cttcccggct ccccgcggtg cgcacccgct ggccactctg cgcacgcgcg ccgggtgccc

60 60

cggcctaagg ccgttgacct cgggttctcc ccggcacagt cgaatccacg ccagggccct cggcctaagg ccgttgacct cgggttctcc ccggcacagt cgaatccacg ccagggccct

120 120

ca ca

122 122

<210> 23<210> 23

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 23<400> 23

gcgggggagg ttgcggggga ggctcggcgt ccccgctctc cgccccgcga caccgactgc gcgggggagg ttgcggggga ggctcggcgt ccccgctctc cgccccgcga caccgactgc

60 60

cgccgtggcc gccctcaaag ctcatggttg tgccgccgcc gccctcctgc cggcccggct cgccgtggcc gccctcaaag ctcatggttg tgccgccgcc gccctcctgc cggcccggct

120 120

gg gg

122 122

<210> 24<210> 24

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 24<400> 24

tgtactactt cctctgccac ctggccttgg tagacgcggg cttcactact agcgtggtgc tgtactactt cctctgccac ctggccttgg tagacgcggg cttcactact agcgtggtgc

60 60

cgccgctgct ggccaacctg cgcggaccag cgctctggct gccgcgcagc cactgcacgg cgccgctgct ggccaacctg cgcggaccag cgctctggct gccgcgcagc cactgcacgg

120 120

cc cc

122 122

<210> 25<210> 25

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 25<400> 25

aaaaaaaaaa aaaagcaatg agccgcaagc cttggactcg cagagctgcc ggtgcccgtc aaaaaaaaaa aaaagcaatg agccgcaagc cttggactcg cagagctgcc ggtgcccgtc

60 60

cgagagcccc accagcgcgg ctcacgcctc agtctcgccg ccccaaggtg ggatccgacg cgagagcccc accagcgcgg ctcacgcctc agtctcgccg ccccaaggtg ggatccgacg

120 120

cc cc

122 122

<210> 26<210> 26

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 26<400> 26

cgagagggcc cggtccagca gcctctgggg cccagtgcgc agggcactgc gggccgattg cgagagggcc cggtccagca gcctctgggg cccagtgcgc agggcactgc gggccgattg

60 60

cgccccgggg ccaggaggcg ccgagaaagc aaaagcaaaa gccggcggcg ggtggaggtc cgccccgggg ccaggaggcg ccgagaaagc aaaagcaaaa gccggcggcg ggtggaggtc

120 120

aa aa

122 122

<210> 27<210> 27

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 27<400> 27

cggccgcagt gtgccgcccg ctgcgctatg cggggctcgt ctccccgcgc ctatgtcgca cggccgcagt gtgccgcccg ctgcgctatg cggggctcgt ctccccgcgc ctatgtcgca

60 60

cgctggccag cgcctcctgg ctaagcggcc tcaccaactc ggttgcgcaa accgcgctcc cgctggccag cgcctcctgg ctaagcggcc tcaccaactc ggttgcgcaa accgcgctcc

120 120

tg tg

122 122

<210> 28<210> 28

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 28<400> 28

cctggcgcga ccgccagcag cacccagcgc ggggccggga gctgctgggg gcccaggctc cctggcgcga ccgccagcag cacccagcgc ggggccggga gctgctgggg gcccaggctc

60 60

cgctctcccc accgctctgc accgctgccg gctgcggaca gacccgatgc gccaccacca cgctctcccc accgctctgc accgctgccg gctgcggaca gacccgatgc gccaccacca

120 120

cc cc

122 122

<210> 29<210> 29

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 29<400> 29

ccggagcgcg ctgctgccct ctaccggtca tccgtgcggc cggacaccgt gtcaggcccg ccggagcgcg ctgctgccct ctaccggtca tccgtgcggc cggacaccgt gtcaggcccg

60 60

cgaggagggc tctgccgcag tcccggggaa cagcacccag cagcgccact gggagaggaa cgaggagggc tctgccgcag tcccggggaa cagcacccag cagcgccact gggagaggaa

120 120

ac ac

122 122

<210> 30<210> 30

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 30<400> 30

agtccagagc ggcgctgtgc agctggaagg gcgcgcgata gctcaagtta gaggcggccc agtccagagc ggcgctgtgc agctggaagg gcgcgcgata gctcaagtta gaggcggccc

60 60

cggggcgcgg cgcaggacac aagacctcaa actggtactt gcacaggtag ccgttggcgc cggggcgcgg cgcaggacac aagacctcaa actggtactt gcacaggtag ccgttggcgc

120 120

gc gc

122 122

<210> 31<210> 31

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 31<400> 31

ggcggtgcga gctccccgcc tgcgggacgc acggagaccg cggtcagcgc gccgcctggc ggcggtgcga gctccccgcc tgcgggacgc acggagaaccg cggtcagcgc gccgcctggc

60 60

cggcccagcg cgcccagccc gcgcccagcc ccgtccactc ccgtccagcc ccgccgcccg cggcccagcg cgcccagccc gcgcccagcc ccgtccactc ccgtccagcc ccgccgcccg

120 120

gc gc

122 122

<210> 32<210> 32

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 32<400> 32

cggtagagtt tccaacacga aagcccgtgt ggtcgcgccg ggagctcacg gcgttccaag cggtagagtt tccaacacga aagcccgtgt ggtcgcgccg ggagctcacg gcgttccaag

60 60

cggcacttat cccgcgttga tgcccaggca ccccgcgcgc cctgtttcac caggcccagt cggcacttat cccgcgttga tgcccaggca ccccgcgcgc cctgtttcac caggcccagt

120 120

ca ca

122 122

<210> 33<210> 33

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 33<400> 33

ccagcggcag tagctgtagc agcttcagcg aagccggaga tgggcagaga gcgcgcgcgg ccagcggcag tagctgtagc agcttcagcg aagccggaga tgggcagaga gcgcgcgcgg

60 60

cgcagcagct ccagattcac tgctctcccc tgcagctccc cgcgcccccg ccgctgtcgc cgcagcagct ccagattcac tgctctcccc tgcagctccc cgcgcccccg ccgctgtcgc

120 120

tg tg

122 122

<210> 34<210> 34

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 34<400> 34

gtgttctctg cggcgggccg cgtccccgct gagcctcgcg gtgacagccg cctttggcag gtgttctctg cggcgggccg cgtccccgct gagcctcgcg gtgacagccg cctttggcag

60 60

cgagcgctcg gggcacttct atccccgcct ctcaaagggt ggggacagcc gtttccagat cgagcgctcg gggcacttct atccccgcct ctcaaagggt ggggacagcc gtttccagat

120 120

tt tt

122 122

<210> 35<210> 35

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 35<400> 35

cggccgcgcc cccggcagcc cagggcgcgc ttccaccacg gtaccggtgg attcgccgtg cggccgcgcc cccggcagcc cagggcgcgc ttccaccacg gtaccggtgg attcgccgtg

60 60

cgcagccgga agatggcgca gacgcacaaa gcacaccgat gctgcgccat gatagggccg cgcagccgga agatggcgca gacgcacaaa gcacaccgat gctgcgccat gataggccg

120 120

gc gc

122 122

<210> 36<210> 36

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 36<400> 36

tctcgcggcg caggcggcgg cggcagaggt ggggtcgcgc agcggaggca gctcgagctt tctcgcggcg caggcggcgg cggcagaggt ggggtcgcgc agcggaggca gctcgagctt

60 60

cgggatgcgc gctcgcttct tgggctcctc gctcgatctt actgccccct tttttctctc cgggatgcgc gctcgcttct tgggctcctc gctcgatctt actgccccct tttttctctc

120 120

cc cc

122 122

<210> 37<210> 37

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 37<400> 37

tcctccagcc agagtcggtg ggactggctg cgctgccctg aagtggttct ccaagcagcg tcctccagcc agagtcggtg ggactggctg cgctgccctg aagtggttct ccaagcagcg

60 60

cggagggtgg cggacggcgg acggagccca ggggccgcgt cgggtgggga aacccgaact cggagggtgg cggacggcgg acggagccca ggggccgcgt cgggtgggga aacccgaact

120 120

cg cg

122 122

<210> 38<210> 38

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 38<400> 38

tgcgcatcgc tggctctggg ttccgccgaa tgcgtcctcc tggcggtgat ggctctggac tgcgcatcgc tggctctggg ttccgccgaa tgcgtcctcc tggcggtgat ggctctggac

60 60

cgcgcggccg cagtgtgccg cccgctgcgc tatgcggggc tcgtctcccc gcgcctatgt cgcgcggccg cagtgtgccg cccgctgcgc tatgcggggc tcgtctcccc gcgcctatgt

120 120

cg cg

122 122

<210> 39<210> 39

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 39<400> 39

aggggagctg cgaggcgaag tgttcttcag ggaagcgggc tcgagtctcc gcagctgcgg aggggagctg cgaggcgaag tgttcttcag ggaagcgggc tcgagtctcc gcagctgcgg

60 60

cggcggcggc ggcgcgctgg gccggcggcg ggcgcgggca gggggccggg ggtgccgcgc cggcggcggc ggcgcgctgg gccggcggcg ggcgcgggca gggggccggg ggtgccgcgc

120 120

gg gg

122 122

<210> 40<210> 40

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 40<400> 40

cctccacccc cggggggttc ctgcgcactg aaagaccgtt ctccggcagg ttttgggatc cctccacccc cggggggttc ctgcgcactg aaagaccgtt ctccggcagg ttttgggatc

60 60

cggcgacggc tgaccgcgcg ccgcccccac gcccggttcc acgatgctgc aatacagaaa cggcgacggc tgaccgcgcg ccgcccccac gcccggttcc acgatgctgc aatacagaaa

120 120

gt GT

122 122

<210> 41<210> 41

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 41<400> 41

agagaggggt cccagaacga aggtggcggc acgagctctg cgctggcggc tgtggggggc agagaggggt cccagaacga aggtggcggc acgagctctg cgctggcggc tgtggggggc

60 60

cggcgctcag gaccccaact ccatccaagt tgcgccgcgg tgggggcggg cggaggcggc cggcgctcag gaccccaact ccatccaagt tgcgccgcgg tgggggcggg cggaggcggc

120 120

gc gc

122 122

<210> 42<210> 42

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 42<400> 42

aatctcccct cgggctcgac ggatgtgcgc cccagatgtg ctgacacatg tccgatgcct aatctcccct cgggctcgac ggatgtgcgc cccagatgtg ctgacacatg tccgatgcct

60 60

cgctgccttg gaggtctccc cgctcgcgtg tctcttctct tcgcaccagc ggcggaaacc cgctgccttg gaggtctccc cgctcgcgtg tctcttctct tcgcaccagc ggcggaaacc

120 120

gc gc

122 122

<210> 43<210> 43

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 43<400> 43

gctccgcttc tccgggtttt agcggaagcc tgcggggggc ggggtaaccg cggaagccgg gctccgcttc tccgggtttt agcggaagcc tgcggggggc ggggtaaccg cggaagccgg

60 60

cggccgtggg cgcgcgggtt gggggctctc gcgccgctcc gggctctccc cccccccggc cggccgtggg cgcgcgggtt gggggctctc gcgccgctcc gggctctccc cccccccggc

120 120

tg tg

122 122

<210> 44<210> 44

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 44<400> 44

cgcgctccgc ttctccgggt tttagcggaa gcctgcgggg ggcggggtaa ccgcggaagc cgcgctccgc ttctccgggt tttagcggaa gcctgcgggg ggcggggtaa ccgcggaagc

60 60

cggcggccgt gggcgcgcgg gttgggggct ctcgcgccgc tccgggctct cccccccccc cggcggccgt gggcgcgcgg gttggggggct ctcgcgccgc tccgggctct cccccccccc

120 120

gg gg

122 122

<210> 45<210> 45

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 45<400> 45

gcgagggatc tctgtgcgtc ctcactggcc catgcaccca gcacctgcga ctcccgccgt gcgagggatc tctgtgcgtc ctcactggcc catgcaccca gcacctgcga ctcccgccgt

60 60

cgggctgcgt ggccccgcgc ccacacctgc ccgtcccttc cgtcgtccct cgctcgcgca cgggctgcgt ggccccgcgc ccacacctgc ccgtcccttc cgtcgtccct cgctcgcgca

120 120

ga ga

122 122

<210> 46<210> 46

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 46<400> 46

ggggaggtgt ggggagcgga aggccgcagg agcatctttg cggagaaagt actttggctg ggggagaggtgt ggggagcgga aggccgcagg agcatctttg cggagaaagt actttggctg

60 60

cggcgggcgc agggcgggcc ggctagcccc gcgccccacc tgttctgtgc gtcgcgctcg cggcgggcgc agggcgggcc ggctagcccc gcgccccacc tgttctgtgc gtcgcgctcg

120 120

cc cc

122 122

<210> 47<210> 47

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 47<400> 47

tagggctgga aacccgccgc cacagcgggc tagaggtcgt ccccgcccgc aacatatgcg tagggctgga aacccgccgc cacagcgggc tagaggtcgt ccccgcccgc aacatatgcg

60 60

cgaaggaaag tgctacgaac gtcaaatggc cgccccccgc cgacgccatc tgctctgcga cgaaggaaag tgctacgaac gtcaaatggc cgccccccgc cgacgccatc tgctctgcga

120 120

ag ag

122 122

<210> 48<210> 48

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 48<400> 48

cgcccgcaac atatgcgcga aggaaagtgc tacgaacgtc aaatggccgc cccccgccga cgcccgcaac atatgcgcga aggaaagtgc tacgaacgtc aaatggccgc cccccgccga

60 60

cgccatctgc tctgcgaagc agaaacggcg gcagctgcgc gcccagtccc tccgcccgcg cgccatctgc tctgcgaagc agaaacggcg gcagctgcgc gcccagtccc tccgcccgcg

120 120

cc cc

122 122

<210> 49<210> 49

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 49<400> 49

ccccctgttc aaggtctgtc accgtagggg gcgggggggc gcgtggagcc gctgggggtt ccccctgttc aaggtctgtc accgtagggg gcgggggggc gcgtggagcc gctgggggtt

60 60

cggcccaccc cgcgaaccga gctcccggcc ctgtgcgccc tcagctctgc cgcgggcgtt cggcccaccc cgcgaaccga gctcccggcc ctgtgcgccc tcagctctgc cgcgggcgtt

120 120

gg gg

122 122

<210> 50<210> 50

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 50<400> 50

gctgtggccg cagctgaggc ccgacgagct tccggccggg tctttgccct tcactggccg gctgtggccg cagctgaggc ccgacgagct tccggccggg tctttgccct tcactggccg

60 60

cgtgaacatc acggtgcgct gcacggtggc cacctctcga ctgctgctgc atagcctctt cgtgaacatc acggtgcgct gcacggtggc cacctctcga ctgctgctgc atagcctctt

120 120

cc cc

122 122

<210> 51<210> 51

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 51<400> 51

gtgtgcgtgt gcgtgtgctc agcctcagcg tgaggggcac ctgctcgtct gggctcacag gtgtgcgtgt gcgtgtgctc agcctcagcg tgaggggcac ctgctcgtct gggctcacag

60 60

cgaaggcagc ctcgccgcga gctgccgctg ccgctgctgc cgccactggt gttgccgctc cgaaggcagc ctcgccgcga gctgccgctg ccgctgctgc cgccactggt gttgccgctc

120 120

tc tc

122 122

<210> 52<210> 52

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 52<400> 52

tggggcagcg gcgttgcagg agatgagctc agcgcaaagg gaaccccgca gcggcgagtg tggggcagcg gcgttgcagg agatgagctc agcgcaaagg gaaccccgca gcggcgagtg

60 60

cggctgctgg cctgcgcgct gtggccccaa caggctggca gggcgcgggc gggtggcggg cggctgctgg cctgcgcgct gtggccccaa caggctggca gggcgcgggc gggtggcggg

120 120

gt GT

122 122

<210> 53<210> 53

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 53<400> 53

agagtcggtg ggactggctg cgctgccctg aagtggttct ccaagcagcg cggagggtgg agagtcggtg ggactggctg cgctgccctg aagtggttct ccaagcagcg cggagggtgg

60 60

cggacggcgg acggagccca ggggccgcgt cgggtgggga aacccgaact cgcggagggg cggacggcgg acggagccca ggggccgcgt cgggtgggga aacccgaact cgcggagggg

120 120

aa aa

122 122

<210> 54<210> 54

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 54<400> 54

aaagccctgg caggtaaaga gaggacccgc gcaggctggg agctcccact cctcctccag aaagccctgg caggtaaaga gaggacccgc gcaggctggg agctcccact cctcctccag

60 60

cgtcacgctc gccctccgcc gctgcctcgc gtccgggtct gtttatatag cgtctggagg cgtcacgctc gccctccgcc gctgcctcgc gtccgggtct gtttatatag cgtctggagg

120 120

cc cc

122 122

<210> 55<210> 55

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 55<400> 55

ctggccaagt gccggcccat cgcggtgcgc agcggagacg ccttccacga gatccggccg ctggccaagt gccggcccat cgcggtgcgc agcggagacg ccttccacga gatccggccg

60 60

cgcgccgagg tggccaacct cagcgcgcac agcgccagcc ccatccagga tgcggtcctg cgcgccgagg tggccaacct cagcgcgcac agcgccagcc ccatccagga tgcggtcctg

120 120

aa aa

122 122

<210> 56<210> 56

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 56<400> 56

ggcgccggca gcttcgcgcc ggcggctgga agcgggcggg ctgcacgggc ggctcgagtg ggcgccggca gcttcgcgcc ggcggctgga agcgggcggg ctgcacgggc ggctcgagtg

60 60

cggggacccc agcccctcgc cctcgtgagc gccgcccctg ccacctgctg ccaagtcacc cggggacccc agcccctcgc cctcgtgagc gccgcccctg ccacctgctg ccaagtcacc

120 120

gg gg

122 122

<210> 57<210> 57

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 57<400> 57

ccccggccgc gccgggcgcg gggctcggga ttcgggagac cgcgcggcgc cgaagccacg ccccggccgc gccgggcgcg gggctcggga ttcgggagac cgcgcggcgc cgaagccacg

60 60

cgtcagcccc actgtcccgc gcgcctcgcc ccaggcctcg ggctcttcct ccgcacctcg cgtcagcccc actgtcccgc gcgcctcgcc ccaggcctcg ggctcttcct ccgcacctcg

120 120

ta ta

122 122

<210> 58<210> 58

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 58<400> 58

acgcggggac tggaaagggc gcctgggtgg gaagaggcgc tggcgggtga tcgtccccac acgcggggac tggaaagggc gcctgggtgg gaagaggcgc tggcgggtga tcgtccccac

60 60

cgggccagtc cccgggatct gctgccgccc ctctccgaaa ttcacagcca gagcgggcgc cggggccagtc cccgggatct gctgccgccc ctctccgaaa ttcacagcca gagcgggcgc

120 120

ac ac

122 122

<210> 59<210> 59

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 59<400> 59

tctgagaagt gtcctcctcg ctctcttata aaaacaggac ttgttgccga ggtcagcgcg tctgagaagt gtcctcctcg ctctcttata aaaacaggac ttgttgccga ggtcagcgcg

60 60

cgcatcgagt gtgccaggcg tgtgcgtggt ttctgctgtg tcattgcttt cacggaaggt cgcatcgagt gtgccaggcg tgtgcgtggt ttctgctgtg tcattgcttt cacggaaggt

120 120

gg gg

122 122

<210> 60<210> 60

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 60<400> 60

gcgcccagac tgcgcgccgc gccgctgcgc ccaacattcc cgaggacggc ttcgcgggcg gcgcccagac tgcgcgccgc gccgctgcgc ccaacattcc cgaggacggc ttcgcgggcg

60 60

cgtatcgtcc agaccggagc accgccccac cgctagcgca ggagacctgc cggggaagtc cgtatcgtcc agaccggagc accgccccac cgctagcgca ggagacctgc cggggaagtc

120 120

gc gc

122 122

<210> 61<210> 61

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 61<400> 61

aaaggccgta ctctgccccc cgcgggaccc aggtccccgc ctgctgcaga gcgcactctg aaaggccgta ctctgccccc cgcgggaccc aggtccccgc ctgctgcaga gcgcactctg

60 60

cgcacgtcga gccgcgaaag gttcacagaa gaaaacaaga gaaagaagta gcaggcactg cgcacgtcga gccgcgaaag gttcacagaa gaaaacaaga gaaagaagta gcaggcactg

120 120

ag ag

122 122

<210> 62<210> 62

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 62<400> 62

ggaatccatt cttttaagcc agggtttaaa actcttcaag caagtcatct gcaaaggtac ggaatccatt cttttaagcc agggtttaaa actcttcaag caagtcatct gcaaaggtac

60 60

cgcttctacc attttaaaga taggattatg ttccctagga caactggatg agccctagga cgcttctacc attttaaaga taggattatg ttccctagga caactggatg agccctagga

120 120

ac ac

122 122

<210> 63<210> 63

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 63<400> 63

gaggagcgcg ccgctgcctc tggcgggctt tcggcttgag gggcaaggtg aagagcgcac gaggagcgcg ccgctgcctc tggcgggctt tcggcttgag gggcaaggtg aagagcgcac

60 60

cggccgtggg gtttaccgag ctggatttgt atgttgcacc atgccttctt ggatcggggc cggccgtggg gtttaccgag ctggatttgt atgttgcacc atgccttctt ggatcggggc

120 120

tg tg

122 122

<210> 64<210> 64

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 64<400> 64

ccctgtgcgt gccgccgcgc tgttgctcgc agtgtgctgg cgccgagctc ggtggacacg ccctgtgcgt gccgccgcgc tgttgctcgc agtgtgctgg cgccgagctc ggtggacacg

60 60

cgcgcagtca gagctgcctc tcgccctcgc tagctgggct cgcagcctct tcctccctcc cgcgcagtca gagctgcctc tcgccctcgc tagctgggct cgcagcctct tcctccctcc

120 120

ct ct

122 122

<210> 65<210> 65

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 65<400> 65

ctctttggca agtggtttgt gcatcaggag aaactttcca cctgcgagcc gaaccggcgc ctctttggca agtggtttgt gcatcaggag aaactttcca cctgcgagcc gaaccggcgc

60 60

cgagtgcgtg tgtttctgcc tttttttgtt gtcgttgcct ccacccctcc ccattcttct cgagtgcgtg tgtttctgcc tttttttgtt gtcgttgcct ccacccctcc ccattcttct

120 120

ct ct

122 122

<210> 66<210> 66

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 66<400> 66

tggctgccag agcgagtgag gggcgcagag gcggcagaga gcggagagcc ccggtgtctc tggctgccag agcgagtgag gggcgcagag gcggcagaga gcggagagcc ccggtgtctc

60 60

cgcgagggcg gcggcggcca gcagacggcg atcgaggcgc gcgccacggc acggccagcg cgcgaggcg gcggcggcca gcagacggcg atcgaggcgc gcgccacggc acggccagcg

120 120

ca ca

122 122

<210> 67<210> 67

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 67<400> 67

aagcgcgtgg agagccgaaa ggtgcggtgg gcgcagaggg cgggctggct gcggggcgac aagcgcgtgg agagccgaaa ggtgcggtgg gcgcagagg cgggctggct gcggggcgac

60 60

cgcgcgccgg ggccatgccg cgctccttcc tggtggactc gctagtgctg cgcgaggcgg cgcgcgccgg ggccatgccg cgctccttcc tggtggactc gctagtgctg cgcgaggcgg

120 120

gc gc

122 122

<210> 68<210> 68

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 68<400> 68

ggggtcgcca tgaccgagtg gcccaggccc gagcgaagcc cgcgcgcggt gagtccgccg ggggtcgcca tgaccgagtg gcccaggccc gagcgaagcc cgcgcgcggt gagtccgccg

60 60

cggcccatcc gtccctccgc ccgccagagc gtccatcggg acgcccaccc gggagggtct cggcccatcc gtccctccgc ccgccagagc gtccatcggg acgcccaccc gggagggtct

120 120

cg cg

122 122

<210> 69<210> 69

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 69<400> 69

ccgagcgctg cccccgccgg cccgcggctg ccagccggcc ctgcccgcgc ccgggccccg ccgagcgctg cccccgccgg cccgcggctg ccagccggcc ctgcccgcgc ccgggccccg

60 60

cgagcggccg cacttcacct tacggagggg agataatgag atcaattaga ggcgccgtca cgagcggccg cacttcacct tacggagggg agataatgag atcaattaga ggcgccgtca

120 120

cc cc

122 122

<210> 70<210> 70

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 70<400> 70

ggcaaccctg actcggaccg ctcgggagag ccccaggaga ggccagcgcc gcgcagcagc ggcaaccctg actcggaccg ctcgggagag ccccaggaga ggccagcgcc gcgcagcagc

60 60

cgccccgctg cgcccacctc cccggctgct cccggagggc tcacaaaggc ggtggccgcc cgccccgctg cgcccacctc cccggctgct cccggagggc tcacaaaggc ggtggccgcc

120 120

cg cg

122 122

<210> 71<210> 71

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 71<400> 71

gcgggcggca gccgcaagcg aggaatccag cgcagggaaa gtagccccag tggggcccgg gcgggcggca gccgcaagcg aggaatccag cgcagggaaa gtagccccag tggggcccgg

60 60

cgcgtcagcc ccactcgcgt ggcaaaactt gcgggggccc ccgcgtgccg cgcctcagcc cgcgtcagcc ccactcgcgt ggcaaaactt gcggggggccc ccgcgtgccg cgcctcagcc

120 120

ca ca

122 122

<210> 72<210> 72

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 72<400> 72

tcctcgccgt cggggtcctc ctcctctgcc gacgagttgt cactgggcga ggcgtagctg tcctcgccgt cggggtcctc ctcctctgcc gacgagttgt cactgggcga ggcgtagctg

60 60

cgctctacgc cgcggagggg cggcctcttg gaggcgggga ccgggtactc ccgctgcagc cgctctacgc cgcggagggg cggcctcttg gaggcgggga ccgggtactc ccgctgcagc

120 120

cc cc

122 122

<210> 73<210> 73

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 73<400> 73

gctgctcgcg ctccgccgcc cgggagatgc ttcctcgcgc ggcgcagcgc tgaggccgtg gctgctcgcg ctccgccgcc cgggagatgc ttcctcgcgc ggcgcagcgc tgaggccgtg

60 60

cgtgcgcccc ggctgcgctg cgcgctcccc acatacacaa gctctccatg tgagctgaca cgtgcgcccc ggctgcgctg cgcgctcccc acatacacaa gctctccatg tgagctgaca

120 120

gg gg

122 122

<210> 74<210> 74

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 74<400> 74

cttctcttga aaaggaggag aatcaacact gggctcacaa ctcatcagag ctgagtcata cttctcttga aaaggaggag aatcaacact gggctcacaa ctcatcagag ctgagtcata

60 60

cgtacatcag caggacctac gtgggaacca aatagcaaac tcaaattggg aaatttgagg cgtacatcag caggacctac gtgggaacca aatagcaaac tcaaattggg aaatttgagg

120 120

aa aa

122 122

<210> 75<210> 75

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 75<400> 75

ccgagagccc cgcctgcagg cggtgtagat acatgtagat actgtagata ctgtagatac ccgagagccc cgcctgcagg cggtgtagat acatgtagat actgtagata ctgtagatac

60 60

cgccccggcg ccgacttgat aaacggtttc gcctcttttg gaagccgcct gcgtgtccat cgccccggcg ccgacttgat aaacggtttc gcctcttttg gaagccgcct gcgtgtccat

120 120

tt tt

122 122

<210> 76<210> 76

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 76<400> 76

tgaggagtga ggaggcagaa aggaccgaga acaaggggac ccggttccat ttctggaccc tgaggagtga ggaggcagaa aggaccgaga acaaggggac ccggttccat ttctggaccc

60 60

cgtccgcagg ctgctcgccc gacttggggt cgctctgccc cggacgatca ggacagctgc cgtccgcagg ctgctcgccc gacttggggt cgctctgccc cggacgatca ggacagctgc

120 120

gt GT

122 122

<210> 77<210> 77

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 77<400> 77

caaatctata tgaaggatcg aattgcattg aactagcaaa cacacacaca cacacgcaca caaatctata tgaaggatcg aattgcattg aactagcaaa cacacacaca cacacgcaca

60 60

cgcaaaaact gatgaaagct gaacaaggtc tgtagtctag tcaacagtac tgcactatgt cgcaaaaact gatgaaagct gaacaaggtc tgtagtctag tcaacagtac tgcactatgt

120 120

ga ga

122 122

<210> 78<210> 78

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 78<400> 78

acagtctctc gcctcaaaga tctccgccat tagtggtagc catttaagaa aacagaatta acagtctctc gcctcaaaga tctccgccat tagtggtagc catttaagaa aacagaatta

60 60

cgatgaataa tgatttgaag ccaaaaagtc aaaatatctt atttcgcaac tgtaattgct cgatgaataa tgatttgaag ccaaaaagtc aaaatatctt atttcgcaac tgtaattgct

120 120

gg gg

122 122

<210> 79<210> 79

<211> 122<211> 122

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 79<400> 79

ccacacaggc ctctccctcg gtgcggtagc gagggttgcg ggcccaaacg cccgcgccca ccacacaggc ctctccctcg gtgcggtagc gagggttgcg ggcccaaacg cccgcgccca

60 60

cggaggcgcc tgcgacgact agaagcttcc acagccatat gggggcaaag acggcccagt cggaggcgcc tgcgacgact agaagcttcc acagccatat gggggcaaag acggcccagt

120 120

ag ag

122 122

<210> 80<210> 80

<211> 25<211> 25

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 80<400> 80

ggtttttggg taggaaggat agtag ggtttttggg taggaaggat agtag

25 25

<210> 81<210> 81

<211> 25<211> 25

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 81<400> 81

aaacaaatct aacccctaaa aaaac aaacaaatct aacccctaaa aaaac

25 25

<210> 82<210> 82

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 82<400> 82

caaactaaac acactaaacc caaactaaac acactaaacc

20 20

<210> 83<210> 83

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 83<400> 83

gggtttttag ggttggtggt a gggtttttag ggttggtggt a

21 21

<210> 84<210> 84

<211> 24<211> 24

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 84<400> 84

tcctcataat aataaataac aacc tcctcataat aataaataac aacc

24 24

<210> 85<210> 85

<211> 18<211> 18

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 85<400> 85

tatgtatgtg gtggggtt tatgtatgtg gtggggtt

18 18

<210> 86<210> 86

<211> 45<211> 45

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 86<400> 86

aatgatacgg cgaccaccga gatctacact ctttccctac acgac aatgatacgg cgaccaccga gatctacact ctttccctac acgac

45 45

<210> 87<210> 87

<211> 52<211> 52

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<220><220>

<221> AGTCATCG<221>AGTCATCG

<222> (25)..(32)<222> (25)..(32)

<400> 87<400> 87

caagcagaag acggcatacg agatagtcat cggtgactgg agttcagacg tg caagcagaag acggcatacg agatagtcat cggtgactgg agttcagacg tg

52 52

<210> 88<210> 88

<211> 59<211> 59

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<220><220>

<221> прочий_признак<221> other_sign

<222> (34)..(38)<222> (34)..(38)

<223> n представляет собой a, c, g, или t<223> n represents a, c, g, or t

<400> 88<400> 88

acactctttc cctacacgac gctcttccga tctnnnnngg gtttttaggg ttggtggta acactctttc cctacacgac gctcttccga tctnnnnngg gtttttaggg ttggtggta

59 59

<210> 89<210> 89

<211> 58<211> 58

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 89<400> 89

gtgactggag ttcagacgtg tgctcttccg atcttcctca taataataaa taacaacc gtgactggag ttcagacgtg tgctcttccg atcttcctca taataataaa taacaacc

58 58

<210> 90<210> 90

<211> 67<211> 67

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<220><220>

<221> прочий_признак<221> other_sign

<222> (34)..(38)<222> (34)..(38)

<223> n представляет собой a, c, g, или t<223> n represents a, c, g, or t

<400> 90<400> 90

acactctttc cctacacgac gctcttccga tctnnnnngg taggtttttg ggtaggaagg acactctttc cctacacgac gctcttccga tctnnnnngg taggtttttg ggtaggaagg

60 60

atagtag atagtag

67 67

<210> 91<210> 91

<211> 59<211> 59

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Описание искусственной последовательности: Синтетический <223> Description of artificial sequence: Synthetic

полинуклеотидpolynucleotide

<400> 91<400> 91

gtgactggag ttcagacgtg tgctcttccg atctaaacaa atctaacccc taaaaaaac gtgactggag ttcagacgtg tgctcttccg atctaaacaa atctaacccc taaaaaaac

59 59

<---<---

Claims (3)

1. Набор для выявления рака шейки матки с использованием анализа метилирования CG-идентификаторов (CGID) с помощью бисульфитного секвенирования с мультиплексной целевой амплификацией, включающий реагенты, необходимые для проведения указанного анализа CGID с SEQ ID NO: 3 и 31 и измерения уровней их метилирования.1. A kit for detecting cervical cancer using CG ID (CGID) methylation assay using bisulfite sequencing with multiplex targeted amplification, including the reagents necessary to perform the said CGID assay with SEQ ID NO: 3 and 31 and measure their methylation levels. 2. Набор по п.1, где CGID, указанный в SEQ ID NO: 3, содержит праймеры, указанные в SEQ ID NO: 88 для прямого праймера и SEQ ID NO: 89 для обратного праймера.2. The kit according to claim 1, wherein the CGID specified in SEQ ID NO: 3 contains the primers specified in SEQ ID NO: 88 for the forward primer and SEQ ID NO: 89 for the reverse primer. 3. Набор по п.1, где CGID, указанный в SEQ ID NO: 31, содержит праймеры, указанные в SEQ ID NO: 90 для прямого праймера и SEQ ID NO: 91 для обратного праймера.3. The kit according to claim 1, wherein the CGID specified in SEQ ID NO: 31 contains the primers specified in SEQ ID NO: 90 for the forward primer and SEQ ID NO: 91 for the reverse primer.
RU2021112399A 2018-12-04 2020-02-04 Dna methylation biomarkers for early detection of cervical cancer RU2817569C2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US62/774,994 2018-12-04

Publications (2)

Publication Number Publication Date
RU2021112399A RU2021112399A (en) 2023-01-09
RU2817569C2 true RU2817569C2 (en) 2024-04-16

Family

ID=

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017219312A1 (en) * 2016-06-23 2017-12-28 Beijing Youan Hospital, Capital Medical University Dna methylation signatures of cancer in host peripheral blood mononuclear cells and t cells
WO2018158589A1 (en) * 2017-03-02 2018-09-07 Ucl Business Plc Diagnostic and prognostic methods

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017219312A1 (en) * 2016-06-23 2017-12-28 Beijing Youan Hospital, Capital Medical University Dna methylation signatures of cancer in host peripheral blood mononuclear cells and t cells
WO2018158589A1 (en) * 2017-03-02 2018-09-07 Ucl Business Plc Diagnostic and prognostic methods

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ESTELLER, M. Epigenetics in Cancer. N ENGL J MED. 2008, v. 358, n.11, pp.1148-1159. WENTZENSEN, N. et al. Utility of methylation markers in cervical cancer early detection: appraisal of the state-of-the-science. GYNECOL ONCOL. 2009, v.112, n.2, pp.1-18. FARKAS, S. A. et al. Genome-wide DNA methylation assay reveals novel candidate biomarker genes in cervical cancer. EPIGENETICS. 2013, v. 8, n. 11, pp.1213-1225. *
KANAI, Y. Genome-wide DNA methylation profiles in precancerous conditions and cancers. CANCER SCI. 2010, v.101, n.1, pp.36-45. КОЗЛОВ В.А. Метилирование ДНК клетки и патология организма. МЕДИЦИНСКАЯ ИММУНОЛОГИЯ. 2008, т. 10, н. 4-5, сс.307-318. *

Similar Documents

Publication Publication Date Title
JP7759974B2 (en) DNA methylation biomarkers for early detection of cervical cancer
TWI797095B (en) Methods and systems for tumor detection
US20250137071A1 (en) Enhancement of cancer screening using cell-free viral nucleic acids
Vasiljević et al. Credentialing of DNA methylation assays for human genes as diagnostic biomarkers of cervical intraepithelial neoplasia in high-risk HPV positive women
JP2024105502A (en) DNA methylation markers for non-invasive detection of cancer and their uses - Patents.com
RU2817569C2 (en) Dna methylation biomarkers for early detection of cervical cancer
US20250109445A1 (en) Dna methylation biomarkers for early detection of cervical cancer
HK40056257A (en) Dna methylation biomarkers for early detection of cervical cancer
KR102889224B1 (en) Augmenting cancer screening using cell-free viral nucleic acids
Meyer et al. Nanopore sequencing-derived methylation biomarker prediction for methylation-specific PCR in patients with head and neck squamous cell carcinoma
HK40023330A (en) Enhancement of cancer screening using cell-free viral nucleic acids
HK40029037B (en) Enhancement of cancer screening using cell-free viral nucleic acids
HK40029037A (en) Enhancement of cancer screening using cell-free viral nucleic acids
EP3921441A1 (en) A method for determining the severity or grade of human papillomavirus (hpv)-induced dysplasia
HK1207124A1 (en) Non-invasive determination of methylome of fetus or tumor from plasma