[go: up one dir, main page]

RU2762759C1 - METHOD FOR SAMPLE PREPARATION OF SARS-CoV-2 CORONAVIRUS ISOLATES AND OLIGONUCLEOTIDE PRIMERS FOR ITS IMPLEMENTATION - Google Patents

METHOD FOR SAMPLE PREPARATION OF SARS-CoV-2 CORONAVIRUS ISOLATES AND OLIGONUCLEOTIDE PRIMERS FOR ITS IMPLEMENTATION Download PDF

Info

Publication number
RU2762759C1
RU2762759C1 RU2021119086A RU2021119086A RU2762759C1 RU 2762759 C1 RU2762759 C1 RU 2762759C1 RU 2021119086 A RU2021119086 A RU 2021119086A RU 2021119086 A RU2021119086 A RU 2021119086A RU 2762759 C1 RU2762759 C1 RU 2762759C1
Authority
RU
Russia
Prior art keywords
seq
oligonucleotide primers
cov
sars
primers
Prior art date
Application number
RU2021119086A
Other languages
Russian (ru)
Inventor
Камиль Фаридович Хафизов
Василий Геннадьевич Акимкин
Иван Андреевич Котов
Надежда Ивановна Борисова
Антон Алексеевич Колесников
Original Assignee
Федеральное бюджетное учреждение науки «Центральный научно-исследовательский институт эпидемиологии» Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Федеральное бюджетное учреждение науки «Центральный научно-исследовательский институт эпидемиологии» Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора) filed Critical Федеральное бюджетное учреждение науки «Центральный научно-исследовательский институт эпидемиологии» Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора)
Priority to RU2021119086A priority Critical patent/RU2762759C1/en
Application granted granted Critical
Publication of RU2762759C1 publication Critical patent/RU2762759C1/en

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

FIELD: biotechnology, medicine, molecular biology, genetic engineering and virology.
SUBSTANCE: invention relates to biotechnology, medicine, molecular biology, genetic engineering and virology. A method for sample preparation of SARS-CoV-2 coronavirus isolates is described, including the stages: (a) reverse transcription of the RNA of the virus; (b) PCR using two pools of oligonucleotide primers, where oligonucleotide primers having the structure SEQ ID NO: 1-4 are used for the first pool, with a concentration of each primer in the reaction mixture of 0.1 pmol/mcl, and for the second pool, oligonucleotide primers are used having the structure of SEQ ID NO: 5-10, with a concentration in the reaction mixture of each primer of 0.2 pmol/mcl; (c) evaluating the PCR products obtained during the amplification by electrophoresis; (d) combining PCR products of the two pools; (e) purifying amplicons from the reaction mixture using paramagnetic particles with a polymer carboxylated coating; (f) indexing using oligonucleotides containing sequences complementary to the adapter sequences SEQ ID NO: 11-12, and index sequences; (g) re-cleaning from the reaction mixture using paramagnetic particles with a polymer carboxylated coating. Provides a pool of oligonucleotide primers for implementing the method according to claim 1, having the structure of SEQ ID NO: 1-4, for performing the function of primers complementary to the regions of the gene encoding the SARS-CoV-2 S protein, and a pool of oligonucleotide primers for implementing the method according to claim 1, having the structure of SEQ ID NO: 5-10, to act as primers complementary to the regions of the gene encoding the SARS-CoV-2 S protein.
EFFECT: invention makes it possible to carry out sample preparation of libraries containing target fragments of the SARS-CoV-2 genome containing known epidemiologically significant mutations, with the least labor, time and material costs, without reducing the quality and volume of the studies performed due to the use.
9 cl, 2 dwg, 1 tbl, 3 ex

Description

Изобретение относится к биотехнологии, медицине, молекулярной биологии, генной инженерии и вирусологии, и может быть использовано для поиска важных мутаций вируса SARS-CoV-2 как при решении задач эпидемиологического надзора, так и в научно-исследовательских целях.The invention relates to biotechnology, medicine, molecular biology, genetic engineering and virology, and can be used to search for important mutations of the SARS-CoV-2 virus both when solving problems of epidemiological surveillance and for research purposes.

В конце 2019 г. в китайском городе Ухань впервые были зарегистрированы пациенты с вирусной пневмонией, вызванной неизвестным патогеном, впоследствии охарактеризованным как коронавирус SARS-CoV-2, способный вызывать инфекцию COVID-19. Исследования показали, что идентичность геномных последовательностей патогенов, собранных у ранних пациентов, составила более 99,98%. Примечательно, что вирус был похож на два других SARS-подобных коронавируса bat-SL-CoVZC45 и bat-SL-CoVZXC21, обнаруженных на территории восточного Китая в Чжоушане в 2018 году. В то же время, геном обнаруженного патогена оказался идентичен геномам SARS-CoV и MERS-CoV примерно на 79% и 50% соответственно. В силу сравнительно малого сходства с SARS-CoV, патоген был признан новым коронавирусом человека.At the end of 2019, in the Chinese city of Wuhan, for the first time, patients were registered with viral pneumonia caused by an unknown pathogen, subsequently characterized as the SARS-CoV-2 coronavirus capable of causing COVID-19 infection. Studies have shown that the identity of the genomic sequences of pathogens collected from early patients was more than 99.98%. It is noteworthy that the virus was similar to two other SARS-like coronaviruses bat-SL-CoVZC45 and bat-SL-CoVZXC21, discovered in eastern China in Zhoushan in 2018. At the same time, the genome of the detected pathogen was found to be identical to the genomes of SARS-CoV and MERS-CoV by about 79% and 50%, respectively. Due to the relatively small similarity with SARS-CoV, the pathogen has been recognized as a new human coronavirus.

С момента начала пандемии COVID-19, вызываемой коронавирусом SARS-CoV-2, международное сообщество обеспокоено появлением мутаций, изменяющих биологические свойства патогена, например, повышающих его контагиозность или вирулентность. В частности, в конце 2020 года во всем мире было обнаружено несколько вызывающих озабоченность вариантов, включая «британский» (В. 1.1.7, ВОЗ предложила название «альфа»), «южноафриканский» (В. 1.351, «бета») и «бразильский» (Р.1, «гамма»). Эти варианты вируса были обозначены как вызывающие беспокойство в основном из-за того, что в некоторых географических регионах сообщалось об учащении случаев их передачи от человека к человеку, после чего они были обнаружены во многих странах мира. Например, «британский» вариант быстро распространился на Юго-Востоке Англии, где вызвал большое количество случаев заболевания COVID-19 и вскоре после этого был выявлен в США, став уже в апреле 2021 года доминирующим в стране. Было определено, что наличие мутации N501Y в гене, кодирующем S-гликопротеин (S-белок) вируса, повышает аффинность вирусного шипа к АСЕ2 рецептору человека, облегчая проникновение в клетку, и, таким образом, увеличивает трансмиссивность патогена. Точно так же варианты из Южной Африки и Бразилии, получившие названия по странам, где они были впервые выявлены, стали причиной крупных вспышек заболеваний в своих регионах. Эти варианты также вызывают озабоченность, поскольку они содержат мутацию Е484К в гене S-белка, которая снижает эффективность некоторых терапевтических моноклональных антител, ухудшает нейтрализацию вируса in vitro и может привести к потенциальному уходу от иммунного ответа, обусловленного ранее перенесенной инфекцией или вакцинацией. Несколько позже были обнаружены и другие эпидемиологически значимые штаммы, например, «индийский» (В. 1.617+, «дельта») и «калифорнийский» (В. 1.427/В. 1.429 «эпсилон»), также вызывающие беспокойство, в особенности первый. Кроме того, в России были выявлены и локальные штаммы «Сибирский» (В. 1.1.397+) и «Северо-западный» (В. 1.1.370.1), имеющие свои собственные ключевые отличия в гене S-белка, вероятно, требующие внимания.Since the outbreak of the COVID-19 pandemic caused by the SARS-CoV-2 coronavirus, the international community has been concerned about the emergence of mutations that alter the biological properties of the pathogen, for example, increasing its infectivity or virulence. In particular, at the end of 2020, several variants of concern were identified around the world, including “British” (B. 1.1.7, WHO suggested the name “alpha”), “South African” (B. 1.351, “beta”) and “ Brazilian "(R.1," gamma "). These variants of the virus have been identified as of concern mainly due to the increased frequency of human-to-human transmission reported in some geographic regions and have since been found in many countries around the world. For example, the “British” version quickly spread to the South East of England, where it caused a large number of cases of COVID-19 and was soon identified in the United States, becoming the dominant country in April 2021. It was determined that the presence of the N501Y mutation in the gene encoding the S-glycoprotein (S-protein) of the virus increases the affinity of the viral spike for the human ACE2 receptor, facilitating its penetration into the cell, and thus increases the transmissibility of the pathogen. Similarly, variants from South Africa and Brazil, named for the countries where they were first identified, have caused large outbreaks in their regions. These variants are also of concern because they contain the E484K mutation in the S-protein gene, which reduces the effectiveness of some therapeutic monoclonal antibodies, impairs virus neutralization in vitro, and may lead to a potential escape from the immune response due to previous infection or vaccination. Somewhat later, other epidemiologically significant strains were discovered, for example, "Indian" (B. 1.617+, "delta") and "Californian" (B. 1.427 / B. 1.429 "epsilon"), also causing concern, especially the first. In addition, in Russia, local strains "Siberian" (B. 1.1.397+) and "North-West" (B. 1.1.370.1) were identified, which have their own key differences in the S-protein gene, probably requiring attention ...

При решении задач молекулярной диагностики нуклеиновых кислот, помимо методов полимеразной цепной реакции (ПЦР) и секвенирования первого поколения по методу Сэнгера, широко используется секвенирование следующего поколения (NGS, от англ. Next Generation Sequencing), потенциально позволяющее выявлять все изменения в геноме. Метод NGS играет незаменимую роль в обнаружении мутаций нового коронавируса SARS-CoV-2 и имеет более высокую точность по сравнению с широко применяемой технологией ОТ-ПЦР для обнаружения нуклеиновых кислот за счет одновременного прочтения протяженных участков генома и выявления сразу большого количества мутаций. Однако, существующий на данный момент механизм детекции важных мутаций и оперативного выявления значимых штаммов недостаточно эффективен, поскольку не все образцы патогена могут быть исследованы на наличие генетических изменений с помощью полногеномного секвенирования ввиду его высокой стоимости и большого объема необходимых работ в лаборатории. По мере развития технологий производительность секвенирующих платформ постоянно возрастает, а затраты на их работу становятся все меньше. Тем не менее, на текущем уровне технологического развития данного семейства методов, полногеномное секвенирование большого числа образцов сложно осуществить как в силу высоких материальных и трудовых затрат, так и в силу ограниченной возможности анализа очень больших массивов получаемых данных.In solving the problems of molecular diagnostics of nucleic acids, in addition to polymerase chain reaction (PCR) methods and first-generation sequencing according to the Sanger method, Next Generation Sequencing (NGS) is widely used, which potentially allows detecting all changes in the genome. The NGS method plays an irreplaceable role in the detection of mutations in the new coronavirus SARS-CoV-2 and has a higher accuracy compared to the widely used RT-PCR technology for the detection of nucleic acids by simultaneously reading extended sections of the genome and detecting a large number of mutations at once. However, the currently existing mechanism for detecting important mutations and promptly detecting significant strains is not effective enough, since not all pathogen samples can be examined for genetic changes using whole genome sequencing due to its high cost and the large amount of work required in the laboratory. As technology advances, the performance of sequencing platforms is constantly increasing, and the costs of operating them are decreasing. Nevertheless, at the current level of technological development of this family of methods, genome-wide sequencing of a large number of samples is difficult to carry out both due to high material and labor costs, and due to the limited ability to analyze very large data sets.

В качестве альтернативы полногеномному секвенированию, при решении ряда задач молекулярной диагностики может быть применено так называемое «таргетное» (или целевое) секвенирование представляющих наибольший интерес участков генома рассматриваемого патогена. Целевая область фрагментов ДНК целевого гена или области генома направленно амплифицируются, а затем подвергаются секвенированию NGS, так что стоимость значительно снижается, а необходимость последующего анализа данных также уменьшается. По сравнению с обычным методом NGS, таргетное секвенирование выполняется после целевой амплификации фрагментов генома, так что стоимость секвенирования и анализа данных значительно снижаются, а чувствительность обнаружения повышается. В настоящее время подобные подходы широко используются, например, для секвенирования экзома человека, отдельных генов, но редко применяется к патогенным микроорганизмам.As an alternative to genome-wide sequencing, when solving a number of molecular diagnostics problems, the so-called “targeted” (or targeted) sequencing of the genome regions of the pathogen in question of greatest interest can be applied. The target region of DNA fragments of the target gene or regions of the genome are directionally amplified and then subjected to NGS sequencing, so that the cost is significantly reduced and the need for subsequent data analysis is also reduced. Compared to the conventional NGS method, targeted sequencing is performed after targeted amplification of genome fragments, so the cost of sequencing and data analysis is significantly reduced and the detection sensitivity is increased. Currently, such approaches are widely used, for example, for sequencing the human exome, individual genes, but rarely applied to pathogenic microorganisms.

Как правило, методы секвенирования выполняют три функции во время эпидемических вспышек:Typically, sequencing techniques perform three functions during outbreaks:

- идентификация неизвестных патогенов и определение идентичности новых патогенов в том случае, если будет получен весь или большая часть генома патогена;- identification of unknown pathogens and determination of the identity of new pathogens in the event that all or most of the pathogen genome is obtained;

- стадия развития эпидемической ситуации может использоваться для непосредственного обнаружения клинических образцов, динамического мониторинга состояния мутаций вирусного генома в режиме реального времени и помощи в диагностике ложно отрицательных образцов;- the stage of development of the epidemic situation can be used for direct detection of clinical samples, dynamic monitoring of the state of mutations of the viral genome in real time and assistance in the diagnosis of false negative samples;

- стадия выявления эпидемической ситуации может использоваться для скрининга лекарственно-устойчивых участков и ежедневного выявления инфекций дыхательных путей, а также повышается точность диагностики заболеваний дыхательных путей.- the stage of detecting the epidemic situation can be used for screening drug-resistant areas and daily detection of respiratory tract infections, as well as increasing the accuracy of diagnosing respiratory diseases.

Для того, чтобы идентифицировать исследуемый образец SARS-CoV-2 как представляющий интерес с эпидемиологической точки зрения, достаточно изучить несколько регионов гена, кодирующего S-белок, благодаря которому вирусная частица SARS-CoV-2 связывается с ангиотензинпревращающем ферментом 2 (рецептором АСЕ2), экспрессируемым клетками большинства тканей человека. При таргетном NGS секвенировании целевые регионы ДНК сначала амплифицируются с помощью специальных олигонуклеотидных праймеров, что позволяет изучать их затем избирательно. Далее, как правило, проводится этап лигирования служебных фрагментов олигонуклеотидов (адаптеров) с помощью особых дорогостоящих ферментов, и индексация с детекцией в режиме реального времени с помощью флуоресцентного интеркалирующего красителя.In order to identify the SARS-CoV-2 sample under study as of interest from an epidemiological point of view, it is enough to study several regions of the gene encoding the S-protein, due to which the SARS-CoV-2 viral particle binds to the angiotensin-converting enzyme 2 (ACE2 receptor), expressed by the cells of most human tissues. In targeted NGS sequencing, the target DNA regions are first amplified using special oligonucleotide primers, which allows them to be studied selectively. Further, as a rule, the stage of ligation of service fragments of oligonucleotides (adapters) is carried out using special expensive enzymes, and indexing with real-time detection using a fluorescent intercalating dye.

Из уровня техники известны следующие протоколы для секвенирования геномов коронавируса SARS-CoV-2 и наборы реагентов, обеспечивающие выявление важных мутаций нового вируса:From the prior art, the following protocols for sequencing the genomes of the SARS-CoV-2 coronavirus and reagent kits are known to ensure the detection of important mutations of the new virus:

Известно решение от Qiagen «QIAseq SARS-CoV-2 Primer Panel» для таргетной полногеномной пробоподготовки библиотек вируса SARS-CoV-2, что важно для геномного надзора и обнаружения генетических вариантов, в том числе новых. Панель праймеров QIAseq SARS-CoV-2 специально разработана для исследований генома коронавируса SARS-CoV-2. Этот набор в сочетании с набором QIAseq FX DNA Library UDI Kit представляет собой готовое решение для обогащения и секвенирования всего вирусного генома. Набор включает реагенты для обратной транскрипции РНК в кДНК и праймеры для специфического обогащения ее генома. Сама панель состоит из более чем 200 пар праймеров, охватывающих полный геном вируса размером ~29,900 п. н. [www.qiagen.com/ru/products/next-generation-sequencing/rna-sequencing/qiaseq-sars-cov-2-primer-panel/?clear=true#orderinginformation].Known solution from Qiagen "QIAseq SARS-CoV-2 Primer Panel" for targeted genome-wide sample preparation of libraries of the SARS-CoV-2 virus, which is important for genomic surveillance and detection of genetic variants, including new ones. The QIAseq SARS-CoV-2 primer panel is specially designed for the research of the SARS-CoV-2 coronavirus genome. This kit, in combination with the QIAseq FX DNA Library UDI Kit, provides a turnkey solution for enriching and sequencing the entire viral genome. The kit includes reagents for reverse transcription of RNA into cDNA and primers for specific enrichment of its genome. The panel itself consists of more than 200 primer pairs covering the entire virus genome of ~ 29,900 bp. [www.qiagen.com/ru/products/next-generation-sequencing/rna-sequencing/qiaseq-sars-cov-2-primer-panel/?clear=true#orinformation].

Существует решение «Swift Amplicon™ SARS-CoV-2 Panel», которое обеспечивает оптимальный охват и качество данных NGS на платформах секвенирования Illumina™. В этом наборе используется технология мультиплексной ПЦР, позволяющая конструировать библиотеку из цепи кДНК с использованием множества пар праймеров для покрытия полного вирусного генома длиной ~29,900 п. н. Праймеры были разработаны для эталонной последовательности NCBI NC 045512.2 (изолят коронавируса тяжелого острого респираторного синдрома 2 Ухань-Hu-l, полный геном) таким образом, чтобы отсутствовали нецелевые продукты, обусловленные амплификацией генома человека [swiftbiosci.com/swift-amplicon-sars-cov-2-panel/].There is a Swift Amplicon ™ SARS-CoV-2 Panel solution that provides optimal coverage and quality of NGS data on Illumina ™ sequencing platforms. This kit uses multiplex PCR technology to construct a library from a cDNA strand using multiple primer pairs to cover the entire viral genome of ~ 29,900 bp. The primers were designed for the reference sequence NCBI NC 045512.2 (Wuhan-Hu-l Severe Acute Respiratory Syndrome Coronavirus 2 isolate, complete genome) so that off-target products due to human genome amplification were absent [swiftbiosci.com/swift-amplicon-sars-cov -2-panel /].

Известна панель «AmpliSeq for Illumina SARS-CoV-2 Research Panel» от компании Illumina, содержащая 247 ампликонов в 2 пулах, нацеленных на геном SARS-CoV-2. Панель обеспечивает более 99% покрытия генома коронавируса (длиной - 30 ООО п. н.) и охватывает все потенциальные серотипы [www.illumina.com/products/by-brand/ampliseq/community-panels/sars-cov-2.html].Known panel "AmpliSeq for Illumina SARS-CoV-2 Research Panel" from Illumina, containing 247 amplicons in 2 pools, targeting the SARS-CoV-2 genome. The panel provides over 99% coverage of the coronavirus genome (30 000 bp long) and covers all potential serotypes [www.illumina.com/products/by-brand/ampliseq/community-panels/sars-cov-2.html] ...

Известна панель «Twist SARS-CoV-2 Research Panel» для обогащения мишеней для NGS секвенирования с целью обнаружения и характеризации вируса SARS-CoV-2. Панель нацелена на вирусный геном размером примерно 30,000 п. н. с использованием -1,000 зондов, разработанных для гибридизации с фрагментами генома SARS-CoV-2 (GenBank: MN908947.3) [www.twistbioscience.com/resources/product-sheet/twist-sars-cov-2-research-panel].Known panel "Twist SARS-CoV-2 Research Panel" for enrichment of targets for NGS sequencing in order to detect and characterize the SARS-CoV-2 virus. The panel targets the viral genome of approximately 30,000 bp. using -1,000 probes designed to hybridize with fragments of the SARS-CoV-2 genome (GenBank: MN908947.3) [www.twistbioscience.com/resources/product-sheet/twist-sars-cov-2-research-panel].

Панель «С1еапР1ех® SARS-CoV-2 FLEX» на основе ампликонов от Paragon Genomics предназначена для исследования и наблюдения за новым коронавирусом, обеспечивая полное покрытие генома вируса SARS-CoV-2. Панель FLEX построена на основе оригинальной панели SARS-CoV-2 и содержит дополнительные компоненты для более надежного поиска генетических вариантов, даже если вирус со временем мутирует. Это высоко мультиплексированная панель обогащения мишеней, охватывающая весь геном вируса SARS-CoV-2 (за исключением 92 нуклеотидных оснований на концах). Панель для исследований и наблюдения за SARS-CoV-2 позволяет провести полное секвенирование генома и эпидемиологические исследования нового вируса SARS-CoV-2, ответственного за пандемию COVID-19. С помощью технологии Paragon Genomics CleanPlex весь геном вируса может быть амплифицирован от РНК до готовых к последовательности библиотек за 5,5 часов [www.paragongenomics.com/product/cleanplex-sars-cov-2-flex-panel/].Paragon Genomics amplicon-based C1eapP1ex® SARS-CoV-2 FLEX panel is designed for research and observation of the new coronavirus, providing full coverage of the genome of the SARS-CoV-2 virus. The FLEX panel builds on the original SARS-CoV-2 panel and contains additional components to more reliably search for genetic variants, even if the virus mutates over time. It is a highly multiplexed target enrichment panel covering the entire genome of the SARS-CoV-2 virus (excluding the 92 nucleotide ends at the ends). The SARS-CoV-2 Research and Surveillance Panel enables full genome sequencing and epidemiological studies of the new SARS-CoV-2 virus, which is responsible for the COVID-19 pandemic. With Paragon Genomics CleanPlex technology, the entire viral genome can be amplified from RNA to sequencing ready libraries in 5.5 hours [www.paragongenomics.com/product/cleanplex-sars-cov-2-flex-panel/].

Исследовательская панель «Ion AmpliSeq SARS-CoV-2» позволяет осуществлять высокоточное типирование вируса SARS-CoV-2, вызывающего COVID-19, менее, чем за сутки. Панель основана на технологии высокомультиплексной ПЦР AmpliSeq, что позволяет исследователям получить надежные данные секвенирования из небольшого количества стартового материала. «Ion AmpliSeq SARS-CoV-2» совместима с любыми секвенаторами, основанными на технологии Ion Torrent [www.thermofisher.com/ru/ra/home/global/forms/life-science/ampliseq-sars-cov-2-analysis-demo/thank-you.html].The Ion AmpliSeq SARS-CoV-2 research panel enables highly accurate typing of the SARS-CoV-2 virus that causes COVID-19 in less than a day. The panel is based on AmpliSeq high multiplex PCR technology, which allows researchers to obtain reliable sequencing data from a small amount of starting material. Ion AmpliSeq SARS-CoV-2 is compatible with any sequencers based on Ion Torrent technology [www.thermofisher.com/ru/ra/home/global/forms/life-science/ampliseq-sars-cov-2-analysis- demo / thank-you.html].

Существует панель для NGS секвенирования гена S-белка «Swift Normalase Amplicon SARS-CoV-2», которая обеспечивает 100% покрытие S-гена, который кодирует спайковый белок в вирусе, вызывающем COVID-19. Панель позволяет определять появление новых вирусных штаммов, которые содержат мутации в гене S-белка, и определять их принадлежность к штаммам [swiftbiosci.com/swift-normalase-amplicon-sars-cov-2-s-gene-panel/].There is a panel for NGS sequencing of the S-protein gene "Swift Normalase Amplicon SARS-CoV-2", which provides 100% coverage of the S-gene, which encodes a spike protein in the virus that causes COVID-19. The panel allows you to determine the emergence of new viral strains that contain mutations in the S-protein gene, and to determine their belonging to the strains [swiftbiosci.com/swift-normalase-amplicon-sars-cov-2-s-gene-panel/].

Компания Thermo Fisher Scientific разработала и создала 26 тестов на основе ПЦР в реальном времени для выявления известных мутаций коронавируса «TaqMan SARS-CoV-2 Applied Biosystems», чтобы дать возможность исследователям комбинируя их создавать свою собственную панель для выявления мутаций. Это масштабируемое решение позволяет запускать несколько или сотни образцов для идентификации одной или нескольких мутаций - все на основе ПЦР в реальном времени [www.thermofisher.com/ru/ra/home/clinical/clinical-genomics/pathogen-detection-solutions/real-time-pcr-research-solutions-sars-cov-2/mutation-panel.html].Thermo Fisher Scientific has designed and built 26 real-time PCR tests to detect known mutations in the TaqMan SARS-CoV-2 Applied Biosystems coronavirus to enable researchers to combine them to create their own mutation detection panel. This scalable solution allows you to run multiple or hundreds of samples to identify one or more mutations - all based on real-time PCR [www.thermofisher.com/ru/ra/home/clinical/clinical-genomics/pathogen-detection-solutions/real- time-pcr-research-solutions-sars-cov-2 / mutation-panel.html].

Существует способ получения кДНК из выделенных вирусных нуклеиновых кислот SARS-CoV-2 и последующего создания ампликонов с длиной 400 нуклеотидов, покрывающих вирусный геном, с использованием праймеров V3 nCov-2019 (ARTIC). За этим следует создание библиотеки, объединение эквивалентных объемов образцов и количественный анализ перед секвенированием на Illumina. Пул праймеров ARTIC V3 обеспечивает полногеномное секвенирование SARS-CoV-2. Пул праймеров ARTIC NGS был скорректирован для обеспечения специфической и равномерной амплификации геномных последовательностей SARS-CoV-2. Продукты ПЦР подходят для последующей подготовки библиотеки и анализа NGS. Этот продукт позволяет проводить селективную обогащающую амплификацию на основе ПЦР полного генома SARS-CoV-2 с использованием праймеров ARTIC, которые состоят из 218 праймеров, охватывающих весь вирусный геном SARS-CoV-2 (29,9 КБ). Каждая партия пула праймеров ARTIC NGS проходит валидацию, где одни и те же пулы праймеров используются для продукта «ARTIC SARS-CoV-2 WGS» [www.protocols.io/view/covid-19-artic-v3-illumina-library-construction-an-bgxjjxkn; eurofinsgenomics.eu/en/dna-ma-oligonucleotides/optimised-application-oligos/artic-ngs-primer-pool/].There is a method for obtaining cDNA from isolated SARS-CoV-2 viral nucleic acids and then creating 400 nucleotide amplicons covering the viral genome using primers V3 nCov-2019 (ARTIC). This is followed by library creation, pooling of equivalent sample volumes, and quantitative analysis prior to sequencing on Illumina. The ARTIC V3 primer pool provides full genome sequencing of SARS-CoV-2. The ARTIC NGS primer pool has been adjusted to provide specific and uniform amplification of SARS-CoV-2 genomic sequences. PCR products are suitable for subsequent library preparation and NGS analysis. This product allows for selective enrichment PCR amplification of the entire SARS-CoV-2 genome using ARTIC primers, which consists of 218 primers covering the entire SARS-CoV-2 viral genome (29.9 KB). Each lot of the ARTIC NGS primer pool is validated, where the same primer pools are used for the ARTIC SARS-CoV-2 WGS product [www.protocols.io/view/covid-19-artic-v3-illumina-library-construction -an-bgxjjxkn; eurofinsgenomics.eu/en/dna-ma-oligonucleotides/optimised-application-oligos/artic-ngs-primer-pool/].

Несмотря на то, что все вышеперечисленные решения позволяют выявлять мутации в геноме нового коронавируса, наиболее близким аналогом предлагаемого способа является протокол для NGS секвенирования гена S-белка «Swift Normalase Amplicon SARS-CoV-2». Процесс определения геномных последовательностей патогенов наподобие вируса SARS-CoV-2, согласно данному протоколу, включает в себя создание ампликонов с помощью мультиплексной ПЦР в одной пробирке в течение 2-х часов, поддерживает высокопроизводительные методы количественного анализа библиотеки (флуориметрический, электрофоретический), и оптимизирован для всех платформ секвенирования от компании Illumina.Despite the fact that all of the above solutions allow detecting mutations in the genome of the new coronavirus, the closest analogue of the proposed method is the protocol for NGS sequencing of the S-protein gene "Swift Normalase Amplicon SARS-CoV-2". The process of determining the genomic sequences of pathogens like the SARS-CoV-2 virus, according to this protocol, includes the creation of amplicons using multiplex PCR in one tube for 2 hours, supports high-throughput methods of quantitative analysis of the library (fluorometric, electrophoretic), and is optimized for all Illumina sequencing platforms.

Вместе с тем, все перечисленные решения, включая ближайший аналог, имеют общий недостаток, который выражается не только в высокой стоимости необходимых расходных материалов, а также в том, что секвенируются полные геном или S-ген вируса, и информация может быть избыточна, если целью стоит только выявление эпидемиологически значимых мутаций вируса, присущих к известным штаммам, вызывающим беспокойство.At the same time, all of the listed solutions, including the closest analogue, have a common disadvantage, which is expressed not only in the high cost of the necessary consumables, but also in the fact that the complete genome or S-gene of the virus is sequenced, and information may be redundant if the goal is it is only necessary to identify epidemiologically significant mutations of the virus inherent in known strains of concern.

Решения, основанные на ПЦР в реальном времени, также имеют свой недостаток -выявляются лишь конкретные мутации, без возможности исследования соседних участков в «горячих» областях, в которых могут произойти новые генетические изменения. Кроме того, выявление каждой мутации требует отдельной постановки ПЦР реакции, что увеличивает время исследования.Solutions based on real-time PCR also have their disadvantage - only specific mutations are detected, without the possibility of examining neighboring regions in "hot" areas in which new genetic changes can occur. In addition, the detection of each mutation requires a separate PCR reaction, which increases the study time.

В настоящее время существует острая необходимость в получении эффективных и простых способах приготовления библиотек для целевого секвенирования важных фрагментов генома нового коронавируса SARS-CoV-2.Currently, there is an urgent need to obtain efficient and simple methods for preparing libraries for targeted sequencing of important fragments of the genome of the new SARS-CoV-2 coronavirus.

Технической задачей, на решение которой направлено заявляемое решение, является разработка эффективного способа пробоподготовки для фрагментарного NGS-секвенирования ряда регионов генома коронавируса S ARS-CoV-2, содержащих известные эпидемиологически значимые мутации.The technical problem to be solved by the claimed solution is the development of an effective method for sample preparation for fragmentary NGS sequencing of a number of regions of the genome of coronavirus S ARS-CoV-2 containing known epidemiologically significant mutations.

Заявляемое изобретение позволяет преодолеть недостатки предшествующего уровня техники и в значительной мере уменьшает трудо- и финансовые затраты при пробоподготовке, объем получаемых данных секвенирования, что упрощает процесс анализа данных, и дополнительно повышает чувствительность и точность метода NGS.The claimed invention allows to overcome the disadvantages of the prior art and significantly reduces labor and financial costs in sample preparation, the volume of obtained sequencing data, which simplifies the data analysis process, and further increases the sensitivity and accuracy of the NGS method.

Технический результат достигается за счет таргетного (целевого) секвенирования представляющих наибольший интерес участков генома вируса SARS-CoV-2, содержащих известные эпидемиологически значимые мутации, позволяющие также отнести изолят коронавируса к известным штаммам, в том числе штаммам, вызывающим обеспокоенность. Посредством разработанных праймеров, имеющих адаптерные подпоследовательности в своем составе, возможна амплификация целевых участков генома, и при этом не требуется проводить дорогостоящий этап лигирования адаптеров, используемый в ряде протоколов. При этом амплификацию проводят с использованием двух пулов олигонуклеотидных праймеров, где для первого пула применяют олигонуклеотидные праймеры, имеющие структуру SEQ ID NO: 1 4, с концентрацией в реакционной смеси каждого праймера 0,1 пмоль/мкл., а для второго пула применяют олигонуклеотидные праймеры, имеющие структуру SEQ ID NO: 5 - 10, с концентрацией в реакционной смеси каждого праймера 0,2 пмоль/мкл. Амплифицированные фрагменты кДНК, после проведения секвенирования, позволяют выявить значимые мутации патогена в исследуемом образце.The technical result is achieved through targeted (targeted) sequencing of the regions of the greatest interest in the genome of the SARS-CoV-2 virus containing known epidemiologically significant mutations, which also make it possible to classify the coronavirus isolate as a known strain, including strains of concern. By means of the developed primers with adapter subsequences in their composition, amplification of the target genome regions is possible, and at the same time it is not required to carry out the expensive stage of adapter ligation, which is used in a number of protocols. In this case, amplification is carried out using two pools of oligonucleotide primers, where oligonucleotide primers having the structure SEQ ID NO: 1 4 are used for the first pool, with a concentration of 0.1 pmol / μL in the reaction mixture of each primer, and oligonucleotide primers are used for the second pool having the structure SEQ ID NO: 5 to 10, with a concentration in the reaction mixture of each primer of 0.2 pmol / μl. Amplified cDNA fragments, after sequencing, make it possible to identify significant pathogen mutations in the sample under study.

Сложность выбора праймеров обусловлена требованием к их строгой видоспецифичности, необходимости обеспечить амплификацию в формате мультиплекса, отсутствия кросс-комплементарности между собой и с используемыми адаптерами, а также другими фрагментами генома коронавируса SARS-CoV-2 и генома человека.The complexity of the choice of primers is due to the requirement for their strict species-specificity, the need to provide amplification in the multiplex format, the absence of cross-complementarity with each other and with the adapters used, as well as other fragments of the SARS-CoV-2 coronavirus genome and the human genome.

Предложенные в изобретении синтетические олигонуклеотидные праймеры для обнаружения ряда эпидемиологически значимых мутаций в генетическом материале (РНК) коронавируса SARS-CoV-2 методом NGS секвенирования имеют следующую структуру: SEQ ID NO: 1-10. При этом олигонуклеотидные праймеры, имеющие структуры SEQ ID NO: 1, 3, 5, 7, 9 выполняют функции прямых праймеров, а олигонуклеотидные праймеры, имеющие структуры SEQ ID NO: 2, 4, 6, 8, 10, выполняют функции обратных праймеров.The synthetic oligonucleotide primers of the invention for detecting a number of epidemiologically significant mutations in the genetic material (RNA) of SARS-CoV-2 coronavirus by NGS sequencing have the following structure: SEQ ID NO: 1-10. In this case, oligonucleotide primers having structures SEQ ID NO: 1, 3, 5, 7, 9 act as forward primers, and oligonucleotide primers having structures SEQ ID NO: 2, 4, 6, 8, 10 act as reverse primers.

Кроме того, олигонуклеотидные праймеры содержат в своем составе универсальные адаптерные последовательности, представленные в перечне последовательностей как SEQ ID NO: 11 и 12, позволяющие в дальнейшем облегчить индексацию продуктов амплификации. Адаптерные последовательности SEQ ID NO: 11, расположены на концах олигонуклеотидов SEQ ID NO: 1, 3, 5, 7, 9. Адаптерные последовательности SEQ ID NO: 12, расположены на концах олигонуклеотидов SEQ ID NO: 2, 4, 6, 8, 10.In addition, the oligonucleotide primers contain universal adapter sequences shown in the sequence listing as SEQ ID NOs: 11 and 12, which further facilitate the indexing of amplification products. The adapter sequences SEQ ID NO: 11 are located at the ends of the oligonucleotides SEQ ID NO: 1, 3, 5, 7, 9. The adapter sequences SEQ ID NO: 12 are located at the ends of the oligonucleotides SEQ ID NO: 2, 4, 6, 8, 10.

При разработке применяемых в данном способе 5 пар праймеров (SEQ ID NO: 1-10) для таргетной амплификации фрагментов гена S-белка олигонуклеотидные последовательности были подобраны вручную с учетом имеющейся информации об известных эпидемиологически значимых мутациях. Этот процесс включал в себя загрузку множества последовательностей геномов коронавируса SARS-CoV-2 из баз данных NCBI и GISAID, выравнивание последовательностей с целью определения консервативных фрагментов, определение списка эпидемиологически значимых генетических изменений. Температуры плавления олигонуклеотидов и характер взаимодействий между ними определялись с помощью инструмента Multiple Primer Analyzer от Thermo Fisher Scientific (США). С помощью программы blastn оценивалась специфичность каждой полученной последовательности ко всем известным организмам, в частности, Homo sapiens, что позволяет исключить неспецифическое взаимодействие между праймерами и участками ДНК человека и других организмов. Кроме того, синтезированные олигонуклеотиды содержат дополнительные последовательности, облегчающие и удешевляющие процесс индексации продуктов амплификации. Расстояния между праймерами в парах были подобраны таким образом, чтобы длина исследуемого региона была в пределах 300 п. н., что позволяет избежать этапа отбора фрагментов с заданной длиной, и совместимо с длиной прочтений большинства наборов реагентов для секвенирования от компании Illumina.When developing used in this method 5 pairs of primers (SEQ ID NO: 1-10) for targeted amplification of fragments of the S-protein gene, oligonucleotide sequences were selected manually taking into account the available information about known epidemiologically significant mutations. This process included downloading multiple sequences of the genomes of the SARS-CoV-2 coronavirus from the NCBI and GISAID databases, aligning the sequences in order to identify conservative fragments, and defining a list of epidemiologically significant genetic changes. Melting temperatures of oligonucleotides and the nature of interactions between them were determined using the Multiple Primer Analyzer instrument from Thermo Fisher Scientific (USA). Using the blastn program, the specificity of each obtained sequence was assessed for all known organisms, in particular, Homo sapiens, which makes it possible to exclude nonspecific interactions between primers and DNA regions of humans and other organisms. In addition, the synthesized oligonucleotides contain additional sequences that facilitate and reduce the cost of the process of indexing amplification products. The distances between the primers in pairs were selected so that the length of the region of interest was within 300 bp, which avoids the step of selecting fragments with a given length, and is compatible with the read lengths of most of the Illumina sequencing reagent kits.

Полученные олигонуклеотиды на одном конце имеют праймерную последовательность, комплементарную участкам генома, а на другом - адаптерные последовательности, следовательно, полученные после амплификации целевые фрагменты сразу фланкированы такими адаптерными последовательностями. Олигонуклеотиды, используемые для индексации, в свою очередь, комплементарны адаптерным последовательностям с одного конца и соответствуют индексам с другого.The resulting oligonucleotides at one end have a primer sequence complementary to the genome regions, and at the other end - adapter sequences; therefore, the target fragments obtained after amplification are immediately flanked by such adapter sequences. Oligonucleotides used for indexing, in turn, are complementary to adapter sequences at one end and correspond to indexes at the other.

В качестве индексных последовательностей используют олигонуклеотиды, несущие различные индексы, которые позволяют отличать данные секвенирования молекул из разных образцов. Примеры подобных индексных последовательностей доступны на сайтах производителей наборов реагентов для высокопроизводительного секвенирования.As index sequences, oligonucleotides with different indexes are used, which make it possible to distinguish the sequencing data of molecules from different samples. Examples of such index sequences are available on the websites of manufacturers of high-throughput sequencing reagent kits.

Таким образом, в процессе индексации происходят этапы отжига олигонуклеотидов на концах целевых фрагментов и амплификации. После этого продукты амплификации подвергаются секвенированию методом NGS. Описанный подход приводит к тому, что стоимость исследования значительно снижается, уменьшаются объемы нуждающихся в анализе экспериментальных данных, а также возрастает чувствительность обнаружения. В настоящее время такие подходы широко распространены при клиническом секвенировании полного экзома человека, но редко применяются к патогенным микроорганизмам.Thus, in the process of indexing, the stages of annealing of oligonucleotides at the ends of the target fragments and amplification take place. After that, the amplification products are subjected to NGS sequencing. The described approach leads to the fact that the cost of research is significantly reduced, the amount of experimental data that needs to be analyzed decreases, and the detection sensitivity also increases. Currently, such approaches are widely used in clinical sequencing of complete human exome, but are rarely applied to pathogenic microorganisms.

На основе имеющейся информации, определены регионы генома SARS-CoV-2, мутации в которых представляют наибольшую эпидемиологическую важность. Таргетное секвенирование данных участков позволяет кардинально снизить стоимость исследования и сократить объем генерируемых данных, включая соответствующий биоинформатический анализ.Based on the available information, the regions of the SARS-CoV-2 genome, in which mutations are of the greatest epidemiological importance, have been identified. Targeted sequencing of these sites can dramatically reduce research costs and reduce the amount of data generated, including appropriate bioinformatics analysis.

По сравнению с известным протоколом пробоподготовки Illumina Nextera XT (https://www.illumina.com/products/by4ype/sequencing-kits/library-prep-kits/nextera-xt-dna.html), предлагаемый способ пробоподготовки позволяет избежать этапов тагментации и отбора фрагментов с необходимыми длинами, поскольку продукты амплификации изначально имеют длину от 216 до 377 пар нуклеотидов без учета адаптерных последовательностей (то есть совместимы с большинством версий наборов реагентов компании Illumina для ее секвенирующих платформ), а также содержат адаптерные последовательности для дальнейшей индексации, что существенно упрощает и удешевляет анализ полученных при секвенировании данных.Compared to the well-known Illumina Nextera XT sample preparation protocol (https://www.illumina.com/products/by4ype/sequencing-kits/library-prep-kits/nextera-xt-dna.html), the proposed sample preparation method avoids the and selection of fragments with the required lengths, since the amplification products are initially from 216 to 377 base pairs in length, excluding adapter sequences (that is, they are compatible with most versions of Illumina reagent kits for its sequencing platforms), and also contain adapter sequences for further indexing, which greatly simplifies and reduces the cost of the analysis of data obtained during sequencing.

Заявляемое изобретение является результатом работы в рамках исследования генетического разнообразия коронавируса SARS-CoV-2, проделанной в ФБУН ЦНИИ Эпидемиологии Роспотребнадзора (Москва, Россия). Представленный способ был отработан более чем на 500 образцах биологического материала, представляющего собой мазки в транспортной среде от пациентов из Москвы и Московской области с подозрениями на COVID-19, которые впоследствии были идентифицированы как положительные на наличие SARS-CoV-2 с помощью набора реагентов «AmpliSens® Cov-Bat-FL» (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора, Россия), использованным в соответствии с инструкцией производителя.The claimed invention is the result of work in the framework of the study of the genetic diversity of the coronavirus SARS-CoV-2, carried out at the FBSI Central Research Institute of Epidemiology of Rospotrebnadzor (Moscow, Russia). The presented method was tested on more than 500 samples of biological material, which are smears in the transport medium from patients from Moscow and the Moscow region with suspected COVID-19, who were subsequently identified as positive for the presence of SARS-CoV-2 using the reagent kit " AmpliSens® Cov-Bat-FL "(FBSI Central Research Institute of Epidemiology of Rospotrebnadzor, Russia), used in accordance with the manufacturer's instructions.

Выделение РНК из клинического материала производилось с помощью комплекта реагентов в соответствии с инструкцией производителя. Для выделения РНК может быть использован комплекта реагентов РИБО-преп (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора, Россия) или любой аналогичный коммерческий набор для выделения РНК.Isolation of RNA from clinical material was performed using a reagent kit in accordance with the manufacturer's instructions. To isolate RNA, a set of reagents RIBO-prep (FBUN Central Research Institute of Epidemiology of Rospotrebnadzor, Russia) or any similar commercial kit for RNA isolation can be used.

Обратная транскрипция проводится с использованием набора реагентов РЕВЕРТА-L (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора, Россия) или любого аналогичного коммерческого набора для обратной транскрипции в соответствии с инструкцией производителя. Далее, с полученной кДНК в качестве матрицы проводятся две реакции амплификации с использованием двух пулов специфических олигонуклеотидов (Таблица 1. Структуры олигонуклеотидов, используемых для амплификации целевых фрагментов геномов коронавируса SARS-CoV-2). Праймеры, помимо специфической области, комплементарной целевому фрагменту генома вируса, дополнительно содержат также особые последовательности, комплементарные последовательностям адаптеров, используемых при пробоподготовке к NGS секвенированию.Reverse transcription is performed using the REVERTA-L reagent kit (FBUN TsNII Epidemiologii Rospotrebnadzor, Russia) or any similar commercial kit for reverse transcription in accordance with the manufacturer's instructions. Further, with the obtained cDNA as a template, two amplification reactions are carried out using two pools of specific oligonucleotides (Table 1. The structures of oligonucleotides used to amplify the target fragments of the genomes of the SARS-CoV-2 coronavirus). The primers, in addition to the specific region complementary to the target fragment of the viral genome, additionally contain special sequences complementary to the sequences of the adapters used in sample preparation for NGS sequencing.

Figure 00000001
Figure 00000001

ПЦР-микс объемом 20 мкл на одну реакцию содержит 10 мкл ПЦР-смеси-2 blue (АмплиСенс, ФБУН ЦНИИ Эпидемиологии Роспотребнадзора, Россия), 2.5 мкл эквимолярной смеси четырех дезоксирибонуклеозидтрифосфатов со стоковой концентрацией 4.4 мМ, олигонуклеотиды в указанных в таблице концентрациях и воду milli-Q. ДНК-матрица добавляется в количестве 5 мкл, итоговый объем реакции составляет 25 мкл. Продуктами амплификации являются целевые участки гена, кодирующего S-белок вируса SARS-CoV-2. Длины получаемых фрагментов составляют 216-377 п. н. без учета длин адаптерных и индексных последовательностей, что обеспечивает их частичное или полное покрытие при использовании популярных наборов реагентов для секвенирования: MiSeq Reagent Kit v2 (300-cycles), MiSeq Reagent Kit v3 (600-cycle), HiSeq Rapid SBS Kit v2 (500 cycles) - все производства Illumina (США). Температурный профиль амплификации для получения ПЦР-продукта:A PCR mix with a volume of 20 μl per reaction contains 10 μl of PCR mixture-2 blue (AmpliSens, FBUN TsNII Epidemiologii Rospotrebnadzor, Russia), 2.5 μl of an equimolar mixture of four deoxyribonucleoside triphosphates with a stock concentration of 4.4 mM, oligonucleotides in the concentrations indicated in the table and milli water -Q. The DNA template is added in an amount of 5 μl, the final reaction volume is 25 μl. The amplification products are the target regions of the gene encoding the S-protein of the SARS-CoV-2 virus. The lengths of the fragments obtained are 216-377 bp. without taking into account the lengths of the adapter and index sequences, which provides their partial or full coverage when using popular sequencing reagent kits: MiSeq Reagent Kit v2 (300-cycles), MiSeq Reagent Kit v3 (600-cycle), HiSeq Rapid SBS Kit v2 (500 cycles) - all manufactured by Illumina (USA). Amplification temperature profile for obtaining a PCR product:

1. Денатурация проводится при 95°С в течение 2 минут;1. Denaturation is carried out at 95 ° C for 2 minutes;

2. 38 циклов амплификации:2.38 amplification cycles:

a. 95°С - 30 сек;a. 95 ° С - 30 sec;

b. 60°С - 20 сек;b. 60 ° С - 20 sec;

c. 72°С - 60 сек.c. 72 ° C - 60 sec.

3. Финальная элонгация: 72°С в течение 3 минут.3. Final elongation: 72 ° C for 3 minutes.

Длины полученных продуктов амплификации оцениваются с помощью электрофореза в агарозном геле. По интенсивности полос, соответствующих целевым фрагментам, оценивается приблизительное количество ПЦР-продуктов в каждом из двух пулов. Пропорционально полученным оценкам продукты амплификации первого и второго пулов объединяются в объемном отношении (n1*2):(n2*3), где n1 и n2 - оценки интенсивности для первого и второго пулов соответственно.The lengths of the amplification products obtained are assessed by agarose gel electrophoresis. The intensity of the bands corresponding to the target fragments is used to estimate the approximate number of PCR products in each of the two pools. In proportion to the estimates obtained, the amplification products of the first and second pools are combined in the volume ratio (n1 * 2) :( n2 * 3), where n1 and n2 are the intensity estimates for the first and second pools, respectively.

Затем проводится очистка ПЦР-продуктов от реакционной смеси с использованием магнитных частиц, например, SpeedBeads™ magnetic carboxylate modified particles (Cytiva, США) в объемном отношении 1:1.3.Then, the PCR products are purified from the reaction mixture using magnetic particles, for example, SpeedBeads ™ magnetic carboxylate modified particles (Cytiva, USA) in a volume ratio of 1: 1.3.

После этого осуществляется индексация полученных фрагментов. Синтезированные олигонуклеотиды на одном конце содержат праймерную последовательность, комплементарную целевым участкам генома, а на другом -адаптерные последовательности двух типов: для прямых праймеров - SEQ ID NO: 11; для обратных праймеров - SEQ ID NO: 12, соответственно. Таким образом, полученные после амплификации целевые фрагменты будут сразу фланкированы адаптерными последовательностями, что существенно ускоряет и удешевляет пробоподготовку. Олигонуклеотиды, используемые для индексации, в свою очередь, на одном конце содержат последовательности, соответствующие индексам, а на другом последовательности, комплементарные упомянутым ранее адаптерным последовательностям.After that, the resulting fragments are indexed. The synthesized oligonucleotides at one end contain a primer sequence complementary to the target regions of the genome, and on the other, two types of adapter sequences: for forward primers - SEQ ID NO: 11; for reverse primers - SEQ ID NO: 12, respectively. Thus, the target fragments obtained after amplification will be immediately flanked by adapter sequences, which significantly speeds up and reduces the cost of sample preparation. The oligonucleotides used for indexing, in turn, contain at one end the sequences corresponding to the indexes, and at the other, the sequences complementary to the previously mentioned adapter sequences.

Таким образом, в процессе индексации происходят этапы отжига олигонуклеотидов на концах целевых фрагментов и амплификации продукта. ПЦР-микс объемом 19 мкл на одну реакцию содержит 11.5 мкл ПЦР-смеси-2 blue (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора, Россия), 2.5 мкл эквимолярной смеси четырех дезоксирибонуклеозидтрифосфатов со стоковой концентрацией 4.4 мМ, 1 мкл интеркалирующего красителя EvaGreen® Dye (Biotium, США) для детекции амплификации в реальном времени, соответствующие олигонуклеотиды в концентрации 0.357 пмоль/мкл и воду milli-Q. ДНК-матрица добавляется в количестве 9 мкл, итоговый объем реакции составляет 28 мкл.Thus, in the process of indexing, the stages of annealing of oligonucleotides at the ends of the target fragments and amplification of the product occur. A PCR mix with a volume of 19 μL for one reaction contains 11.5 μL of PCR mixture-2 blue (FBUN TsNII Epidemiologii Rospotrebnadzor, Russia), 2.5 μL of an equimolar mixture of four deoxyribonucleoside triphosphates with a stock concentration of 4.4 mM, 1 μL of intercalating dye EvaGreen® Dye (Biotium, USA ) for real-time amplification detection, the corresponding oligonucleotides at a concentration of 0.357 pmol / μl and milli-Q water. The DNA template is added in an amount of 9 μl, the final reaction volume is 28 μl.

Температурный профиль индексации:Temperature Indexing Profile:

1. 98°С в течение 30 секунд;1.98 ° C for 30 seconds;

2. 15 циклов:2.15 cycles:

a. 98°С в течение 10 секунд;a. 98 ° C for 10 seconds;

b. 65°С в течение 1 минуты 15 секунд (на этом этапе осуществляется детекция).b. 65 ° C for 1 minute 15 seconds (at this stage, detection is carried out).

Далее повторно производится очистка от реакционной смеси с использованием магнитных частиц, например, SpeedBeads™ magnetic carboxylate modified particles (Cytiva, США) в объемном отношении 1:1.3.Then, the reaction mixture is purified again using magnetic particles, for example, SpeedBeads ™ magnetic carboxylate modified particles (Cytiva, USA) in a volume ratio of 1: 1.3.

В результате получаются готовые для секвенирования библиотеки, содержащие целевые фрагменты генома SARS-CoV-2, содержащие известные эпидемиологически значимые мутации, позволяющие также отнести изолят коронавируса к известным штаммам, в том числе, штаммам, вызывающим обеспокоенность.As a result, libraries are obtained, ready for sequencing, containing target fragments of the SARS-CoV-2 genome containing known epidemiologically significant mutations, which also make it possible to classify the coronavirus isolate as a known strain, including strains of concern.

Заявляемое изобретение поясняется рисунками, где:The claimed invention is illustrated by drawings, where:

Рисунок 1. Расположение участков гена S-белка вируса SARS-CoV-2, амплифицируемых с помощью разработанных наборов олигонуклеотидных праймеров. Также на рисунке отмечены мутации, представляющие наибольший интерес с эпидемиологической точки зрения ввиду их влияния на биологические свойства вируса.Figure 1. Location of the S-protein gene regions of the SARS-CoV-2 virus amplified using the developed sets of oligonucleotide primers. The figure also shows mutations that are of greatest epidemiological interest due to their effect on the biological properties of the virus.

Рисунок 2. Электрофореграмма продуктов амплификации участков генома SARS-CoV-2, полученных с помощью разработанных олигонуклеотидных праймеров. А -продукты амплификации с первым пулом праймеров, В - продукты амплификации со вторым пулом праймеров.Figure 2. Electropherogram of amplification products of SARS-CoV-2 genome regions obtained using the developed oligonucleotide primers. A - products of amplification with the first pool of primers, B - products of amplification with the second pool of primers.

Заявляемое изобретение также поясняется следующими примерами конкретного применения.The claimed invention is also illustrated by the following examples of specific applications.

Пример 1. Обнаружение последовательности линии В. 1.1.7.Example 1. Detection of the sequence of line B. 1.1.7.

У пациента с симптомами ОРВИ был взят мазок из ротоглотки. С помощью набора реагентов РИБО-преп (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора, Россия) из собранного материала была выделена РНК вируса, впоследствии подвергнутая обратной транскрипции с помощью набора PEBEPTA-L (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора, Россия), оба этапа проводились согласно инструкциям производителя. Полученная кДНК была использована для амплификации целевых участков в двух пулах. ПЦР-микс объемом 20 мкл на одну реакцию был составлен из 10 мкл ПЦР-смеси-2 blue (АмплиСенс, Россия), 2.5 мкл эквимолярной смеси четырех дезоксирибонуклеозидтрифосфатов со стоковой концентрацией 4.4 мМ и последовательностей, приведенных в перечне. В первом пуле в реакционную среду были добавлены олигонуклеотидные праймеры SEQ ID NO: 1-4 с концентрацией в реакционной смеси каждого праймера 0,1 пмоль/мкл. Во втором пуле в реакционную среду были добавлены олигонуклеотидные праймеры SEQ ID NO: 5-10 с концентрацией в реакционной смеси каждого праймера 0,2 пмоль/мкл.An oropharyngeal swab was taken from a patient with ARVI symptoms. Using a set of reagents RIBO-prep (FBUN Central Research Institute of Epidemiology of Rospotrebnadzor, Russia), virus RNA was isolated from the collected material, subsequently subjected to reverse transcription using the PEBEPTA-L kit (FBUN Central Research Institute of Epidemiology of Rospotrebnadzor, Russia), both stages were carried out according to the manufacturer's instructions. The obtained cDNA was used to amplify the target regions in two pools. A PCR mix with a volume of 20 μL per reaction was composed of 10 μL of PCR mixture-2 blue (AmpliSens, Russia), 2.5 μL of an equimolar mixture of four deoxyribonucleoside triphosphates with a stock concentration of 4.4 mM, and the sequences listed in the list. In the first pool, oligonucleotide primers SEQ ID NO: 1-4 were added to the reaction medium with a concentration of 0.1 pmol / μl for each primer in the reaction mixture. In the second pool, oligonucleotide primers SEQ ID NO: 5-10 were added to the reaction medium with a concentration of 0.2 pmol / μl for each primer in the reaction mixture.

Полученные смеси были доведены до объема 20 мкл с помощью воды Milli-Q. ДНК-матрица добавлялась в количестве 5 мкл, итоговый объем каждой реакции составлял 25 мкл.The resulting mixtures were made up to a volume of 20 μl with Milli-Q water. The template DNA was added in an amount of 5 μl; the final volume of each reaction was 25 μl.

Температурный профиль амплификации:Amplification temperature profile:

1. Денатурация проводится при 95°С в течение 2 минут;1. Denaturation is carried out at 95 ° C for 2 minutes;

2. 38 циклов амплификации:2.38 amplification cycles:

a. 95°С - 30 сек;a. 95 ° С - 30 sec;

b. 60°С - 20 сек;b. 60 ° С - 20 sec;

c. 72°С - 60 сек.c. 72 ° C - 60 sec.

3. Финальная элонгация: 72°С в течение 3 минут.3. Final elongation: 72 ° C for 3 minutes.

Полученные продукты амплификации, имеющие длину 216-377 п.н. без учета длин адаптерных и индексных последовательностей, были обнаружены методом электрофореза в агарозном геле, после чего пулы были объединены, а полученная смесь была очищена от реакционной среды с помощью магнитных частиц, SpeedBeads™ magnetic carboxylate modified particles (Cytiva, США). Затем, методом ПЦР в реальном времени была проведена индексация продуктов амплификации. Синтезированные олигонуклеотиды на одном конце содержат праймерную последовательность, комплементарную целевым участкам генома, а на другом - адаптерные последовательности двух типов: для прямых праймеров - SEQ ID NO: 11; для обратных праймеров - SEQ ID NO: 12, соответственно. ПЦР-микс объемом 19 мкл на одну реакцию был составлен из 11.5 мкл ПЦР-смеси-2 blue (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора, Россия), 2.5 мкл эквимолярной смеси четырех дезоксирибонуклеозидтрифосфатов со стоковой концентрацией 4.4 мМ, 1 мкл интеркалирующего красителя EvaGreen® Dye (Biotium, США) для детекции амплификации в реальном времени, соответствующих олигонуклеотидов в концентрации 0.357 пмоль/мкл и воды milli-Q. ДНК-матрица добавлялась в количестве 9 мкл, итоговый объем реакции составлял 28 мкл.The resulting amplification products having a length of 216-377 bp. without taking into account the lengths of the adapter and index sequences, were detected by electrophoresis in agarose gel, after which the pools were pooled, and the resulting mixture was purified from the reaction medium using magnetic particles, SpeedBeads ™ magnetic carboxylate modified particles (Cytiva, USA). Then, the amplification products were indexed by real-time PCR. The synthesized oligonucleotides at one end contain a primer sequence complementary to the target regions of the genome, and at the other end - adapter sequences of two types: for forward primers - SEQ ID NO: 11; for reverse primers - SEQ ID NO: 12, respectively. The PCR mix with a volume of 19 μL per reaction was composed of 11.5 μL of PCR mixture-2 blue (FBSI TsNII Epidemiologii Rospotrebnadzor, Russia), 2.5 μL of an equimolar mixture of four deoxyribonucleoside triphosphates with a stock concentration of 4.4 mM, 1 μL of intercalating dye EvaGreen® Dye ( , USA) for real-time amplification detection of the corresponding oligonucleotides at a concentration of 0.357 pmol / μL and milli-Q water. The template DNA was added in an amount of 9 μl, the final reaction volume was 28 μl.

Температурный профиль индексации:Temperature Indexing Profile:

1. 98°С в течение 30 секунд;1.98 ° C for 30 seconds;

2. 15 циклов:2.15 cycles:

a. 98°С в течение 10 секунд;a. 98 ° C for 10 seconds;

b. 65°С в течение 1 минуты 15 секунд (этап детекции).b. 65 ° C for 1 minute 15 seconds (detection stage).

Далее повторно была произведена очистка от реакционной смеси с использованием магнитных частиц, SpeedBeads™ magnetic carboxylate modified particles (Cytiva, США).Then, the reaction mixture was purified again using magnetic particles, SpeedBeads ™ magnetic carboxylate modified particles (Cytiva, USA).

Индексированные последовательности были отсеквенированы на приборе Illumina MiSeq с использованием реагентов MiSeq Reagent Kit v3 (600-cycle). Результаты исследования были проанализированы с помощью утилит FastQC, bwa и samtools.Indexed sequences were sequenced on an Illumina MiSeq instrument using MiSeq Reagent Kit v3 (600-cycle). The research results were analyzed using the FastQC, bwa and samtools utilities.

При изучении полученных данных был сделан вывод о наличии в исходной последовательности мутаций HV69-70, Y144, N501Y и A570D, что позволяет отнести ее к линии В. 1.1.7 («британский» штамм).When studying the data obtained, it was concluded that the initial sequence contained mutations HV69-70, Y144, N501Y, and A570D, which makes it possible to assign it to line B. 1.1.7 ("British" strain).

Пример 2. Обнаружение последовательности линии В. 1.351.Example 2. Detection of the sequence of line B. 1.351.

У пациента с симптомами ОРВИ был взят мазок из ротоглотки. С помощью набора реагентов РИБО-преп (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора, Россия) из собранного материала была выделена РНК вируса, впоследствии подвергнутая обратной транскрипции с помощью набора PEBEPTA-L (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора, Россия), оба этапа проводились согласно инструкциям производителя. Полученная кДНК была использована для амплификации целевых участков в двух пулах. ПЦР-микс объемом 20 мкл на одну реакцию был составлен из 10 мкл ПЦР-смеси-2 blue (АмплиСенс, Россия), 2.5 мкл эквимолярной смеси четырех дезоксирибонуклеозидтрифосфатов со стоковой концентрацией 4.4 мМ и последовательностей, приведенных в перечне. В первом пуле в реакционную среду были добавлены олигонуклеотидные праймеры SEQ ID NO: 1-4 с концентрацией в реакционной смеси каждого праймера 0,1 пмоль/мкл. Во втором пуле в реакционную среду были добавлены олигонуклеотидные праймеры SEQ ID NO: 5-10 с концентрацией в реакционной смеси каждого праймера 0,2 пмоль/мкл. Полученные смеси были доведены до объема 20 мкл с помощью воды Milli-Q. ДНК-матрица добавлялась в количестве 5 мкл, итоговый объем каждой реакции составлял 25 мкл.An oropharyngeal swab was taken from a patient with ARVI symptoms. Using a set of reagents RIBO-prep (FBUN Central Research Institute of Epidemiology of Rospotrebnadzor, Russia), virus RNA was isolated from the collected material, subsequently subjected to reverse transcription using the PEBEPTA-L kit (FBUN Central Research Institute of Epidemiology of Rospotrebnadzor, Russia), both stages were carried out according to the manufacturer's instructions. The obtained cDNA was used to amplify the target regions in two pools. A PCR mix with a volume of 20 μL per reaction was composed of 10 μL of PCR mixture-2 blue (AmpliSens, Russia), 2.5 μL of an equimolar mixture of four deoxyribonucleoside triphosphates with a stock concentration of 4.4 mM, and the sequences listed in the list. In the first pool, oligonucleotide primers SEQ ID NO: 1-4 were added to the reaction medium with a concentration of 0.1 pmol / μl for each primer in the reaction mixture. In the second pool, oligonucleotide primers SEQ ID NO: 5-10 were added to the reaction medium with a concentration of 0.2 pmol / μl for each primer in the reaction mixture. The resulting mixtures were made up to a volume of 20 μl with Milli-Q water. The template DNA was added in an amount of 5 μl; the final volume of each reaction was 25 μl.

Температурный профиль амплификации:Amplification temperature profile:

1. Денатурация проводится при 95°С в течение 2 минут;1. Denaturation is carried out at 95 ° C for 2 minutes;

2. 38 циклов амплификации:2.38 amplification cycles:

a. 95°С - 30 сек;a. 95 ° С - 30 sec;

b. 60°С - 20 сек;b. 60 ° С - 20 sec;

c. 72°С - 60 сек.c. 72 ° C - 60 sec.

3. Финальная элонгация: 72°С в течение 3 минут.3. Final elongation: 72 ° C for 3 minutes.

Полученные продукты амплификации, имеющие длину 216-377 п. н. без учета длин адаптерных и индексных последовательностей, были обнаружены методом электрофореза в агарозном геле, после чего пулы были объединены, а полученная смесь была очищена от реакционной среды с помощью магнитных частиц, SpeedBeads™ magnetic carboxylate modified particles (Cytiva, США). Затем, методом ПЦР в реальном времени была проведена индексация продуктов амплификации. Синтезированные олигонуклеотиды на одном конце содержат праймерную последовательность, комплементарную целевым участкам генома, а на другом - адаптерные последовательности двух типов: для прямых праймеров - SEQ ID NO: 11; для обратных праймеров - SEQ ID NO: 12, соответственно. ПЦР-микс объемом 19 мкл на одну реакцию был составлен из 11.5 мкл ПЦР-смеси-2 blue (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора, Россия), 2.5 мкл эквимолярной смеси четырех дезоксирибонуклеозидтрифосфатов со стоковой концентрацией 4.4 мМ, 1 мкл интеркалирующего красителя EvaGreen® Dye (Biotium, США) для детекции амплификации в реальном времени, соответствующих олигонуклеотидов в концентрации 0.357 пмоль/мкл и воды milli-Q. ДНК-матрица добавлялась в количестве 9 мкл, итоговый объем реакции составлял 28 мкл.The obtained amplification products having a length of 216-377 bp. without taking into account the lengths of the adapter and index sequences, were detected by electrophoresis in agarose gel, after which the pools were pooled, and the resulting mixture was purified from the reaction medium using magnetic particles, SpeedBeads ™ magnetic carboxylate modified particles (Cytiva, USA). Then, the amplification products were indexed by real-time PCR. The synthesized oligonucleotides at one end contain a primer sequence complementary to the target regions of the genome, and at the other end - adapter sequences of two types: for forward primers - SEQ ID NO: 11; for reverse primers - SEQ ID NO: 12, respectively. The PCR mix with a volume of 19 μL per reaction was composed of 11.5 μL of PCR mixture-2 blue (FBSI TsNII Epidemiologii Rospotrebnadzor, Russia), 2.5 μL of an equimolar mixture of four deoxyribonucleoside triphosphates with a stock concentration of 4.4 mM, 1 μL of intercalating dye EvaGreen® Dye ( , USA) for real-time amplification detection of the corresponding oligonucleotides at a concentration of 0.357 pmol / μL and milli-Q water. The template DNA was added in an amount of 9 μl, the final reaction volume was 28 μl.

Температурный профиль индексации:Temperature Indexing Profile:

1. 98°С в течение 30 секунд;1.98 ° C for 30 seconds;

2. 15 циклов:2.15 cycles:

a. 98°С в течение 10 секунд;a. 98 ° C for 10 seconds;

b. 65°С в течение 1 минуты 15 секунд (этап детекции).b. 65 ° C for 1 minute 15 seconds (detection stage).

Далее повторно была произведена очистка от реакционной смеси с использованием магнитных частиц, SpeedBeads™ magnetic carboxylate modified particles (Cytiva, США).Then, the reaction mixture was purified again using magnetic particles, SpeedBeads ™ magnetic carboxylate modified particles (Cytiva, USA).

Индексированные последовательности были отсеквенированы на приборе Illumina MiSeq с использованием реагентов MiSeq Reagent Kit v3 (600-cycle). Результаты исследования были проанализированы с помощью утилит FastQC, bwa и samtools. При изучении полученных данных был сделан вывод о наличии в исходной последовательности мутаций D80A, Е484К и N501Y, что позволяет отнести ее к линии В. 1.351 («южноафриканский» штамм).Indexed sequences were sequenced on an Illumina MiSeq instrument using MiSeq Reagent Kit v3 (600-cycle). The research results were analyzed using the FastQC, bwa and samtools utilities. When studying the data obtained, it was concluded that the original sequence contains mutations D80A, E484K and N501Y, which allows us to assign it to line B. 1.351 ("South African" strain).

Пример 3. Обнаружение последовательности линии В. 1.1.523.Example 3. Detection of the sequence of line B. 1.1.523.

У пациента с симптомами ОРВИ был взят мазок из ротоглотки. С помощью набора реагентов РИБО-преп (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора, Россия) из собранного материала была выделена РНК вируса, впоследствии подвергнутая обратной транскрипции с помощью набора PEBEPTA-L (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора, Россия), оба этапа проводились согласно инструкциям производителя. Полученная кДНК была использована для амплификации целевых участков в двух пулах. ПЦР-микс объемом 20 мкл на одну реакцию был составлен из 10 мкл ПЦР-смеси-2 blue (АмплиСенс, Россия), 2.5 мкл эквимолярной смеси четырех дезоксирибонуклеозидтрифосфатов со стоковой концентрацией 4.4 мМ и последовательностей, приведенных в перечне. В первом пуле в реакционную среду были добавлены олигонуклеотидные праймеры SEQ ID NO: 1-4 с концентрацией в реакционной смеси каждого праймера 0,1 пмоль/мкл. Во втором пуле в реакционную среду были добавлены олигонуклеотидные праймеры SEQ ID NO: 5-10 с концентрацией в реакционной смеси каждого праймера 0,2 пмоль/мкл. В первом и во втором пулах в реакционную среду были добавлены олигонуклеотиды SEQ ID NO: 1-4 и SEQ ID NO: 5-10 соответственно. Полученные смеси были доведены до объема 20 мкл с помощью воды Milli-Q. ДНК-матрица добавлялась в количестве 5 мкл, итоговый объем каждой реакции составлял 25 мкл.An oropharyngeal swab was taken from a patient with ARVI symptoms. Using a set of reagents RIBO-prep (FBUN Central Research Institute of Epidemiology of Rospotrebnadzor, Russia), virus RNA was isolated from the collected material, subsequently subjected to reverse transcription using the PEBEPTA-L kit (FBUN Central Research Institute of Epidemiology of Rospotrebnadzor, Russia), both stages were carried out according to the manufacturer's instructions. The obtained cDNA was used to amplify the target regions in two pools. A PCR mix with a volume of 20 μL per reaction was composed of 10 μL of PCR mixture-2 blue (AmpliSens, Russia), 2.5 μL of an equimolar mixture of four deoxyribonucleoside triphosphates with a stock concentration of 4.4 mM, and the sequences listed in the list. In the first pool, oligonucleotide primers SEQ ID NO: 1-4 were added to the reaction medium with a concentration of 0.1 pmol / μl for each primer in the reaction mixture. In the second pool, oligonucleotide primers SEQ ID NO: 5-10 were added to the reaction medium with a concentration of 0.2 pmol / μl for each primer in the reaction mixture. In the first and second pools, oligonucleotides SEQ ID NO: 1-4 and SEQ ID NO: 5-10 were added to the reaction medium, respectively. The resulting mixtures were made up to a volume of 20 μl with Milli-Q water. The template DNA was added in an amount of 5 μl; the final volume of each reaction was 25 μl.

Температурный профиль амплификации:Amplification temperature profile:

1. Денатурация проводится при 95°С в течение 2 минут;1. Denaturation is carried out at 95 ° C for 2 minutes;

2. 38 циклов амплификации:2.38 amplification cycles:

a. 95°С - 30 сек;a. 95 ° С - 30 sec;

b. 60°С - 20 сек;b. 60 ° С - 20 sec;

c. 72°С - 60 сек.c. 72 ° C - 60 sec.

3. Финальная элонгация: 72°С в течение 3 минут.3. Final elongation: 72 ° C for 3 minutes.

Полученные продукты амплификации, имеющие длину 216-377 п. н. без учета длин адаптерных и индексных последовательностей, были обнаружены методом электрофореза в агарозном геле, после чего пулы были объединены, а полученная смесь была очищена от реакционной среды с помощью магнитных частиц, SpeedBeads™ magnetic carboxylate modified particles (Cytiva, США). Затем, методом ПЦР в реальном времени была проведена индексация продуктов амплификации. Синтезированные олигонуклеотиды на одном конце содержат праймерную последовательность, комплементарную целевым участкам генома, а на другом - адаптерные последовательности двух типов: для прямых праймеров - SEQ ID NO: 11; для обратных праймеров - SEQ ID NO: 12, соответственно. ПЦР-микс объемом 19 мкл на одну реакцию был составлен из 11.5 мкл ПЦР-смеси-2 blue (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора, Россия), 2.5 мкл эквимолярной смеси четырех дезоксирибонуклеозидтрифосфатов со стоковой концентрацией 4.4 мМ, 1 мкл интеркалирующего красителя EvaGreen® Dye (Biotium, США) для детекции амплификации в реальном времени, соответствующих олигонуклеотидов в концентрации 0.357 пмоль/мкл и воды milli-Q. ДНК-матрица добавлялась в количестве 9 мкл, итоговый объем реакции составлял 28 мкл.The obtained amplification products having a length of 216-377 bp. without taking into account the lengths of the adapter and index sequences, were detected by electrophoresis in agarose gel, after which the pools were pooled, and the resulting mixture was purified from the reaction medium using magnetic particles, SpeedBeads ™ magnetic carboxylate modified particles (Cytiva, USA). Then, the amplification products were indexed by real-time PCR. The synthesized oligonucleotides at one end contain a primer sequence complementary to the target regions of the genome, and at the other end - adapter sequences of two types: for forward primers - SEQ ID NO: 11; for reverse primers - SEQ ID NO: 12, respectively. The PCR mix with a volume of 19 μL per reaction was composed of 11.5 μL of PCR mixture-2 blue (FBSI TsNII Epidemiologii Rospotrebnadzor, Russia), 2.5 μL of an equimolar mixture of four deoxyribonucleoside triphosphates with a stock concentration of 4.4 mM, 1 μL of intercalating dye EvaGreen® Dye ( , USA) for real-time amplification detection of the corresponding oligonucleotides at a concentration of 0.357 pmol / μL and milli-Q water. The template DNA was added in an amount of 9 μl, the final reaction volume was 28 μl.

Температурный профиль индексации:Temperature Indexing Profile:

1. 98°С в течение 30 секунд;1.98 ° C for 30 seconds;

2. 15 циклов:2.15 cycles:

a. 98°С в течение 10 секунд;a. 98 ° C for 10 seconds;

b. 65°С в течение 1 минуты 15 секунд (этап детекции).b. 65 ° C for 1 minute 15 seconds (detection stage).

Далее повторно была произведена очистка от реакционной смеси с использованием магнитных частиц, SpeedBeads™ magnetic carboxylate modified particles (Cytiva, США).Then, the reaction mixture was purified again using magnetic particles, SpeedBeads ™ magnetic carboxylate modified particles (Cytiva, USA).

Индексированные последовательности были отсеквенированы на приборе Illumina MiSeq с использованием реагентов MiSeq Reagent Kit v3 (600-cycle). Результаты исследования были проанализированы с помощью утилит FastQC, bwa и samtools. При изучении полученных данных был сделан вывод о наличии в исходной последовательности мутаций Е484К, S494P и EFR156-158, что позволяет отнести ее к линии В.1.1.523.Indexed sequences were sequenced on an Illumina MiSeq instrument using MiSeq Reagent Kit v3 (600-cycle). The research results were analyzed using the FastQC, bwa and samtools utilities. When studying the data obtained, it was concluded that the original sequence contains E484K, S494P, and EFR156-158 mutations, which makes it possible to assign it to line B.1.1.523.

Предложенное изобретение позволяет произвести пробоподготовку библиотек, содержащие целевые фрагменты генома SARS-CoV-2, содержащих известные эпидемиологически значимые мутации, с наименьшими трудовыми, временными и материальными затратами, не снижая качество и объемы произведенных исследований.The proposed invention allows for sample preparation of libraries containing target fragments of the SARS-CoV-2 genome containing known epidemiologically significant mutations, with the least labor, time and material costs, without reducing the quality and volume of research.

--->--->

Перечень последовательностей Sequence listing

ФБУН ЦНИИ Эпидемиологии Роспотребнадзора FBSI Central Research Institute of Epidemiology of Rospotrebnadzor

NUMBER OF SEQ ID NO: NOS: 12 NUMBER OF SEQ ID NO: NOS: 12

SEQ ID NO: NO 1 SEQ ID NO: NO 1

63 63

DNA DNA

artificial artificial

SEQUENCE 1 (): SEQUENCE 1 ():

TCG TCG GCA GCG TCA GAT GTG TAT AAG AGA CAG TGT TTT TCT TGT TTT ATT GCC ACT AGT CTC 63 TCG TCG GCA GCG TCA GAT GTG TAT AAG AGA CAG TGT TTT TCT TGT TTT ATT GCC ACT AGT CTC 63

SEQ ID NO: NO 2 SEQ ID NO: NO 2

65 65

DNA DNA

artificial artificial

SEQUENCE 2 (): SEQUENCE 2 ():

GTC TCG TGG GCT CGG AGA TGT GTA TAA GAG ACA GTC TTA TTA TGT TAG ACT TCT CAG TGG AAG CA 65 GTC TCG TGG GCT CGG AGA TGT GTA TAA GAG ACA GTC TTA TTA TGT TAG ACT TCT CAG TGG AAG CA 65

SEQ ID NO: NO 3 SEQ ID NO: NO 3

62 62

DNA DNA

artificial artificial

SEQUENCE 3 (): SEQUENCE 3 ():

TCG TCG GCA GCG TCA GAT GTG TAT AAG AGA CAG GCT GGA TTT TTG GTA CTA CTT TAG ATT CG 62 TCG TCG GCA GCG TCA GAT GTG TAT AAG AGA CAG GCT GGA TTT TTG GTA CTA CTT TAG ATT CG 62

SEQ ID NO: NO 4 SEQ ID NO: NO 4

64 64

DNA DNA

artificial artificial

SEQUENCE 4 (): SEQUENCE 4 ():

GTC TCG TGG GCT CGG AGA TGT GTA TAA GAG ACA GAA TCT ACC AAT GGT TCT AAA GCC GAA AAA C 64 GTC TCG TGG GCT CGG AGA TGT GTA TAA GAG ACA GAA TCT ACC AAT GGT TCT AAA GCC GAA AAA C 64

SEQ ID NO: NO 5 SEQ ID NO: NO 5

53 53

DNA DNA

artificial artificial

SEQUENCE 5 (): SEQUENCE 5 ():

TCG TCG GCA GCG TCA GAT GTG TAT AAG AGA CAG GCT CCA GGG CAA ACT GGA AA 53 TCG TCG GCA GCG TCA GAT GTG TAT AAG AGA CAG GCT CCA GGG CAA ACT GGA AA 53

SEQ ID NO: NO 6 SEQ ID NO: NO 6

59 59

DNA DNA

artificial artificial

SEQUENCE 6 (): SEQUENCE 6 ():

GTC TCG TGG GCT CGG AGA TGT GTA TAA GAG ACA GCT GTA TGG TTG GTA ACC AAC ACC AT 59 GTC TCG TGG GCT CGG AGA TGT GTA TAA GAG ACA GCT GTA TGG TTG GTA ACC AAC ACC AT 59

SEQ ID NO: NO 7 SEQ ID NO: NO 7

56 56

DNA DNA

artificial artificial

SEQUENCE 7 (): SEQUENCE 7 ():

TCG TCG GCA GCG TCA GAT GTG TAT AAG AGA CAG CCA ACA ATT TGG CAG AGA CAT TG 56 TCG TCG GCA GCG TCA GAT GTG TAT AAG AGA CAG CCA ACA ATT TGG CAG AGA CAT TG 56

SEQ ID NO: NO 8 SEQ ID NO: NO 8

59 59

DNA DNA

artificial artificial

SEQUENCE 8 (): SEQUENCE 8 ():

GTC TCG TGG GCT CGG AGA TGT GTA TAA GAG ACA GCG CCA AGT AGG AGT AAG TTG ATC TG 59 GTC TCG TGG GCT CGG AGA TGT GTA TAA GAG ACA GCG CCA AGT AGG AGT AAG TTG ATC TG 59

SEQ ID NO: NO 9 SEQ ID NO: NO 9

58 58

DNA DNA

artificial artificial

SEQUENCE 9 (): SEQUENCE 9 ():

TCG TCG GCA GCG TCA GAT GTG TAT AAG AGA CAG AAA CAC GTG CAG GCT GTT TAA TAG G 58 TCG TCG GCA GCG TCA GAT GTG TAT AAG AGA CAG AAA CAC GTG CAG GCT GTT TAA TAG G 58

SEQ ID NO: NO 10 SEQ ID NO: NO 10

62 62

DNA DNA

artificial artificial

SEQUENCE 10 (): SEQUENCE 10 ():

GTC TCG TGG GCT CGG AGA TGT GTA TAA GAG ACA GCT ACT GAT GTC TTG GTC ATA GAC ACT GG 62 GTC TCG TGG GCT CGG AGA TGT GTA TAA GAG ACA GCT ACT GAT GTC TTG GTC ATA GAC ACT GG 62

SEQ ID NO: NO 11 SEQ ID NO: NO 11

33 33

DNA DNA

artificial artificial

SEQUENCE 11 (): SEQUENCE 11 ():

TCG TCG GCA GCG TCA GAT GTG TAT AAG AGA CAG 33 TCG TCG GCA GCG TCA GAT GTG TAT AAG AGA CAG 33

SEQ ID NO: NO 12 SEQ ID NO: NO 12

34 34

DNA DNA

artificial artificial

SEQUENCE 12 (): SEQUENCE 12 ():

GTC TCG TGG GCT CGG AGA TGT GTA TAA GAG ACA G 34GTC TCG TGG GCT CGG AGA TGT GTA TAA GAG ACA G 34

<---<---

Claims (16)

1. Способ пробоподготовки образцов изолятов коронавируса SARS-CoV-2, включающий стадии:1. A method for sample preparation of SARS-CoV-2 coronavirus isolates, including the stages: (a) обратной транскрипции РНК вируса;(a) reverse transcription of the RNA of the virus; (b) ПЦР с применением двух пулов олигонуклеотидных праймеров, где для первого пула применяют олигонуклеотидные праймеры, имеющие структуру SEQ ID NO: 1-4, с концентрацией в реакционной смеси каждого праймера 0,1 пмоль/мкл, а для второго пула применяют олигонуклеотидные праймеры, имеющие структуру SEQ ID NO: 5-10, с концентрацией в реакционной смеси каждого праймера 0,2 пмоль/мкл;(b) PCR using two pools of oligonucleotide primers, where oligonucleotide primers having the structure SEQ ID NO: 1-4 are used for the first pool, with a concentration of each primer in the reaction mixture of 0.1 pmol / μl, and for the second pool, oligonucleotide primers are used having the structure of SEQ ID NO: 5-10, with a concentration in the reaction mixture of each primer of 0.2 pmol / μl; (c) оценки получаемых в ходе амплификации ПЦР-продуктов с помощью электрофореза;(c) evaluating the PCR products obtained during the amplification by electrophoresis; (d) объединения ПЦР-продуктов двух пулов;(d) combining PCR products of the two pools; (e) очистки ампликонов от реакционной смеси с использованием парамагнитных частиц с полимерным карбоксилированным покрытием;(e) purifying amplicons from the reaction mixture using paramagnetic particles with a polymer carboxylated coating; (f) индексации с использованием олигонуклеотидов, содержащих последовательности, комплементарные адаптерным последовательностям SEQ ID NO: 11-12, и индексные последовательности;(f) indexing using oligonucleotides containing sequences complementary to the adapter sequences SEQ ID NO: 11-12, and index sequences; (g) повторной очистки от реакционной смеси с использованием парамагнитных частиц с полимерным карбоксилированным покрытием.(g) re-cleaning from the reaction mixture using paramagnetic particles with a polymer carboxylated coating. 2. Способ по п. 1, в котором амплификацию фрагментов кДНК в ПЦР осуществляют с использованием Таq-полимеразы.2. The method according to claim 1, wherein the amplification of the cDNA fragments in PCR is performed using Taq polymerase. 3. Пул олигонуклеотидных праймеров для реализации способа по п. 1, имеющих структуру SEQ ID NO: 1-4, для выполнения функции праймеров, комплементарных участкам гена, кодирующего S-белок SARS-CoV-2.3. A pool of oligonucleotide primers for implementing the method according to claim 1, having the structure of SEQ ID NO: 1-4, for performing the function of primers complementary to the regions of the gene encoding the SARS-CoV-2 S protein. 4. Пул олигонуклеотидных праймеров для реализации способа по п. 1, имеющих структуру SEQ ID NO: 5-10, для выполнения функции праймеров, комплементарных участкам гена, кодирующего S-белок SARS-CoV-2.4. A pool of oligonucleotide primers for implementing the method according to claim 1, having the structure of SEQ ID NO: 5-10, to function as primers complementary to the regions of the gene encoding the SARS-CoV-2 S protein. 5. Олигонуклеотидные праймеры по п. 3, где функции прямых праймеров выполняют олигонуклеотидные праймеры, имеющие структуру SEQ ID NO: 1, 3.5. Oligonucleotide primers according to claim 3, wherein the functions of forward primers are performed by oligonucleotide primers having the structure SEQ ID NO: 1, 3. 6. Олигонуклеотидные праймеры по п. 3, где функции обратных праймеров выполняют олигонуклеотидные праймеры, имеющие структуру SEQ ID NO: 2, 4.6. Oligonucleotide primers according to claim 3, wherein the functions of the reverse primers are performed by oligonucleotide primers having the structure SEQ ID NO: 2, 4. 7. Олигонуклеотидные праймеры по п. 4, где функции прямых праймеров выполняют олигонуклеотидные праймеры, имеющие структуру SEQ ID NO: 5, 7, 9.7. Oligonucleotide primers according to claim 4, wherein the functions of forward primers are performed by oligonucleotide primers having the structure SEQ ID NO: 5, 7, 9. 8. Олигонуклеотидные праймеры по п. 4, где функции обратных праймеров выполняют олигонуклеотидные праймеры, имеющие структуру SEQ ID NO: 6, 8, 10.8. Oligonucleotide primers according to claim 4, wherein the functions of the reverse primers are performed by oligonucleotide primers having the structure SEQ ID NO: 6, 8, 10. 9. Олигонуклеотидные праймеры по пп. 3 и 4, которые в своем составе имеют адаптерные последовательности, при этом адаптерные последовательности SF.Q ID NO: 11 расположены на концах олигонуклеотидных праймеров, имеющих структуру SEQ ID NO: 1, 3, 5, 7, 9, а адаптерные последовательности SEQ ID NO: 12 расположены на концах олигонуклеотидных праймеров, имеющих структуру SEQ ID NO: 2, 4, 6, 8, 10.9. Oligonucleotide primers according to PP. 3 and 4, which contain adapter sequences, wherein the adapter sequences SF.Q ID NO: 11 are located at the ends of oligonucleotide primers having the structure SEQ ID NO: 1, 3, 5, 7, 9, and the adapter sequences are SEQ ID NO: 12 are located at the ends of oligonucleotide primers having the structure SEQ ID NO: 2, 4, 6, 8, 10.
RU2021119086A 2021-06-30 2021-06-30 METHOD FOR SAMPLE PREPARATION OF SARS-CoV-2 CORONAVIRUS ISOLATES AND OLIGONUCLEOTIDE PRIMERS FOR ITS IMPLEMENTATION RU2762759C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2021119086A RU2762759C1 (en) 2021-06-30 2021-06-30 METHOD FOR SAMPLE PREPARATION OF SARS-CoV-2 CORONAVIRUS ISOLATES AND OLIGONUCLEOTIDE PRIMERS FOR ITS IMPLEMENTATION

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2021119086A RU2762759C1 (en) 2021-06-30 2021-06-30 METHOD FOR SAMPLE PREPARATION OF SARS-CoV-2 CORONAVIRUS ISOLATES AND OLIGONUCLEOTIDE PRIMERS FOR ITS IMPLEMENTATION

Publications (1)

Publication Number Publication Date
RU2762759C1 true RU2762759C1 (en) 2021-12-22

Family

ID=80038975

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2021119086A RU2762759C1 (en) 2021-06-30 2021-06-30 METHOD FOR SAMPLE PREPARATION OF SARS-CoV-2 CORONAVIRUS ISOLATES AND OLIGONUCLEOTIDE PRIMERS FOR ITS IMPLEMENTATION

Country Status (1)

Country Link
RU (1) RU2762759C1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111139317A (en) * 2020-03-13 2020-05-12 欧陆分析技术服务(苏州)有限公司 Multiplex fluorescent quantitative PCR detection kit and detection method for SARS-COV-2 virus
RU2727054C1 (en) * 2020-04-24 2020-07-17 Сергей Феликсович Дрозд Method for detecting cdna of sars-cov-2 coronavirus using synthetic oligonucleotide primers in polymerase chain reaction
CN111455114A (en) * 2020-05-22 2020-07-28 深圳华大智造科技有限公司 High-flux detection kit for SARS-CoV-2

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111139317A (en) * 2020-03-13 2020-05-12 欧陆分析技术服务(苏州)有限公司 Multiplex fluorescent quantitative PCR detection kit and detection method for SARS-COV-2 virus
RU2727054C1 (en) * 2020-04-24 2020-07-17 Сергей Феликсович Дрозд Method for detecting cdna of sars-cov-2 coronavirus using synthetic oligonucleotide primers in polymerase chain reaction
CN111455114A (en) * 2020-05-22 2020-07-28 深圳华大智造科技有限公司 High-flux detection kit for SARS-CoV-2

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Comparison of National RT-PCR Primers, Probes, and Protocols for SARS-CoV-2 Diagnostics, Johns Hopkins Center for Health Security, 13.04.2021, стр.1-5. *

Similar Documents

Publication Publication Date Title
Chen et al. Emerging biosensing technologies for improved diagnostics of COVID-19 and future pandemics
EP3320110B1 (en) 16s ribosomal rna universal primers and use thereof in microbiological analysis and diagnostics
JP2016013133A (en) Amplicon rescue multiplex polymerase chain reaction for amplification of multiple targets
US6867021B2 (en) Multiplex RT-PCR/PCR for simultaneous detection of bovine coronavirus, bovine rotavirus, Cryptosporidium parvum, and Escherichia coli
CN106906306A (en) Rapid and sensitive genotype identification and nucleic acid detection
CN113817868A (en) Primer, probe composition and kit for detecting novel coronavirus and variant thereof
CN112941210A (en) Kit and method for detecting drug-resistant mutation of mycobacterium tuberculosis rifampicin and isoniazid
CN110484655B (en) Detection method for parainfluenza virus whole genome second-generation sequencing
CN107142320B (en) Gene marker for detecting liver cancer and application thereof
Luque-González et al. Identification of Trypanosomatids by detecting Single Nucleotide Fingerprints using DNA analysis by dynamic chemistry with MALDI-ToF
CN117625764A (en) Methods to accurately detect and quantify nucleic acids in parallel
JP4950656B2 (en) Nucleic acid detection
US8785130B2 (en) Use of markers including nucleotide sequence based codes to monitor methods of detection and identification of genetic material
CN112011595A (en) Whole genome amplification method for SARS-CoV-2 virus, application and sequencing method and kit
RU2762759C1 (en) METHOD FOR SAMPLE PREPARATION OF SARS-CoV-2 CORONAVIRUS ISOLATES AND OLIGONUCLEOTIDE PRIMERS FOR ITS IMPLEMENTATION
KR20210113083A (en) Composition For Detecting SARS-CoV-2, Kit For Detecting the Same and Method of Detecting SARS-CoV-2 Using the Same
CN111961763A (en) Novel gene chip for detecting coronavirus
CN113481326B (en) Isothermal nucleic acid amplification reaction reagent, isothermal nucleic acid amplification method and application thereof
CN104975077A (en) Pig-sourced eperythrozoon fluorogenic quantitative PCR detection kit and application thereof
US8216810B2 (en) Multiplex systems, methods, and kits for detecting and identifying nucleic acids
KR102076343B1 (en) Composition for detecting adenovirus type 55 using Real-time LAMP and uses thereof
WO2023021978A1 (en) Method for examining autoimmune disease
CN118703696B (en) Primer combination for diagnosing multiple respiratory pathogens and application thereof
KR20220040834A (en) Multiplex LAMP composition for diagnosis of COVID-19 comprising molecular beacon probe
RU2850880C1 (en) Set of oligonucleotide primers for detecting epidemic parotitis virus rna