RU2845909C2 - Crispr enzyme mutations that reduce off-target effects - Google Patents
Crispr enzyme mutations that reduce off-target effectsInfo
- Publication number
- RU2845909C2 RU2845909C2 RU2021120582A RU2021120582A RU2845909C2 RU 2845909 C2 RU2845909 C2 RU 2845909C2 RU 2021120582 A RU2021120582 A RU 2021120582A RU 2021120582 A RU2021120582 A RU 2021120582A RU 2845909 C2 RU2845909 C2 RU 2845909C2
- Authority
- RU
- Russia
- Prior art keywords
- sequence
- crispr
- target
- cas9 protein
- guide
- Prior art date
Links
Abstract
Description
Перекрестные ссылки/включение посредством ссылкиCross-referencing/inclusion by reference
Ссылаются на предварительную заявку на патент США с порядковым № 62/181453, поданную 18 июня 2015 года, предварительную заявку на патент США с порядковым № 62/207312, поданную 19 августа 2015 года, предварительную заявку на патент США с порядковым № 62/237360, поданную 5 октября 2015 года, предварительную заявку на патент США с порядковым № 62/255256, поданную 13 ноября 2015 года и предварительную заявку на патент США с порядковым № 62/269876, поданную 18 декабря 2015 года.Reference is made to U.S. Provisional Patent Application Serial No. 62/181,453, filed June 18, 2015, U.S. Provisional Patent Application Serial No. 62/207,312, filed August 19, 2015, U.S. Provisional Patent Application Serial No. 62/237,360, filed October 5, 2015, U.S. Provisional Patent Application Serial No. 62/255,256, filed November 13, 2015, and U.S. Provisional Patent Application Serial No. 62/269,876, filed December 18, 2015.
Вышеупомянутая заявка(заявки) и все документы, цитируемые или приводимые в качестве ссылки в данном документе ("документы, цитируемые в данном документе"), и все документы, цитируемые или приводимые в качестве ссылки в документах, цитируемых в данном документе, вместе с любыми инструкциями производителя, описаниями, спецификациями продукта и технологическими картами для любых продуктов, упомянутых в данном документе или в любом документе, включенном в данный документ посредством ссылки, настоящим включены в данный документ посредством ссылки и могут быть использованы при осуществлении настоящего изобретения на практике. Более конкретно, все документы, приводимые в качестве ссылки, включены посредством ссылки в такой же мере, как если бы конкретно и отдельно было указано, что каждый отдельный документ включен посредством ссылки.The above-mentioned application(s) and all documents cited or incorporated by reference herein (the "documents cited herein"), and all documents cited or incorporated by reference in documents cited herein, together with any manufacturer's instructions, descriptions, product specifications, and process sheets for any products mentioned herein or in any document incorporated herein by reference, are hereby incorporated herein by reference and may be used in the practice of the present invention. More specifically, all documents incorporated by reference are hereby incorporated by reference to the same extent as if each individual document was specifically and individually indicated to be incorporated by reference.
Заявление в отношении финансируемого из федерального бюджета исследованияStatement Regarding Federally Funded Research
Настоящее изобретение было выполнено при поддержке правительства в рамках грантов под номером MH100706 и MH110049, выданных Национальными институтами здоровья. Правительство обладает определенными правами на настоящее изобретение.This invention was made with support from the Government under Grant Numbers MH100706 and MH110049 from the National Institutes of Health. The Government has certain rights in this invention.
Область изобретенияField of invention
Настоящее изобретение в целом относится к коротким палиндромным повторам, регулярно расположенным группами (CRISPR), ферменту CRISPR (например, Cas или Cas9), CRISPR-Cas или системе CRISPR или комплексу CRISPR-Cas, их компонентам, молекулам нуклеиновой кислоты, например, векторам, включающим их, а также вариантам применения всего из вышеупомянутого, среди прочих аспектов.The present invention generally relates to clustered regularly interspaced short palindromic repeats (CRISPR), a CRISPR enzyme (e.g., Cas or Cas9), a CRISPR-Cas or CRISPR system or CRISPR-Cas complex, components thereof, nucleic acid molecules, e.g., vectors, comprising them, and uses of any of the above, among other aspects.
Предпосылки изобретенияBackground of the invention
Первой публикацией с достаточным раскрытием того, как получать и применять систему CRISPR-Cas в эукариотических клетках, является Cong et al., Science 2013; 339:819-823 (опубликована онлайн 3 января 2013 года). Первой подачей заявки на патент с достаточным раскрытием того, как получать и применять систему CRISPR-Cas в эукариотических клетках, является Zhang et al., предварительная заявка на патент США с порядковым № 61/736527, поданная 12 декабря 2012 года, на основании которой многие патентные заявки заявляют приоритет, включая те, которые перешли в фундаментальные патенты США №№ 8999641, 8993233, 8945839, 8932814, 8906616, 8895308, 8889418, 8889356, 8871445, 8865406, 8795965, 8771945 и 8697359.The first publication with sufficient disclosure of how to generate and use the CRISPR-Cas system in eukaryotic cells is Cong et al., Science 2013; 339:819–823 (published online January 3, 2013). The first patent application filing with a sufficient disclosure of how to make and use the CRISPR-Cas system in eukaryotic cells is Zhang et al., U.S. Provisional Patent Application Ser. No. 61/736,527, filed December 12, 2012, from which many patent applications claim priority, including those that have transitioned into fundamental U.S. Patent Nos. 8999641, 8993233, 8945839, 8932814, 8906616, 8895308, 8889418, 8889356, 8871445, 8865406, 8795965, 8771945, and 8697359.
Краткое описание изобретенияBrief description of the invention
С учетом обеспечения революционных достижений, которые обеспечили возможность применения системы CRISPR-Cas в эукариотических клетках, лаборатория Zhang и соавт. из института Броуда понимала, что остается потребность в улучшенных ферментах CRISPR для применения в осуществлении модификаций в целевых локусах, которые при этом снижают или исключают активность в направлении нецелевых локусов. Существует актуальная потребность в альтернативных и надежных системах и методиках снижения нецелевой активности ферментов CRISPR, находящихся в комплексе с направляющими РНК. Также существует актуальная потребность в альтернативных и надежных системах и методиках повышения активности ферментов CRISPR, находящихся в комплексе с направляющими РНК.Given the breakthrough advances that have enabled the use of the CRISPR-Cas system in eukaryotic cells, the Zhang et al. lab at the Broad Institute recognized that there remains a need for improved CRISPR enzymes for use in making modifications at target loci that reduce or eliminate activity at off-target loci. There is a pressing need for alternative and robust systems and methods for reducing off-target activity of CRISPR enzymes complexed with guide RNAs. There is also a pressing need for alternative and robust systems and methods for enhancing activity of CRISPR enzymes complexed with guide RNAs.
Было разработано несколько стратегий усиления специфичности Cas9, включая уменьшение количества Cas9 в клетке, применение мутантных никаз Cas9 для создания пары накладываемых однонитевых надрезов ДНК, усечения направляющей последовательности на 5'-конце и применение пары каталитически неактивных нуклеаз Cas9, каждая из которых слита с нуклеазным доменом FokI.Several strategies have been developed to enhance the specificity of Cas9, including reducing the amount of Cas9 in the cell, using mutant Cas9 nicks to create a pair of superimposable single-stranded DNA nicks, truncating the guide sequence at the 5' end, and using a pair of catalytically inactive Cas9 nucleases, each fused to the FokI nuclease domain.
Авторы настоящего изобретения неожиданно установили, что можно проводить модификации ферментов CRISPR, что обеспечивает сниженную нецелевую активность по сравнению с немодифицированными ферментами CRISPR и/или повышенную целевую активность по сравнению с немодифицированными ферментами CRISPR. Таким образом, в данном документ предусмотрены улучшенные ферменты CRISPR, которые можно применять в целом ряде применений, связанных с модификациями генов. Также в данном документе предусмотрены комплексы, композиции и системы CRISPR, а также способы и варианты применения, все из которых предусматривают модифицированные ферменты CRISPR, раскрытые в данном документе. Предпочтительным является CRISPR-Cas9, включая без ограничения SaCas9, SpCas9 и ортологи.The inventors of the present invention have surprisingly found that modifications can be made to CRISPR enzymes that provide reduced off-target activity compared to unmodified CRISPR enzymes and/or increased on-target activity compared to unmodified CRISPR enzymes. Thus, provided herein are improved CRISPR enzymes that can be used in a variety of gene modification applications. Also provided herein are CRISPR complexes, compositions, and systems, as well as methods and uses, all of which involve the modified CRISPR enzymes disclosed herein. Preferred is CRISPR-Cas9, including but not limited to SaCas9, SpCas9, and orthologs.
В одном аспекте предусмотрен сконструированный белок CRISPR, где белок объединяется в комплекс с молекулой нуклеиновой кислоты, предусматривающей РНК, с образованием комплекса CRISPR, при этом находясь в комплексе CRISPR, молекула нуклеиновой кислоты нацеливается на один или несколько целевых полинуклеотидных локусов, причем белок содержит по меньшей мере одну модификацию по сравнению с немодифицированным CRISPR, и где комплекс CRISPR, содержащий модифицированный белок, характеризуется измененной активностью в сравнении с комплексом, содержащим немодифицированный белок CRISPR. Предпочтительным является CRISPR-Cas9, включая без ограничения SaCas9, SpCas9 и ортологи. Белки CRISPR включают белки с ферментативной активностью, например, нуклеазной активностью.In one aspect, an engineered CRISPR protein is provided, wherein the protein is complexed with a nucleic acid molecule comprising RNA to form a CRISPR complex, wherein the nucleic acid molecule, when in the CRISPR complex, targets one or more target polynucleotide loci, wherein the protein comprises at least one modification compared to an unmodified CRISPR, and wherein the CRISPR complex comprising the modified protein is characterized by altered activity compared to a complex comprising an unmodified CRISPR protein. Preferred is CRISPR-Cas9, including but not limited to SaCas9, SpCas9 and orthologs. CRISPR proteins include proteins with enzymatic activity, such as nuclease activity.
В одном аспекте измененная активность сконструированного белка CRISPR предусматривает измененное свойство связывания в отношении молекулы нуклеиновой кислоты, предусматривающей РНК, или целевых полинуклеотидных локусов, измененную кинетику связывания в отношении молекулы нуклеиновой кислоты, предусматривающей РНК, или целевых полинуклеотидных локусов, или измененную специфичность связывания в отношении молекулы нуклеиновой кислоты, предусматривающей РНК, или целевых полинуклеотидных локусов в сравнении с нецелевыми полинуклеотидными локусами.In one aspect, the altered activity of the engineered CRISPR protein comprises an altered binding property with respect to the nucleic acid molecule providing RNA or target polynucleotide loci, altered binding kinetics with respect to the nucleic acid molecule providing RNA or target polynucleotide loci, or altered binding specificity with respect to the nucleic acid molecule providing RNA or target polynucleotide loci compared to non-target polynucleotide loci.
В определенных вариантах осуществления измененная активность сконструированного белка CRISPR предусматривает повышенную эффективность нацеливания или сниженное нецелевое связывание. В определенных вариантах осуществления измененная активность сконструированного белка CRISPR предусматривает модифицированную активность расщепления.In certain embodiments, the altered activity of the engineered CRISPR protein provides for increased targeting efficiency or decreased off-target binding. In certain embodiments, the altered activity of the engineered CRISPR protein provides for modified cleavage activity.
В определенных вариантах осуществления измененная активность предусматривает повышенную активность расщепления в отношении целевых полинуклеотидных локусов. В определенных вариантах осуществления измененная активность предусматривает сниженную активность расщепления в отношении целевых полинуклеотидных локусов. В определенных вариантах осуществления измененная активность предусматривает сниженную активность расщепления в отношении нецелевых полинуклеотидных локусов. В определенных вариантах осуществления измененная активность предусматривает повышенную активность расщепления в отношении нецелевых полинуклеотидных локусов. В соответствии с этим, в определенных вариантах осуществления наблюдается повышенная специфичность в отношении целевых полинуклеотидных локусов по сравнению с нецелевыми полинуклеотидными локусами. В других вариантах осуществления наблюдается сниженная специфичность в отношении целевых полинуклеотидных локусов по сравнению с нецелевыми полинуклеотидными локусами.In certain embodiments, the altered activity comprises increased cleavage activity at target polynucleotide loci. In certain embodiments, the altered activity comprises decreased cleavage activity at target polynucleotide loci. In certain embodiments, the altered activity comprises decreased cleavage activity at non-target polynucleotide loci. In certain embodiments, the altered activity comprises increased cleavage activity at non-target polynucleotide loci. Accordingly, in certain embodiments, there is increased specificity at target polynucleotide loci compared to non-target polynucleotide loci. In other embodiments, there is decreased specificity at target polynucleotide loci compared to non-target polynucleotide loci.
В одном аспекте настоящего изобретения измененная активность сконструированного белка CRISPR предусматривает измененные кинетические свойства хеликазы.In one aspect of the present invention, the altered activity of the engineered CRISPR protein comprises altered kinetic properties of the helicase.
В одном аспекте настоящего изобретения сконструированный белок CRISPR содержит модификацию, которая изменяет связывание белка с молекулой нуклеиновой кислоты, предусматривающей РНК, или нитью, содержащей целевые полинуклеотидные локусы, или нитью, содержащей нецелевые полинуклеотидные локусы. В одном аспекте настоящего изобретения сконструированный белок CRISPR содержит модификацию, которая изменяет образование комплекса CRISPR.In one aspect of the present invention, the engineered CRISPR protein comprises a modification that alters the binding of the protein to a nucleic acid molecule comprising RNA, or a strand comprising target polynucleotide loci, or a strand comprising non-target polynucleotide loci. In one aspect of the present invention, the engineered CRISPR protein comprises a modification that alters the formation of a CRISPR complex.
В настоящем изобретении предусмотрен:The present invention provides:
не встречающийся в природе фермент CRISPR, где:a non-naturally occurring CRISPR enzyme where:
фермент объединяется в комплекс с направляющей РНК с образованием комплекса CRISPR,the enzyme combines with the guide RNA to form the CRISPR complex,
при этом находясь в комплексе CRISPR, направляющая РНК нацеливается на один или несколько целевых полинуклеотидных локусов, и фермент изменяет полинуклеотидные локусы, иwhile in the CRISPR complex, the guide RNA targets one or more target polynucleotide loci, and the enzyme alters the polynucleotide loci, and
фермент содержит по меньшей мере одну модификацию,the enzyme contains at least one modification,
в результате чего фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом, и/или в результате чего фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом.whereby the enzyme in the CRISPR complex has a reduced ability to modify one or more off-target loci compared to an unmodified enzyme, and/or whereby the enzyme in the CRISPR complex has an increased ability to modify one or more target loci compared to an unmodified enzyme.
В любом таком, не встречающемся в природе ферменте CRISPR, модификация может предусматривать модификацию одного или нескольких аминокислотных остатков фермента.In any such non-naturally occurring CRISPR enzyme, the modification may involve modification of one or more amino acid residues of the enzyme.
В любом таком, не встречающемся в природе ферменте CRISPR, модификация может предусматривать модификацию одного или нескольких аминокислотных остатков, расположенных в участке, который содержит остатки, которые являются положительно заряженными в немодифицированном ферменте.In any such non-naturally occurring CRISPR enzyme, the modification may involve modification of one or more amino acid residues located in a region that contains residues that are positively charged in the unmodified enzyme.
В любом таком, не встречающемся в природе ферменте CRISPR, модификация может предусматривать модификацию одного или нескольких аминокислотных остатков, которые являются положительно заряженными в немодифицированном ферменте.In any such non-naturally occurring CRISPR enzyme, the modification may involve modification of one or more amino acid residues that are positively charged in the unmodified enzyme.
В любом таком, не встречающемся в природе ферменте CRISPR, модификация может предусматривать модификацию одного или нескольких аминокислотных остатков, которые не являются положительно заряженными в немодифицированном ферменте.In any such non-naturally occurring CRISPR enzyme, the modification may involve modification of one or more amino acid residues that are not positively charged in the unmodified enzyme.
Модификация может предусматривать модификацию одного или нескольких аминокислотных остатков, которые являются незаряженными в немодифицированном ферменте.The modification may involve modification of one or more amino acid residues that are uncharged in the unmodified enzyme.
Модификация может предусматривать модификацию одного или нескольких аминокислотных остатков, которые являются отрицательно заряженными в немодифицированном ферменте.The modification may involve modification of one or more amino acid residues that are negatively charged in the unmodified enzyme.
Модификация может предусматривать модификацию одного или нескольких аминокислотных остатков, которые являются гидрофобными в немодифицированном ферменте.The modification may involve modification of one or more amino acid residues that are hydrophobic in the unmodified enzyme.
Модификация может предусматривать модификацию одного или нескольких аминокислотных остатков, которые являются полярными в немодифицированном ферменте.The modification may involve modification of one or more amino acid residues that are polar in the unmodified enzyme.
В случае любого из описанных выше не встречающихся в природе ферментов CRISPR фермент может предусматривать фермент CRISPR II типа. Фермент может предусматривать фермент Cas9.In the case of any of the above non-naturally occurring CRISPR enzymes, the enzyme may include a type II CRISPR enzyme. The enzyme may include a Cas9 enzyme.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR модификация может предусматривать модификацию одного или нескольких остатков, расположенных в участке между доменом RuvC и доменом HNH. Домен RuvC может предусматривать домен RuvCII или домен RuvCIII. Модификация может предусматривать модификацию одного или нескольких остатков, расположенных в бороздке.For some of the non-naturally occurring CRISPR enzymes described above, the modification may involve modification of one or more residues located in the region between the RuvC domain and the HNH domain. The RuvC domain may involve a RuvCII domain or a RuvCIII domain. The modification may involve modification of one or more residues located in the groove.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR модификация может предусматривать модификацию одного или нескольких остатков, расположенные за пределами участка между доменом RuvC и доменом HNH, или за пределами бороздки.In the case of some of the non-naturally occurring CRISPR enzymes described above, the modification may involve modification of one or more residues located outside the region between the RuvC domain and the HNH domain, or outside the groove.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR модификация может предусматривать модификацию одного или нескольких остатков в участке, который включает:In the case of some of the non-naturally occurring CRISPR enzymes described above, modification may involve modification of one or more residues in a region that includes:
остатки R63-K1325 или K775-K1325 из Cas9 (SpCas9) Streptococcus pyogenes или соответствующий участок в другом ортологе Cas9; илиresidues R63-K1325 or K775-K1325 of Streptococcus pyogenes Cas9 (SpCas9) or the corresponding region in another Cas9 ortholog; or
остатки K37-K736 из Cas9 (SaCas9) Staphylococcus aureus или соответствующий участок в другом ортологе Cas9.residues K37-K736 of Staphylococcus aureus Cas9 (SaCas9) or the corresponding region in another Cas9 ortholog.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR модификация предусматривает модификацию одного или нескольких остатков, где один или несколько остатков предусматривают аргинин, гистидин или лизин.In the case of some of the non-naturally occurring CRISPR enzymes described above, the modification involves modifying one or more residues, where one or more residues include arginine, histidine, or lysine.
В случае любого из описанных выше не встречающихся в природе ферментов CRISPR фермент может быть модифицирован с помощью мутации указанного одного или нескольких остатков.In the case of any of the above-described non-naturally occurring CRISPR enzymes, the enzyme may be modified by mutating said one or more residues.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на аланиновый остаток.In the case of some of the non-naturally occurring CRISPR enzymes described above, the enzyme is modified by a mutation of said one or more residues, wherein the mutation involves replacing the residue in the unmodified enzyme with an alanine residue.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на аспарагиновую кислоту или глутаминовую кислоту.In the case of some of the non-naturally occurring CRISPR enzymes described above, the enzyme is modified by a mutation of said one or more residues, and the mutation involves replacing the residue in the unmodified enzyme with aspartic acid or glutamic acid.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на серин, треонин, аспарагин или глутамин.In the case of some of the non-naturally occurring CRISPR enzymes described above, the enzyme is modified by a mutation of the specified one or more residues, and the mutation involves replacing the residue in the unmodified enzyme with serine, threonine, asparagine, or glutamine.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на аланин, глицин, изолейцин, лейцин, метионин, фенилаланин, триптофан, тирозин или валин.In the case of some of the non-naturally occurring CRISPR enzymes described above, the enzyme is modified by a mutation of said one or more residues, wherein the mutation involves replacing the residue in the unmodified enzyme with alanine, glycine, isoleucine, leucine, methionine, phenylalanine, tryptophan, tyrosine, or valine.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на полярный аминокислотный остаток.In the case of some of the non-naturally occurring CRISPR enzymes described above, the enzyme is modified by a mutation of said one or more residues, wherein the mutation involves replacing the residue in the unmodified enzyme with a polar amino acid residue.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на аминокислотный остаток, который не является полярным аминокислотным остатком.In the case of some of the non-naturally occurring CRISPR enzymes described above, the enzyme is modified by a mutation of said one or more residues, and the mutation involves replacing the residue in the unmodified enzyme with an amino acid residue that is not a polar amino acid residue.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на отрицательно заряженный аминокислотный остаток.In the case of some of the non-naturally occurring CRISPR enzymes described above, the enzyme is modified by a mutation of said one or more residues, wherein the mutation involves replacing the residue in the unmodified enzyme with a negatively charged amino acid residue.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на аминокислотный остаток, который не является отрицательно заряженным аминокислотным остатком.In the case of some of the non-naturally occurring CRISPR enzymes described above, the enzyme is modified by a mutation of said one or more residues, and the mutation involves replacing the residue in the unmodified enzyme with an amino acid residue that is not a negatively charged amino acid residue.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на незаряженный аминокислотный остатокIn the case of some of the non-naturally occurring CRISPR enzymes described above, the enzyme is modified by mutating said one or more residues, and the mutation involves replacing the residue in the unmodified enzyme with an uncharged amino acid residue.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на аминокислотный остаток, который не является незаряженным аминокислотным остатком.In the case of some of the non-naturally occurring CRISPR enzymes described above, the enzyme is modified by a mutation of said one or more residues, and the mutation involves replacing the residue in the unmodified enzyme with an amino acid residue that is not an uncharged amino acid residue.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на гидрофобный аминокислотный остаток.In the case of some of the non-naturally occurring CRISPR enzymes described above, the enzyme is modified by a mutation of said one or more residues, and the mutation involves replacing the residue in the unmodified enzyme with a hydrophobic amino acid residue.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации указанного одного или нескольких остатков, и при этом мутация предусматривает замену остатка в немодифицированном ферменте на аминокислотный остаток, который не является гидрофобным аминокислотным остатком.In the case of some of the non-naturally occurring CRISPR enzymes described above, the enzyme is modified by a mutation of said one or more residues, and the mutation involves replacing the residue in the unmodified enzyme with an amino acid residue that is not a hydrophobic amino acid residue.
Не встречающийся в природе фермент CRISPR может представлять собой SpCas9 или ортолог SpCas9, и при этом:The non-naturally occurring CRISPR enzyme may be SpCas9 or an ortholog of SpCas9, and:
фермент модифицирован с помощью модификации или содержит ее, например, содержит, состоит, по сути, из или состоит из модификации с помощью мутации любого из остатков SpCas9 или SaCas9, перечисленных в любой из таблиц 1-7, или соответствующего остатка в ортологе Cas9; илиthe enzyme is modified by or comprises a modification, such as comprises, consists essentially of, or consists of a modification by mutation of any of the SpCas9 or SaCas9 residues listed in any of Tables 1-7 or the corresponding residue in a Cas9 ortholog; or
фермент содержит, состоит, по сути, из или состоит из модификации в любом одном (одиночная), двух (двойная), трех (тройная), четырех (четверная) или более положениях в соответствии с настоящим изобретением по всей настоящей заявке, включая без ограничения в данном кратком описании, и/или в кратком описании графических материалов, и/или в подробном описании, и/или в любом из примеров и/или на любой из фигур, или по соответствующему остатку или положению в ортологе Cas9, например, фермент содержит, состоит, по сути, из или состоит из модификации по любому из остатков Cas9, упомянутому в любом из данного краткого описания, и/или в кратком описании графических материалов, и/или в подробном описании, и/или в любом из примеров, и/или на любой из фигур или в других разделах данного документа, или по соответствующему остатку или положению в ортологе Cas9. В таком ферменте каждый остаток может быть модифицирован с помощью замены на аланиновый остаток.the enzyme comprises, consists essentially of, or consists of a modification at any one (single), two (double), three (triple), four (quadruple) or more positions as described herein throughout the present application, including but not limited to this summary and/or the summary of the drawings and/or the detailed description and/or any of the examples and/or any of the figures, or at a corresponding residue or position in a Cas9 ortholog, for example, the enzyme comprises, consists essentially of, or consists of a modification at any of the Cas9 residues mentioned in any of this summary and/or the summary of the drawings and/or the detailed description and/or any of the examples and/or any of the figures or elsewhere herein, or at a corresponding residue or position in a Cas9 ortholog. In such an enzyme, each residue may be modified by substitution with an alanine residue.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации одного или нескольких остатков, включающих без ограничения положения 12, 13, 63, 415, 610, 775, 779, 780, 810, 832, 848, 855, 861, 862, 866, 961, 968, 974, 976, 982, 983, 1000, 1003, 1014, 1047, 1060, 1107, 1108, 1109, 1114, 1129, 1240, 1289, 1296, 1297, 1300, 1311 и 1325 в соответствии с нумерацией аминокислотных положений SpCas9.In the case of some of the non-naturally occurring CRISPR enzymes described above, the enzyme is modified by mutation of one or more residues including, but not limited to, positions 12, 13, 63, 415, 610, 775, 779, 780, 810, 832, 848, 855, 861, 862, 866, 961, 968, 974, 976, 982, 983, 1000, 1003, 1014, 1047, 1060, 1107, 1108, 1109, 1114, 1129, 1240, 1289, 1296, 1297, 1300, 1311, and 1325 as numbered amino acid positions of SpCas9.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации и содержит одну или несколько замен на аланин по остаткам, включающим без ограничения положения 63, 415, 775, 779, 780, 810, 832, 848, 855, 861, 862, 866, 961, 968, 974, 976, 982, 983, 1000, 1003, 1014, 1047, 1060, 1107, 1108, 1109, 1114, 1129, 1240, 1289, 1296, 1297, 1300, 1311 или 1325 в соответствии с нумерацией аминокислотных положений SpCas9.In the case of some of the above-described non-naturally occurring CRISPR enzymes, the enzyme is modified by mutation and contains one or more substitutions to alanine at residues including, but not limited to, positions 63, 415, 775, 779, 780, 810, 832, 848, 855, 861, 862, 866, 961, 968, 974, 976, 982, 983, 1000, 1003, 1014, 1047, 1060, 1107, 1108, 1109, 1114, 1129, 1240, 1289, 1296, 1297, 1300, 1311, or 1325 according to amino acid numbering provisions of SpCas9.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации и содержит одну или несколько замен K775A, E779L, Q807A, R780A, K810A, R832A, K848A, K855A, K862A, K866A, K961A, K968A, K974A, R976A, H982A, H983A, K1000A, K1014A, K1047A, K1060A, K1003A, K1107A, S1109A, H1240A, K1289A, K1296A, H1297A, K1300A, H1311A или K1325A.In the case of some of the non-naturally occurring CRISPR enzymes described above, the enzyme is modified by mutation and contains one or more of the substitutions K775A, E779L, Q807A, R780A, K810A, R832A, K848A, K855A, K862A, K866A, K961A, K968A, K974A, R976A, H982A, H983A, K1000A, K1014A, K1047A, K1060A, K1003A, K1107A, S1109A, H1240A, K1289A, K1296A, H1297A, K1300A, H1311A, or K1325A.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации и содержит две или более замен, где две или более замен включают без ограничения R783A и A1322T, или R780A и K810A, или ER780A и K855A, или R780A и R976A, или K848A и R976A, или K855A и R976A, и R780A и K848A, или K810A и K848A, или K848A и K855A, или K810A и K855A, или H982A и R1060A, или H982A и R1003A, или K1003A и R1060A, или R780A и H982A, или K810A и H982A, или K848A и H982A, или K855A и H982A, или R780A и K1003A, или K810A и R1003A, или K848A и K1003A, или K848A и K1007A, или R780A и R1060A, или K810A и R1060A, или K848A и R1060A, или R780A и R1114A, или K848A и R1114A, или R63A и K855A, или R63A и H982A, или H415A и R780A, или H415A и K848A, или K848A и E1108A, или K810A и K1003A, или R780A и R1060A, K810A и R1060A, или K848A и R1060A.In the case of some of the above-described non-naturally occurring CRISPR enzymes, the enzyme is modified by mutation and comprises two or more substitutions, wherein the two or more substitutions include, but are not limited to, R783A and A1322T, or R780A and K810A, or ER780A and K855A, or R780A and R976A, or K848A and R976A, or K855A and R976A, and R780A and K848A, or K810A and K848A, or K848A and K855A, or K810A and K855A, or H982A and R1060A, or H982A and R1003A, or K1003A and R1060A, or R780A and H982A, or K810A and H982A, or K848A and H982A, or K855A and H982A, or R780A and K1003A, or K810A and R1003A, or K848A and K1003A, or K848A and K1007A, or R780A and R1060A, or K810A and R1060A, or K848A and R1060A, or R780A and R1114A, or K848A and R1114A, or R63A and K855A, or R63A and H982A, or H415A and R780A, or H415A and K848A, or K848A and E1108A, or K810A and K1003A, or R780A and R1060A, K810A and R1060A, or K848A and R1060A.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации и содержит три или более замен, где три или более замен включают без ограничения H982A, K1003A и K1129E, или R780A, K1003A и R1060A, или K810A, K1003A и R1060A, или K848A, K1003A и R1060A, или K855A, K1003A и R1060A, или H982A, K1003A и R1060A, или R63A, K848A и R1060A, или T13I, R63A и K810A, или G12D, R63A и R1060A.In the case of some of the above-described non-naturally occurring CRISPR enzymes, the enzyme is modified by mutation and contains three or more substitutions, wherein the three or more substitutions include, but are not limited to, H982A, K1003A, and K1129E, or R780A, K1003A, and R1060A, or K810A, K1003A, and R1060A, or K848A, K1003A, and R1060A, or K855A, K1003A, and R1060A, or H982A, K1003A, and R1060A, or R63A, K848A, and R1060A, or T13I, R63A, and K810A, or G12D, R63A, and R1060A.
В случае некоторых из описанных выше не встречающихся в природе ферментов CRISPR фермент модифицирован с помощью мутации и содержит четыре или более замен, где четыре или более замен включают без ограничения R63A, E610G, K855A и R1060A, или R63A, K855A, R1060A и E610G.In the case of some of the non-naturally occurring CRISPR enzymes described above, the enzyme is modified by mutation and contains four or more substitutions, wherein the four or more substitutions include, but are not limited to, R63A, E610G, K855A, and R1060A, or R63A, K855A, R1060A, and E610G.
В одном предпочтительном варианте осуществления мутация в не встречающемся в природе ферменте CRISPR не является мутацией, перечисленной в таблице B. В дополнительном предпочтительном варианте осуществления мутация в не встречающемся в природе ферменте CRISPR не является R63A, K866A, H982A, H983A, K1107A, K1107A, KES1107-1109AG или KES1107-1109GG в соответствии с нумерацией аминокислотных положений SpCas9. В дополнительном предпочтительном варианте осуществления не встречающийся в природе фермент CRISPR не является ферментом, модифицированным с помощью одиночной мутации, выбранной из R63A, K866A, H982A, H983A, K1107A и K1107A, или ферментом, модифицированным с помощью мутации, выбранной из KES1107-1109AG и KES1107-1109GG в соответствии с нумерацией аминокислотных положений SpCas9.In one preferred embodiment, the mutation in the non-naturally occurring CRISPR enzyme is not a mutation listed in Table B. In a further preferred embodiment, the mutation in the non-naturally occurring CRISPR enzyme is not R63A, K866A, H982A, H983A, K1107A, K1107A, KES1107-1109AG, or KES1107-1109GG according to the amino acid position numbering of SpCas9. In a further preferred embodiment, the non-naturally occurring CRISPR enzyme is not an enzyme modified with a single mutation selected from R63A, K866A, H982A, H983A, K1107A and K1107A, or an enzyme modified with a mutation selected from KES1107-1109AG and KES1107-1109GG according to the amino acid position numbering of SpCas9.
В предпочтительном варианте осуществления описанный выше не встречающийся в природе фермент CRISPR модифицирован с помощью мутации одного или нескольких остатков, включающих без ограничения положения 12, 13, 415, 610, 775, 779, 780, 810, 832, 848, 855, 861, 862, 961, 968, 974, 976, 1000, 1003, 1014, 1047, 1060, 1114, 1129, 1240, 1289, 1296, 1297, 1300, 1311 и 1325 в соответствии с нумерацией аминокислотных положений SpCas9.In a preferred embodiment, the above-described non-naturally occurring CRISPR enzyme is modified by mutation of one or more residues including, but not limited to, positions 12, 13, 415, 610, 775, 779, 780, 810, 832, 848, 855, 861, 862, 961, 968, 974, 976, 1000, 1003, 1014, 1047, 1060, 1114, 1129, 1240, 1289, 1296, 1297, 1300, 1311, and 1325, according to the amino acid position numbering of SpCas9.
В дополнительном предпочтительном варианте осуществления описанный выше не встречающийся в природе фермент CRISPR модифицирован с помощью мутации и содержит одну или несколько замен на аланин по остаткам, включающим без ограничения положения 415, 775, 779, 780, 810, 832, 848, 855, 861, 862, 961, 968, 974, 976, 1000, 1003, 1014, 1047, 1060, 1114, 1129, 1240, 1289, 1296, 1297, 1300, 1311 или 1325 в соответствии с нумерацией аминокислотных положений SpCas9.In a further preferred embodiment, the above-described non-naturally occurring CRISPR enzyme is modified by mutation and comprises one or more substitutions to alanine at residues including, but not limited to, positions 415, 775, 779, 780, 810, 832, 848, 855, 861, 862, 961, 968, 974, 976, 1000, 1003, 1014, 1047, 1060, 1114, 1129, 1240, 1289, 1296, 1297, 1300, 1311 or 1325 according to the amino acid position numbering of SpCas9.
В дополнительном предпочтительном варианте осуществления описанный выше не встречающийся в природе фермент CRISPR модифицирован с помощью мутации и содержит одну или несколько замен K775A, E779L, Q807A, R780A, K810A, R832A, K848A, K855A, K862A, K961A, K968A, K974A, R976A, K1000A, K1014A, K1047A, K1060A, K1003A, S1109A, H1240A, K1289A, K1296A, H1297A, K1300A, H1311A или K1325A.In a further preferred embodiment, the above-described non-naturally occurring CRISPR enzyme is modified by mutation and comprises one or more of the substitutions K775A, E779L, Q807A, R780A, K810A, R832A, K848A, K855A, K862A, K961A, K968A, K974A, R976A, K1000A, K1014A, K1047A, K1060A, K1003A, S1109A, H1240A, K1289A, K1296A, H1297A, K1300A, H1311A or K1325A.
В любом из не встречающихся в природе ферментов CRISPR:In any of the non-naturally occurring CRISPR enzymes:
одиночное несовпадение может находиться между целевой и соответствующей последовательностью одного или нескольких нецелевых локусов; и/илиa single mismatch may be between the target and the corresponding sequence of one or more non-target loci; and/or
два, три или четыре или более несовпадений могут находиться между целевой и соответствующей последовательностью одного или нескольких нецелевых локусов, и/илиtwo, three, or four or more mismatches may be between the target and the corresponding sequence of one or more non-target loci, and/or
где (ii) указанные два, три или четыре или более несовпадения являются смежными.where (ii) said two, three or four or more mismatches are adjacent.
В случае любого из не встречающихся в природе ферментов CRISPR фермент в комплексе CRISPR может характеризоваться сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом, и при этом фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать указанные целевые локусы по сравнению с немодифицированным ферментом.For any of the non-naturally occurring CRISPR enzymes, the enzyme in the CRISPR complex may have a reduced ability to modify one or more non-target loci compared to the unmodified enzyme, and the enzyme in the CRISPR complex may have an increased ability to modify said target loci compared to the unmodified enzyme.
В случае любого из не встречающихся в природе ферментов CRISPR, когда он находится в комплексе CRISPR, относительная разница модифицирующей способности фермента в отношении целевого и по меньшей мере одного нецелевого локуса может быть увеличена по сравнению с относительной разницей для немодифицированного фермента.For any of the non-naturally occurring CRISPR enzymes, when it is in a CRISPR complex, the relative difference in the modifying ability of the enzyme with respect to the target and at least one non-target locus may be increased compared to the relative difference for the unmodified enzyme.
В случае любого из не встречающихся в природе ферментов CRISPR фермент CRISPR может содержать одну или несколько дополнительный мутаций, где одна или несколько дополнительных мутаций находятся в одном или нескольких каталитически активных доменах.For any of the non-naturally occurring CRISPR enzymes, the CRISPR enzyme may contain one or more additional mutations, where the one or more additional mutations are in one or more catalytically active domains.
В случае таких не встречающихся в природе ферментов CRISPR фермент CRISPR может характеризоваться сниженной или отмененной нуклеазной активностью в сравнении с ферментом, у которого отсутствует указанная одна или несколько дополнительных мутаций.In the case of such non-naturally occurring CRISPR enzymes, the CRISPR enzyme may have reduced or abolished nuclease activity compared to an enzyme that lacks the specified one or more additional mutations.
В случае некоторых таких не встречающихся в природе ферментов CRISPR фермент CRISPR не управляет расщеплением одной или другой нити ДНК в определенном положении целевой последовательности.In the case of some of these non-naturally occurring CRISPR enzymes, the CRISPR enzyme does not direct the cleavage of one or the other strand of DNA at a specific position in the target sequence.
В случае некоторых таких не встречающихся в природе ферментов CRISPR одна или несколько дополнительных мутаций предусматривают мутацию D10 из SpCas9, E762 из SpCas9, H840 из SpCas9, N854 из SpCas9, N863 из SpCas9 и/или D986 из SpCas9 или соответствующие остатки из других ортологов Cas9.For some of these unnaturally occurring CRISPR enzymes, one or more additional mutations involve mutation of D10 of SpCas9, E762 of SpCas9, H840 of SpCas9, N854 of SpCas9, N863 of SpCas9, and/or D986 of SpCas9 or corresponding residues from other Cas9 orthologs.
В случае некоторых таких не встречающихся в природе ферментов CRISPR одна или несколько дополнительных мутаций предусматривают D10A, E762A, H840A, N854A, N863A и/или D986A из SpCas9 или соответствующие остатки из других ортологов Cas9.For some of these unnatural CRISPR enzymes, one or more additional mutations involve D10A, E762A, H840A, N854A, N863A, and/or D986A from SpCas9 or corresponding residues from other Cas9 orthologs.
В случае некоторых таких не встречающихся в природе ферментов CRISPR одна или несколько дополнительных мутаций предусматривают две дополнительные мутации. Две дополнительные мутации могут предусматривать D10A SpCas9 и H840A SpCas9 или соответствующие остатки из другого ортолога Cas9. В случае некоторых таких не встречающихся в природе ферментов CRISPR фермент CRISPR может не управлять расщеплением одной из нитей ДНК в определенном положении целевой последовательности.For some of these unnatural CRISPR enzymes, one or more additional mutations result in two additional mutations. The two additional mutations may result in D10A of SpCas9 and H840A of SpCas9 or the corresponding residues from another Cas9 ortholog. For some of these unnatural CRISPR enzymes, the CRISPR enzyme may not direct the cleavage of one of the DNA strands at a particular position in the target sequence.
Если фермент CRISPR содержит одну или несколько дополнительных мутаций в одном или нескольких каталитически активных доменах, одна или несколько дополнительных мутаций может находиться в каталитически активном домене фермента CRISPR, содержащего RuvCI, RuvCII или RuvCIII.If the CRISPR enzyme contains one or more additional mutations in one or more catalytically active domains, the one or more additional mutations may be in a catalytically active domain of the CRISPR enzyme that contains RuvCI, RuvCII, or RuvCIII.
Без ограничения теорией, в одном аспекте настоящего изобретения описаны способы и мутации, предусмотренные для улучшения конформационной перегруппировки доменов Cas9 в положения, которые обеспечивают расщепление в целевых сайтах, и избегание таких конформационных состояний в случае нецелевых сайтов. Cas9 расщепляет целевую ДНК с помощью целого ряда координированных стадий. Вначале PAM-взаимодействующий домен распознает PAM-последовательность на 5'-конце целевой ДНК. После связывания PAM первые 10-12 нуклеотидов целевой последовательности (затравочная последовательность) проверяется на комплементарность sgRNA:ДНК, причем данный процесс обусловлен разделением ДНК-дуплекса. Если нуклеотиды затравочной последовательности комплементарны sgRNA, остальная ДНК раскручивается, и sgRNA по всей длине гибридизируется с целевой нитью ДНК. nt-Бороздка между доменами RuvC и HNH стабилизирует не подвергаемую нацеливанию нить ДНК и облегчает раскручивание благодаря неспецифическим взаимодействиям с положительными зарядами фосфатного остова ДНК. Взаимодействия РНК:cDNA и Cas9:ncDNA управляют раскручиванием ДНК, конкурирующим с повторной гибридизацией cDNA:ncDNA. Другие домены cas9 также влияют на конформацию нуклеазных доменов, например, линкеры, соединяющие HNH с RuvCII и RuvCIII. В соответствии с этим, предусмотренные способы и мутации охватывают без ограничения домены RuvCI, RuvCIII, RuvCIII и HNH и линкеры. Конформационные изменения в Cas9, вызванные связыванием целевой ДНК, включая взаимодействия с затравочной последовательностью и взаимодействия с целевой и не подвергаемой нацеливанию нитью ДНК, определяют, будут ли домены расположены так, чтобы запустить нуклеазную активность. Таким образом, мутации и способы, предусмотренные в данном документе, демонстрируют и обеспечивают модификации, которые выходят за пределы распознавания PAM и образования пар оснований между РНК-ДНК.Without being limited by theory, one aspect of the present invention provides methods and mutations for improving the conformational rearrangement of Cas9 domains into positions that allow cleavage at target sites and avoiding such conformational states at off-target sites. Cas9 cleaves target DNA through a series of coordinated steps. Initially, the PAM-interacting domain recognizes a PAM sequence at the 5' end of the target DNA. Upon PAM binding, the first 10-12 nucleotides of the target sequence (the seed sequence) are tested for sgRNA:DNA complementarity, a process driven by separation of the DNA duplex. If the nucleotides of the seed sequence are complementary to the sgRNA, the remainder of the DNA is unwound and the entire length of the sgRNA hybridizes to the target DNA strand. The nt-groove between the RuvC and HNH domains stabilizes the non-targetable DNA strand and facilitates unwinding through non-specific interactions with the positive charges of the DNA phosphate backbone. RNA:cDNA and Cas9:ncDNA interactions drive DNA unwinding in competition with cDNA:ncDNA rehybridization. Other Cas9 domains also influence the conformation of the nuclease domains, such as the linkers connecting HNH to RuvCII and RuvCIII. Accordingly, the provided methods and mutations include, but are not limited to, the RuvCI, RuvCIII, RuvCIII, and HNH domains and linkers. Conformational changes in Cas9 induced by binding of target DNA, including interactions with the primer sequence and interactions with the target and non-targetable DNA strand, determine whether the domains are positioned to trigger nuclease activity. Thus, the mutations and methods provided herein demonstrate and provide modifications that extend beyond PAM recognition and RNA-DNA base pairing.
В одном аспекте настоящего изобретения предусмотрены нуклеазы Cas9, которые предусматривают улучшенное равновесие, смещенное в направлении конформаций, ассоциированных с активностью расщепления, при вовлечении в целевые взаимодействия, и/или улучшенное равновесие, смещенное в обратную сторону от конформаций, ассоциированных с активностью расщепления, при вовлечении в нецелевые взаимодействия. В одном аспекте настоящего изобретения предусмотрены нуклеазы Cas9 с улучшенной функцией редактирования, т.е. нуклеаза Cas9, которая принимает конформацию, предусматривающую нуклеазную активность в отношении целевого сайта, и при этом такая конформация характеризуется повышенной невыгодностью в отношении нецелевого сайта. Sternberg et al., Nature 527(7576):110-3, doi: 10.1038/nature15544, опубликована онлайн 28 октября 2015 года. В Epub 2015 Oct 28, применяли эксперименты c Ферстеровским резонансным переносом энергии (FRET) для обнаружения относительной ориентации каталитических доменов Cas9 при ассоциации с целевой и нецелевой ДНК.In one aspect, the present invention provides Cas9 nucleases that provide an improved equilibrium biased toward conformations associated with cleavage activity when engaged in on-target interactions and/or an improved equilibrium biased away from conformations associated with cleavage activity when engaged in off-target interactions. In one aspect, the present invention provides Cas9 nucleases with improved editing function, i.e., a Cas9 nuclease that adopts a conformation that provides nuclease activity at a target site, and wherein such conformation has an increased disfavor at an off-target site. Sternberg et al., Nature 527(7576):110-3, doi: 10.1038/nature15544, published online October 28, 2015. In Epub 2015 Oct 28, Forster resonance energy transfer (FRET) experiments were used to detect the relative orientation of the Cas9 catalytic domains when associated with target and non-target DNA.
В настоящем изобретении также предусмотрены способы и мутации для модулирования нуклеазной активности и/или специфичности с применением модифицированных направляющих РНК. Как уже обсуждалось, целевая нуклеазная активность может быть повышенной или сниженной. Также, нецелевая нуклеазная активность может быть повышенной или сниженной. Кроме того, может быть повышена или снижена специфичность в отношении целевой активности в сравнении с нецелевой активностью. Модифицированные направляющие РНК включают без ограничения усеченные направляющие РНК, нефункциональные направляющие РНК, химически модифицированные направляющие РНК, направляющие РНК, ассоциированные с функциональными доменами, модифицированные направляющие РНК, содержащие функциональные домены, модифицированные направляющие РНК, содержащие аптамеры, модифицированные направляющие РНК, содержащие адапторные белки, и направляющие РНК, содержащие добавленные или модифицированные петли.The present invention also provides methods and mutations for modulating nuclease activity and/or specificity using modified guide RNAs. As discussed, the target nuclease activity can be increased or decreased. Also, the off-target nuclease activity can be increased or decreased. Additionally, the specificity for the target activity can be increased or decreased compared to the off-target activity. Modified guide RNAs include, but are not limited to, truncated guide RNAs, non-functional guide RNAs, chemically modified guide RNAs, guide RNAs associated with functional domains, modified guide RNAs containing functional domains, modified guide RNAs containing aptamers, modified guide RNAs containing adaptor proteins, and guide RNAs containing added or modified loops.
В одном аспекте настоящего изобретения также предусмотрены способы и мутации для модулирования активности связывания и/или специфичности связывания Cas9. В определенных вариантах осуществления применяют белки Cas9, у которых отсутствует нуклеазная активность. В определенных вариантах осуществления используют модифицированные направляющие РНК, которые содействуют связыванию, но не нуклеазной активности нуклеазы Cas9. В таких вариантах осуществления целевое связывание может быть повышенным или сниженным. Также, в таких вариантах осуществления нецелевое связывание может быть повышенным или сниженным. Более того, может быть повышена или снижена специфичность в отношении целевого связывания в сравнении с нецелевым связыванием.In one aspect, the present invention also provides methods and mutations for modulating the binding activity and/or binding specificity of Cas9. In certain embodiments, Cas9 proteins that lack nuclease activity are used. In certain embodiments, modified guide RNAs are used that promote binding but not the nuclease activity of the Cas9 nuclease. In such embodiments, target binding may be increased or decreased. Also, in such embodiments, off-target binding may be increased or decreased. Moreover, the specificity for on-target binding relative to off-target binding may be increased or decreased.
Способы и мутации, которые можно использовать в различных комбинациях для повышения или снижения активности и/или специфичности целевой в сравнении с нецелевой активностью, или повышения или снижения связывания и/или специфичности целевого в сравнении с нецелевым связыванием, можно применять, чтобы компенсировать или усилить влияние мутаций или модификаций, выполненных для содействия другим эффектам. Такие мутации или модификации, выполненные для содействия другим эффектам, включают мутации или модификацию в Cas9 и/или мутацию или модификацию, выполненную в направляющей РНК. В определенных вариантах осуществления способы и мутации применяют с химически модифицированными направляющими РНК. Примеры химических модификаций направляющих РНК включают без ограничения введение 2′-O-метила (M), 2′-O-метил-3′-фосфоротиоата (MS) или 2′-O-метил-3′-тио-PACE (MSP) в один или несколько концевых нуклеотидов. Такие химически модифицированные направляющие РНК могут предусматривать повышенную стабильность и повышенную активность по сравнению с немодифицированными направляющими РНК, хотя целевая в сравнении с нецелевой специфичность не является прогнозируемой. (См., Hendel, 2015, Nat Biotechnol. 33(9):985-9, doi: 10.1038/nbt.3290, опубликована онлайн 29 июня 2015 года). Химически модифицированные направляющие РНК также включают без ограничения РНК с фосфоротиоатными связями и нуклеотиды закрытых нуклеиновых кислот (LNA), содержащие метиленовый мостик между атомами углерода 2′ и 4′ в кольце рибозы. Способы и мутации по настоящему изобретению применяют для модулирования нуклеазной активности и/или связывания Cas9 с химически модифицированными направляющими РНК.Methods and mutations that can be used in various combinations to increase or decrease the activity and/or specificity of a target versus an off-target activity, or to increase or decrease the binding and/or specificity of a target versus an off-target binding, can be used to compensate for or enhance the effect of mutations or modifications made to promote other effects. Such mutations or modifications made to promote other effects include mutations or a modification in Cas9 and/or a mutation or modification made in a guide RNA. In certain embodiments, the methods and mutations are used with chemically modified guide RNAs. Examples of chemical modifications of guide RNAs include, but are not limited to, the introduction of 2′-O-methyl (M), 2′-O-methyl-3′-phosphorothioate (MS), or 2′-O-methyl-3′-thio-PACE (MSP) at one or more terminal nucleotides. Such chemically modified guide RNAs may provide increased stability and increased activity compared to unmodified guide RNAs, although on-target versus off-target specificity is not predictable. (See, Hendel, 2015, Nat Biotechnol. 33(9):985-9, doi: 10.1038/nbt.3290, published online June 29, 2015.) Chemically modified guide RNAs also include, but are not limited to, phosphorothioate-linked RNAs and locked nucleic acid (LNA) nucleotides containing a methylene bridge between the 2′ and 4′ carbons of the ribose ring. The methods and mutations of the present invention are used to modulate the nuclease activity and/or binding of Cas9 to chemically modified guide RNAs.
В одном аспекте настоящего изобретения предусмотрены способы и мутации для модулирования связывания и/или специфичности связывания белков Cas9, содержащих функциональные домены, такие нуклеазы, активаторы транскрипции, репрессоры транскрипции и т.п. К примеру, можно сделать белок Cas9 с отсутствием нуклеазной активности путем введения мутаций, таких как D10A, D839A, H840A и N863A в нуклеазные домены RuvC и HNH. Белки Cas9, лишенные нуклеазной активности, пригодны для РНК-направляемой зависимой от целевой последовательности доставки функциональных доменов. В настоящем изобретении предусмотрены способы и мутации для модулирования связывания белков Cas9. В одном варианте осуществления функциональный домен предусматривает VP64, обеспечивающий РНК-направляемый фактор транскрипции. В другом варианте осуществления функциональный домен предусматривает Fok I, обеспечивающий РНК-направляемую нуклеазную активность. Здесь следует упомянуть публикацию заявки на патент США 2014/0356959, публикацию заявки на патент США 2014/0342456, публикацию заявки на патент США 2015/0031132, и Mali, P. et al., 2013, Science 339(6121):823-6, doi: 10.1126/science.1232033, опубликованную онлайн 3 января 2013 года, и в идеях, изложенных в данном документе, настоящее изобретение подразумевает способы и материалы этих документов, применяемые в сочетании с идеями, изложенными в данном документе. В определенных вариантах осуществления целевое связывание является повышенным. В определенных вариантах осуществления нецелевое связывание является сниженным. В определенных вариантах осуществления целевое связывание является сниженным. В определенных вариантах осуществления нецелевое связывание является повышенным. В соответствии с этим, в настоящем изобретении также предусмотрено повышение или снижение специфичности целевого связывания в сравнении с нецелевым связыванием у функционализированных связывающих белков Cas9.In one aspect, the present invention provides methods and mutations for modulating the binding and/or binding specificity of Cas9 proteins comprising functional domains such as nucleases, transcriptional activators, transcriptional repressors, and the like. For example, a Cas9 protein can be made to lack nuclease activity by introducing mutations such as D10A, D839A, H840A, and N863A into the RuvC and HNH nuclease domains. Cas9 proteins lacking nuclease activity are suitable for RNA-directed, target sequence-dependent delivery of functional domains. The present invention provides methods and mutations for modulating the binding of Cas9 proteins. In one embodiment, the functional domain provides VP64, which provides an RNA-directed transcription factor. In another embodiment, the functional domain provides Fok I, which provides RNA-directed nuclease activity. Reference should be made herein to U.S. Patent Application Publication 2014/0356959, U.S. Patent Application Publication 2014/0342456, U.S. Patent Application Publication 2015/0031132, and Mali, P. et al., 2013, Science 339(6121):823-6, doi: 10.1126/science.1232033, published online January 3, 2013, and in the teachings herein, the present invention contemplates the methods and materials of these documents used in conjunction with the teachings herein. In certain embodiments, on-target binding is increased. In certain embodiments, off-target binding is decreased. In certain embodiments, on-target binding is decreased. In certain embodiments, off-target binding is increased. Accordingly, the present invention also provides for increasing or decreasing the specificity of target binding compared to off-target binding in functionalized Cas9 binding proteins.
Применение Cas9 в качестве РНК-направляемого связывающего белка не ограничивается Cas9 с отсутствием нуклеазной активности Ферменты Cas9, предусматривающие нуклеазную активность, также могут функционировать как РНК-направляемые связывающие белки, при применении с определенными направляющими РНК. Например, короткие направляющие РНК и направляющие РНК, содержащие нуклеотиды, несовпадающие с мишенью, могут содействовать управляемому РНК связыванию Cas9 с целевой последовательностью с небольшим или отсутствием расщепления целевой последовательности. (См., например, Dahlman, 2015, Nat Biotechnol. 33(11):1159-1161, doi: 10.1038/nbt.3390, опубликованный онлайн 05 октября 2015 года). В одном аспекте настоящего изобретения предусмотрены способы и мутации для модулирования связывания белков Cas9, которые предусматривают нуклеазную активность. В определенных вариантах осуществления целевое связывание является повышенным. В определенных вариантах осуществления нецелевое связывание является сниженным. В определенных вариантах осуществления целевое связывание является сниженным. В определенных вариантах осуществления нецелевое связывание является повышенным. В определенных вариантах осуществления имеется повышенная или сниженная специфичность целевого связывания в сравнении с нецелевым связыванием. В определенных вариантах осуществления нуклеазная активность направляющей РНК-фермента Cas9 также модулирована.The use of Cas9 as an RNA-guided binding protein is not limited to Cas9 lacking nuclease activity. Cas9 enzymes that provide nuclease activity can also function as RNA-guided binding proteins when used with certain guide RNAs. For example, short guide RNAs and guide RNAs containing nucleotides that are mismatched to the target can promote RNA-guided binding of Cas9 to a target sequence with little or no cleavage of the target sequence. (See, e.g., Dahlman, 2015, Nat Biotechnol. 33(11):1159-1161, doi: 10.1038/nbt.3390, published online October 5, 2015.) In one aspect, the present invention provides methods and mutations for modulating the binding of Cas9 proteins that provide nuclease activity. In certain embodiments, the target binding is increased. In certain embodiments, the off-target binding is decreased. In certain embodiments, the target binding is decreased. In certain embodiments, the off-target binding is increased. In certain embodiments, there is increased or decreased specificity of the target binding compared to the off-target binding. In certain embodiments, the nuclease activity of the Cas9 guide RNA enzyme is also modulated.
Для активности и специфичности расщепления является важным образование гетеродуплекса РНК-ДНК на протяжении всего целевого участка, а не только участка затравочной последовательности, ближайшего к PAM. Так, усеченные направляющие РНК проявляют сниженную активность и специфичность расщепления. В одном аспекте настоящего изобретения предусмотрены способ и мутации для повышения активности и специфичности расщепления с применением измененных направляющих РНК.For cleavage activity and specificity, it is important to form an RNA-DNA heteroduplex throughout the target region, not just the region of the seed sequence closest to the PAM. Thus, truncated guide RNAs exhibit reduced cleavage activity and specificity. In one aspect of the present invention, a method and mutations are provided for increasing cleavage activity and specificity using altered guide RNAs.
В настоящем изобретении также продемонстрировано, что модификации специфичности нуклеазы Cas9 могут быть выполнены в сочетании с модификациями в отношении диапазона нацеливания. Могут быть разработаны мутанты Cas9, которые характеризуются повышенной специфичностью в отношении мишени, а также имеют модификации, обеспечивающие распознавание PAM, например, путем выбора мутаций, который изменяют специфичность в отношении PAM и комбинирования этих мутаций с мутациями nt-бороздки, которые повышают (или, в случае необходимости, снижают) специфичность в отношении целевых последовательностей в сравнении с нецелевыми последовательностями. В одном таком варианте осуществления остаток домена PI подвергают мутированию для обеспечения распознавания требуемой последовательности PAM, при этом одну или несколько аминокислот nt-бороздки подвергают мутированию для изменения специфичности в отношении мишени. Kleinstiver приводит нуклеазы SpCas9 и SaCas9, в которых определенные остатки домена PI мутированы и распознают альтернативные последовательности PAM (см. Kleinstiver et al., Nature 523(7561):481-5 doi: 10.1038/nature14592, опубликована онлайн 22 июня 2015 года; Kleinstiver et al., Nature Biotechnology, doi: 10.1038/nbt.3404, опубликована онлайн 2 ноября 2015 года). Способы и модификации Cas9, описанные в данном документе, можно применять для противодействия потере специфичности, происходящей в результате изменения распознавания PAM, усиления возрастания специфичности, происходящего в результате изменения распознавания PAM, противодействия возрастанию специфичности, происходящему в результате изменения распознавания PAM, или усиления потери специфичности, происходящей в результате изменения распознавания PAM.The present invention also demonstrates that modifications to the specificity of the Cas9 nuclease can be made in combination with modifications to the targeting range. Cas9 mutants can be developed that have increased target specificity and also have modifications that allow recognition of PAMs, for example, by selecting mutations that alter specificity for PAMs and combining these mutations with nt groove mutations that increase (or, where appropriate, decrease) specificity for target sequences compared to non-target sequences. In one such embodiment, the PI domain residue is mutated to allow recognition of the desired PAM sequence, and one or more nt groove amino acids are mutated to alter target specificity. Kleinstiver reported SpCas9 and SaCas9 nucleases in which certain residues of the PI domain are mutated and recognize alternative PAM sequences (see Kleinstiver et al., Nature 523(7561):481-5 doi: 10.1038/nature14592, published online June 22, 2015; Kleinstiver et al., Nature Biotechnology, doi: 10.1038/nbt.3404, published online November 2, 2015). The methods and modifications of Cas9 described herein can be used to counteract a loss of specificity resulting from an alteration in PAM recognition, enhance a gain in specificity resulting from an alteration in PAM recognition, counteract a gain in specificity resulting from an alteration in PAM recognition, or enhance a loss of specificity resulting from an alteration in PAM recognition.
Способы и мутации можно применять в отношении любого фермента Cas9 с измененным распознаванием PAM. Неограничивающие примеры PAM включают NGG, NNGRRT, NN[A/C/T]RRT, NGAN, NGCG, NGAG, NGNG, NGC и NGA.The methods and mutations can be applied to any Cas9 enzyme with altered PAM recognition. Non-limiting examples of PAMs include NGG, NNGRRT, NN[A/C/T]RRT, NGAN, NGCG, NGAG, NGNG, NGC, and NGA.
В дополнительных вариантах осуществления способов и мутаций применяют модифицированные белки.In additional embodiments of the methods and mutations, modified proteins are used.
В случае любого из не встречающихся в природе ферментов CRISPR фермент CRISPR может содержать один или несколько гетерологичных функциональных доменов.For any of the non-naturally occurring CRISPR enzymes, the CRISPR enzyme may contain one or more heterologous functional domains.
Один или несколько гетерологичных функциональных доменов могут предусматривать один или несколько доменов, представляющих собой сигнал ядерной локализации (NLS). Один или несколько гетерологичных функциональных доменов могут предусматривать по меньшей мере два или более NLS.One or more heterologous functional domains may provide one or more domains that represent a nuclear localization signal (NLS). One or more heterologous functional domains may provide at least two or more NLS.
В определенных вариантах осуществления настоящего изобретения по меньшей мере один сигнал ядерной локализации (NLS) прикреплен к последовательностям нуклеиновой кислоты, кодирующим эффекторные белки Cas9. В предпочтительных вариантах осуществления прикреплены по меньшей мере один или несколько C-концевых или N-концевых NLS (и, следовательно, молекула(молекулы) нуклеиновой кислоты, кодирующая(кодирующие) эффекторный белок Cas9, может предусматривать кодирование NLS, вследствие чего экспрессированный продукт имеет прикрепленный(прикрепленные) или присоединенный(присоединенные) NLS). В предпочтительном варианте осуществления C-концевой NLS прикреплен для оптимальной экспрессии и нацеливания в ядро в эукариотических клетках, предпочтительно клетках человека. В предпочтительном варианте осуществления кодон-оптимизированный эффекторный белок представляет собой SpCas9 или SaCas9, а длина спейсера направляющей РНК составляет от 15 до 35 нуклеотидов. В определенных вариантах осуществления длина спейсера направляющей РНК составляет по меньшей мере 16 нуклеотидов, как, например, по меньшей мере 17 нуклеотидов. В определенных вариантах осуществления длина спейсера составляет от 15 до 17 нуклеотидов, от 17 до 20 нуклеотидов, от 20 до 24 нуклеотидов, например, 20, 21, 22, 23 или 24 нуклеотида, от 23 до 25 нуклеотидов, например, 23, 24 или 25 нуклеотидов, от 24 до 27 нуклеотидов, 27-30 нуклеотидов, 30-35 нуклеотидов, или 35 нуклеотидов или больше. В определенных вариантах осуществления настоящего изобретения кодон-оптимизированный эффекторный белок представляет собой SpCas9 или SaCas9, а длина прямого повтора направляющей РНК составляет по меньшей мере 16 нуклеотидов. В определенных вариантах осуществления кодон-оптимизированный эффекторный белок представляет собой FnCpf1p, а длина прямого повтора направляющей РНК составляет от 16 до 20 нуклеотидов, например, 16, 17, 18, 19 или 20 нуклеотидов. В определенных предпочтительных вариантах осуществления длина прямого повтора направляющей РНК составляет 19 нуклеотидов.In certain embodiments of the present invention, at least one nuclear localization signal (NLS) is attached to the nucleic acid sequences encoding the Cas9 effector proteins. In preferred embodiments, at least one or more C-terminal or N-terminal NLSs are attached (and thus the nucleic acid molecule(s) encoding the Cas9 effector protein may provide for encoding an NLS, such that the expressed product has the NLS(s) attached or tethered). In a preferred embodiment, the C-terminal NLS is attached for optimal expression and targeting to the nucleus in eukaryotic cells, preferably human cells. In a preferred embodiment, the codon-optimized effector protein is SpCas9 or SaCas9 and the guide RNA spacer length is from 15 to 35 nucleotides. In certain embodiments, the length of the guide RNA spacer is at least 16 nucleotides, such as at least 17 nucleotides. In certain embodiments, the length of the spacer is from 15 to 17 nucleotides, from 17 to 20 nucleotides, from 20 to 24 nucleotides, such as 20, 21, 22, 23 or 24 nucleotides, from 23 to 25 nucleotides, such as 23, 24 or 25 nucleotides, from 24 to 27 nucleotides, 27-30 nucleotides, 30-35 nucleotides, or 35 nucleotides or more. In certain embodiments of the present invention, the codon-optimized effector protein is SpCas9 or SaCas9, and the length of the direct repeat of the guide RNA is at least 16 nucleotides. In certain embodiments, the codon-optimized effector protein is FnCpf1p and the direct repeat length of the guide RNA is from 16 to 20 nucleotides, such as 16, 17, 18, 19, or 20 nucleotides. In certain preferred embodiments, the direct repeat length of the guide RNA is 19 nucleotides.
Один или несколько гетерологичных функциональных доменов предусматривают один или несколько доменов активации транскрипции. Домен активации транскрипции может предусматривать VP64.One or more heterologous functional domains provide one or more transcriptional activation domains. A transcriptional activation domain may provide VP64.
Один или несколько гетерологичных функциональных доменов предусматривают один или несколько доменов репрессии транскрипции. Домен репрессии транскрипции может предусматривать домен KRAB или домен SID.One or more heterologous functional domains provide one or more transcriptional repression domains. A transcriptional repression domain may provide a KRAB domain or a SID domain.
Один или несколько гетерологичных функциональных доменов могут предусматривать один или несколько нуклеазных доменов. Один или несколько нуклеазных доменов могут предусматривать Fok1.One or more heterologous functional domains may provide one or more nuclease domains. One or more nuclease domains may provide Fok1.
Один или несколько гетерологичных функциональных доменов могут характеризоваться одной или несколькими из следующих видов активности: метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, нуклеазной активностью, активностью расщепления однонитевой РНК, активностью расщепления двухнитевой РНК, активностью расщепления однонитевой ДНК, активностью расщепления двухнитевой ДНК и активностью связывания нуклеиновой кислоты.One or more heterologous functional domains may be characterized by one or more of the following activities: methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, nuclease activity, single-stranded RNA cleavage activity, double-stranded RNA cleavage activity, single-stranded DNA cleavage activity, double-stranded DNA cleavage activity, and nucleic acid binding activity.
По меньшей мере один или несколько гетерологичных функциональных доменов могут быть расположены на амино-конце фермента или вблизи него и/или на карбокси-конце фермента или вблизи него.At least one or more heterologous functional domains may be located at or near the amino terminus of the enzyme and/or at or near the carboxy terminus of the enzyme.
Один или несколько гетерологичных функциональных доменов могут быть слиты с ферментом CRISPR, или связаны с ферментом CRISPR, или присоединены к ферменту CRISPR с помощью линкерного фрагмента.One or more heterologous functional domains may be fused to a CRISPR enzyme, or linked to a CRISPR enzyme, or attached to a CRISPR enzyme via a linker moiety.
В случае любого из не встречающихся в природе ферментов CRISPR фермент CRISPR может предусматривать фермент CRISPR от организма из рода, включающего Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium или Corynebacter.For any of the non-naturally occurring CRISPR enzymes, the CRISPR enzyme may include a CRISPR enzyme from an organism of the genus Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, or Corynebacter.
В случае любого из не встречающихся в природе ферментов CRISPR фермент CRISPR может предусматривать химерный фермент Cas9, содержащий первый фрагмент от первого ортолога Cas9 и второй фрагмент от второго ортолога Cas9, и при этом первый и второй ортологи Cas9 являются различными. По меньшей мере один из первого и второго ортологов Cas9 может предусматривать Cas9 от организма, включающего Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium или Corynebacter.In the case of any of the non-naturally occurring CRISPR enzymes, the CRISPR enzyme may provide a chimeric Cas9 enzyme comprising a first fragment from a first Cas9 ortholog and a second fragment from a second Cas9 ortholog, and wherein the first and second Cas9 orthologs are different. At least one of the first and second Cas9 orthologs may provide a Cas9 from an organism comprising Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, or Corynebacter.
В случае любого из не встречающихся в природе ферментов CRISPR нуклеотидная последовательность, кодирующая фермент CRISPR может быть подвергнута кодон-оптимизации для экспрессии в эукариотическом организме.For any of the non-naturally occurring CRISPR enzymes, the nucleotide sequence encoding the CRISPR enzyme can be codon optimized for expression in a eukaryotic organism.
В случае любого из не встречающихся в природе ферментов CRISPR клетка может представлять собой эукариотическую клетку или прокариотическую клетку; причем комплекс CRISPR является функциональным в клетке, и при этом фермент комплекса CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов в клетке по сравнению с немодифицированным ферментом, и/или при этом фермент в комплексе CRISPR характеризуется усиленной способностью модифицировать один или нескольких целевых локусов по сравнению с немодифицированным ферментом.In the case of any of the non-naturally occurring CRISPR enzymes, the cell may be a eukaryotic cell or a prokaryotic cell; wherein the CRISPR complex is functional in the cell, and wherein the enzyme in the CRISPR complex has a reduced ability to modify one or more off-target loci in the cell compared to an unmodified enzyme, and/or wherein the enzyme in the CRISPR complex has an enhanced ability to modify one or more target loci compared to an unmodified enzyme.
В настоящем изобретении также предусмотрена не встречающаяся в природе, сконструированная композиция, содержащая комплекс CRISPR-Cas, содержащий любой не встречающийся в природе фермент CRISPR, описанный выше.The present invention also provides a non-naturally occurring, engineered composition comprising a CRISPR-Cas complex comprising any non-naturally occurring CRISPR enzyme described above.
В настоящем изобретении также предусмотрена не встречающаяся в природе, сконструированная композиция, содержащая:The present invention also provides a non-naturally occurring, engineered composition comprising:
систему доставки, функционально сконфигурированную с возможностью доставки компонентов комплекса CRISPR-Cas или одной или нескольких полинуклеотидных последовательностей, предусматривающих или кодирующих указанные компоненты, в клетку, и где указанный комплекс CRISPR-Cas является функциональным в клетке,a delivery system operatively configured to deliver components of a CRISPR-Cas complex or one or more polynucleotide sequences comprising or encoding said components into a cell, and wherein said CRISPR-Cas complex is functional in the cell,
компоненты комплекса CRISPR-Cas или одну или несколько кодирующих полинуклеотидных последовательностей для транскрипции и/или трансляции в клетке, причем компоненты комплекса CRISPR-Cas предусматривают:components of the CRISPR-Cas complex or one or more coding polynucleotide sequences for transcription and/or translation in a cell, wherein the components of the CRISPR-Cas complex provide for:
(I) не встречающийся в природе фермент CRISPR в соответствии с любым из предыдущих пунктов;(I) a non-naturally occurring CRISPR enzyme according to any of the preceding paragraphs;
(II) РНК комплекса CRISPR-Cas, содержащую:(II) CRISPR-Cas complex RNA containing:
направляющую последовательность,guiding sequence,
парную tracr-последовательность, иpaired tracr sequence, and
tracr-последовательность,tracr-sequence,
гдеWhere
в клеткеin a cage
парная tracr-последовательность гибридизируется с tracr-последовательностью;the paired tracr sequence hybridizes with the tracr sequence;
образуется комплекс CRISPR;the CRISPR complex is formed;
направляющая РНК нацеливается на целевые полинуклеотидные локусы и фермент изменяет полинуклеотидные локусы, иthe guide RNA targets the target polynucleotide loci and the enzyme alters the polynucleotide loci, and
фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом, и/или в результате чего фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом.an enzyme in a CRISPR complex has a reduced ability to modify one or more off-target loci compared to an unmodified enzyme, and/or resulting in an enzyme in a CRISPR complex having an increased ability to modify one or more target loci compared to an unmodified enzyme.
В случае любой такой композиции система доставки может предусматривать дрожжевую систему, систему на основе липофекции, систему на основе микроинъекции, систему на основе биолистики, виросомы, липосомы, иммунолипосомы, поликатионы, конъюгаты липид:нуклеиновая кислота или искусственные вирионы.In the case of any such composition, the delivery system may comprise a yeast system, a lipofection-based system, a microinjection-based system, a biolistics-based system, virosomes, liposomes, immunoliposomes, polycations, lipid:nucleic acid conjugates, or artificial virions.
В случае любых таких композиций система доставки может предусматривать векторную систему, содержащую один или несколько векторов, и где компонент (II) содержит первый регуляторный элемент, функционально связанный с полинуклеотидной последовательностью, которая содержит направляющую последовательность, парную tracr-последовательность и tracr-последовательность, и где компонент (I) содержит второй регуляторный элемент, функционально связанный с полинуклеотидной последовательностью, кодирующей фермент CRISPR. В случае таких композиций направляющая РНК или РНК комплекса CRISPR-Cas может предусматривать химерную РНК.In the case of any such compositions, the delivery system may provide a vector system comprising one or more vectors, and where component (II) comprises a first regulatory element operably linked to a polynucleotide sequence that comprises a guide sequence, a tracr mate sequence and a tracr sequence, and where component (I) comprises a second regulatory element operably linked to a polynucleotide sequence encoding a CRISPR enzyme. In the case of such compositions, the guide RNA or RNA of the CRISPR-Cas complex may provide a chimeric RNA.
В случае любых таких композиций система доставки может предусматривать векторную систему, содержащую один или несколько векторов, и где компонент (II) содержит первый регуляторный элемент, функционально связанный с направляющей последовательностью и парной tracr-последовательностью, и третий регуляторный элемент, функционально связанный с tracr-последовательностью, и где компонент (I) содержит второй регуляторный элемент, функционально связанный с полинуклеотидной последовательностью, кодирующей фермент CRISPR.In the case of any such compositions, the delivery system may provide a vector system comprising one or more vectors, and where component (II) comprises a first regulatory element operably linked to a guide sequence and a tracr pair sequence, and a third regulatory element operably linked to a tracr sequence, and where component (I) comprises a second regulatory element operably linked to a polynucleotide sequence encoding a CRISPR enzyme.
В случае любых таких композиций композиция может предусматривать более одной направляющей РНК, и каждая направляющая РНК имеет свою мишень, в результате чего происходит мультиплексирование.In the case of any such compositions, the composition may comprise more than one guide RNA, and each guide RNA has its own target, resulting in multiplexing.
В случае любых таких композиций полинуклеотидная(полинуклеотидные) последовательность(последовательности) может(могут) находиться на одном векторе.In the case of any such compositions, the polynucleotide sequence(s) may be located on a single vector.
В настоящем изобретении также предусмотрена векторная система на основе сконструированного, не встречающегося в природе фермента Cas, ассоциированного с короткими палиндромными повторами, регулярно расположенными группами (CRISPR)-CRISPR-ассоциированного (Cas) (CRISPR-Cas), содержащая один или несколько векторов, содержащих:The present invention also provides a vector system based on an engineered, non-naturally occurring clustered regularly interspaced short palindromic repeats (CRISPR)-associated CRISPR (Cas) enzyme (CRISPR-Cas), comprising one or more vectors comprising:
a) первый регуляторный элемент, функционально связанный с нуклеотидной последовательностью, кодирующей не встречающийся в природе фермент CRISPR любой из конструкций по настоящему изобретению, изложенных в данном документе; и(a) a first regulatory element operably linked to a nucleotide sequence encoding a non-naturally occurring CRISPR enzyme of any of the constructs of the present invention set forth herein; and
b) второй регуляторный элемент, функционально связанный с одной или несколькими нуклеотидными последовательностями, кодирующими одну или несколько направляющих РНК, причем направляющая РНК предусматривает направляющую последовательность, tracr-последовательность и парную tracr-последовательность,b) a second regulatory element operably linked to one or more nucleotide sequences encoding one or more guide RNAs, wherein the guide RNA comprises a guide sequence, a tracr sequence and a tracr mate sequence,
гдеWhere
компоненты (a) и (b) находятся в одном и том же или разных векторах,components (a) and (b) are in the same or different vectors,
парная tracr-последовательность гибридизируется с tracr-последовательностью;the paired tracr sequence hybridizes with the tracr sequence;
образуется комплекс CRISPR;the CRISPR complex is formed;
направляющая РНК нацеливается на целевые полинуклеотидные локусы и фермент изменяет полинуклеотидные локусы, иthe guide RNA targets the target polynucleotide loci and the enzyme modifies the polynucleotide loci, and
фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом, и/или в результате чего фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом.an enzyme in a CRISPR complex has a reduced ability to modify one or more off-target loci compared to an unmodified enzyme, and/or resulting in an enzyme in a CRISPR complex having an increased ability to modify one or more target loci compared to an unmodified enzyme.
В случае такой системы компонент (II) может содержать первый регуляторный элемент, функционально связанный с полинуклеотидной последовательностью, которая содержит направляющую последовательность, парную tracr-последовательность и tracr-последовательность, и где компонент (II) может содержать второй регуляторный элемент, функционально связанный с полинуклеотидной последовательностью, кодирующей фермент CRISPR. В случае такой системы направляющая РНК может предусматривать химерную РНК.In the case of such a system, component (II) may comprise a first regulatory element operably linked to a polynucleotide sequence that comprises a guide sequence, a tracr pair sequence and a tracr sequence, and where component (II) may comprise a second regulatory element operably linked to a polynucleotide sequence encoding a CRISPR enzyme. In the case of such a system, the guide RNA may comprise a chimeric RNA.
В случае такой системы компонент (I) может содержать первый регуляторный элемент, функционально связанный с направляющей последовательностью и парной tracr-последовательностью, и третий регуляторный элемент, функционально связанный с tracr-последовательностью, и где компонент (II) может содержать второй регуляторный элемент, функционально связанный с полинуклеотидной последовательностью, кодирующей фермент CRISPR. Такая система может содержать более одной направляющей РНК, и каждая направляющая РНК имеет свою мишень, в результате чего происходит мультиплексирование. Компоненты (a) и (b) могут быть расположены на одном и том же векторе.In the case of such a system, component (I) may comprise a first regulatory element operably linked to a guide sequence and a paired tracr sequence, and a third regulatory element operably linked to a tracr sequence, and where component (II) may comprise a second regulatory element operably linked to a polynucleotide sequence encoding a CRISPR enzyme. Such a system may comprise more than one guide RNA, and each guide RNA has its own target, resulting in multiplexing. Components (a) and (b) may be located on the same vector.
В случае любой из таких систем, содержащих векторы, один или несколько векторов могут предусматривать один или несколько вирусных векторов, таких как один или несколько ретровирусных, лентивирусных, аденовирусных векторов, векторов на основе аденоассоциированного вируса или вируса простого герпеса.In the case of any of such vector-containing systems, the one or more vectors may comprise one or more viral vectors, such as one or more retroviral, lentiviral, adenoviral, adeno-associated virus, or herpes simplex virus vectors.
В случае любой из таких систем, содержащих регуляторные элементы, по меньшей мере один из указанных регуляторных элементов может предусматривать тканеспецифичный промотор. Тканеспецифичный промотор может управлять экспрессией в клетке крови млекопитающего, в клетке печени млекопитающего или в глазу млекопитающего.In the case of any of such systems containing regulatory elements, at least one of said regulatory elements may provide a tissue-specific promoter. The tissue-specific promoter may direct expression in a mammalian blood cell, in a mammalian liver cell, or in a mammalian eye.
В случае любой из описанных выше композиций или систем tracr-последовательность может предусматривать один или несколько РНК-аптамеров, взаимодействующих с белком. Один или несколько аптамеров могут находиться в тетрапетле и/или структуре "петля-на-стебле" 2 tracr-последовательности. Один или несколько аптамеров могут быть способны связывать белок оболочки бактериофага MS2.In any of the above compositions or systems, the tracr sequence may provide one or more RNA aptamers that interact with the protein. The one or more aptamers may be in a tetraloop and/or a stem-loop 2 structure of the tracr sequence. The one or more aptamers may be capable of binding the MS2 bacteriophage coat protein.
В случае любой из описанных выше композиций или систем tracr-последовательность может иметь длину 30 или более нуклеотидов.In the case of any of the above described compositions or systems, the tracr sequence may be 30 or more nucleotides in length.
В случае любой из описанных выше композиций или систем клетка может представлять собой эукариотическую клетку или прокариотическую клетку; где комплекс CRISPR является функциональным в клетке, и в результате этого фермент комплекса CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов в клетке по сравнению с немодифицированным ферментом и/или в результате этого фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом.In the case of any of the above-described compositions or systems, the cell can be a eukaryotic cell or a prokaryotic cell; wherein the CRISPR complex is functional in the cell and, as a result, the enzyme in the CRISPR complex has a reduced ability to modify one or more off-target loci in the cell compared to an unmodified enzyme and/or, as a result, the enzyme in the CRISPR complex has an increased ability to modify one or more target loci compared to an unmodified enzyme.
В настоящем изобретении также предусмотрен комплекс CRISPR любой из описанных выше композиций или из любой из описанных выше систем.The present invention also provides a CRISPR complex of any of the above-described compositions or from any of the above-described systems.
В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в терапии.The present invention also provides an engineered CRISPR protein, complex, composition, system, vector, cell or cell line according to the present invention for use in therapy.
В настоящем изобретении также предусмотрен способ модифицирования представляющего интерес локуса в клетке, включающий приведение клетки в контакт с любой из описанных выше композиций или любой из описанных выше систем, или где клетка содержит любой из описанных выше комплексов CRISPR, присутствующих в клетке. В случае таких способов клетка может представлять собой эукариотическую клетку. В случае таких способов организм может содержать клетку. В случае таких способов организм может не представлять собой человека или другое животное. В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в модифицировании представляющего интерес локуса в клетке. Такое модифицирование предпочтительно предусматривает приведение клетки в контакт с любой из описанных выше композиций или любой из описанных выше систем. В настоящем изобретении также предусмотрено применение сконструированного белка CRISPR, комплекса, композиции, системы, вектора, клетки или линии клеток в соответствии с настоящим изобретением в получении лекарственного препарата для модифицирования представляющего интерес локуса в клетке.The present invention also provides a method of modifying a locus of interest in a cell, comprising contacting the cell with any of the above-described compositions or any of the above-described systems, or wherein the cell comprises any of the above-described CRISPR complexes present in the cell. In such methods, the cell may be a eukaryotic cell. In such methods, the organism may comprise the cell. In such methods, the organism may not be a human or other animal. The present invention also provides an engineered CRISPR protein, complex, composition, system, vector, cell, or cell line according to the present invention for use in modifying a locus of interest in a cell. Such modification preferably involves contacting the cell with any of the above-described compositions or any of the above-described systems. The present invention also provides the use of an engineered CRISPR protein, complex, composition, system, vector, cell, or cell line according to the present invention in the preparation of a medicament for modifying a locus of interest in a cell.
Любой такой способ может осуществляться ex vivo или in vitro.Any such method may be carried out ex vivo or in vitro.
Любой такой способ указанного модифицирования может предусматривать модулирование экспрессия гена. Указанное модулирование экспрессии гена может предусматривать активацию экспрессии гена и/или репрессию экспрессии гена.Any such method of said modification may involve modulating gene expression. Said modulating gene expression may involve activating gene expression and/or repressing gene expression.
В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в модифицировании представляющего интерес локуса в клетке. В настоящем изобретении также предусмотрено применение сконструированного белка CRISPR, комплекса, композиции, системы, вектора, клетки или линии клеток в соответствии с настоящим изобретением в получении лекарственного препарата для модифицирования представляющего интерес локуса в клетке. Указанное модифицирование предпочтительно предусматривает приведение клетки в контакт с любой из описанных выше композиций или любой из описанных выше систем. В настоящем изобретении также предусмотрен способ лечения заболевания, нарушения или инфекции у индивидуума, нуждающегося в этом, включающий введение эффективного количества любой из композиций, систем или комплексов CRISPR, описанных выше. Заболевание, нарушение или инфекция могут предусматривать вирусную инфекцию. Вирусная инфекция может представлять собой инфекцию, вызванную HBV.The present invention also provides an engineered CRISPR protein, complex, composition, system, vector, cell or cell line according to the present invention for use in modifying a locus of interest in a cell. The present invention also provides the use of an engineered CRISPR protein, complex, composition, system, vector, cell or cell line according to the present invention in the preparation of a medicament for modifying a locus of interest in a cell. Said modification preferably involves contacting the cell with any of the above-described compositions or systems. The present invention also provides a method of treating a disease, disorder or infection in an individual in need thereof, comprising administering an effective amount of any of the above-described compositions, systems or CRISPR complexes. The disease, disorder or infection may include a viral infection. The viral infection may be an HBV infection.
В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в лечении заболевания, нарушения или инфекции у индивидуума, нуждающегося в этом. Заболевание, нарушение или инфекция могут предусматривать вирусную инфекцию. Вирусная инфекция может представлять собой инфекцию, вызванную HBV. В настоящем изобретении также предусмотрено применение сконструированного белка CRISPR, комплекса, композиции, системы, вектора, клетки или линии клеток в соответствии с настоящим изобретением в получении лекарственного препарата для лечения заболевания, нарушения или инфекции у индивидуума, нуждающегося в этом. Заболевание, нарушение или инфекция могут предусматривать вирусную инфекцию.The present invention also provides an engineered CRISPR protein, complex, composition, system, vector, cell or cell line according to the present invention for use in the treatment of a disease, disorder or infection in an individual in need thereof. The disease, disorder or infection may include a viral infection. The viral infection may be an infection caused by HBV. The present invention also provides the use of an engineered CRISPR protein, complex, composition, system, vector, cell or cell line according to the present invention in the preparation of a medicament for the treatment of a disease, disorder or infection in an individual in need thereof. The disease, disorder or infection may include a viral infection.
В настоящем изобретении также предусмотрено применение любой из композиций, систем или комплексов CRISPR, описанных выше в отношении редактирования гена или генома.The present invention also provides for the use of any of the CRISPR compositions, systems or complexes described above with respect to gene or genome editing.
В настоящем изобретении также предусмотрена любая из композиций, систем или комплексов CRISPR, описанных выше, для применения в качестве терапевтического средства. Терапевтическое средство может предназначаться для редактирования гена или генома, или генной терапии.The present invention also provides any of the CRISPR compositions, systems or complexes described above for use as a therapeutic agent. The therapeutic agent may be for gene or genome editing or gene therapy.
В одном аспекте настоящего изобретения предусмотрен способ модифицирования организма или организма, отличного от человека, путем манипуляции с целевой последовательностью в представляющем интерес локусе генома HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, включающий:In one aspect of the present invention, there is provided a method for modifying an organism or non-human organism by manipulating a target sequence in a locus of interest in the genome of an HSC, for example, where the locus of interest in the genome is associated with a mutation associated with aberrant protein expression or with a disease state or disease course, comprising:
доставку в HSC, например, путем приведения HSC в контакт с частицей, содержащей не встречающуюся в природе или сконструированную композицию, содержащую:delivery to the HSC, such as by contacting the HSC with a particle comprising a non-naturally occurring or engineered composition comprising:
I. полинуклеотидную последовательность химерной РНК (chiRNA) системы CRISPR-Cas, содержащую:I. a polynucleotide sequence of a chimeric RNA (chiRNA) of the CRISPR-Cas system, containing:
(a) направляющую последовательность, способную гибридизироваться с целевой последовательностью в HSC,(a) a guide sequence capable of hybridizing to a target sequence in HSC,
(b) парную tracr-последовательность и(b) the paired tracr sequence and
(c) tracr-последовательность, и(c) tracr sequence, and
II. фермент CRISPR, необязательно содержащий по меньшей мере одну или несколько последовательностей ядерной локализации,II. a CRISPR enzyme, optionally comprising at least one or more nuclear localization sequences,
где парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, иwhere the tracr mate sequence hybridizes to the tracr sequence and the guide sequence directs sequence-specific binding of the CRISPR complex to the target sequence, and
где комплекс CRISPR содержит фермент CRISPR в комплексе с (1) направляющей последовательностью, которая гибридизирована с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизирована с tracr-последовательностью; иwherein the CRISPR complex comprises a CRISPR enzyme in a complex with (1) a guide sequence that is hybridized to a target sequence, and (2) a tracr mate sequence that is hybridized to the tracr sequence; and
способ может необязательно также включать доставку матрицы для HDR, например, посредством указанной частицы, приводимой в контакт с HSC, которая содержит матрицу для HDR, или посредством приведения HSC в контакт с другой частицей, содержащей матрицу для HDR, где матрица для HDR обеспечивает экспрессию нормальной или менее абберантной формы белка; где "нормальная" относится к дикому типу, а "абберантная" может обозначать экспрессию белка, которая приводит к возникновению патологического состояния или болезненного состояния; иthe method may optionally also comprise delivering an HDR matrix, such as by said particle being contacted with an HSC that comprises an HDR matrix, or by contacting the HSC with another particle that comprises an HDR matrix, wherein the HDR matrix provides for expression of a normal or less aberrant form of the protein; wherein "normal" refers to the wild type and "aberrant" may refer to expression of the protein that results in a pathological condition or disease state; and
необязательно способ может включать выделение или получение HSC из организма или организма, отличного от человека, необязательно размножение популяции HSC, осуществление контакта частицы(частиц) с HSC c получением популяции модифицированных HSC, необязательно размножение популяции модифицированных HSC и необязательно введение модифицированных HSC в организм или организм, отличный от человека.optionally, the method may include isolating or obtaining HSC from an organism or non-human organism, optionally expanding the population of HSC, contacting the particle(s) with the HSC to obtain a population of modified HSC, optionally expanding the population of modified HSC, and optionally introducing the modified HSC into the organism or non-human organism.
В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в модифицировании организма или организма, отличного от человека, путем манипуляции с целевой последовательностью в представляющем интерес локусе генома HSC. Указанное модифицирование предпочтительно предусматриваетThe present invention also provides an engineered CRISPR protein, complex, composition, system, vector, cell or cell line according to the present invention for use in modifying an organism or non-human organism by manipulating a target sequence in a locus of interest of the HSC genome. Said modification preferably comprises
доставку в HSC, например, путем приведения HSC в контакт с частицей, содержащей не встречающуюся в природе или сконструированную композицию, содержащую:delivery to the HSC, such as by contacting the HSC with a particle comprising a non-naturally occurring or engineered composition comprising:
I. полинуклеотидную последовательность химерной РНК (chiRNA) системы CRISPR-Cas, содержащую:I. a polynucleotide sequence of a chimeric RNA (chiRNA) of the CRISPR-Cas system, containing:
(a) направляющую последовательность, способную гибридизироваться с целевой последовательностью в HSC,(a) a guide sequence capable of hybridizing to a target sequence in HSC,
(b) парную tracr-последовательность и(b) the paired tracr sequence and
(c) tracr-последовательность, и(c) tracr sequence, and
II. фермент CRISPR, необязательно содержащий по меньшей мере одну или несколько последовательностей ядерной локализации,II. a CRISPR enzyme, optionally comprising at least one or more nuclear localization sequences,
где парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, иwhere the tracr mate sequence hybridizes to the tracr sequence and the guide sequence directs sequence-specific binding of the CRISPR complex to the target sequence, and
где комплекс CRISPR содержит фермент CRISPR в комплексе с (1) направляющей последовательностью, которая гибридизирована с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизирована с tracr-последовательностью. Указанное модифицирование также необязательно включает доставку матрицы для HDR, например, посредством указанной частицы, приводимой в контакт с HSC, которая содержит матрицу для HDR, или посредством приведения HSC в контакт с другой частицей, содержащей матрицу для HDR, где матрица для HDR обеспечивает экспрессию нормальной или менее абберантной формы белка; где "нормальная" относится к дикому типу, а "абберантная" может обозначать экспрессию белка, которая приводит к возникновению патологического состояния или болезненного состояния. Указанное модифицирование также необязательно включает выделение или получение HSC из организма или организма, отличного от человека, необязательно размножение популяции HSC, осуществление контакта частицы(частиц) с HSC с получением популяции модифицированных HSC, необязательно размножение популяции модифицированных HSC и необязательно введение модифицированных HSC в организм или организм, отличный от человека.wherein the CRISPR complex comprises a CRISPR enzyme in a complex with (1) a guide sequence that is hybridized to a target sequence, and (2) a tracr mate sequence that is hybridized to the tracr sequence. Said modification also optionally comprises delivering an HDR template, such as by said particle being contacted with an HSC that contains the HDR template, or by contacting the HSC with another particle that contains the HDR template, wherein the HDR template provides for expression of a normal or less aberrant form of the protein; wherein "normal" refers to the wild type, and "aberrant" may refer to protein expression that results in a pathological condition or disease state. Said modification also optionally includes isolating or obtaining HSC from an organism or non-human organism, optionally propagating a population of HSC, contacting the particle(s) with HSC to obtain a population of modified HSC, optionally propagating the population of modified HSC, and optionally introducing the modified HSC into an organism or non-human organism.
В одном аспекте настоящего изобретения предусмотрен способ модифицирования организма или организма, отличного от человека, путем манипуляции с целевой последовательностью в представляющем интерес локусе генома HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, включающий: доставку в HSC, например, путем приведения HSC в контакт с частицей, содержащей не встречающуюся в природе или сконструированную композицию, содержащую: I. (a) направляющую последовательность, способную гибридизироваться с целевой последовательностью в HSC, и (b) по меньшей мере одну или несколько парных tracr-последовательностей, II. фермент CRISPR необязательно с одним или несколькими NLS и III. полинуклеотидную последовательность, содержащую tracr-последовательность, где парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, и где комплекс CRISPR содержит фермент CRISPR в комплексе с (1) направляющей последовательностью, которая гибридизирована с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизирована с tracr-последовательностью; иIn one aspect of the present invention, there is provided a method of modifying an organism or non-human organism by manipulating a target sequence in a genomic locus of interest of an HSC, e.g., wherein the genomic locus of interest is associated with a mutation associated with aberrant protein expression or with a disease state or disease course, comprising: delivering to the HSC, e.g., by contacting the HSC with a particle comprising a non-naturally occurring or engineered composition comprising: I. (a) a guide sequence capable of hybridizing to a target sequence in the HSC, and (b) at least one or more tracr mate sequences, II. a CRISPR enzyme optionally with one or more NLS, and III. a polynucleotide sequence comprising a tracr sequence, wherein a tracr mate sequence hybridizes to a tracr sequence and a guide sequence directs sequence-specific binding of a CRISPR complex to a target sequence, and wherein the CRISPR complex comprises a CRISPR enzyme in complex with (1) a guide sequence that is hybridized to a target sequence and (2) a tracr mate sequence that is hybridized to the tracr sequence; and
способ может необязательно также включать доставку матрицы для HDR, например, посредством указанной частицы, приводимой в контакт с HSC, которая содержит матрицу для HDR, или посредством приведения HSC в контакт с другой частицей, содержащей матрицу для HDR, где матрица для HDR обеспечивает экспрессию нормальной или менее абберантной формы белка; где "нормальная" относится к дикому типу, а "абберантная" может обозначать экспрессию белка, которая приводит к возникновению патологического состояния или болезненного состояния; иthe method may optionally also comprise delivering an HDR matrix, such as by said particle being contacted with an HSC that comprises an HDR matrix, or by contacting the HSC with another particle that comprises an HDR matrix, wherein the HDR matrix provides for expression of a normal or less aberrant form of the protein; wherein "normal" refers to the wild type and "aberrant" may refer to expression of the protein that results in a pathological condition or disease state; and
необязательно способ может включать выделение или получение HSC из организма или организма, отличного от человека, необязательно размножение популяции HSC, осуществление контакта частицы(частиц) с HSC c получением популяции модифицированных HSC, необязательно размножение популяции модифицированных HSC и необязательно введение модифицированных HSC в организм или организм, отличный от человека. В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в таком модифицировании организма или организма, отличного от человека, путем манипуляции с целевой последовательностью в представляющем интерес локусе генома HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания.optionally, the method may comprise isolating or obtaining HSCs from an organism or non-human organism, optionally expanding the population of HSCs, contacting the particle(s) with the HSCs to obtain a population of modified HSCs, optionally expanding the population of modified HSCs, and optionally introducing the modified HSCs into the organism or non-human organism. The present invention also provides an engineered CRISPR protein, complex, composition, system, vector, cell or cell line according to the present invention for use in such modification of an organism or non-human organism by manipulating a target sequence at a genomic locus of interest of an HSC, for example, where the genomic locus of interest is associated with a mutation associated with aberrant protein expression or with a disease state or disease course.
Доставка может представлять собой доставку одного или нескольких полинуклеотидов, кодирующих какой-либо один или несколько или все из CRISPR-комплексов, преимущественно связанных с одним или несколькими регуляторными элементами для экспрессии in vivo, например, посредством частицы(частиц), (содержащей)содержащих вектор, содержащий полинуклеотид(полинуклеотиды), функционально связанный(связанные) с регуляторным(регуляторными) элементом(элементами). Любая или все из полинуклеотидной последовательности, кодирующей фермент CRISPR, направляющей последовательности, парной tracr-последовательности или tracr-последовательности могут представлять собой РНК. Следует иметь в виду, что если ссылаются на полинуклеотид, который представляет собой РНК, и, как говорят, "содержит" элемент, такой как парная tracr-последовательность, то последовательность РНК включает данный элемент. Если полинуклеотид представляет собой ДНК и, как говорят, содержит элемент, такой как парная tracr-последовательность, то последовательность ДНК транскрибируется или может быть транскрибирована в РНК, содержащую элемент, о котором идет речь. Если элемент представляет собой белок, как, например, фермент CRISPR, то упоминаемая последовательность ДНК или РНК транслируется или может быть транслирована (а в случае ДНК сначала транскрибируется).The delivery may be delivery of one or more polynucleotides encoding any one or more or all of the CRISPR complexes preferably linked to one or more regulatory elements for in vivo expression, such as via a particle(s) comprising a vector comprising a polynucleotide(s) operably linked to a regulatory element(s). Any or all of the polynucleotide sequence encoding the CRISPR enzyme, the guide sequence, the tracr mate sequence or the tracr sequence may be RNA. It should be appreciated that when a polynucleotide is referred to as RNA and is said to "comprise" an element such as a tracr mate sequence, the RNA sequence includes the element. When a polynucleotide is DNA and is said to contain an element such as a tracr mate sequence, the DNA sequence is or can be transcribed into RNA containing the element in question. If the element is a protein, such as the CRISPR enzyme, then the DNA or RNA sequence in question is or can be translated (and in the case of DNA, first transcribed).
В определенных вариантах осуществления настоящего изобретения предусмотрен способ модифицирования организма, например, млекопитающего, включая человека, или отличного от человека млекопитающего или организма путем манипуляции с целевой последовательностью в представляющем интерес локусе генома HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, включающий доставку, например, путем приведения не встречающейся в природе или сконструированной композиция в контакт с HSC, где композиция содержит одну или несколько частиц, содержащих вирусный, плазмидный вектор(векторы) или вектор(векторы) на основе молекул нуклеиновой кислоты (например, РНК), функционально кодирующие композицию для их экспрессии, где композиция содержит: (A) I. первый регуляторный элемент, функционально связанный с полинуклеотидной последовательностью химерной РНК (chiRNA) системы CRISPR-Cas, где полинуклеотидная последовательность содержит (a) направляющую последовательность, способную гибридизироваться с целевой последовательностью в эукариотической клетке, (b) парную tracr-последовательность и (c) tracr-последовательность, и II. второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, кодирующей фермент CRISPR, содержащий по меньшей мере одну или несколько последовательностей ядерной локализации (или необязательно по меньшей мере одну или несколько последовательностей ядерной локализации, поскольку в некоторых вариантах осуществления может не предусматриваться NLS), где (a), (b) и (c) расположены в 5'-3'-ориентации, где компоненты I и II находятся в одном и том же или разных векторах системы, где будучи транскрибированными, парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфическим к последовательности связыванием комплекса CRISPR с целевой последовательностью, и где комплекс CRISPR содержит фермент CRISPR в комплексе с (1) направляющей последовательностью, которая гибридизирована с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизирована с tracr-последовательностью, или (B) не встречающуюся в природе или сконструированную композицию, содержащую векторную систему, содержащую один или несколько векторов, содержащих I. первый регуляторный элемент, функционально связанный с (a) направляющей последовательностью, способной гибридизироваться с целевой последовательностью в эукариотической клетке, (b) по меньшей мере одной или несколькими парными tracr-последовательностями, II. второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, кодирующей фермент CRISPR, и III. третий регуляторный элемент, функционально связанный с tracr-последовательностью, где компоненты I, II и III находятся на одном и том же или разных векторах системы, где будучи транскрибированными, парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, и где комплекс CRISPR содержит фермент CRISPR в комплексе с (1) направляющей последовательностью, которая гибридизирована с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизирована с tracr-последовательностью; причем способ необязательно может включать также доставку матрицы для HDR, например, посредством указанной частицы, приводимой в контакт с HSC, которая содержит матрицу для HDR, или посредством приведения HSC в контакт с другой частицей, содержащей матрицу для HDR, где матрица для HDR обеспечивает экспрессию нормальной или менее абберантной формы белка; где "нормальная" относится к дикому типу, а "абберантная" может обозначать экспрессию белка, которая приводит к возникновению патологического состояния или болезненного состояния; и необязательно способ может включать выделение или получение HSC от организма или организма, отличного от человека, необязательно размножение популяции HSC, осуществление контакта частицы(частиц) с HSC с получением популяции модифицированных HSC, необязательно размножение популяции модифицированных HSC и необязательно введение модифицированных HSC в организм или организм, отличный от человека. В некоторых вариантах осуществления компоненты I, II и III находятся на одном и том же векторе. В других вариантах осуществления компоненты I и II находятся в одном и том же векторе, тогда как компонент III находится в другом векторе. В других вариантах осуществления компоненты I и III находятся в одном и том же векторе, тогда как компонент II находится в другом векторе. В других вариантах осуществления компоненты II и III находятся в одном и том же векторе, тогда как компонент I находится в другом векторе. В других вариантах осуществления каждый из компонентов I, II и III находится в отдельных векторах. В настоящем изобретении также предусмотрена вирусная или плазмидная векторная система, описанная в данном документе. В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в таком модифицировании организма, например, млекопитающего, включая человека или отличного от человека млекопитающего или организма, путем манипуляции с целевой последовательностью в представляющем интерес локусе генома HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, предусматривающей доставку, например, путем приведения не встречающейся в природе или сконструированной композиции в контакт с HSC.In certain embodiments, the present invention provides a method of modifying an organism, e.g., a mammal, including a human, or a non-human mammal or organism, by manipulating a target sequence in a genomic locus of interest of an HSC, e.g., wherein the genomic locus of interest is associated with a mutation associated with aberrant protein expression or with a disease state or disease course, comprising delivering, e.g., by contacting a non-naturally occurring or engineered composition to the HSC, wherein the composition comprises one or more particles comprising viral, plasmid, or nucleic acid molecule (e.g., RNA) vector(s) operably encoding the composition for expression thereof, wherein the composition comprises: (A) I. a first regulatory element operably linked to a polynucleotide sequence of a chimeric RNA (chiRNA) of the CRISPR-Cas system, wherein the polynucleotide sequence comprises (a) a guide sequence capable of hybridizing to the target sequence in a eukaryotic cell, (b) the paired tracr sequence and (c) the tracr sequence, and II. a second regulatory element operably linked to an enzyme-coding sequence encoding a CRISPR enzyme comprising at least one or more nuclear localization sequences (or optionally at least one or more nuclear localization sequences since some embodiments may not provide an NLS), wherein (a), (b) and (c) are arranged in a 5' to 3' orientation, wherein components I and II are in the same or different vectors of a system wherein, when transcribed, the tracr mate sequence hybridizes to a tracr sequence and the guide sequence directs sequence-specific binding of the CRISPR complex to a target sequence, and wherein the CRISPR complex comprises a CRISPR enzyme in complex with (1) a guide sequence that is hybridized to a target sequence and (2) a tracr mate sequence that is hybridized to a tracr sequence, or (B) a non-naturally occurring or engineered composition comprising a vector system comprising one or more vectors comprising I. a first regulatory element operably linked to (a) a guide sequence capable of hybridizing to a target sequence in a eukaryotic cell, (b) at least one or more tracr mate sequences, II. a second regulatory element operably linked to an enzyme-coding sequence encoding a CRISPR enzyme, and III. a third regulatory element operably linked to a tracr sequence, wherein components I, II and III are on the same or different vectors of a system wherein, when transcribed, the tracr mate sequence hybridizes to a tracr sequence and the guide sequence directs sequence-specific binding of a CRISPR complex to a target sequence, and wherein the CRISPR complex comprises a CRISPR enzyme in complex with (1) a guide sequence that is hybridized to a target sequence and (2) a tracr mate sequence that is hybridized to the tracr sequence; wherein the method may optionally further comprise delivering an HDR matrix, such as by said particle being contacted with an HSC that comprises an HDR matrix or by contacting the HSC with another particle that comprises an HDR matrix, wherein the HDR matrix provides for expression of a normal or less aberrant form of the protein; wherein "normal" refers to the wild type and "aberrant" may denote expression of the protein that results in a pathological condition or disease state; and optionally the method may comprise isolating or obtaining HSC from an organism or non-human organism, optionally expanding the population of HSC, contacting the particle(s) with the HSC to obtain a population of modified HSC, optionally expanding the population of modified HSC, and optionally introducing the modified HSC into the organism or non-human organism. In some embodiments, components I, II, and III are on the same vector. In other embodiments, components I and II are on the same vector while component III is on a different vector. In other embodiments, components I and III are in the same vector, while component II is in a different vector. In other embodiments, components II and III are in the same vector, while component I is in a different vector. In other embodiments, components I, II, and III are each in separate vectors. The present invention also provides a viral or plasmid vector system as described herein. The present invention also provides an engineered CRISPR protein, complex, composition, system, vector, cell, or cell line according to the present invention for use in such modification of an organism, e.g., a mammal, including a human or a non-human mammal or organism, by manipulating a target sequence in a genomic locus of interest of an HSC, e.g., wherein the genomic locus of interest is associated with a mutation associated with aberrant protein expression or with a disease state or disease course, comprising delivery, e.g., by contacting a non-naturally occurring or engineered composition with an HSC.
Под манипуляцией с целевой последовательностью заявители также подразумевают эпигенетическую манипуляцию с целевой последовательностью. Она может осуществляться в отношении состояния хроматина целевой последовательности, как, например, путем модификации состояния метилирования целевой последовательности (т.е. добавление или устранение метилирования, или паттернов метилирования, или CpG-островков), модификации гистонов, повышения или снижения доступности целевой последовательности или путем активации укладки в 3D-структуру. Следует иметь в виду, что если ссылаются на способ модифицирования организма или млекопитающего, включая человека или отличного от человека млекопитающего или организма, путем манипуляции с целевой последовательностью в представляющем интерес локусе генома, то он может применяться в отношении организма (или млекопитающего) в целом или всего лишь одной клетки или популяции клеток из этого организма (если организм является многоклеточным). К примеру, в случае человека заявители предусматривают, inter alia, одну клетку или популяцию клеток, и их предпочтительно можно модифицировать ex vivo и затем вводить обратно. В этом случае может быть необходим биоптат или другой образец ткани или биологической жидкости. Стволовые клетки также являются особенно предпочтительными в этом отношении. Но, разумеется, также предусматриваются варианты осуществления in vivo. И настоящее изобретение является особенно преимущественным в отношении HSC.By manipulation of a target sequence, the applicants also mean epigenetic manipulation of a target sequence. This may be carried out on the chromatin state of the target sequence, such as by modifying the methylation state of the target sequence (i.e. adding or removing methylation or methylation patterns or CpG islands), modifying histones, increasing or decreasing the accessibility of the target sequence, or by activating folding into a 3D structure. It should be noted that where reference is made to a method for modifying an organism or mammal, including a human or a non-human mammal or organism, by manipulating a target sequence at a genomic locus of interest, this may be applied to the organism (or mammal) as a whole or to only one cell or population of cells from the organism (if the organism is multicellular). For example, in the case of a human, the applicants envisage, inter alia, a single cell or population of cells, and these may preferably be modified ex vivo and then reintroduced. In this case, a biopsy or other tissue or biological fluid sample may be necessary. Stem cells are also particularly preferred in this regard. But, of course, in vivo embodiments are also envisaged. And the present invention is particularly advantageous with respect to HSC.
В некоторых вариантах осуществления настоящее изобретение охватывает способ модифицирования организма или организма, отличного от человека, путем манипуляции с первой и второй целевыми последовательностями на противоположных нитях ДНК-дуплекса в представляющем интерес локусе генома в HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, предусматривающей доставку, например, путем приведения HSC в контакт с частицей(частицами), (содержащей)содержащими не встречающуюся в природе или сконструированную композицию, содержащую:In some embodiments, the present invention encompasses a method of modifying an organism or non-human organism by manipulating first and second target sequences on opposite strands of a DNA duplex at a genomic locus of interest in an HSC, e.g., where the genomic locus of interest is associated with a mutation associated with aberrant protein expression or with a disease state or disease course, comprising delivering, e.g., by contacting the HSC with particle(s) comprising a non-naturally occurring or engineered composition comprising:
I. первую полинуклеотидную последовательность химерной РНК (chiRNA) системы CRISPR-Cas, где первая полинуклеотидная последовательность содержит:I. a first polynucleotide sequence of a chimeric RNA (chiRNA) of the CRISPR-Cas system, wherein the first polynucleotide sequence comprises:
(a) первую направляющую последовательность, способную гибридизироваться с первой целевой последовательностью,(a) a first guide sequence capable of hybridizing to a first target sequence,
(b) первую парную tracr-последовательность и(b) the first paired tracr sequence and
(c) первую tracr-последовательность,(c) the first tracr sequence,
II. вторую полинуклеотидную последовательность chiRNA системы CRISPR-Cas, где вторая полинуклеотидная последовательность содержит:II. a second polynucleotide sequence of the chiRNA of the CRISPR-Cas system, wherein the second polynucleotide sequence comprises:
(a) вторую направляющую последовательность, способную гибридизироваться со второй целевой последовательностью,(a) a second guide sequence capable of hybridizing to a second target sequence,
(b) вторую парную tracr-последовательность и(b) the second paired tracr sequence and
(c) вторую tracr-последовательность, и(c) the second tracr sequence, and
III. полинуклеотидную последовательность, кодирующую фермент CRISPR, содержащий по меньшей мере одну или несколько последовательностей ядерной локализации и содержащий одну или несколько мутаций, где (a), (b) и (c) расположены в 5'-3'-ориентации; илиIII. a polynucleotide sequence encoding a CRISPR enzyme comprising at least one or more nuclear localization sequences and comprising one or more mutations, wherein (a), (b) and (c) are arranged in a 5'-3' orientation; or
IV. продукт(продукты) экспрессии одной или нескольких из I. - III., например, первую и вторую парные tracr-последовательности, фермент CRISPR;IV. the expression product(s) of one or more of I. - III., e.g., the first and second paired tracr sequences, the CRISPR enzyme;
где будучи транскрибированными, первая и вторая парная tracr-последовательности гибридизируются с первой и второй tracr-последовательностями соответственно, а первая и вторая направляющие последовательности управляют специфичным к последовательности связыванием первого и второго комплексов CRISPR с первой и второй целевыми последовательностями соответственно, где первый комплекс CRISPR содержит фермент CRISPR в комплексе с (1) первой направляющей последовательностью, которая гибридизирована с первой целевой последовательностью, и (2) первой парной tracr-последовательностью, которая гибридизирована с первой tracr-последовательностью, где второй комплекс CRISPR содержит фермент CRISPR в комплексе с (1) второй направляющей последовательностью, которая гибридизирована с второй целевой последовательностью, и (2) второй парной tracr-последовательностью, которая гибридизирована с второй tracr-последовательностью, где полинуклеотидная последовательность, кодирующая фермент CRISPR, представляет собой ДНК или РНК, и где первая направляющая последовательность управляет расщеплением одной нити ДНК-дуплекса возле первой целевой последовательности, а вторая направляющая последовательность управляет расщеплением другой нити возле второй целевой последовательности, индуцируя двухнитевой разрыв, за счет чего обеспечивается модифицирование организма или организма, отличного от человека; и при этом способ необязательно может также включать доставку матрицы для HDR, например, посредством указанной частицы, приводимой в контакт с HSC, которая содержит матрицу для HDR, или посредством приведения HSC в контакт с другой частицей, содержащей матрицу для HDR, где матрица для HDR обеспечивает экспрессию нормальной или менее абберантной формы белка; где "нормальная" относится к дикому типу, а "абберантная" может обозначать экспрессию белка, которая приводит к возникновению патологического состояния или болезненного состояния; и при этом необязательно способ может включать выделение или получение HSC из организма или организма, отличного от человека, необязательно размножение популяции HSC, осуществление контакта частицы(частиц) с HSC с получением популяции модифицированных HSC, необязательно размножение популяции модифицированных HSC и необязательно введение модифицированных HSC в организм или организм, отличный от человека. В некоторых способах по настоящему изобретению любая или все из полинуклеотидной последовательности, кодирующей фермент CRISPR, первой и второй направляющих последовательностей, первой и второй парных tracr-последовательностей или первой и второй tracr-последовательностей представляет собой/представляют собой РНК. В дополнительных вариантах осуществления настоящего изобретения полинуклеотиды, кодирующие последовательность, кодирующую фермент CRISPR, первую и вторую направляющие последовательности, первую и вторую парные tracr-последовательности или первую и вторую tracr-последовательности, представляют собой/представляют собой РНК и доставляются с помощью липосом, наночастиц, экзосом, микровезикул или генной пушки; но преимущественно, чтобы доставка осуществлялась посредством частицы. В определенных вариантах осуществления настоящего изобретения первая и вторая парные tracr-последовательности обладают 100% идентичностью, и/или первая и вторая tracr-последовательности обладают 100% идентичностью. В некоторых вариантах осуществления полинуклеотиды могут содержаться в векторной системе, содержащей один или несколько векторов. В предпочтительных вариантах осуществления настоящего изобретения фермент CRISPR представляет собой фермент Cas9, например SpCas9. В одном аспекте настоящего изобретения фермент CRISPR содержит одну или несколько мутаций в каталитическом домене, где одна или несколько мутаций по сравнению с SpCas9 выбраны из группы, состоящей из мутации D10A, E762A, H840A, N854A, N863A и D986A, например, мутацию D10A. В предпочтительных вариантах осуществления первый фермент CRISPR имеет одну или несколько мутаций, вследствие которых фермент является ферментом, вносящим однонитевой разрыв в комплементарную нить, а второй фермент CRISPR имеет одну или несколько мутаций, вследствие которых фермент является ферментом, вносящим однонитевой разрыв в некомплементарную нить. Альтернативно первый фермент может являться ферментом, вносящим однонитевой разрыв в некомплементарную нить, а второй фермент может являться ферментом, вносящим однонитевой разрыв в комплементарную нить. В предпочтительных способах по настоящему изобретению первая направляющая последовательность, управляющая расщеплением одной нити ДНК-дуплекса возле первой целевой последовательности, и вторая направляющая последовательность, управляющая расщеплением другой нити возле второй целевой последовательности, приводят к образованию "липкого" 5'-конца. В вариантах осуществления настоящего изобретения "липкий" 5'-конец содержит не более 200 пар оснований, предпочтительно не более 100 пар оснований или более предпочтительно не более 50 пар оснований. В вариантах осуществления настоящего изобретения "липкий" 5'-конец содержит по меньшей мере 26 пар оснований, предпочтительно по меньшей мере 30 пар оснований или более предпочтительно 34-50 пар оснований. В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в таком модифицировании организма или организма, отличного от человека, путем манипуляции с первой и второй целевыми последовательностями на противоположных нитях ДНК-дуплекса в представляющем интерес локусе генома у HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, предусматривающей доставку, например, путем приведения HSC в контакт с частицей(частицами), содержащей(содержащими) не встречающуюся в природе или сконструированную композицию.wherein, when transcribed, the first and second tracr mate sequences hybridize to the first and second tracr sequences, respectively, and the first and second guide sequences direct sequence-specific binding of the first and second CRISPR complexes to the first and second target sequences, respectively, wherein the first CRISPR complex comprises a CRISPR enzyme in complex with (1) a first guide sequence that is hybridized to the first target sequence and (2) a first tracr mate sequence that is hybridized to the first tracr sequence, wherein the second CRISPR complex comprises a CRISPR enzyme in complex with (1) a second guide sequence that is hybridized to the second target sequence and (2) a second tracr mate sequence that is hybridized to the second tracr sequence, wherein the polynucleotide sequence encoding the CRISPR enzyme is DNA or RNA, and wherein the first guide sequence directs the cleavage of one strand of a DNA duplex near the first target sequences, and the second guide sequence directs cleavage of the other strand near the second target sequence, inducing a double-strand break, thereby modifying the organism or non-human organism; and wherein the method may optionally further comprise delivering an HDR matrix, such as by said particle being contacted with an HSC that contains the HDR matrix, or by contacting the HSC with another particle that contains the HDR matrix, wherein the HDR matrix provides expression of a normal or less aberrant form of the protein; wherein "normal" refers to the wild type, and "aberrant" may refer to expression of the protein that results in a pathological condition or a disease state; and optionally the method may comprise isolating or obtaining HSC from an organism or non-human organism, optionally expanding the population of HSC, contacting the particle(s) with the HSC to obtain a population of modified HSC, optionally expanding the population of modified HSC, and optionally introducing the modified HSC into the organism or non-human organism. In some methods of the present invention, any or all of the polynucleotide sequence encoding the CRISPR enzyme, the first and second guide sequences, the first and second tracr mate sequences, or the first and second tracr sequences is/are RNA. In further embodiments of the present invention, the polynucleotides encoding the sequence encoding the CRISPR enzyme, the first and second guide sequences, the first and second tracr mate sequences, or the first and second tracr sequences are/are RNA and are delivered by liposomes, nanoparticles, exosomes, microvesicles, or a gene gun; but preferably, the delivery is by means of a particle. In certain embodiments of the present invention, the first and second tracr paired sequences have 100% identity, and/or the first and second tracr sequences have 100% identity. In some embodiments, the polynucleotides may be contained in a vector system comprising one or more vectors. In preferred embodiments of the present invention, the CRISPR enzyme is a Cas9 enzyme, such as SpCas9. In one aspect of the present invention, the CRISPR enzyme comprises one or more mutations in the catalytic domain, wherein the one or more mutations compared to SpCas9 are selected from the group consisting of a D10A, E762A, H840A, N854A, N863A and D986A mutation, such as a D10A mutation. In preferred embodiments, the first CRISPR enzyme has one or more mutations such that the enzyme is an enzyme that introduces a single-strand break in the complementary strand, and the second CRISPR enzyme has one or more mutations such that the enzyme is an enzyme that introduces a single-strand break in the non-complementary strand. Alternatively, the first enzyme may be an enzyme that introduces a single-strand break in the non-complementary strand, and the second enzyme may be an enzyme that introduces a single-strand break in the complementary strand. In preferred methods of the present invention, a first guide sequence that directs cleavage of one strand of a DNA duplex near a first target sequence and a second guide sequence that directs cleavage of the other strand near a second target sequence result in the formation of a 5' overhang. In embodiments of the present invention, the 5' overhang comprises no more than 200 base pairs, preferably no more than 100 base pairs, or more preferably no more than 50 base pairs. In embodiments of the present invention, the 5' overhang comprises at least 26 base pairs, preferably at least 30 base pairs, or more preferably 34-50 base pairs. The present invention also provides an engineered CRISPR protein, complex, composition, system, vector, cell or cell line according to the present invention for use in such modification of an organism or an organism other than a human by manipulating first and second target sequences on opposite strands of a DNA duplex at a genomic locus of interest in HSCs, for example, where the genomic locus of interest is associated with a mutation associated with aberrant protein expression or with a disease state or disease course, comprising delivery, for example, by contacting the HSCs with a particle(s) containing a non-naturally occurring or engineered composition.
В некоторых вариантах осуществления настоящее изобретение охватывает способ модифицирования организма или организма, отличного от человека, путем манипуляции с первой и второй целевыми последовательностями на противоположных нитях ДНК-дуплекса в представляющем интерес локусе генома в HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, предусматривающей доставку, например, путем приведения HSC в контакт с частицей(частицами), (содержащей)содержащими не встречающуюся в природе или сконструированную композицию, содержащую:In some embodiments, the present invention encompasses a method of modifying an organism or non-human organism by manipulating first and second target sequences on opposite strands of a DNA duplex at a genomic locus of interest in an HSC, e.g., where the genomic locus of interest is associated with a mutation associated with aberrant protein expression or with a disease state or disease course, comprising delivering, e.g., by contacting the HSC with particle(s) comprising a non-naturally occurring or engineered composition comprising:
I. первый регуляторный элемент, функционально связанный сI. the first regulatory element functionally associated with
(a) первой направляющей последовательностью, способной гибридизироваться с первой целевой последовательностью и(a) a first guide sequence capable of hybridizing to a first target sequence and
(b) по меньшей мере одной или несколькими парными tracr-последовательностями,(b) at least one or more paired tracr sequences,
II. второй регуляторный элемент, функционально связанный сII. the second regulatory element, functionally associated with
(a) второй направляющей последовательностью, способной гибридизироваться с второй целевой последовательностью, и(a) a second guide sequence capable of hybridizing to a second target sequence, and
(b) по меньшей мере одной или несколькими парными tracr-последовательностями,(b) at least one or more paired tracr sequences,
III. третий регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, кодирующей фермент CRISPR, иIII. a third regulatory element operably linked to an enzyme-coding sequence encoding a CRISPR enzyme, and
IV. четвертый регуляторный элемент, функционально связанный с tracr-последовательностью,IV. the fourth regulatory element, functionally linked to the tracr sequence,
V. продукт(продукты) экспрессии одной или нескольких из I. - IV., например, первую и вторую парные tracr-последовательности, фермент CRISPR;V. the expression product(s) of one or more of I. - IV., e.g., the first and second paired tracr sequences, the CRISPR enzyme;
где компоненты I, II, III и IV расположены в одном и том же или разных векторах системы, при этом будучи транскрибированными, парная tracr-последовательность гибридизируется с tracr-последовательностью, а первая и вторая направляющие последовательности управляют специфичным к последовательности связыванием первого и второго комплексов CRISPR с первой и второй целевыми последовательностями соответственно, где первый комплекс CRISPR содержит фермент CRISPR в комплексе с (1) первой направляющей последовательностью, которая гибридизирована с первой целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизирована с tracr-последовательностью, где второй комплекс CRISPR содержит фермент CRISPR в комплексе с (1) второй направляющей последовательностью, которая гибридизирована с второй целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизирована с tracr-последовательностью, где полинуклеотидная последовательность, кодирующая фермент CRISPR, представляет собой ДНК или РНК, и где первая направляющая последовательность управляет расщеплением одной нити ДНК-дуплекса возле первой целевой последовательности, а вторая направляющая последовательность управляет расщеплением другой нити возле второй целевой последовательности, индуцируя двухнитевой разрыв, за счет чего обеспечивается модифицирование организма или организма, отличного от человека; и при этом способ необязательно может также включать доставку матрицы для HDR, например, посредством указанной частицы, приводимой в контакт с HSC, которая содержит матрицу для HDR, или посредством приведения HSC в контакт с другой частицей, содержащей матрицу для HDR, где матрица для HDR обеспечивает экспрессию нормальной или менее абберантной формы белка; где "нормальная" относится к дикому типу, а "абберантная" может обозначать экспрессию белка, которая приводит к возникновению патологического состояния или болезненного состояния; и при этом необязательно способ может включать выделение или получение HSC из организма или организма, отличного от человека, необязательно размножение популяции HSC, осуществление контакта частицы(частиц) с HSC с получением популяции модифицированных HSC, необязательно размножение популяции модифицированных HSC и необязательно введение модифицированных HSC в организм или организм, отличный от человека. В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в таком модифицировании организма или организма, отличного от человека, путем манипуляции с первой и второй целевыми последовательностями на противоположных нитях ДНК-дуплекса в представляющем интерес локусе генома у HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, предусматривающей доставку, например, путем приведения HSC в контакт с частицей(частицами), содержащей(содержащими) не встречающуюся в природе или сконструированную композицию.wherein components I, II, III and IV are located in the same or different vectors of the system, while being transcribed, the mate tracr sequence hybridizes to the tracr sequence, and the first and second guide sequences direct sequence-specific binding of the first and second CRISPR complexes to the first and second target sequences, respectively, wherein the first CRISPR complex comprises a CRISPR enzyme in complex with (1) a first guide sequence that is hybridized to the first target sequence, and (2) a mate tracr sequence that is hybridized to the tracr sequence, wherein the second CRISPR complex comprises a CRISPR enzyme in complex with (1) a second guide sequence that is hybridized to the second target sequence, and (2) a mate tracr sequence that is hybridized to the tracr sequence, wherein the polynucleotide sequence encoding the CRISPR enzyme is DNA or RNA, and wherein the first guide sequence directs the cleavage of one strands of a DNA duplex near a first target sequence, and a second guide sequence directs cleavage of the other strand near the second target sequence, inducing a double-strand break, thereby modifying the organism or non-human organism; and wherein the method may optionally further comprise delivering an HDR template, such as by said particle being contacted with an HSC that contains the HDR template, or by contacting the HSC with another particle that contains the HDR template, wherein the HDR template provides for expression of a normal or less aberrant form of the protein; wherein "normal" refers to the wild type, and "aberrant" may refer to expression of the protein that results in a pathological condition or a disease state; and optionally the method may comprise isolating or obtaining HSCs from an organism or non-human organism, optionally expanding the population of HSCs, contacting the particle(s) with the HSCs to obtain a population of modified HSCs, optionally expanding the population of modified HSCs, and optionally introducing the modified HSCs into the organism or non-human organism. The present invention also provides an engineered CRISPR protein, complex, composition, system, vector, cell or cell line according to the present invention for use in such modification of an organism or non-human organism by manipulating first and second target sequences on opposite strands of a DNA duplex at a genomic locus of interest in HSCs, for example, wherein the genomic locus of interest is associated with a mutation associated with aberrant protein expression or with a disease state or disease course, comprising delivery, for example, by contacting the HSCs with particle(s) comprising a non-naturally occurring or engineered composition.
В настоящем изобретении также предусмотрена векторная система, описанная в данном документе. Система может содержать один, два, три или четыре различных вектора. Компоненты I, II, III и IV таким образом могут находиться в одном, двух, трех или четырех разных векторах, и в данном документе предусмотрены все комбинации возможных местоположений компонентов, например: компоненты I, II, III и IV могут находиться в одном и том же векторе; каждый из компонентов I, II, III и IV может находиться в отдельных векторах; компоненты I, II, III и IV могут находиться в общей сложности в двух или трех разных векторах, при этом предусмотрены все комбинации местоположений и т.п. В некоторых способах по настоящему изобретению любая или все полинуклеотидные последовательности, кодирующие фермент CRISPR, первую и вторую направляющие последовательности, первую и вторую парные tracr-последовательности или первую и вторую tracr-последовательности, представляет собой/представляют собой РНК. В дополнительных вариантах осуществления настоящего изобретения первая и вторая парные tracr-последовательности обладают 100% идентичностью, и/или первая и вторая tracr-последовательности обладают 100% идентичностью. В предпочтительных вариантах осуществления настоящего изобретения фермент CRISPR представляет собой фермент Cas9, например SpCas9. В одном аспекте настоящего изобретения фермент CRISPR содержит одну или несколько мутаций в каталитическом домене, где одна или несколько мутаций по сравнению с SpCas9 выбраны из группы, состоящей из D10A, E762A, H840A, N854A, N863A и D986A; например, мутацию D10A. В предпочтительных вариантах осуществления первый фермент CRISPR имеет одну или несколько мутаций, вследствие которых фермент является ферментом, вносящим однонитевой разрыв в комплементарную нить, а второй фермент CRISPR имеет одну или несколько мутаций, вследствие которых фермент является ферментом, вносящим однонитевой разрыв в некомплементарную нить. Альтернативно первый фермент может являться ферментом, вносящим однонитевой разрыв в некомплементарную нить, а второй фермент может являться ферментом, вносящим однонитевой разрыв в комплементарную нить. В дополнительном варианте осуществления настоящего изобретения один или несколько вирусных векторов доставляются посредством липосом, наночастиц, экзосом, микровезикул или генной пушки; но доставка с помощью частиц является преимущественной.The present invention also provides a vector system as described herein. The system may comprise one, two, three or four different vectors. Components I, II, III and IV may thus be in one, two, three or four different vectors, and all combinations of possible locations of the components are contemplated herein, such as: Components I, II, III and IV may be in the same vector; Components I, II, III and IV may each be in separate vectors; Components I, II, III and IV may be in a total of two or three different vectors, and all combinations of locations are contemplated, and the like. In some methods of the present invention, any or all of the polynucleotide sequences encoding the CRISPR enzyme, the first and second guide sequences, the first and second tracr mate sequences or the first and second tracr sequences is/are RNA. In further embodiments of the present invention, the first and second tracr mate sequences have 100% identity and/or the first and second tracr sequences have 100% identity. In preferred embodiments of the present invention, the CRISPR enzyme is a Cas9 enzyme, such as SpCas9. In one aspect of the present invention, the CRISPR enzyme comprises one or more mutations in the catalytic domain, wherein the one or more mutations compared to SpCas9 are selected from the group consisting of D10A, E762A, H840A, N854A, N863A and D986A; such as the D10A mutation. In preferred embodiments, the first CRISPR enzyme has one or more mutations such that the enzyme is a complementary strand break introducing enzyme, and the second CRISPR enzyme has one or more mutations such that the enzyme is a non-complementary strand break introducing enzyme. Alternatively, the first enzyme may be an enzyme that introduces a single-strand break in the non-complementary strand, and the second enzyme may be an enzyme that introduces a single-strand break in the complementary strand. In a further embodiment of the present invention, one or more viral vectors are delivered via liposomes, nanoparticles, exosomes, microvesicles or a gene gun; but delivery via particles is advantageous.
В предпочтительных способах по настоящему изобретению первая направляющая последовательность, управляющая расщеплением одной нити ДНК-дуплекса возле первой целевой последовательности, и вторая направляющая последовательность, управляющая расщеплением другой нити возле второй целевой последовательности, обуславливают образование "липкого" 5'-выступающего конца. В вариантах осуществления настоящего изобретения "липкий" 5'-конец содержит не более 200 пар оснований, предпочтительно не более 100 пар оснований или более предпочтительно не более 50 пар оснований. В вариантах осуществления настоящего изобретения "липкий" 5'-конец содержит по меньшей мере 26 пар оснований, предпочтительно по меньшей мере 30 пар оснований или более предпочтительно 34-50 пар оснований.In preferred methods of the present invention, a first guide sequence directing cleavage of one strand of a DNA duplex near a first target sequence and a second guide sequence directing cleavage of the other strand near a second target sequence cause the formation of a 5' overhang. In embodiments of the present invention, the 5' overhang comprises no more than 200 base pairs, preferably no more than 100 base pairs, or more preferably no more than 50 base pairs. In embodiments of the present invention, the 5' overhang comprises at least 26 base pairs, preferably at least 30 base pairs, or more preferably 34-50 base pairs.
В некоторых вариантах осуществления настоящее изобретение охватывает способ модифицирования представляющего интерес локуса генома в HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, путем введения в HSC, например, путем приведения HSC в контакт с частицей(частицами), содержащей(содержащими) белок Cas с одной или несколькими мутациями и две направляющие РНК, которые нацеливаются на первую нить и вторую нить молекулы ДНК соответственно в HSC, в результате чего направляющие РНК нацеливаются на молекулу ДНК, а белок Cas вносит однонитевой разрыв в каждую из первой нити и второй нити молекулы ДНК, в результате чего мишень в HSC изменяется; и, где белок Cas и две направляющие РНК не встречаются в природе вместе, и при этом способ необязательно может также включать доставку матрицы для HDR, например, посредством указанной частицы, приводимой в контакт с HSC, которая содержит матрицу для HDR, или посредством приведения HSC в контакт с другой частицей, содержащей матрицу для HDR, где матрица для HDR обеспечивает экспрессию нормальной или менее абберантной формы белка; где "нормальная" относится к дикому типу, а "абберантная" может обозначать экспрессию белка, которая приводит к возникновению патологического состояния или болезненного состояния; и при этом необязательно способ может включать выделение или получение HSC из организма или организма, отличного от человека, необязательно размножение популяции HSC, осуществление контакта частицы(частиц) с HSC получением популяции модифицированных HSC, необязательно размножение популяции модифицированных HSC и необязательно введение модифицированных HSC в организм или организм, отличный от человека. В предпочтительных способах по настоящему изобретению белок Cas вносит однонитевой разрыв в каждую из первой нити и второй нити молекулы ДНК, что приводит к образованию "липкого" 5'-конца. В вариантах осуществления настоящего изобретения "липкий" 5'-конец содержит не более 200 пар оснований, предпочтительно не более 100 пар оснований или более предпочтительно не более 50 пар оснований. В вариантах осуществления настоящего изобретения "липкий" 5'-конец содержит по меньшей мере 26 пар оснований, предпочтительно по меньшей мере 30 пар оснований или более предпочтительно 34-50 пар оснований. Варианты осуществления настоящего изобретения также охватывают направляющие РНК, предусматривающие направляющую последовательность, слитую с парной tracr-последовательностью и tracr-последовательностью. В одном аспекте настоящего изобретения белок Cas является кодон-оптимизированным для экспрессии в эукариотической клетке, предпочтительно в клетке млекопитающего или клетке человека. В дополнительных вариантах осуществления настоящего изобретения белок Cas представляет собой белок системы CRISPR-Cas II типа, например белок Cas 9. В особенно предпочтительном варианте осуществления белок Cas представляет собой белок Cas9, например, SpCas9 или SaCas9. В аспектах настоящего изобретения белок Cas имеет одну или несколько мутаций по сравнению с SpCas9, выбранных из группы, состоящей из D10A, E762A, H840A, N854A, N863A и D986A; например, мутацию D10A. Аспекты настоящего изобретения относятся к снижению экспрессии продукта гена, или к дополнительному введению полинуклеотидной матрицы в молекулу ДНК, кодирующую продукт гена, или к точному вырезанию вставочной последовательности путем обеспечения повторной гибридизации и лигирования двух "липких" 5’-концов, или к изменению активности или функционирования продукта гена, или к повышению экспрессии продукта гена. В одном варианте осуществления настоящего изобретения продукт гена представляет собой белок.In some embodiments, the present invention encompasses a method of modifying a genomic locus of interest in an HSC, such as where the genomic locus of interest is associated with a mutation associated with aberrant protein expression or with a disease state or course of a disease, by introducing into the HSC, such as by contacting the HSC with a particle(s) comprising a Cas protein with one or more mutations and two guide RNAs that target a first strand and a second strand of a DNA molecule, respectively, in the HSC, whereby the guide RNAs target the DNA molecule and the Cas protein introduces a single-strand break into each of the first strand and the second strand of the DNA molecule, whereby the target in the HSC is altered; and, wherein the Cas protein and the two guide RNAs do not occur together in nature, and wherein the method may optionally further comprise delivering an HDR template, such as by said particle being contacted with an HSC that comprises an HDR template, or by contacting the HSC with another particle that comprises an HDR template, wherein the HDR template provides for expression of a normal or less aberrant form of the protein; wherein "normal" refers to the wild type and "aberrant" may denote expression of the protein that results in the occurrence of a pathological condition or a disease state; and wherein optionally the method may comprise isolating or obtaining HSC from an organism or non-human organism, optionally expanding the population of HSC, contacting the particle(s) with the HSC to obtain a population of modified HSC, optionally expanding the population of modified HSC, and optionally introducing the modified HSC into the organism or non-human organism. In preferred methods of the present invention, the Cas protein introduces a single-strand break into each of the first strand and the second strand of the DNA molecule, resulting in the formation of a 5' overhang. In embodiments of the present invention, the 5' overhang comprises no more than 200 base pairs, preferably no more than 100 base pairs, or more preferably no more than 50 base pairs. In embodiments of the present invention, the 5' overhang comprises at least 26 base pairs, preferably at least 30 base pairs, or more preferably 34-50 base pairs. Embodiments of the present invention also encompass guide RNAs comprising a guide sequence fused to a tracr mate sequence and a tracr sequence. In one aspect of the present invention, the Cas protein is codon optimized for expression in a eukaryotic cell, preferably a mammalian cell or a human cell. In further embodiments of the present invention, the Cas protein is a protein of the Type II CRISPR-Cas system, such as the Cas 9 protein. In a particularly preferred embodiment, the Cas protein is a Cas9 protein, such as SpCas9 or SaCas9. In aspects of the present invention, the Cas protein has one or more mutations compared to SpCas9 selected from the group consisting of D10A, E762A, H840A, N854A, N863A and D986A; such as the D10A mutation. Aspects of the present invention relate to decreasing the expression of a gene product, or further introducing a polynucleotide template into a DNA molecule encoding a gene product, or precisely excising an insertion sequence by allowing re-hybridization and ligation of two 5' sticky ends, or altering the activity or function of a gene product, or increasing the expression of a gene product. In one embodiment, the gene product is a protein.
В некоторых вариантах осуществления настоящее изобретение охватывает способ модифицирования представляющего интерес локуса генома в HSC, например, где представляющий интерес локус генома ассоциирован с мутацией, ассоциированной с абберантной экспрессией белка или с болезненным состоянием или течением заболевания, путем введения в HSC, например, путем приведения HSC в контакт с частицей(частицами), содержащей(содержащими):In some embodiments, the present invention encompasses a method of modifying a genomic locus of interest in an HSC, such as where the genomic locus of interest is associated with a mutation associated with aberrant protein expression or with a disease state or disease course, by introducing into the HSC, such as by contacting the HSC with a particle(s) comprising:
a) первый регуляторный элемент, функционально связанный с каждой из двух направляющих РНК системы CRISPR-Cas, которые нацеливаются на первую нить и вторую нить соответственно двухнитевой молекулы ДНК HSC, иa) a first regulatory element operably linked to each of two guide RNAs of the CRISPR-Cas system that target the first strand and the second strand, respectively, of a double-stranded DNA molecule of the HSC, and
b) второй регуляторный элемент, функционально связанный с белком Cas, илиb) a second regulatory element functionally linked to the Cas protein, or
c) продукт экспрессии(продукты экспрессии) a) или b),c) expression product(s) a) or b),
где компоненты (a) и (b) находятся в одном и том же или разных векторах системы, в результате чего направляющие РНК нацеливаются на молекулу ДНК HSC, а белок Cas вносит однонитевой разрыв в каждую из первой нити и второй нити молекулы ДНК HSC; и где белок Cas и две направляющие РНК не встречаются в природе вместе; и при этом способ необязательно может также включать доставку матрицы для HDR, например, посредством указанной частицы, приводимой в контакт с HSC, которая содержит матрицу для HDR, или посредством приведения HSC в контакт с другой частицей, содержащей матрицу для HDR, где матрица для HDR обеспечивает экспрессию нормальной или менее абберантной формы белка; где "нормальная" относится к дикому типу, а "абберантная" может обозначать экспрессию белка, которая приводит к возникновению патологического состояния или болезненного состояния; и при этом необязательно способ может включать выделение или получение HSC из организма или организма, отличного от человека, необязательно размножение популяции HSC, осуществление контакта частицы(частиц) с HSC с получением популяции модифицированных HSC, необязательно размножение популяции модифицированных HSC и необязательно введение модифицированных HSC в организм или организм, отличный от человека. В аспектах настоящего изобретения направляющие РНК могут предусматривать направляющую последовательность, слитую с парной tracr-последовательностью и tracr-последовательностью. В одном варианте осуществления настоящего изобретения белок Cas представляет собой белок системы CRISPR-Cas II типа. В одном аспекте настоящего изобретения белок Cas является кодон-оптимизированным для экспрессии в эукариотической клетке, предпочтительно в клетке млекопитающего или клетке человека. В дополнительных вариантах осуществления настоящего изобретения белок Cas представляет собой белок системы CRISPR-Cas II типа, например белок Cas 9. В особенно предпочтительном варианте осуществления белок Cas представляет собой белок Cas9, например, SpCas9 или SaCas9. В аспектах настоящего изобретения белок Cas имеет одну или несколько мутаций по сравнению с SpCas9, выбранных из группы, состоящей из D10A, E762A, H840A, N854A, N863A и D986A; например, мутацию D10A. Аспекты настоящего изобретения относятся к снижению экспрессии продукта гена, или к дополнительному введению полинуклеотидной матрицы в молекулу ДНК, кодирующую продукт гена, или к точному вырезанию вставочной последовательности путем обеспечения повторной гибридизации и лигирования двух "липких" 5’-концов, или к изменению активности или функционирования продукта гена, или к повышению экспрессии продукта гена. В одном варианте осуществления настоящего изобретения продукт гена представляет собой белок. В предпочтительных вариантах осуществления настоящего изобретения векторы системы являются вирусными векторами. В дополнительном варианте осуществления векторы системы доставляют посредством липосом, наночастиц, экзосом, микровезикул или генной пушки; причем частицы являются предпочтительными. В одном аспекте настоящего изобретения предусмотрен способ модифицирования целевого полинуклеотида в HSC. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида, за счет чего обеспечивается модифицирование целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизированной с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью. В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении целевой последовательности с помощью указанного фермента CRISPR. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида с помощью гомологичной рекомбинации с экзогенной полинуклеотидной матрицей, где указанная репарация приводит к возникновению мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в указанном целевом полинуклеотиде. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот в белке, экспрессируемом с гена, содержащего целевую последовательность. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов или продукта(продуктов) их экспрессии, например, посредством частицы(частиц), в указанную HSC, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью, и tracr-последовательности. В некоторых вариантах осуществления указанные векторы доставляются в HSC, находящуюся в организме субъекта. В некоторых вариантах осуществления указанное модифицирование происходит в указанной HSC, находящей в культуре клеток. В некоторых вариантах осуществления способ дополнительно включает выделение указанной HSC из организма субъекта перед проведением указанного модифицирования. В некоторых вариантах осуществления способ дополнительно включает возвращение указанных HSC и/или клеток, происходящих из них, указанному субъекту.wherein components (a) and (b) are in the same or different vectors of the system, whereby the guide RNAs target the HSC DNA molecule and the Cas protein introduces a single-strand break into each of the first strand and the second strand of the HSC DNA molecule; and wherein the Cas protein and the two guide RNAs do not occur together in nature; and wherein the method may optionally also comprise delivering an HDR template, such as by said particle being contacted with the HSC that contains the HDR template or by contacting the HSC with another particle containing the HDR template, wherein the HDR template provides for expression of a normal or less aberrant form of the protein; wherein "normal" refers to the wild type and "aberrant" may mean expression of the protein that results in a pathological condition or a disease state; and optionally the method may comprise isolating or obtaining HSCs from an organism or non-human organism, optionally expanding the population of HSCs, contacting the particle(s) with the HSCs to obtain a population of modified HSCs, optionally expanding the population of modified HSCs, and optionally introducing the modified HSCs into the organism or non-human organism. In aspects of the present invention, the guide RNAs may comprise a guide sequence fused to a tracr mate sequence and a tracr sequence. In one embodiment of the present invention, the Cas protein is a type II CRISPR-Cas system protein. In one aspect of the present invention, the Cas protein is codon optimized for expression in a eukaryotic cell, preferably a mammalian cell or a human cell. In further embodiments of the present invention, the Cas protein is a type II CRISPR-Cas system protein, such as Cas 9 protein. In a particularly preferred embodiment, the Cas protein is a Cas9 protein, such as SpCas9 or SaCas9. In aspects of the present invention, the Cas protein has one or more mutations compared to SpCas9 selected from the group consisting of D10A, E762A, H840A, N854A, N863A and D986A; for example, the D10A mutation. Aspects of the present invention relate to decreasing the expression of the gene product, or to further introducing a polynucleotide template into the DNA molecule encoding the gene product, or to precisely excising the insertion sequence by providing re-hybridization and ligation of two "sticky" 5'-ends, or to altering the activity or function of the gene product, or to increasing the expression of the gene product. In one embodiment of the present invention, the gene product is a protein. In preferred embodiments of the present invention, the vectors of the system are viral vectors. In a further embodiment, the vectors of the system are delivered via liposomes, nanoparticles, exosomes, microvesicles or a gene gun; particles being preferred. In one aspect of the present invention, there is provided a method for modifying a target polynucleotide in an HSC. In some embodiments, the method comprises causing a CRISPR complex to bind to the target polynucleotide to effect cleavage of said target polynucleotide, thereby effecting modification of the target polynucleotide, wherein the CRISPR complex comprises a CRISPR enzyme complexed with a guide sequence hybridized to a target sequence in said target polynucleotide, wherein said guide sequence is linked to a tracr mate sequence, which in turn hybridizes to the tracr sequence. In some embodiments, said cleavage comprises cleavage of one or two strands at a certain position of the target sequence by said CRISPR enzyme. In some embodiments, said cleavage results in reduced transcription of the target gene. In some embodiments, the method further comprises repairing said cleaved target polynucleotide by homologous recombination with an exogenous polynucleotide template, wherein said repair results in a mutation involving an insertion, deletion or substitution of one or more nucleotides in said target polynucleotide. In some embodiments, said mutation results in a change in one or more amino acids in a protein expressed from a gene comprising the target sequence. In some embodiments, the method further comprises delivering one or more vectors or expression product(s) thereof, such as via a particle(s), to said HSC, wherein the one or more vectors direct the expression of one or more of: a CRISPR enzyme, a guide sequence associated with a tracr mate sequence, and a tracr sequence. In some embodiments, said vectors are delivered to an HSC located in the subject's body. In some embodiments, said modification occurs in said HSC located in cell culture. In some embodiments, the method further comprises isolating said HSC from the subject prior to said modification. In some embodiments, the method further comprises returning said HSC and/or cells derived therefrom to said subject.
В одном аспекте настоящего изобретения предусмотрен способ получения HSC, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, является любым геном, ассоциированным с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) введение одного или нескольких векторов или продукта(продуктов) их экспрессии, например, посредством частицы(частиц) в HSC, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью, и tracr-последовательности; и (b) обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в указанном гене, ответственном за развитие заболевания, где комплекс CRISPR содержит фермент CRISPR в комплексе с (1) направляющей последовательностью, которая гибридизирована с целевой последовательностью в целевом полинуклеотиде, и (2) парной tracr-последовательностью, которая гибридизирована с tracr-последовательностью, с получением тем самым HSC, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении целевой последовательности с помощью указанного фермента CRISPR. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида с помощью гомологичной рекомбинации с экзогенной полинуклеотидной матрицей, где указанная репарация приводит к возникновению мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в указанном целевом полинуклеотиде. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот при экспрессии белка с гена, содержащего целевую последовательность. В некоторых вариантах осуществления модифицированную HSC вводят животному с получением тем самым животной модели.In one aspect of the present invention, there is provided a method for producing an HSC comprising a mutated gene responsible for developing a disease. In some embodiments, the gene responsible for developing a disease is any gene associated with an increased risk of having or developing a disease. In some embodiments, the method comprises (a) introducing one or more vectors or expression product(s) thereof, such as via a particle(s), into the HSC, wherein the one or more vectors direct the expression of one or more of: a CRISPR enzyme, a guide sequence associated with a tracr mate sequence, and a tracr sequence; and (b) causing a CRISPR complex to bind to a target polynucleotide to effect cleavage of the target polynucleotide in said disease-causing gene, wherein the CRISPR complex comprises a CRISPR enzyme in complex with (1) a guide sequence that is hybridized to a target sequence in the target polynucleotide and (2) a tracr mate sequence that is hybridized to the tracr sequence, thereby producing an HSC comprising a mutated disease-causing gene. In some embodiments, said cleavage comprises cleavage of one or two strands at a specific position of the target sequence by said CRISPR enzyme. In some embodiments, said cleavage results in reduced transcription of the target gene. In some embodiments, the method further comprises repairing said cleaved target polynucleotide by homologous recombination with an exogenous polynucleotide template, wherein said repair results in a mutation involving an insertion, deletion or substitution of one or more nucleotides in said target polynucleotide. In some embodiments, said mutation results in a change in one or more amino acids in the expression of a protein from a gene comprising the target sequence. In some embodiments, the modified HSC is administered to an animal, thereby producing an animal model.
В одном аспекте настоящего изобретения предусмотрены способы модифицирования целевого полинуклеотида в HSC. Также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в модифицировании целевого полинуклеотида в HSC. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида с модифицированием тем самым целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR в комплексе с направляющей последовательностью, гибридизированной с целевой последовательностью в пределах указанного целевого полинуклеотида, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизирована с tracr-последовательностью. В других вариантах осуществления настоящего изобретения предусмотрен способ модифицирования экспрессии полинуклеотида в эукариотической клетке, которая происходит из HSC. Способ включает повышение или снижение экспрессии целевого полинуклеотида с помощью применения комплекса CRISPR, который связывается с полинуклеотидом в HSC; преимущественно комплекс CRISPR доставляется посредством частицы(частиц).In one aspect, the present invention provides methods for modifying a target polynucleotide in an HSC. Also provided is an engineered CRISPR protein, complex, composition, system, vector, cell, or cell line according to the present invention for use in modifying a target polynucleotide in an HSC. In some embodiments, the method comprises causing a CRISPR complex to bind to a target polynucleotide to effect cleavage of said target polynucleotide, thereby modifying the target polynucleotide, wherein the CRISPR complex comprises a CRISPR enzyme complexed with a guide sequence hybridized to a target sequence within said target polynucleotide, wherein said guide sequence is linked to a tracr mate sequence that is in turn hybridized to a tracr sequence. In other embodiments, the present invention provides a method of modifying expression of a polynucleotide in a eukaryotic cell that is derived from an HSC. The method comprises increasing or decreasing expression of a target polynucleotide by using a CRISPR complex that binds to a polynucleotide in an HSC; The CRISPR complex is primarily delivered via particle(s).
В некоторых способах целевой полинуклеотид можно инактивировать для осуществления модифицирования экспрессии в клетке. Например, после связывания комплекса CRISPR с целевой последовательностью в клетке целевой полинуклеотид инактивируется, вследствие чего последовательность не транскрибируется, при этом не вырабатывается кодируемый белок или последовательность не функционирует так, как последовательность дикого типа.In some methods, the target polynucleotide may be inactivated to effect modification of expression in the cell. For example, after the CRISPR complex binds to the target sequence in the cell, the target polynucleotide is inactivated, causing the sequence to not be transcribed, the encoded protein not being produced, or the sequence not functioning as a wild-type sequence.
В некоторых вариантах осуществления РНК из системы CRISPR-Cas, например, направляющая или sgRNA, может быть модифицирована; к примеру, включать аптамер или функциональный домен. Аптамер представляет собой синтетический олигонуклеотид, который связывается со специфической целевой молекулой; к примеру, молекулой нуклеиновой кислоты, которая была сконструирована благодаря повторным раундам in vitro отбора или SELEX (систематическая эволюция лигандов с помощью экспоненциального обогащения) для связывания с различными молекулярными мишенями, такими как малые молекулы, белки, нуклеиновые кислоты и даже клетки, ткани и организмы. Аптамеры являются пригодными в том, что они обеспечивают свойства молекулярного распознавания, что делает их конкурентами антител. В дополнение к их способности дифференциального распознавания, аптамеры предоставляют преимущества в сравнении с антителами, включая то, что при применении в терапевтических целях они вызывают небольшую иммуногенность или не вызывают ее. В соответствии с этим, при осуществлении настоящего изобретения на практике, любое или оба из фермента или РНК могут включать функциональный домен.In some embodiments, the RNA from the CRISPR-Cas system, such as a guide or sgRNA, can be modified; for example, to include an aptamer or a functional domain. An aptamer is a synthetic oligonucleotide that binds to a specific target molecule; for example, a nucleic acid molecule that has been engineered through repeated rounds of in vitro selection or SELEX (systematic evolution of ligands by exponential enrichment) to bind to a variety of molecular targets, such as small molecules, proteins, nucleic acids, and even cells, tissues, and organisms. Aptamers are useful in that they provide molecular recognition properties that make them competitors to antibodies. In addition to their ability to differentially recognize, aptamers provide advantages over antibodies, including that they cause little or no immunogenicity when used therapeutically. Accordingly, in practicing the present invention, either or both of the enzyme or the RNA may comprise a functional domain.
В некоторых вариантах осуществления функциональный домен представляет собой домен активации транскрипции, предпочтительно VP64. В некоторых вариантах осуществления функциональный домен представляет собой домен репрессии транскрипции, предпочтительно KRAB. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой SID или конкатемеры SID (например, SID4X). В некоторых вариантах осуществления функциональный домен представляет собой домен эпигенетического модифицирования, так что обеспечивается фермент эпигенетического модифицирования. В некоторых вариантах осуществления функциональный домен представляет собой домен активации, который может представлять собой домен активации P65. В некоторых вариантах осуществления функциональный домен предусматривает нуклеазную активность. В одном таком варианте осуществления функциональный домен предусматривает Fok1.In some embodiments, the functional domain is a transcriptional activation domain, preferably VP64. In some embodiments, the functional domain is a transcriptional repression domain, preferably KRAB. In some embodiments, the transcriptional repression domain is SID or SID concatemers (e.g., SID4X). In some embodiments, the functional domain is an epigenetic modification domain, such that an epigenetic modification enzyme is provided. In some embodiments, the functional domain is an activation domain, which may be a P65 activation domain. In some embodiments, the functional domain provides nuclease activity. In one such embodiment, the functional domain provides Fok1.
В настоящем изобретении также предусмотрена in vitro или ex vivo клетка, содержащая любое из модифицированных ферментов CRISPR, композиций, систем или комплексов, описанных выше, или из любого из способов, описанных выше. Клетка может быть эукариотической клеткой или прокариотической клеткой. В настоящем изобретении также предусмотрено потомство таких клеток. В настоящем изобретении также предусмотрен продукт любой такой клетки или любого такого потомства, где продукт представляет собой продукт указанного одного или нескольких целевых локусов, модифицированных с помощью модифицированного фермента CRISPR из комплекса CRISPR. Продукт может представлять собой пептид, полипептид или белок. Некоторые такие продукты могут быть модифицированы с помощью модифицированного фермента CRISPR из комплекса CRISPR. В случае некоторых таких модифицированных продуктов продукт целевого локуса физически отличается от продукта указанного целевого локуса, который не был модифицирован с помощью указанного модифицированного фермента CRISPR.The present invention also provides an in vitro or ex vivo cell comprising any of the modified CRISPR enzymes, compositions, systems or complexes described above or from any of the methods described above. The cell may be a eukaryotic cell or a prokaryotic cell. The present invention also provides a progeny of such cells. The present invention also provides a product of any such cell or any such progeny, wherein the product is a product of said one or more target loci modified with a modified CRISPR enzyme of a CRISPR complex. The product may be a peptide, a polypeptide or a protein. Some such products may be modified with a modified CRISPR enzyme of a CRISPR complex. In the case of some such modified products, the product of the target locus is physically different from the product of said target locus that has not been modified with said modified CRISPR enzyme.
В настоящем изобретении также предусмотрена полинуклеотидная молекула, содержащая полинуклеотидную последовательность, кодирующую любой из не встречающихся в природе ферментов CRISPR, описанный выше.The present invention also provides a polynucleotide molecule comprising a polynucleotide sequence encoding any of the non-naturally occurring CRISPR enzymes described above.
Любой такой полинуклеотид может дополнительно содержать один или несколько регуляторных элементов, которые функционально связаны с полинуклеотидной последовательностью, кодирующей не встречающийся в природе фермент CRISPR.Any such polynucleotide may further comprise one or more regulatory elements that are operably linked to a polynucleotide sequence encoding a non-naturally occurring CRISPR enzyme.
В случае любого такого полинуклеотида, который содержит один или несколько регуляторных элементов, один или несколько регуляторных элементов могут быть функционально сконфигурированы с возможностью экспрессии не встречающегося в природе фермента CRISPR в эукариотической клетке. Эукариотическая клетка может представлять собой клетку человека. Эукариотическая клетка может представлять собой клетку грызуна, необязательно клетку мыши. Эукариотическая клетка может представлять собой клетку дрожжей. Эукариотическая клетка может представлять собой клетку яичника китайского хомячка (CHO). Эукариотическая клетка может представлять собой клетку насекомого.In the case of any such polynucleotide that comprises one or more regulatory elements, the one or more regulatory elements may be operably configured to express a non-naturally occurring CRISPR enzyme in a eukaryotic cell. The eukaryotic cell may be a human cell. The eukaryotic cell may be a rodent cell, optionally a mouse cell. The eukaryotic cell may be a yeast cell. The eukaryotic cell may be a Chinese hamster ovary (CHO) cell. The eukaryotic cell may be an insect cell.
В случае любого такого полинуклеотида, который содержит один или несколько регуляторных элементов, один или несколько регуляторных элементов могут быть функционально сконфигурированы с возможностью экспрессии не встречающегося в природе фермента CRISPR в прокариотической клетке.In the case of any such polynucleotide that comprises one or more regulatory elements, the one or more regulatory elements may be operably configured to express a non-naturally occurring CRISPR enzyme in a prokaryotic cell.
В случае любого такого полинуклеотида, который содержит один или несколько регуляторных элементов, один или несколько регуляторных элементов могут быть функционально сконфигурированы с возможностью экспрессии не встречающегося в природе фермента CRISPR в in vitro системе.In the case of any such polynucleotide that comprises one or more regulatory elements, the one or more regulatory elements may be operably configured to express a non-naturally occurring CRISPR enzyme in an in vitro system.
В настоящем изобретении также предусмотрен вектор экспрессии, содержащий любую из описанных выше полинуклеотидных молекул. В настоящем изобретении также предусмотрена такая полинуклеотидная молекула(молекулы), к примеру, такие полинуклеотидные молекулы, функционально сконфигурированные для обеспечения экспрессии белка и/или компонента(компонентов) на основе нуклеиновой кислоты, а также такой вектор(векторы).The present invention also provides an expression vector comprising any of the above-described polynucleotide molecules. The present invention also provides such a polynucleotide molecule(s), for example, such polynucleotide molecules functionally configured to provide expression of a protein and/or component(s) based on a nucleic acid, as well as such a vector(s).
В настоящем изобретении дополнительно предусмотрен способ получения мутаций в Cas9 или мутированного или модифицированного Cas9, который является ортологом SaCas9 и/или SpCas9, включающий определение аминокислоты(аминокислот), которые в таком ортологе могут находиться в непосредственной близости или могут касаться молекулы нуклеиновой кислоты, например, ДНК, РНК, sgRNA и т.д., и/или аминокислоты(аминокислот), аналогичных или соответствующих идентифицированной в данном документе аминокислоте(аминокислотам) в SaCas9 и/или SpCas9, для осуществления модификации и/или мутации, и синтеза, или получения, или экспрессии ортолога, содержащего, состоящего из или состоящего, по сути, из модификации(модификаций) и/или мутации(мутаций), или осуществления мутирования, как обсуждается в данном документе, например, путем модифицирования, например, изменения или мутирования, нейтральной аминокислоты в заряженную, например положительно заряженную аминокислоту, например, из аланина, например, в лизин. Модифицированный таким образом ортолог можно применять в системах CRISPR-Cas; и молекулу(молекулы) нуклеиновой кислоты, экспрессирующую(экспрессирующие) его, можно применять в векторе или других системах доставки, которые доставляют молекулы или кодируют компоненты системы CRISPR-Cas, как обсуждается в данном документе.The present invention further provides a method for producing mutations in Cas9 or a mutated or modified Cas9 that is an orthologue of SaCas9 and/or SpCas9, comprising identifying an amino acid(s) that may be in close proximity to or may touch a nucleic acid molecule, such as DNA, RNA, sgRNA, etc., in such an orthologue, and/or an amino acid(s) similar to or corresponding to the amino acid(s) identified herein in SaCas9 and/or SpCas9, to effect the modification and/or mutation, and synthesizing or producing or expressing an orthologue comprising, consisting of, or consisting essentially of the modification(s) and/or mutation(s), or effecting the mutation, as discussed herein, such as by modifying, such as changing or mutating, a neutral amino acid to a charged, such as a positively charged amino acid, such as alanine, such as into lysine. The ortholog modified in this manner can be used in CRISPR-Cas systems; and the nucleic acid molecule(s) expressing it can be used in a vector or other delivery systems that deliver molecules or encode components of the CRISPR-Cas system, as discussed in this document.
В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток в соответствии с настоящим изобретением для применения в получении мутаций в Cas9 или мутированного или модифицированного Cas9, который является ортологом SaCas9 и/или SpCas9, включающий определение аминокислоты(аминокислот), которые в таком ортологе могут находиться в непосредственной близости или могут касаться молекулы нуклеиновой кислоты, например, ДНК, РНК, sgRNA, и/или аминокислоты(аминокислот), аналогичных или соответствующих идентифицированной в данном документе аминокислоте(аминокислотам) в SaCas9 и/или SpCas9, для осуществления модификации и/или мутации, и синтеза, или получения, или экспрессии ортолога, содержащего, состоящего из или состоящего, по сути, из модификации(модификаций) и/или мутации(мутаций), или осуществления мутирования, как обсуждается в данном документе, например, путем модифицирования, например, изменения или мутирования, нейтральной аминокислоты в заряженную, например, положительно заряженную аминокислоту, например, из аланина, например, в лизин.The present invention also provides an engineered CRISPR protein, complex, composition, system, vector, cell or cell line according to the present invention for use in making mutations in Cas9 or a mutated or modified Cas9 that is an ortholog of SaCas9 and/or SpCas9, comprising identifying amino acid(s) that may be in close proximity to or may touch a nucleic acid molecule, e.g., DNA, RNA, sgRNA, and/or amino acid(s) similar to or corresponding to the amino acid(s) identified herein in SaCas9 and/or SpCas9, to make the modification and/or mutation, and synthesizing or producing or expressing an ortholog comprising, consisting of, or consisting essentially of the modification(s) and/or mutation(s), or making the mutation, as discussed herein, e.g., by modifying, e.g., altering or mutating, a neutral amino acids into a charged, for example, positively charged amino acid, for example, from alanine, for example, into lysine.
В одном аспекте настоящего изобретения предусмотрены эффективная целевая активность и сведенная к минимуму нецелевая активность. В одном аспекте настоящего изобретения предусмотрено эффективное целевое расщепление с помощью белка CRISPR и сведенное к минимуму нецелевое расщепление под действием белка CRISPR. В одном аспекте настоящего изобретения предусмотрено направленно-специфичное связывание белка CRISPR в генном локусе без расщепления ДНК. В одном аспекте настоящего изобретения предусмотрены эффективное управляемое направляющей последовательностью целевое связывание белка CRISPR в генном локусе и сведенное к минимуму нецелевое связывание белка CRISPR. В соответствии с этим, в одном аспекте настоящего изобретения предусмотрена специфичная к мишени генная регуляция. В одном аспекте настоящего изобретения предусмотрено направленно-специфичное связывание фермента CRISPR в генном локусе без расщепления ДНК. В соответствии с этим, в одном аспекте настоящего изобретения предусмотрено расщепление в одном генном локусе и генная регуляция в другом генном локусе с применением одного фермента CRISPR. В одном аспекте настоящего изобретения предусмотрена ортогональная активация и/или ингибирование и/или расщепление нескольких мишеней с применением одного или нескольких белков и/или ферментов CRISPR.In one aspect, the present invention provides efficient on-target activity and minimized off-target activity. In one aspect, the present invention provides efficient on-target cleavage by a CRISPR protein and minimized off-target cleavage by a CRISPR protein. In one aspect, the present invention provides target-specific binding of a CRISPR protein at a gene locus without cleaving DNA. In one aspect, the present invention provides efficient guide sequence-driven target binding of a CRISPR protein at a gene locus and minimized off-target binding of a CRISPR protein. Accordingly, in one aspect, the present invention provides target-specific gene regulation. In one aspect, the present invention provides target-specific binding of a CRISPR enzyme at a gene locus without cleaving DNA. Accordingly, one aspect of the present invention provides for cleavage at one gene locus and gene regulation at another gene locus using one CRISPR enzyme. One aspect of the present invention provides for orthogonal activation and/or inhibition and/or cleavage of multiple targets using one or more CRISPR proteins and/or enzymes.
В другом аспекте настоящего изобретения предусмотрен способ функционального скрининга генов в геноме в пуле клеток ex vivo или in vivo, включающий введение или экспрессию библиотеки, содержащей несколько направляющих РНК системы CRISPR-Cas (sgRNA), и где скрининг дополнительно предусматривает применение фермента CRISPR, где комплекс CRISPR является модифицированным, чтобы содержать гетерологичный функциональный домен. В одном аспекте настоящего изобретения предусмотрен способ скрининга генома, включающий введение хозяину библиотеки или ее экспрессию у хозяина in vivo. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, дополнительно включающий активатор, вводимый хозяину или экспрессируемый у хозяина. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где активатор прикреплен к белку CRISPR. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где активатор прикреплен к N-концу или C-концу белка CRISPR. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где активатор прикреплен к петле sgRNA. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, дополнительно включающий репрессор, вводимый хозяину или экспрессируемый у хозяина. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где скрининг предусматривает воздействие на активацию гена, ингибирование гена или расщепление в локусе, и выявление указанного.In another aspect, the present invention provides a method for functionally screening genes in a genome in a cell pool ex vivo or in vivo, comprising administering or expressing a library comprising multiple CRISPR-Cas guide RNAs (sgRNAs), and wherein the screening further comprises using a CRISPR enzyme, wherein the CRISPR complex is modified to comprise a heterologous functional domain. In one aspect, the present invention provides a method for screening a genome, comprising administering a library to a host or expressing it in a host in vivo. In one aspect, the present invention provides a method as discussed herein, further comprising an activator administered to the host or expressed in the host. In one aspect, the present invention provides a method as discussed herein, wherein the activator is attached to a CRISPR protein. In one aspect, the present invention provides a method as discussed herein, wherein the activator is attached to the N-terminus or the C-terminus of the CRISPR protein. In one aspect of the present invention, there is provided a method as discussed herein, wherein the activator is attached to a loop of an sgRNA. In one aspect of the present invention, there is provided a method as discussed herein, further comprising a repressor introduced into the host or expressed in the host. In one aspect of the present invention, there is provided a method as discussed herein, wherein the screening comprises targeting and detecting gene activation, gene inhibition, or cleavage at a locus.
В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где хозяином является эукариотическая клетка. В одном аспекте настоящего изобретения предусмотрен способ или применение, обсуждаемые в данном документе, где хозяином является клетка млекопитающего. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где хозяином является клетка эукариотического организма, отличного от человека. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где клеткой эукариотического организма, отличного от человека, является клетка млекопитающего, отличного от человека. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где клетка млекопитающего, отличного от человека, может представлять собой, включая без ограничения клетку представителя приматов, бычьих, овечьих, свиньих, псовых, грызунов, Leporidae, как, например, обезьяны, коровы, овцы, свиньи, собаки, кролика, крысы или мыши. В одном аспекте настоящего изобретения предусмотрен способ или применение, обсуждаемые в данном документе, причем клетка может представлять собой эукариотическую клетку от организма, отличного от млекопитающего, как, например, клетку домашней птицы (например, курицы), позвоночной рыбы (например, лосося) или моллюсков и ракообразных (например, устрицы, двустворчатых моллюсков, омара, креветки). В одном аспекте настоящего изобретения предусмотрен способ или применение, обсуждаемые в данном документе, причем клеткой эукариотического организма, отличного от человека, является растительная клетка. Растительная клетка может быть получена от однодольного или двудольного растения, или от сельскохозяйственного или зернового растения, такого как маниока, кукуруза, сорго, соя, пшеница, овес или рис. Растительная клетка также может быть получена от водоросли, дерева или продуктивного растения, фрукта или овоща (например, деревьев, таких как цитрусовые деревья, например, деревья апельсина, грейпфрута или лимона; деревья персика или нектарина; деревья яблони или груши; орехоплодные деревья, такие как деревья миндаля, или грецкого ореха, или фисташки; пасленовых растений; растений из рода Brassica; растений из рода Lactuca; растений из рода Spinacia; растений из рода Capsicum; хлопчатника, табака, спаржи, моркови, капусты кочанной, брокколи, цветной капусты, томата, баклажана, перца, салата, шпината, земляники, черники, малины, ежевики, винограда, кофе, какао и т.д.).In one aspect, the present invention provides a method as discussed herein, wherein the host is a eukaryotic cell. In one aspect, the present invention provides a method or use as discussed herein, wherein the host is a mammalian cell. In one aspect, the present invention provides a method as discussed herein, wherein the host is a cell of a eukaryotic organism other than a human. In one aspect, the present invention provides a method as discussed herein, wherein the cell of a eukaryotic organism other than a human is a cell of a mammal other than a human. In one aspect, the present invention provides a method as discussed herein, wherein the cell of a mammal other than a human can be, including but not limited to, a cell of a primate, bovine, ovine, porcine, canine, rodent, Leporidae, such as a monkey, cow, sheep, pig, dog, rabbit, rat, or mouse. In one aspect, the present invention provides a method or use as discussed herein, wherein the cell may be a eukaryotic cell from an organism other than a mammal, such as a cell from a poultry (e.g., chicken), a vertebrate fish (e.g., salmon), or a shellfish (e.g., oyster, clam, lobster, shrimp). In one aspect, the present invention provides a method or use as discussed herein, wherein the cell from a eukaryotic organism other than a human is a plant cell. The plant cell may be derived from a monocot or dicot plant, or from an agricultural or cereal plant, such as cassava, corn, sorghum, soybean, wheat, oats, or rice. The plant cell may also be derived from an alga, a tree, or a productive plant, fruit, or vegetable (e.g., trees such as citrus trees, such as orange, grapefruit, or lemon trees; peach or nectarine trees; apple or pear trees; nut trees, such as almond or walnut or pistachio trees; nightshade plants; plants of the genus Brassica; plants of the genus Lactuca; plants of the genus Spinacia; plants of the genus Capsicum; cotton, tobacco, asparagus, carrot, cabbage, broccoli, cauliflower, tomato, eggplant, pepper, lettuce, spinach, strawberry, blueberry, raspberry, blackberry, grape, coffee, cocoa, etc.).
В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, включающий доставку комплексов CRISPR-Cas, или их компонента(компонентов), или молекулы(молекул) нуклеиновой кислоты, кодирующей их, где указанная молекула(молекулы) нуклеиновой кислоты функционально связаны с регуляторной последовательностью(последовательностями) и экспрессируются in vivo. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где экспрессия in vivo осуществляется с помощью лентивируса, аденовируса или AAV. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где доставка осуществляется с помощью частицы, наночастицы, липида или пептида, проникающих в клетку (CPP).In one aspect, the present invention provides a method as discussed herein, comprising delivering CRISPR-Cas complexes, or component(s) thereof, or nucleic acid molecule(s) encoding them, wherein said nucleic acid molecule(s) are operably linked to regulatory sequence(s) and expressed in vivo. In one aspect, the present invention provides a method as discussed herein, wherein the in vivo expression is by a lentivirus, adenovirus, or AAV. In one aspect, the present invention provides a method as discussed herein, wherein the delivery is by a cell penetrating particle, nanoparticle, lipid, or peptide (CPP).
В одном аспекте настоящего изобретения предусмотрена пара комплексов CRISPR-Cas, при этом каждый из них содержит направляющую РНК (sgRNA), предусматривающую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, где по меньшей мере одна петля каждой sgRNA является модифицированной путем вставки отличающейся последовательности(последовательностей) РНК, которая связывается с одним или несколькими адаптерными белками, и где адаптерный белок ассоциируется с одним или несколькими функциональными доменами, где каждая sgRNA из каждого CRISPR-Cas содержит функциональный домен, характеризующийся активностью расщепления ДНК. В одном аспекте настоящего изобретения предусмотрены парные комплексы CRISPR-Cas, обсуждаемые в данном документе, где активность расщепления ДНК обусловлена нуклеазой Fok1.In one aspect of the present invention, there is provided a pair of CRISPR-Cas complexes, each comprising a guide RNA (sgRNA) comprising a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell, wherein at least one loop of each sgRNA is modified by insertion of a different RNA sequence(s) that binds to one or more adaptor proteins, and wherein the adaptor protein is associated with one or more functional domains, wherein each sgRNA of each CRISPR-Cas comprises a functional domain characterized by DNA cleavage activity. In one aspect of the present invention, there are provided the paired CRISPR-Cas complexes discussed herein, wherein the DNA cleavage activity is mediated by the Fok1 nuclease.
В одном аспекте настоящего изобретения предусмотрен способ разрезания целевой последовательности в представляющем интерес локусе генома, включающий доставку в клетку комплексов CRISPR-Cas, или их компонента(компонентов), или молекулы(молекул) нуклеиновой кислоты, кодирующей их, где указанная молекула(молекулы) нуклеиновой кислоты функционально связаны с регуляторной последовательностью(последовательностями) и экспрессируются in vivo. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где доставка осуществляется с помощью лентивируса, аденовируса или AAV. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, или парные комплексы CRISPR-Cas, обсуждаемые в данном документе, где целевая последовательность для первого комплекса из пары находится на первой нити двухнитевой ДНК, а целевая последовательность для второго комплекса из пары находится на второй нити двухнитевой ДНК. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, или парные комплексы CRISPR-Cas, обсуждаемые в данном документе, где целевые последовательности первого и второго комплексов расположены близко друг от друга, так что ДНК разрезается таким способом, который облегчает гомологичную репарацию. В одном аспекте способ, изложенный в данном документе, может дополнительно включать введение в клетку ДНК-матрицы. В одном аспекте способа, изложенного в данном документе, могут подразумеваться парные комплексы CRISPR-Cas, изложенные в данном документе, где каждый комплекс CRISPR-Cas имеет фермент CRISPR, который является мутированным, так что он характеризуется не более, чем приблизительно 5% нуклеазной активности фермента CRISPR, который не является мутированным.In one aspect, the present invention provides a method of cleaving a target sequence at a genomic locus of interest, comprising delivering to a cell CRISPR-Cas complexes, or component(s) thereof, or nucleic acid molecule(s) encoding the same, wherein said nucleic acid molecule(s) are operably linked to a regulatory sequence(s) and expressed in vivo. In one aspect, the present invention provides a method as discussed herein, wherein delivery is via a lentivirus, an adenovirus, or an AAV. In one aspect, the present invention provides a method as discussed herein, or paired CRISPR-Cas complexes as discussed herein, wherein the target sequence for the first complex of the pair is on a first strand of double-stranded DNA, and the target sequence for the second complex of the pair is on a second strand of double-stranded DNA. In one aspect, the present invention provides a method as discussed herein, or paired CRISPR-Cas complexes as discussed herein, wherein the target sequences of the first and second complexes are located close to each other such that the DNA is cut in a manner that facilitates homologous repair. In one aspect, the method as set forth herein may further comprise introducing a DNA template into a cell. In one aspect, the method as set forth herein may involve paired CRISPR-Cas complexes as set forth herein, wherein each CRISPR-Cas complex has a CRISPR enzyme that is mutated such that it has no more than about 5% of the nuclease activity of a CRISPR enzyme that is not mutated.
В одном аспекте настоящего изобретения предусмотрена библиотека, способ или комплекс, обсуждаемые в данном документе, где sgRNA модифицирована так, что она имеет по меньшей мере одну некодирующую функциональную петлю, например, где по меньшей мере одна некодирующая функциональная петля является репрессорной; к примеру, где по меньшей мере одна некодирующая функциональная петля содержит Alu.In one aspect of the present invention, there is provided a library, method, or complex as discussed herein, wherein the sgRNA is modified such that it has at least one non-coding functional loop, such as wherein the at least one non-coding functional loop is repressor; such as wherein the at least one non-coding functional loop comprises Alu.
В одном аспекте настоящего изобретения предусмотрен способ изменения или модифицирования экспрессии продукта гена. Указанный способ может включать введение в клетку, содержащую и экспрессирующую молекулу ДНК, кодирующую продукт гена, сконструированной, не встречающейся в природе системы CRISPR-Cas, содержащей белок Cas и направляющую РНК, которая нацеливается на молекулу ДНК, в результате чего направляющая РНК нацеливается на молекулу ДНК, кодирующую продукт гена, а белок Cas расщепляет молекулу ДНК, кодирующую продукт гена, в результате чего экспрессия продукта гена является измененной; и где белок Cas и направляющая РНК не встречаются в природе вместе. Настоящее изобретение охватывает направляющую РНК, предусматривающую направляющую последовательность, слитую с tracr-последовательностью. Настоящее изобретение дополнительно охватывает белок Cas, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающего, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной.In one aspect, the present invention provides a method for altering or modifying the expression of a gene product. The method may comprise introducing into a cell comprising and expressing a DNA molecule encoding the gene product an engineered, non-naturally occurring CRISPR-Cas system comprising a Cas protein and a guide RNA that targets the DNA molecule, whereby the guide RNA targets the DNA molecule encoding the gene product, and the Cas protein cleaves the DNA molecule encoding the gene product, whereby expression of the gene product is altered; and wherein the Cas protein and the guide RNA do not occur together in nature. The present invention encompasses a guide RNA that includes a guide sequence fused to a tracr sequence. The present invention further encompasses a Cas protein that is codon-optimized for expression in a eukaryotic cell. In a preferred embodiment, the eukaryotic cell is a mammalian cell, and in a more preferred embodiment, the mammalian cell is a human cell. In a further embodiment of the present invention, expression of the gene product is reduced.
В настоящем изобретении также предусмотрен сконструированный белок CRISPR, комплекс, композиция, система, вектор, клетка или линия клеток, определяемые в данном документе, для применения в изменении экспрессии представляющего интерес локуса генома в клетке млекопитающего. В настоящем изобретении также предусмотрено применение сконструированного белка CRISPR, комплекса, композиции, системы, вектора, клетки или линии клеток для получения лекарственного препарата для изменения экспрессии представляющего интерес локуса генома в клетке млекопитающего. Указанное изменение предпочтительно предусматривает приведение клетки в контакт со сконструированным белком CRISPR, комплексом, композицией, системой, вектором, клеткой или линией клеток по настоящему изобретению, за счет чего осуществляется доставка вектора и обеспечивается образование комплекса CRISPR-Cas и его связывания с мишенью. Указанное изменение также предпочтительно предусматривает определение того, была ли экспрессия локуса генома изменена.The present invention also provides an engineered CRISPR protein, complex, composition, system, vector, cell or cell line as defined herein for use in altering the expression of a genomic locus of interest in a mammalian cell. The present invention also provides the use of an engineered CRISPR protein, complex, composition, system, vector, cell or cell line for the preparation of a medicament for altering the expression of a genomic locus of interest in a mammalian cell. Said alteration preferably involves contacting the cell with an engineered CRISPR protein, complex, composition, system, vector, cell or cell line of the present invention, thereby delivering the vector and allowing the formation of a CRISPR-Cas complex and its binding to a target. Said alteration also preferably involves determining whether the expression of the genomic locus has been altered.
В одном аспекте настоящего изобретения предусмотрены измененные клетки и потомство таких клеток, а также продукты, производимые клетками. Белки и системы CRISPR-Cas9 по настоящему изобретению применяют для получения клеток, содержащих модифицированный целевой локус. В некоторых вариантах осуществления способ может включать обеспечение связывания комплекса нацеливания на нуклеиновую кислоту с целевой ДНК или РНК для осуществления расщепления указанной целевой ДНК или РНК, с модифицированием тем самым целевой ДНК или РНК, где комплекс нацеливания на нуклеиновую кислоту содержит эффекторный белок для нацеливания на нуклеиновую кислоту в комплексе с направляющей РНК, гибридизированной с целевой последовательностью в пределах указанной целевой ДНК или РНК. В одном аспекте настоящего изобретения предусмотрен способ репарации локуса гена в клетке. В другом аспекте настоящего изобретения предусмотрен способ модифицирования экспрессии ДНК или РНК в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса нацеливания на нуклеиновую кислоту с ДНК или РНК, так что указанное связывание приводит к повышенной или сниженной экспрессии указанной ДНК или РНК; где комплекс нацеливания на нуклеиновую кислоту содержит эффекторный белок для нацеливания на нуклеиновую кислоту в комплексе с направляющей РНК. Аналогичные соображения и условия распространяются на способы модифицирования целевой ДНК или РНК, изложенные выше. Фактически, эти варианты отбора образцов, культивирования и повторного введения охватываются аспектами настоящего изобретения. В одном аспекте настоящего изобретения предусмотрены способы модифицирования целевой ДНК или РНК в эукариотической клетке, которые могут осуществляться in vivo, ex vivo или in vitro. В некоторых вариантах осуществления способ включает отбор клетки или популяции клеток у человека или отличного от человека животного и модификацию клетки или клеток. Культивирование можно осуществлять на любой стадии ex vivo. Такие клетки могут представлять собой без ограничения растительные клетки, клетки животного, конкретные типы клеток любого организма, в том числе стволовые клетки, иммунные клетки, T-клетку, B-клетки, дендритные клетки, клетки сердечно-сосудистой системы, эпителиальные клетки, стволовые клетки и т.п. Клетки могут быть модифицированными в соответствии с настоящим изобретением для получения продуктов гена, например, в контролируемых количествах, которые могут быть повышенными или сниженными, в зависимости от применения, и/или мутированными. В определенных вариантах осуществления локус гена в клетке является репарированным. Клетку или клетки можно даже повторно вводить отличному от человека животному или в растение. Что касается повторно вводимых клеток, может быть предпочтительным, чтобы эти клетки являлись стволовыми клетками.In one aspect, the present invention provides altered cells and progeny of such cells, as well as products produced by the cells. The CRISPR-Cas9 proteins and systems of the present invention are used to produce cells comprising a modified target locus. In some embodiments, the method may include causing a nucleic acid targeting complex to bind to a target DNA or RNA to effect cleavage of said target DNA or RNA, thereby modifying the target DNA or RNA, wherein the nucleic acid targeting complex comprises a nucleic acid targeting effector protein in complex with a guide RNA hybridized to a target sequence within said target DNA or RNA. In one aspect, the present invention provides a method of repairing a gene locus in a cell. In another aspect, the present invention provides a method of modifying the expression of DNA or RNA in a eukaryotic cell. In some embodiments, the method comprises causing a nucleic acid targeting complex to bind to DNA or RNA, such that said binding results in increased or decreased expression of said DNA or RNA; wherein the nucleic acid targeting complex comprises a nucleic acid targeting effector protein in complex with a guide RNA. Similar considerations and conditions apply to the methods of modifying a target DNA or RNA set forth above. Indeed, these sampling, culturing and reintroduction options are encompassed by aspects of the present invention. In one aspect, the present invention provides methods of modifying a target DNA or RNA in a eukaryotic cell, which can be performed in vivo, ex vivo or in vitro. In some embodiments, the method comprises selecting a cell or a population of cells from a human or non-human animal and modifying the cell or cells. The culturing can be performed at any stage ex vivo. Such cells may be, but are not limited to, plant cells, animal cells, specific cell types of any organism, including stem cells, immune cells, T cells, B cells, dendritic cells, cardiovascular cells, epithelial cells, stem cells, and the like. The cells may be modified according to the present invention to produce gene products, for example, in controlled amounts, which may be increased or decreased, depending on the application, and/or mutated. In certain embodiments, the gene locus in the cell is repaired. The cell or cells may even be reintroduced into a non-human animal or into a plant. With respect to the cells reintroduced, it may be preferable that the cells are stem cells.
В одном аспекте настоящего изобретения предусмотрены клетки, которые временно содержат системы CRISPR или их компоненты. Например, белки или ферменты CRISPR, а также нуклеиновые кислоты, временно обеспечиваются в клетке, и локус гена изменяется, после чего происходит снижение количества одного или нескольких компонентов системы CRISPR. Впоследствии клетки, потомство клеток и организмы, которые содержат клетки, которые приобрели генетическое изменение, опосредованное CRISPR, содержат сниженные количества одного или нескольких компонентов системы CRISPR, или более не содержат один или несколько компонентов системы CRISPR. Одним неограничивающим примером является самоинактивирующаяся система CRISPR-Cas, такая как дополнительно описанная в данном документе. Таким образом, в настоящем изобретении предусмотрены клетки, и организмы, и потомство клеток и организмов, которые содержат один или несколько генетических локусов, измененных под действием системы CRISPR-Cas, но, по сути, не содержащие один или несколько компонентов системы CRISPR. В определенных вариантах осуществления компоненты системы CRISPR фактически отсутствуют. Такие клетки, ткани и организмы преимущественно содержат требуемое или выбранное генетическое изменение, но утратили компоненты CRISPR-Cas или их остатки, которые потенциально могли бы действовать неспецифически, что привело бы к вопросам, касающимся безопасности, или затрудняло бы разрешение регуляторного органа. Помимо прочего, в настоящем изобретении предусмотрены продукты, производимые клетками, организмами и потомство клеток и организмов.In one aspect, the present invention provides cells that transiently contain CRISPR systems or components thereof. For example, CRISPR proteins or enzymes, as well as nucleic acids, are transiently provided to a cell and a gene locus is altered, after which a decrease in the amount of one or more components of the CRISPR system occurs. Subsequently, cells, progeny of cells, and organisms that contain cells that have acquired a CRISPR-mediated genetic change contain reduced amounts of one or more components of the CRISPR system, or no longer contain one or more components of the CRISPR system. One non-limiting example is a self-inactivating CRISPR-Cas system, such as those further described herein. Thus, the present invention provides cells and organisms, and progeny of cells and organisms that contain one or more genetic loci altered by a CRISPR-Cas system, but substantially lack one or more components of the CRISPR system. In certain embodiments, components of the CRISPR system are substantially absent. Such cells, tissues and organisms preferably contain the desired or selected genetic alteration but have lost CRISPR-Cas components or remnants thereof that could potentially act non-specifically, leading to safety concerns or complicating regulatory approval. Among other things, the present invention provides products produced by cells, organisms and progeny of cells and organisms.
В настоящем изобретении также предусмотрен способ улучшения специфичности системы CRISPR путем обеспечения сконструированного белка CRISPR в соответствии с настоящим изобретением. Предпочтительно предусмотрен сконструированный белок CRISPR, гдеThe present invention also provides a method for improving the specificity of a CRISPR system by providing an engineered CRISPR protein according to the present invention. Preferably, an engineered CRISPR protein is provided, wherein
белок объединяется в комплекс с молекулой нуклеиновой кислоты, предусматривающей РНК, с образованием комплекса CRISPR,the protein combines into a complex with a nucleic acid molecule containing RNA to form the CRISPR complex,
где, находясь в комплексе CRISPR, молекула нуклеиновой кислоты нацеливается на один или несколько целевых полинуклеотидных локусов,where, when in a CRISPR complex, a nucleic acid molecule is targeted to one or more target polynucleotide loci,
причем белок содержит по меньшей мере одну модификацию по сравнению с немодифицированным белком,wherein the protein contains at least one modification compared to the unmodified protein,
где комплекс CRISPR, содержащий модифицированный белок, характеризуется измененной активностью по сравнению с комплексом, содержащим немодифицированный белок. Указанная по меньшей мере одна модификация предпочтительно находится в доменах RuvC и/или HNH, как описано в данном документе, или в связывающей бороздке между доменами HNH и RuvC. Предпочтительные модификации представляют собой мутации, описанные в данном документе.wherein the CRISPR complex comprising the modified protein is characterized by altered activity compared to the complex comprising the unmodified protein. Said at least one modification is preferably in the RuvC and/or HNH domains as described herein, or in the binding groove between the HNH and RuvC domains. Preferred modifications are mutations described herein.
В настоящем изобретении дополнительно предусмотрено применение сконструированного белка CRISPR в соответствии с настоящим изобретением для улучшения специфичности системы CRISPR. Предпочтительно предусмотрен сконструированный белок CRISPR,The present invention further provides the use of an engineered CRISPR protein according to the present invention to improve the specificity of the CRISPR system. Preferably, an engineered CRISPR protein is provided,
где белок объединяется в комплекс с молекулой нуклеиновой кислоты, предусматривающей РНК, с образованием комплекса CRISPR,where the protein is complexed with a nucleic acid molecule containing RNA to form the CRISPR complex,
где, находясь в комплексе CRISPR, молекула нуклеиновой кислоты нацеливается на один или несколько целевых полинуклеотидных локусов,where, when in a CRISPR complex, a nucleic acid molecule is targeted to one or more target polynucleotide loci,
где белок является модифицированным, чтобы содержать по меньшей мере одну модификацию по сравнению с немодифицированным белком,wherein the protein is modified to contain at least one modification compared to the unmodified protein,
где комплекс CRISPR, содержащий модифицированный белок, характеризуется измененной активностью по сравнению с комплексом, содержащим немодифицированный белок. Указанная по меньшей мере одна модификация предпочтительно находится в доменах RuvC и/или HNH, как описано в данном документе, или в связывающей бороздке между доменами HNH и RuvC. Предпочтительные модификации представляют собой мутации, описанные в данном документе.wherein the CRISPR complex comprising the modified protein is characterized by altered activity compared to the complex comprising the unmodified protein. Said at least one modification is preferably in the RuvC and/or HNH domains as described herein, or in the binding groove between the HNH and RuvC domains. Preferred modifications are mutations described herein.
Краткое описание графических материаловBrief description of graphic materials
Новые признаки настоящего изобретения изложены с характерными особенностями в прилагаемой формуле изобретения. Лучшее понимание признаков и преимуществ настоящего изобретения будет получено при ссылке на следующее подробное описание, в котором изложены иллюстративные варианты осуществления, в которых используются принципы настоящего изобретения, и на сопутствующие графические материалы.The novel features of the present invention are set forth with characteristic features in the appended claims. A better understanding of the features and advantages of the present invention will be obtained by reference to the following detailed description, which sets forth illustrative embodiments in which the principles of the present invention are used, and to the accompanying drawings.
На фигуре 1A-1B представлена краткая схема, при этом понятно, что заявитель(заявители)/изобретатель(изобретатели) не обязательно вдаются в какую-либо конкретную теорию, изложенную в данном документе или на какой-либо конкретной фигуре, включая фигуру 1. На фигуре рассмотрена мутация положительно заряженных остатков, влияющая на связывание с не подвергаемой нацеливанию нитью gDNA, в результате чего специфичность улучшается. Данные в таблице на краткой схеме являются следующими, и касаются мутаций SpCas9:Figure 1A-1B provides a summary diagram, it being understood that the applicant(s)/inventor(s) do not necessarily commit to any particular theory set forth herein or in any particular figure, including Figure 1. The figure illustrates a mutation of positively charged residues that affects binding to the non-targetable strand of gDNA, resulting in improved specificity. The data in the table in the summary diagram are as follows, and relate to SpCas9 mutations:
В соответствии с нумерацией SpCas9 на фигуре 1A проиллюстрированы аланиновые мутации, которые улучшают специфичность, расположенные вдоль бороздки для не подвергаемой нацеливанию нити, например, Arg780, Lys810, Lys855, Lys848, Lys1003, Arg1060, Arg976, His982. Не вдаваясь в какую-либо конкретную теорию, предложенный механизм состоит в том, что нуклеазная активность является инактивированной до тех пор, пока не подвергаемая нацеливанию нить ДНК не запускает стерически изменение конформации HNH; при этом связывание не подвергаемой нацеливанию нити с бороздкой между HNH и RuvC зависит от образования пар РНК:ДНК; причем мутировавшие остатки для связывания ДНК в бороздке требуют больше энергии для правильного образования пар РНК:ДНК (фигура 1B). Применяя информацию из данного документа, включая информацию на фигуре 1, специалист может легко получить мутантов других Cas9 (например, отличных от SpCas9), которые проявляют усиленные или сниженные нецелевые эффекты. К примеру, в документах, процитированных в данном документе, представлена информация о многочисленных ортологах SpCas9 и SaCas9, которые приведены в данном документе в качестве примера. Исходя из такой информации, включая информацию о последовательности таких других Cas9, специалист в данной области, на основании информации из настоящего изобретения, легко сможет получить аналогичных мутантов со сниженными нецелевыми эффектами у ортологов Cas9, в дополнение к SpCas9 и SaCas9, которые приведены в данном документе в качестве примера. Кроме того, в документах, упомянутых в данном документе, предоставлена информация о кристаллической структуре Cas9, например SpCas9; и можно легко провести структурные сравнения между кристаллическими структурами, например, между кристаллической структурой SpCas9 и кристаллической структурой его ортолога, чтобы также легко, без неоправданных экспериментов, получить аналогичных мутантов, характеризующихся сниженными нецелевыми эффектами, у ортологов Cas9 в дополнение к SpCas9. В соответствии с этим настоящее изобретение широко применимо в отношении модификации(модификациям) или мутации(мутациям), направленных на снижение нецелевых эффектов у различных ортологов Cas9, включая без ограничения SpCas9 и SaCas9. Как дополнительно обсуждается в данном документе, можно легко обеспечить дополнительную или дальнейшую модификацию описанных выше ферментов Cas9, в результате чего фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом.In accordance with the SpCas9 numbering, Figure 1A illustrates alanine mutations that improve specificity located along the groove for the non-targetable strand, e.g., Arg780, Lys810, Lys855, Lys848, Lys1003, Arg1060, Arg976, His982. Without being bound by any particular theory, the proposed mechanism is that the nuclease activity is inactivated until the non-targetable strand of DNA triggers a steric change in the conformation of HNH; whereby binding of the non-targetable strand to the groove between HNH and RuvC depends on RNA:DNA pairing; whereby mutated residues for DNA binding in the groove require more energy for proper RNA:DNA pairing (Figure 1B). Using the information in this document, including the information in Figure 1, one skilled in the art can readily generate mutants of other Cas9s (e.g., other than SpCas9) that exhibit enhanced or reduced off-target effects. For example, the documents cited in this document provide information on numerous orthologs of SpCas9 and SaCas9, which are exemplified herein. Based on such information, including the sequence information of such other Cas9s, one skilled in the art, using the information in the present invention, can readily generate similar mutants with reduced off-target effects in Cas9 orthologs, in addition to SpCas9 and SaCas9, which are exemplified herein. In addition, the documents referenced in this document provide information on the crystal structure of Cas9s, such as SpCas9; and structural comparisons can be readily made between crystal structures, such as between the crystal structure of SpCas9 and the crystal structure of its ortholog, to also readily, without undue experimentation, obtain similar mutants characterized by reduced off-target effects in Cas9 orthologs in addition to SpCas9. Accordingly, the present invention is broadly applicable to modification(s) or mutation(s) aimed at reducing off-target effects in various Cas9 orthologs, including but not limited to SpCas9 and SaCas9. As further discussed herein, additional or further modification of the above-described Cas9 enzymes can readily be provided, resulting in an enzyme in a CRISPR complex characterized by an increased ability to modify one or more target loci compared to an unmodified enzyme.
На фигуре 2A показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Изображены 49 точечных мутантов SpCas9. Целевая последовательность EMX1.3 представляет собой последовательность гена EMX1, а активность сравнивают с активностью в отношении родственной нецелевой последовательности (OT 46).Figure 2A shows the activity of modified SpCas9 enzymes measured by % insertion/deletion formation. 49 point mutants of SpCas9 are depicted. The target sequence EMX1.3 is the EMX1 gene sequence, and the activity is compared to the activity against a related non-target sequence (OT 46).
На фигуре 2B показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Изображены 49 точечных мутантов SpCas9. Целевая последовательность представляет собой последовательность гена VEGFA, а активность сравнивают с активностью в отношении двух родственных нецелевых последовательностей (OT 1 и OT 2).Figure 2B shows the activity of modified SpCas9 enzymes measured by % insertion/deletion formation. 49 point mutants of SpCas9 are depicted. The target sequence is the VEGFA gene sequence, and the activity is compared with the activity against two related non-target sequences (OT 1 and OT 2).
На фигуре 2C показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Целевая последовательность представляет собой последовательность гена VEGFA, а активность сравнивают с активностью в отношении трех родственных нецелевых последовательностей (OT 1, OT 4 и OT 18).Figure 2C shows the activity of modified SpCas9 enzymes measured by % insertion/deletion formation. The target sequence is the VEGFA gene sequence, and the activity is compared to the activity against three related non-target sequences (OT 1, OT 4, and OT 18).
На фигуре 3 показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Изображены точечные мутанты, демонстрирующие специфичность в отношении нецелевых последовательностей. Целевые последовательности представляют собой последовательности из генов EMX1 и VEGFA, а активность сравнивают с активностью в отношении девяти родственных нецелевых последовательностей.Figure 3 shows the activity of modified SpCas9 enzymes measured by % insertion/deletion formation. Point mutants showing specificity for non-target sequences are depicted. The target sequences are sequences from the EMX1 and VEGFA genes, and the activity is compared with the activity against nine related non-target sequences.
На фигуре 4A показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Изображены двойные мутанты SpCas9. Целевая последовательность представляет собой последовательность гена EMX1, а активность сравнивают с активностью в отношении двух родственных нецелевых последовательностей.Figure 4A shows the activity of modified SpCas9 enzymes measured by % insertion/deletion formation. Double mutants of SpCas9 are shown. The target sequence is the EMX1 gene sequence, and the activity is compared to the activity toward two related non-target sequences.
На фигуре 4B показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Изображены двойные мутанты SpCas9. Целевая последовательность представляет собой последовательность генов VEGFA, а активность сравнивают с активностью в отношении трех родственных нецелевых последовательностей.Figure 4B shows the activity of modified SpCas9 enzymes measured by % insertion/deletion formation. Double mutants of SpCas9 are shown. The target sequence is the VEGFA gene sequence, and the activity is compared to the activity against three related non-target sequences.
На фигуре 5 показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Изображены 14 тройных мутантов SpCas9. Целевые последовательности представляют собой последовательности из генов EMX1 и VEGFA, а активность сравнивают с активностью в отношении четырех родственных нецелевых последовательностей (OT 46, OT 1, OT 4 и OT 18).Figure 5 shows the activity of modified SpCas9 enzymes measured by % insertion/deletion formation. Fourteen triple mutants of SpCas9 are shown. The target sequences are sequences from the EMX1 and VEGFA genes, and the activity is compared with the activity against four related non-target sequences (OT 46, OT 1, OT 4, and OT 18).
На фигуре 6 показана активность модифицированных ферментов SaCas9, измеряемая по % образования вставок/делеций. Целевая последовательность EMX101 представляет собой последовательность гена EMX1, а активность сравнивают с активностью в отношении трех родственных нецелевых последовательностей (OT1, OT2 и OT3).Figure 6 shows the activity of the modified SaCas9 enzymes measured by % insertion/deletion formation. The target sequence EMX101 is the EMX1 gene sequence, and the activity is compared with the activity against three related non-target sequences (OT1, OT2, and OT3).
На фигуре 7 показана активность модифицированных ферментов SaCas9, измеряемая по % образования вставок/делеций. Целевая последовательность EMX101 представляет собой последовательность из EMX1, а активность сравнивают с активностью в отношении родственной нецелевой последовательности (OT3).Figure 7 shows the activity of the modified SaCas9 enzymes measured by % insertion/deletion formation. The target sequence EMX101 is the sequence from EMX1, and the activity is compared to the activity against a related non-target sequence (OT3).
На фигуре 8A-8D показано филогенетическое дерево генов Cas; на основании сведений из данного документа и знаний из уровня техники мутацию(мутации) или модификацию(модификации) SpCas9 и SaCas9, приведенных в качестве примера, можно применять в отношении других Cas9.Figure 8A-8D shows a phylogenetic tree of Cas genes; based on the information in this document and the knowledge of the state of the art, the mutation(s) or modification(s) of SpCas9 and SaCas9 given as an example can be applied to other Cas9.
На фигуре 9A-9F показан филогенетический анализ, который позволил выявить пять семейств Cas9, включая три группы крупных Cas9 (~1400 аминокислот) и две группы малых Cas9 (~1100 аминокислот); на основании сведений из данного документа и знаний из уровня техники мутацию(мутации) или модификацию(модификации) SpCas9 и SaCas9, приведенных в качестве примера, можно применять в отношении других Cas9 (и, таким образом, настоящее изобретение охватывает модификацию(модификации) или мутацию(мутации), которые в данном документе приведены в качестве примера в отношении SpCas9 и SaCas9, в отношении всех Cas9 и семейств и групп Cas9, изображенных на фигуре 9).Figure 9A-9F shows a phylogenetic analysis that identified five families of Cas9, including three groups of large Cas9 (~1400 amino acids) and two groups of small Cas9 (~1100 amino acids); based on the teachings herein and the prior art, the mutation(s) or modification(s) of SpCas9 and SaCas9 exemplified herein may be applied to other Cas9s (and thus the present invention encompasses the modification(s) or mutation(s) exemplified herein with respect to SpCas9 and SaCas9 with respect to all Cas9s and the families and groups of Cas9 depicted in Figure 9).
На фигуре 10A-10D показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. На фигуре 10A-C показана активность в отношении целевых последовательностей EMX101, EMX1.1, EMX1.2, EMX1.3, EMX1.8, EMX1.10, DNMT1.1, DNMT1.2, DNMT1.4, DNMT1.7, VEGFA4, VEGFA5 и VEGFA3. На фигуре 10D показана активность в отношении VEGFA3 в сравнении с активностью в отношении нецелевой последовательности OT4.Figure 10A-10D show the activity of the modified SpCas9 enzymes as measured by % insertion/deletion formation. Figure 10A-C shows the activity against the target sequences EMX101, EMX1.1, EMX1.2, EMX1.3, EMX1.8, EMX1.10, DNMT1.1, DNMT1.2, DNMT1.4, DNMT1.7, VEGFA4, VEGFA5, and VEGFA3. Figure 10D shows the activity against VEGFA3 compared to the activity against the non-target sequence OT4.
На фигуре 11A-11D показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. На фигуре 11A-C показана активность в отношении целевых последовательностей EMX101, EMX1.1, EMX1.2, EMX1.3, EMX1.8, EMX1.10, DNMT1.1, DNMT1.2, DNMT1.4, DNMT1.7, VEGFA4, VEGFA5 и VEGFA3. На фигуре 11D показана активность в отношении VEGFA3 в сравнении с активностью в отношении нецелевой последовательности OT4.Figure 11A-11D show the activity of the modified SpCas9 enzymes as measured by % insertion/deletion formation. Figure 11A-C shows the activity against the target sequences EMX101, EMX1.1, EMX1.2, EMX1.3, EMX1.8, EMX1.10, DNMT1.1, DNMT1.2, DNMT1.4, DNMT1.7, VEGFA4, VEGFA5, and VEGFA3. Figure 11D shows the activity against VEGFA3 compared to the activity against the non-target sequence OT4.
На фигуре 12 показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Целевая последовательность представляет собой VEGFA3, а активность сравнивают с активностью в отношении четырех родственных нецелевых последовательностей (OT1, OT2, OT4 и OT18).Figure 12 shows the activity of the modified SpCas9 enzymes, measured by % insertion/deletion formation. The target sequence is VEGFA3, and the activity is compared to the activity against four related non-target sequences (OT1, OT2, OT4, and OT18).
На фигуре 13 показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Целевая последовательность представляет собой VEGFA3, а активность сравнивают с активностью в отношении четырех родственных нецелевых последовательностей (OT1, OT2, OT4 и OT18).Figure 13 shows the activity of the modified SpCas9 enzymes, measured by % insertion/deletion formation. The target sequence is VEGFA3, and the activity is compared to the activity against four related non-target sequences (OT1, OT2, OT4, and OT18).
На фигуре 14 показана активность модифицированных ферментов SpCas9, измеряемая по % образования вставок/делеций. Изображены 14 точечных мутантов SpCas9. Целевая последовательность представляет собой EMX1.3, а активность сравнивают с активностью в отношении пяти родственных нецелевых последовательностей (OT14, OT23, OE35, OT46 и OT53).Figure 14 shows the activity of modified SpCas9 enzymes measured by % insertion/deletion formation. Fourteen point mutants of SpCas9 are depicted. The target sequence is EMX1.3 and the activity is compared to the activity against five related non-target sequences (OT14, OT23, OE35, OT46 and OT53).
На фигуре 15A-15F показаны аспекты структуры SpCas9 и улучшенная специфичность. Панель A представляет собой модель раскручивания целевой последовательности. nt-Бороздка между доменами RuvC (бирюзовый) и HNH (пурпурный) стабилизирует раскручивание ДНК благодаря неспецифичным взаимодействиям с некомплементарной нитью ДНК. Взаимодействия РНК:cDNA и Cas9:ncDNA управляют раскручиванием ДНК (верхняя стрелка), конкурирующим с регибридизацией cDNA:ncDNA (нижняя стрелка). Панель B: структура SpCas9 (PDB ID 4UN3), на которой показана nt-бороздка, расположенная между доменами HNH (пурпурный) и RuvC (бирюзовый). Не подвергаемая нацеливанию нить ДНК (красный) была смоделирована внутри nt-бороздки (врезка) в ручном режиме. Панель C: скрининг точечных мутантов с аланиновыми мутациями в отношении улучшения специфичности. Панель D: оценка лучших точечных мутантов в отношении дополнительных нецелевых локусов. Пять лучших мутантов, обеспечивающих специфичность, выделены красным цветом. Панель E: у комбинационных мутантов улучшена специфичность по сравнению с мутантами с одиночными точечными мутациями. eSpCas9(1.0) и eSpCas9(1.1) выделены красным цветом. Панель F: скрининг лучших точечных мутантов и комбинационных мутантов для 10 целевых локусов в отношении эффективности целевого расщепления. SpCas9(K855A), eSpCas9(1.0) и eSpCas9(1.1) выделены красным цветом.Figure 15A–15F show aspects of the SpCas9 structure and improved specificity. Panel A is a model of target sequence unwinding. The nt-groove between the RuvC (teal) and HNH (magenta) domains stabilizes DNA unwinding through non-specific interactions with the non-complementary DNA strand. RNA:cDNA and Cas9:ncDNA interactions drive DNA unwinding (upper arrow) competing with cDNA:ncDNA rehybridization (lower arrow). Panel B: Structure of SpCas9 (PDB ID 4UN3) showing the nt-groove located between the HNH (magenta) and RuvC (teal) domains. The non-targetable DNA strand (red) was modeled within the nt-groove (inset) manually. Panel C: Screening of alanine point mutants for improved specificity. Panel D: Evaluation of the best point mutants for additional off-target loci. The top five mutants for specificity are highlighted in red. Panel E: Combination mutants have improved specificity compared to single point mutants. eSpCas9(1.0) and eSpCas9(1.1) are highlighted in red. Panel F: Screening of the best point mutants and combination mutants for 10 target loci for on-target cleavage efficiency. SpCas9(K855A), eSpCas9(1.0), and eSpCas9(1.1) are highlighted in red.
На фигуре 16A-16C показано сохранение целевой эффективности у мутантов spCas9. На панели A показана оценка эффективности целевого разрезания у мутантов SpCas9 по сравнению с SpCas9 в случае с 24 sgRNA, нацеленных на 9 локусов генома. Панель B представляет собой диаграмму Тьюки с нормализованными значениями образования целевых вставок/делеций для мутантов SpCas9(K855A), eSpCas9(1.0) и eSpCas9(1.1). Панель C представляет собой результаты вестерн-блоттинга SpCas9 и мутантов с применением антитела к SpCas9.Figure 16A-16C show the retention of target efficiency in spCas9 mutants. Panel A shows the estimated target cleavage efficiency of SpCas9 mutants compared to SpCas9 for 24 sgRNAs targeting 9 genomic loci. Panel B is a Tukey plot of normalized target insertion/deletion rates for SpCas9(K855A), eSpCas9(1.0), and eSpCas9(1.1) mutants. Panel C is the results of Western blot analysis of SpCas9 and mutants using anti-SpCas9 antibody.
На фигуре 17A-17C показана чувствительность spCas9 и мутантов K855A, eSpCas9(1.0) и eSpCas9(1.1) к одиночным и двойным несовпадениям оснований между направляющей РНК и целевой ДНК. На панели A изображены направляющие последовательности с несовпадениями в сравнении с мишенью VEGFA. На панели B представлены тепловые карты для spCas9 и трех мутантов, показывающие % вставок /делеций в случае направляющих последовательностей с несовпадением одиночного основания. На панели C показано образование вставок/делеций в случае направляющих последовательностей, содержащих последовательные пересекающиеся несовпадения. По сравнению с ферментом дикого типа: eSpCas9(1.0) содержит K810A, K1003A, R1060A; eSpCas9(1.1) содержит K848A, K1003A, R1060A.Figure 17A-17C show the sensitivity of spCas9 and the K855A, eSpCas9(1.0), and eSpCas9(1.1) mutants to single and double base mismatches between the guide RNA and the target DNA. Panel A depicts guide sequences with mismatches compared to the VEGFA target. Panel B shows heat maps for spCas9 and the three mutants showing the % insertions/deletions for guide sequences with a single base mismatch. Panel C shows the formation of insertions/deletions for guide sequences containing consecutive intersecting mismatches. Compared to the wild-type enzyme, eSpCas9(1.0) contains K810A, K1003A, R1060A; eSpCas9(1.1) contains K848A, K1003A, R1060A.
На фигуре 18A-18F показаны несмещенные полногеномные профили нецелевой активности мутантов SpCas9(K855A) и eSpCas9(1.1). Панель A представляет собой схематический обзор технологии BLESS (прямое in situ мечение разрывов, обогащение на стрептавидине и секвенирование нового поколения). На панели B показано типичное секвенирование BLESS для прямых (красные) и обратных (синие) ридов, картированных в геноме. Картирование ридов в сайтах разреза Cas9 отличается по форме от горячих точек DSB. На панелях C и D показаны Манхэттенские графики полногеномных кластеров DSB, полученные при воздействии каждого мутанта SpCas9 с применением направляющих, нацеливающихся на EMX1(1) (панель C) и VEGFA(1) (панель D). На панели E и F изображена валидация с помощью нацеленного глубокого секвенирования нецелевых сайтов, идентифицированных в BLESS. Нецелевые сайты распределяли по баллу DSB (синяя тепловая карта). Зеленые тепловые карты указывают на сходство последовательности у целевой и нецелевой последовательностей.Figure 18A–18F show unbiased genome-wide off-target activity profiles of SpCas9(K855A) and eSpCas9(1.1) mutants. Panel A is a schematic overview of the BLESS (direct in situ breakpoint labeling, streptavidin enrichment, and next-generation sequencing) technology. Panel B shows a representative BLESS sequencing run of forward (red) and reverse (blue) reads mapped to the genome. Read mapping to Cas9 cut sites differs in shape from DSB hotspots. Panels C and D show Manhattan plots of genome-wide DSB clusters generated by each SpCas9 mutant using guides targeting EMX1(1) (panel C) and VEGFA(1) (panel D). Panels E and F show validation by targeted deep sequencing of off-target sites identified in BLESS. Off-target sites were categorized by DSB score (blue heatmap). Green heatmaps indicate sequence similarity between target and off-target sequences.
На фигуре 19 показана схема sgRNA-направленного нацеливания и раскручивания ДНК. Cas9 расщепляет целевую ДНК с помощью целого ряда координированных стадий. Вначале PAM-взаимодействующий домен распознает последовательность NGG на 5'-конце целевой ДНК. После связывания PAM первые 10-12 нуклеотидов целевой последовательности (затравочная последовательность) проверяется на комплементарность sgRNA:ДНК, причем данный процесс обусловлен разделением ДНК-дуплекса. Если нуклеотиды затравочной последовательности комплементарны sgRNA, остальная ДНК раскручивается, и sgRNA по всей длине гибридизируется с целевой нитью ДНК. Согласно данной модели nt-бороздка между доменами RuvC (бирюзовый) и HNH (пурпурный) стабилизирует не подвергаемую нацеливанию нить ДНК и облегчает раскручивание благодаря неспецифическим взаимодействиям с положительными зарядами фосфатного остова ДНК. Взаимодействия РНК:cDNA и Cas9:ncDNA управляют раскручиванием ДНК (верхняя стрелка), конкурирующим с регибридизацией cDNA:ncDNA (нижняя стрелка).Figure 19 shows a schematic of sgRNA-directed DNA targeting and unwinding. Cas9 cleaves the target DNA through a series of coordinated steps. First, the PAM-interacting domain recognizes the NGG sequence at the 5′ end of the target DNA. Following PAM binding, the first 10-12 nucleotides of the target sequence (the seed sequence) are tested for sgRNA:DNA complementarity, a process mediated by separation of the DNA duplex. If the seed sequence nucleotides are complementary to the sgRNA, the remainder of the DNA is unwound and the entire length of the sgRNA hybridizes to the target DNA strand. In this model, the nt groove between the RuvC (teal) and HNH (magenta) domains stabilizes the non-targeted DNA strand and facilitates unwinding through non-specific interactions with the positive charges of the DNA phosphate backbone. RNA:cDNA and Cas9:ncDNA interactions drive DNA unwinding (upper arrow) in competition with cDNA:ncDNA rehybridization (lower arrow).
На фигуре 20 изображены электростатические свойства SpCas9, выявляющие бороздку для не подвергаемой нацеливанию нити. (A) Кристаллическая структура (4UN3) SpCas9, образующего пару с sgRNA и целевой ДНК, окрашена в соответствии с электростатическим потенциалом, чтобы выделить положительно заряженные участки. На шкале представлен диапазон от -10 до 1 кэВ. (B) Структура, идентичная таковой на панели (A), за исключением того, что домен HNH удален для выявления гетеродуплекса sgRNA:ДНК. (C) Кристаллическая структура (в той же ориентации, что и (A)), окрашенная в соответствии с доменом: HNH (пурпурный), RuvC (бирюзовый) и PAM-взаимодействующий (PI) (бежевый).Figure 20 depicts the electrostatic properties of SpCas9 revealing the groove for the non-targetable strand. (A) Crystal structure (4UN3) of SpCas9 paired with sgRNA and target DNA, colored according to electrostatic potential to highlight positively charged regions. Scale bar represents -10 to 1 keV. (B) Structure identical to that in panel (A) except that the HNH domain has been removed to reveal the sgRNA:DNA heteroduplex. (C) Crystal structure (same orientation as (A)) colored according to domain: HNH (magenta), RuvC (turquoise), and PAM-interacting (PI) (beige).
На фигурах 21A-21D показан анализ нецелевого связывания полученных мутантов. Получили двадцать девять SpCas9 точечных мутантов и тестировали их в отношении специфичности для (A) целевого сайта EMX1 и (B) двух целевых сайтов VEGFA. Мутантов, в которых скомбинированы лучшие остатки, которые улучшают специфичность, дополнительно тестировали на (C) EMX1 и (D) VEGFA.Figures 21A-21D show off-target binding analysis of the resulting mutants. Twenty-nine SpCas9 point mutants were generated and tested for specificity for (A) the EMX1 target site and (B) two VEGFA target sites. Mutants combining the best residues that improve specificity were further tested for (C) EMX1 and (D) VEGFA.
На фигуре 22A-22C представлена аннотированная аминокислотная последовательность SpCas9. Мутации SpCas9, которые изменяют заряды в бороздке для не подвергаемой нацеливанию нити, располагались преимущественно в доменах RuvC и HNH (выделены желтым). Домены RuvC (голубой), мостиковая спираль (BH, зеленый), REC (серый), HNH (пурпурный) и PI (бежевый) аннотированы как в Nishmasu et al.Figure 22A-22C shows the annotated amino acid sequence of SpCas9. SpCas9 mutations that alter charges in the groove of the non-targetable strand were located predominantly in the RuvC and HNH domains (highlighted in yellow). The RuvC (blue), bridging helix (BH, green), REC (gray), HNH (magenta), and PI (beige) domains are annotated as in Nishmasu et al.
На фигуре 23 показано сравнение специфичности K855A, eSpCas9(1.0) и eSpCas9(1.1) при применении усеченных sgRNA и отмечено, что SpCas9(1.0) и eSpCas9(1.1) преодолевают влияние усеченных sgRNA в качестве стратегии для улучшения специфичности. Частоту вставок/делеций в трех локусах (EMX1(1), VEGFA(1) и VEGFA(5)) тестировали для главных аннотированных и прогнозируемых нецелевых сайтов. В случае обоих целевых сайтов VEGFA усеченные sgRNA повышали частоту вставок/делеций в некоторых нецелевых сайтах и приводили к образованию вставок/делеций в нецелевых последовательностях, не наблюдаемых при применении последовательностей дикого типа. Количество нецелевых сайтов, обнаруживаемых с помощью NGS, для каждого мутанта SpCas9 приведено ниже тепловой карты.Figure 23 shows a comparison of the specificity of K855A, eSpCas9(1.0), and eSpCas9(1.1) using truncated sgRNAs and highlights that SpCas9(1.0) and eSpCas9(1.1) overcome the effect of truncated sgRNAs as a strategy to improve specificity. The insertion/deletion frequency at three loci (EMX1(1), VEGFA(1), and VEGFA(5)) was tested for the top annotated and predicted off-target sites. For both VEGFA target sites, the truncated sgRNAs increased the insertion/deletion frequency at some off-target sites and resulted in insertions/deletions at off-target sequences not observed with the wild-type sequences. The number of off-target sites detected by NGS for each SpCas9 mutant is shown below the heatmap.
На фигуре 24 показано, что повышение положительного заряда в nt-бороздке может приводить к повышенному расщеплению в нецелевых сайтах. Точечные мутанты SpCas9(S845K) и SpCas9(L847R) проявляли меньшую специфичность, чем SpCas9 дикого типа в целевом сайте EMX1(1).Figure 24 shows that increasing the positive charge in the nt groove can lead to increased cleavage at off-target sites. Point mutants SpCas9(S845K) and SpCas9(L847R) exhibited lower specificity than wild-type SpCas9 at the EMX1(1) target site.
На фигурах 25A-25D изображено получение eSaCas9 посредством мутагенеза nt-бороздки. Версию SaCas9 с улучшенной специфичностью получали аналогично eSpCas9. (A,B) Мутантов по одиночным и двойным аминокислотным остаткам в бороздке между доменами RuvC и HNH подвергали скринингу в отношении сниженного нецелевого разрезания. (C) Мутантов с улучшенной специфичностью комбинировали с получением варианта SaCas9, который сохранял целевое разрезание сайта 7 EMX и характеризовался значительно сниженным нецелевым разрезанием. (D) Кристаллическая структура SaCas9, показывающая бороздку между доменами HNH и RuvC.Figures 25A-25D depict the generation of eSaCas9 by nt-groove mutagenesis. A version of SaCas9 with improved specificity was generated similarly to eSpCas9. (A,B) Single and double amino acid residue mutants in the groove between the RuvC and HNH domains were screened for reduced off-target cleavage. (C) The mutants with improved specificity were combined to generate a SaCas9 variant that retained on-target cleavage of EMX site 7 and had significantly reduced off-target cleavage. (D) Crystal structure of SaCas9 showing the groove between the HNH and RuvC domains.
На фигуре 26 показано определение характеристик целевой эффективности для определенных мутантов с улучшенной специфичностью. Три мутанта SpCas9 имели мутации в петле захвата фосфата (Lys1107, Glu1108, Ser1109) в домене PI, которые придавали специфичность к основаниям 1 и 2 sgRNA, проксимальным относительно PAM. Они включали точечный мутант (K1107A) и два мутанта, у которых последовательность Lys-Glu-Ser была замещена дипептидами Lys-Gly (KG) и Gly-Gly (GG) соответственно. Данные, полученные авторами настоящего изобретения, указывают на то, что эти мутанты могут значительно снижать эффективность целевого расщепления.Figure 26 shows the determination of target efficiency characteristics for certain mutants with improved specificity. Three SpCas9 mutants had mutations in the phosphate acquisition loop (Lys1107, Glu1108, Ser1109) in the PI domain that conferred specificity to bases 1 and 2 of the sgRNA proximal to the PAM. These included a point mutant (K1107A) and two mutants in which the Lys-Glu-Ser sequence was replaced by the dipeptides Lys-Gly (KG) and Gly-Gly (GG), respectively. Our data indicate that these mutants can significantly reduce the efficiency of target cleavage.
На фигуре 27 показано, что eSpCas9(1.1) не является цитотоксичным для клеток человека. Клетки HEK293T трансфицировали с помощью фермента WT или eSpCas9(1.1) и инкубировали в течение 72 часов перед измерением жизнеспособности клеток с применением анализа CellTiter-Glo, при котором флуоресценция обнаруживается вследствие образования ATP в живых клетках.Figure 27 shows that eSpCas9(1.1) is not cytotoxic to human cells. HEK293T cells were transfected with WT or eSpCas9(1.1) enzyme and incubated for 72 hours before cell viability was measured using the CellTiter-Glo assay, which detects fluorescence due to ATP production in living cells.
На фигуре 28 показан анализ мутантов по Nt-бороздке с применением усеченных направляющих РНК. Усеченные направляющие РНК (Tru) комбинировали с мутантами SpCas9 по одиночной аминокислоте и нацеливали на (A) EMX1(1) или (B) VEGFA(1). В то время как большинство мутантов, нацеленных на EMX1 с применением направляющей длиной 18 нуклеотидов, сохраняли целевую эффективность, мутанты, нацеленные на VEGFA(1) с применением направляющей длиной 17 нуклеотидов, были существенно ослаблены.Figure 28 shows analysis of Nt groove mutants using truncated guide RNAs. Truncated guide RNAs (Tru) were combined with single amino acid mutants of SpCas9 and targeted (A) EMX1(1) or (B) VEGFA(1). While most mutants targeting EMX1 using an 18-nt guide retained targeting efficiency, mutants targeting VEGFA(1) using a 17-nt guide were significantly attenuated.
На фигурах 29A-29B показаны выбранные мутанты по одиночным и двойным аминокислотным остаткам. Как и в случае SpCas9, уменьшение числа положительных зарядов в бороздке для не подвергаемой нацеливанию нити усиливает специфичность. Уменьшения числа положительных зарядов можно достичь путем замены положительно заряженных аминокислот на нейтральные или отрицательно заряженные аминокислоты (A) или путем смещения положения положительно заряженной аминокислоты внутри бороздки (B). Представляющим интерес мутантом является K572.Figures 29A-29B show selected single and double amino acid residue mutants. As in the case of SpCas9, reducing the number of positive charges in the groove on the non-targetable strand enhances specificity. Reducing the number of positive charges can be achieved by replacing positively charged amino acids with neutral or negatively charged amino acids (A) or by shifting the position of the positively charged amino acid within the groove (B). The mutant of interest is K572.
На фигуре 30 показана улучшенная специфичность выбранных мутантов. CM2 проявляет сильное снижение нецелевой активности при полном сохранении целевой активности. CM1: R499A; Q500K; K572A. CM2: R499A; Q500K; R654A; G655R. CM3: K572A; R654A; G655R.Figure 30 shows the improved specificity of the selected mutants. CM2 exhibits a strong reduction in off-target activity while fully maintaining on-target activity. CM1: R499A; Q500K; K572A. CM2: R499A; Q500K; R654A; G655R. CM3: K572A; R654A; G655R.
На фигуре 31 показана активация локуса гамма-глобина HBG1 с помощью комплексов spCas9 или мутантов spCas9 с направляющими длиной 15 п. о., 17 п. о. и 20 п. о. Cas9 (px165) представляет собой не подвергнутый мутированию spCas9. dCas9 обозначает неактивный spCas9. Изображенные одиночные мутанты ("SM") представляют собой R780A, K810A и K848A. Изображенные двойные мутанты ("SM") представляют собой R780A/K810A и R780A/K855A.Figure 31 shows activation of the HBG1 gamma globin locus by spCas9 complexes or spCas9 mutants with 15 bp, 17 bp, and 20 bp guides. Cas9(px165) represents unmutated spCas9. dCas9 denotes inactive spCas9. The single mutants ("SM") shown are R780A, K810A, and K848A. The double mutants ("SM") shown are R780A/K810A and R780A/K855A.
На фигуре 32 показано сравнение различных программируемых нуклеазных платформ.Figure 32 shows a comparison of different programmable nuclease platforms.
На фигуре 33 показаны типы терапевтических модификаций генома. Конкретный тип терапии с применением редактирования генома зависит от природы мутации, вызывающей заболевание. a. В случае нарушения функционирования гена патогенную функцию белка подвергают сайленсингу путем нацеливания на локус с осуществлением NHEJ. Образование вставок/делеций в представляющем интерес гене часто приводит к мутациям по типу сдвига рамки считывания, которые обусловливают преждевременные стоп-кодоны и нефункциональный белковый продукт или нонсенс-опосредованный распад транскриптов, что приводит к супрессии функции гена. b. Коррекцию гена, опосредованную HDR, можно применять, чтобы скорректировать вредную мутацию. Образование DSB запланировано вблизи сайта мутации в присутствии обеспечиваемой экзогенно корректирующей матрицы для HDR. HDR-репарация сайта разрыва с помощью экзогенной матрицы корректирует мутацию, восстанавливая функцию гена. c. Альтернативой для коррекции гена является добавление гена. При этом методе лечения в безопасный локус генома вводят терапевтический трансген. Образование DSB запланировано в безопасном локусе, а матрицу для HDR, характеризующуюся гомологией с сайтом разрыва, промотор и трансген вводят в ядро. При HDR-репарации происходит копирование кассеты с промотором-трансгеном в безопасный локус, при этом функция гена восстанавливается, хотя и без истинного физиологического контроля над экспрессией гена.Figure 33 shows the types of therapeutic genome modifications. The specific type of genome editing therapy depends on the nature of the disease-causing mutation. a. In the case of a gene dysfunction, the pathogenic protein function is silenced by targeting the locus with NHEJ. Insertion/deletion formation in the gene of interest often results in frameshift mutations that result in premature stop codons and a nonfunctional protein product or nonsense-mediated transcript decay, resulting in suppression of gene function. b. HDR-mediated gene correction can be used to correct a deleterious mutation. DSB formation is targeted near the site of the mutation in the presence of an exogenously provided HDR correction template. HDR repair of the breakpoint with the exogenous template corrects the mutation, restoring gene function. c. An alternative to gene correction is gene addition. In this treatment, a therapeutic transgene is introduced into a safe locus in the genome. The DSB is targeted at the safe locus, and an HDR template with homology to the breakpoint, a promoter, and a transgene are introduced into the nucleus. HDR repair copies the promoter-transgene cassette into the safe locus, restoring gene function, albeit without true physiological control over gene expression.
На фигуре 34 показана терапия с применением редактирования ex vivo и in vivo. В случае терапии с применением редактирования ex vivo проводят отбор клеток у человека, редактируют их и затем повторно пересаживают (верхняя панель). Чтобы данный метод терапии был успешным, целевые клетки должны обладать способностью выживать вне организма и попадать обратно в целевые ткани после трансплантации. Терапия in vivo предусматривает редактирование генома клеток in situ (нижние панели). В случае системной терапии in vivo средства доставки, которые являются относительно нейтральными относительно вида или состояния клеток, будут применяться для осуществления редактирования в широком диапазоне типов тканей. Хотя этот метод терапии с редактированием может стать осуществимым в будущем, в настоящее время не существует систем доставки, которые являются достаточно эффективными, чтобы сделать его практически осуществимым. Нацеленная терапия in vivo, при которой пациентам вводят средства доставки, обладающие тропизмом к конкретным системам органов, является практически осуществимой с применением клинически значимых вирусных векторов.Figure 34 shows ex vivo and in vivo editing therapies. In ex vivo editing therapies, cells are collected from a person, edited, and then replanted (upper panel). For this therapy to be successful, the target cells must be able to survive outside the body and be rehomed into target tissues after transplantation. In vivo therapies involve editing the genome of cells in situ (lower panels). In vivo systemic therapies, delivery vehicles that are relatively cell-species or state-neutral would be used to deliver editing to a wide range of tissue types. Although this type of editing therapy may be feasible in the future, there are currently no delivery systems that are efficient enough to make it practical. In vivo targeted therapies, in which patients are administered delivery vehicles that have tropism for specific organ systems, are practical using clinically relevant viral vectors.
На фигурах 35A-35B показано схематическое изображение генной терапии с помощью векторов для гомологичной рекомбинации (HR) с применением Cas9.Figures 35A-35B show a schematic representation of gene therapy using homologous recombination (HR) vectors using Cas9.
На фигуре 36 представлена схема прикрепления сахаров для направленной доставки белка или направляющей, в частности с помощью GalNac.Figure 36 shows a diagram of the attachment of sugars for targeted delivery of a protein or guide, in particular using GalNac.
На фигурах 37A, 37B и 37C совместно проиллюстрировано выравнивание последовательностей SaCas9 и SpCas9. Аннотации доменов RUVC и HNH этих двух белков также показаны на данных трех фигурах.Figures 37A, 37B, and 37C together illustrate the sequence alignment of SaCas9 and SpCas9. The annotations of the RUVC and HNH domains of these two proteins are also shown in these three figures.
Фигуры приведены в данном документе только с целью иллюстрации, и они необязательно изображены в масштабе.The figures shown in this document are for illustrative purposes only and are not necessarily drawn to scale.
Подробное описание изобретенияDetailed description of the invention
Перед тем как описать способы по настоящему изобретению, следует отметить, что настоящее изобретение не ограничивается конкретными описанными способами, компонентами, продуктами или комбинациями, поскольку такие способы, компоненты, продукты и комбинации, без сомнения, могут варьироваться. Также следует отметить, что терминология, применяемая в данном документе, не подразумевается как ограничивающая, поскольку объем настоящего изобретения будет ограничиваться только прилагаемой формулой изобретения.Before describing the methods of the present invention, it should be noted that the present invention is not limited to the specific methods, components, products or combinations described, as such methods, components, products and combinations may, of course, vary. It should also be noted that the terminology used herein is not intended to be limiting, as the scope of the present invention will be limited only by the appended claims.
Используемые в данном документе формы единственного числа включают ссылки на объекты как в единственном, так и множественном числе, если из контекста явно не следует иное.As used herein, the singular forms "a" and "an" include references to both singular and plural entities unless the context clearly requires otherwise.
Используемые в данном документе термины "содержащий", "содержит" и "содержащийся" являются синонимами "включающий", "включает" или "охватывающие", "охватывает", и являются включительными или неограничивающими и не исключают дополнительные, неупомянутые части, элементы или стадии способов. Следует понимать, что используемые в данном документе термины "содержащий", "содержит" и "содержащийся" предусматривают термины "состоящий из", "состоит" и "состоит из", а также термины "состоящий, по сути, из", "состоит по сути" и "состоит, по сути, из". Следует отметить, что в настоящем изобретении и, в частности, в формуле изобретения и/или параграфах такие термины, как "содержит", "содержащийся", "содержащий" и т.п., могут иметь значение, приписываемое им в патентном законодательстве США, например, они могут означать "включает", "включенный", "включающий" и т.п., и что такие термины, как "состоящий, по сути, из" и "состоит, по сути, из" имеют значение, приписываемое им в патентном законодательстве США, например, они допускают не указанные в явной форме элементы, но исключают элементы, которые встречаются в известном уровне техники или которые влияют на основные или новые характеристики настоящего изобретения. При осуществлении настоящего изобретения на практике предпочтительным является соответствие статье 53(c) EPC и правилу 28(b), а также (c) EPC. Ничто из содержащегося в данном документе не предполагается как обязательство.As used herein, the terms "comprising," "comprises," and "contained" are synonymous with "including," "includes," or "comprising," "comprises," and are inclusive or open-ended and do not exclude additional, unreferenced parts, elements, or method steps. It should be understood that as used herein, the terms "comprising," "comprises," and "contained" include the terms "consisting of," "consists of," and "consists of," as well as the terms "consisting essentially of," "consists essentially of," and "consists essentially of." It should be noted that in the present invention, and in particular in the claims and/or paragraphs, terms such as "comprises," "comprised," "comprising," etc. may have the meaning ascribed to them in the U.S. patent law, for example, they may mean "includes," "included," "including," etc., and that terms such as "consisting essentially of" and "consists essentially of" have the meaning ascribed to them in the U.S. patent law, for example, they allow for elements not expressly stated, but exclude elements that are found in the prior art or that affect the essential or novel characteristics of the present invention. In practicing the present invention, compliance with Article 53(c) EPC and Rule 28(b) as well as (c) EPC is preferred. Nothing contained herein is intended as an obligation.
Описание диапазона числовых значение с помощью крайних точек подразумевает все числа и дробные числа, относящиеся к соответствующим диапазонам, а также указанные крайние точки.Describing a range of numeric values using endpoints includes all numbers and fractions that fall within the ranges, as well as the endpoints specified.
Подразумевается, что используемый в данном документе термин "приблизительно" или "примерно" при ссылке на измеряемую величину, такую как параметр, количество, промежуток времени и т.п., охватывает изменения, составляющие +/-20% или меньше, предпочтительно +/-10% или меньше, более предпочтительно +/-5% или меньше, и еще более предпочтительно +/-1% или меньше, от указанного значения, в той степени, в которой такие изменения подходят для осуществления в раскрытом изобретении. Следует понимать, что значение, к которому относится модификатор "приблизительно" или "примерно", также раскрыто специально, и предпочтительно, само по себе.As used herein, the term "about" or "approximately" when referring to a measurable quantity such as a parameter, quantity, time period, etc., is intended to encompass variations of +/- 20% or less, preferably +/- 10% or less, more preferably +/- 5% or less, and even more preferably +/- 1% or less, from the stated value, to the extent that such variations are suitable for implementation in the disclosed invention. It should be understood that the value to which the modifier "about" or "approximately" refers is also specifically disclosed, and preferably, on its own.
Несмотря на то, что термины "один или несколько" или "по меньшей мере один", как, например, один или несколько или по меньшей мере один элемент(элементы) из группы элементов, понятны сами по себе в виде дальнейших примеров, данный термин охватывает, помимо прочего, ссылку на любой из указанных элементов, или на любые два или более указанных элементов, таких как, например, любые ≥3, ≥4, ≥5, ≥6 или ≥7 и т.д. указанных элементов и вплоть до всех указанных элементов.Although the terms "one or more" or "at least one", such as one or more or at least one element(s) of a group of elements, are self-explanatory in further examples, the term encompasses, inter alia, a reference to any one of the said elements, or to any two or more of the said elements, such as, for example, any ≥3, ≥4, ≥5, ≥6 or ≥7 etc. of the said elements, up to and including all of the said elements.
Все ссылки, процитированные в настоящем описании, тем самым включены посредством ссылки во всей своей полноте. В частности, специально указано, что идеи из всех литературных источников в данном документе, включены посредством ссылки.All references cited in this disclosure are hereby incorporated by reference in their entirety. In particular, it is expressly indicated that the teachings of all literature references in this document are incorporated by reference.
Если не определено иное, все термины, применяемые в раскрытии настоящего изобретения, включая технические и научные термины, имеют значение, которое обычно понятно среднему специалисту в области, к которой принадлежит настоящее изобретение. С помощью дополнительного руководства включены определения терминов для лучшего понимания идеи настоящего изобретения.Unless otherwise defined, all terms used in the disclosure of the present invention, including technical and scientific terms, have the meaning commonly understood by one of ordinary skill in the art to which the present invention pertains. Definitions of terms are included for additional guidance to better understand the concept of the present invention.
В следующих частях различные аспекты настоящего изобретения определены более подробно. Каждый аспект, определенный таким образом, может быть скомбинирован с любым другим аспектом или аспектами, если явно не указано обратное. В частности, любой признак, обозначенный как являющийся предпочтительным или преимущественным, может быть скомбинирован с любым другим признаком или признаками, обозначенными как являющиеся предпочтительными или преимущественными.In the following sections, various aspects of the present invention are defined in more detail. Each aspect so defined may be combined with any other aspect or aspects, unless expressly stated otherwise. In particular, any feature indicated as being preferred or advantageous may be combined with any other feature or features indicated as being preferred or advantageous.
Стандартные справочные издания, излагающие общие принципы технологии рекомбинантной ДНК, включают Molecular Cloning: A Laboratory Manual, 2nd ed., vol. 1-3, ed. Sambrook et al., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989; Current Protocols in Molecular Biology, ed. Ausubel et al., Greene Publishing and Wiley-Interscience, New York, 1992 (с периодическими поправками) ("Ausubel et al. 1992"); серию Methods in Enzymology (Academic Press, Inc.); Innis et al., PCR Protocols: A Guide to Methods and Applications, Academic Press: San Diego, 1990; PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995); Harlow and Lane, eds. (1988) Antibodies, a Laboratory Manual; and Animal Cell Culture (R.I. Freshney, ed. (1987). Общие принципы микробиологии изложены, например, в Davis, B. D. et al., Microbiology, 3rd edition, Harper & Row, publishers, Philadelphia, Pa. (1980).Standard reference works covering the general principles of recombinant DNA technology include Molecular Cloning: A Laboratory Manual, 2nd ed., vol. 1–3, ed. Sambrook et al., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989; Current Protocols in Molecular Biology, ed. Ausubel et al., Greene Publishing and Wiley-Interscience, New York, 1992 (with periodic revisions) ("Ausubel et al. 1992"); the Methods in Enzymology series (Academic Press, Inc.); Innis et al., PCR Protocols: A Guide to Methods and Applications, Academic Press: San Diego, 1990; PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995); Harlow and Lane, eds. (1988) Antibodies, a Laboratory Manual; and Animal Cell Culture (R.I. Freshney, ed. (1987). General principles of microbiology are presented, for example, in Davis, B. D. et al., Microbiology, 3rd edition, Harper & Row, publishers, Philadelphia, Pa. (1980).
Ссылка на протяжении всего настоящего описания на "один вариант осуществления" или "вариант осуществления" означает, что конкретный признак, структура или характеристика, описанные в связи с вариантом осуществления, включены по меньшей мере в один вариант осуществления настоящего изобретения. Таким образом, при появлении фраз "в одном варианте осуществления" или "в варианте осуществления" в различных местах на протяжении настоящего описания, не обязательно все они ссылаются на один и тот же вариант осуществления, но могут и ссылаться. Более того, конкретные признаки, структуры или характеристики могут быть скомбинированы любым подходящим способом, как будет очевидно для специалиста в данной области на основании настоящего изобретения, в одном или нескольких вариантах осуществления. Более того, хотя некоторые варианты осуществления, описанные в данном документе, включают некоторые, но не другие признаки, включенные в другие варианты осуществления, подразумевается, что комбинации признаков из различных вариантов осуществления находятся в пределах объема настоящего изобретения и образуют различные варианты осуществления, как будет понятно специалистам в данной области. Например, в прилагаемой формуле изобретения любой из заявленных вариантов осуществления может применяться в любой комбинации.Reference throughout this specification to "one embodiment" or "an embodiment" means that a particular feature, structure, or characteristic described in connection with the embodiment is included in at least one embodiment of the present invention. Thus, when the phrases "in one embodiment" or "in an embodiment" appear in various places throughout this specification, they are not necessarily all referring to the same embodiment, but may be. Moreover, particular features, structures, or characteristics may be combined in any suitable manner, as would be apparent to one skilled in the art based on the present invention, in one or more embodiments. Moreover, although some embodiments described herein include some, but not other, features included in other embodiments, it is intended that combinations of features from different embodiments are within the scope of the present invention and form different embodiments, as would be appreciated by those skilled in the art. For example, in the appended claims, any of the claimed embodiments may be used in any combination.
В данном описании настоящего изобретения сделана ссылка на сопровождающие фигуры, которые образуют его часть и в которых показаны для иллюстрации только конкретные варианты осуществления, с помощью которых настоящее изобретение может быть осуществлено на практике. Следует понимать, что могут использоваться другие варианты осуществления и структурные или логические изменения могут осуществляться без отступления от объема настоящего изобретения. Описание, следовательно, не следует понимать в ограничивающем смысле, и объем настоящего изобретения определяется прилагаемой формулой изобретения.In this description of the present invention, reference is made to the accompanying figures which form a part hereof and which show by way of illustration only specific embodiments by which the present invention may be carried out in practice. It is to be understood that other embodiments may be used and structural or logical changes may be made without departing from the scope of the present invention. The description is therefore not to be understood in a limiting sense and the scope of the present invention is defined by the appended claims.
Целью настоящего изобретения не является охват в пределах настоящего изобретения любого ранее известного продукта, способа получения продукта или способа применения продукта, так что заявители оставляют за собой право и настоящим объявляют отказ от прав на любой ранее известный продукт, процесс или способ. Следует дополнительно отметить, что настоящее изобретение не предназначено охватывать в пределах объема настоящего изобретения любой продукт, способ получения продукта или способ применения продукта, который не соответствует письменному описанию и требованиям достаточного раскрытия сути изобретения USPTO (первый пункт § 112 статьи 35 USC) или EPO (статья 83 EPC), так что заявители оставляют за собой право и настоящим объявляют отказ от прав на любой ранее описанный продукт, способ получения продукта или способ применения продукта.It is not the intent of the present invention to cover within the scope of the present invention any previously known product, process for making a product, or method of using a product, so applicants reserve the right to and hereby disclaim any previously known product, process, or method. It should be further noted that the present invention is not intended to cover within the scope of the present invention any product, process for making a product, or method of using a product that does not conform to the written description and sufficient disclosure requirements of the USPTO (first paragraph of 35 USC § 112) or the EPO (EPC Article 83), so applicants reserve the right to and hereby disclaim any previously described product, process for making a product, or method of using a product.
Предпочтительные утверждения (признаки) и варианты осуществления настоящего изобретения изложены в данном документе ниже. Каждое из утверждений и вариантов осуществления настоящего изобретения, определенных таким образом, может быть скомбинировано с любым другим утверждением и/или вариантом осуществления, если явно не указано обратное. В частности, любой признак, обозначенный как являющийся предпочтительным или преимущественным, может быть скомбинирован с любым другим признаком или признаками или утверждениями, обозначенными как являющиеся предпочтительными или преимущественными.Preferred statements (features) and embodiments of the present invention are set forth herein below. Each of the statements and embodiments of the present invention so defined may be combined with any other statement and/or embodiment unless explicitly stated otherwise. In particular, any feature indicated as being preferred or advantageous may be combined with any other feature or features or statements indicated as being preferred or advantageous.
Используемый в данном документе термин "организм, отличный от человека" или "клетка организма, отличного от человека" обозначает организм, иной чем Homo sapiens, или клетку, не происходящую от него. Используемый в данном документе термин "эукариотический организм, отличный от человека" или "клетка эукариотического организма, отличного от человека" обозначает эукариотический организм, иной чем Homo sapiens, или клетку, полученную не от него. В предпочтительных вариантах осуществления такой эукариотический организм (клетка) представляет собой отличное от человека животное (клетку), как, например, (клетку или популяцию клеток) из отличного от человека млекопитающего, отличного от человека примата, копытного, грызуна (предпочтительно мыши или крысы), кролика, представителя псовых, собаки, коровы, представителя бычьих, овцы, представителя овечьих, козы, свиньи, представителя дикой птицы, представителя домашней птицы, курицы, рыбы, насекомого или членистоногого, предпочтительно млекопитающего, такого как грызун, в частности, мыши. В некоторых вариантах осуществления настоящего изобретения организм, или субъект, или клетка могут представлять собой (клетка или популяция клеток получены из) членистоногое, к примеру, насекомое, или нематоду. В некоторых способах по настоящему изобретению организм, или субъект, или клетка являются растением (клеткой). В некоторых способах по настоящему изобретению организм, или субъект, или клетка являются (получены из) водорослью, включая микроскопическую водоросль, или грибом. Специалист в данной области будет понимать, что эукариотические клетки, которые можно трансплантировать или вводить в эукариотический организм, отличный от человека, в соответствии со способами, упоминаемыми в данном документе, предпочтительно получены или происходят из того же вида, что и эукариотический организм, в который их трансплантируют. Например, клетку мыши трансплантируют в организм мыши в определенном варианте осуществления в соответствии со способами по настоящему изобретению, описываемыми в данном документе. В определенных вариантах осуществления эукариотический организм представляет собой эукариотический организм с ослабленной иммунной системой, т.е. эукариотический организм, у которого иммунная система частично или полностью отключена. К примеру, в способах в соответствии с настоящим изобретением могут применяться мыши с ослабленной иммунной системой, описываемые в данном документе. Примеры мышей с ослабленной иммунной системой включают без ограничения "голых" мышей, мышей RAG -/-, мышей SCID (с тяжелым комбинированным иммунодефицитом), мышей SCID-Beige, мышей NOD (с инсулинзависимым диабетом)-SCID, мышей NOG или NSG и т.д.As used herein, the term "non-human organism" or "cell of a non-human organism" means an organism other than Homo sapiens or a cell not derived from such organism. As used herein, the term "non-human eukaryotic organism" or "cell of a non-human eukaryotic organism" means a eukaryotic organism other than Homo sapiens or a cell not derived from such organism. In preferred embodiments, such a eukaryotic organism (cell) is a non-human animal (cell), such as (a cell or population of cells) from a non-human mammal, a non-human primate, an ungulate, a rodent (preferably a mouse or rat), a rabbit, a canine, a dog, a cow, a bovine, a sheep, an ovine, a goat, a pig, a wild bird, a poultry, a chicken, a fish, an insect, or an arthropod, preferably a mammal such as a rodent, in particular a mouse. In some embodiments of the present invention, the organism or subject or cell may be (a cell or population of cells is derived from) an arthropod, such as an insect, or a nematode. In some methods of the present invention, the organism or subject or cell is a plant (cell). In some methods of the present invention, the organism or subject or cell is (is derived from) an alga, including a microscopic alga, or a fungus. One skilled in the art will appreciate that eukaryotic cells that can be transplanted or introduced into a non-human eukaryotic organism according to the methods mentioned herein are preferably obtained or derived from the same species as the eukaryotic organism into which they are transplanted. For example, a mouse cell is transplanted into a mouse in a certain embodiment according to the methods of the present invention described herein. In certain embodiments, the eukaryotic organism is an immunocompromised eukaryotic organism, i.e., a eukaryotic organism in which the immune system is partially or completely disabled. For example, the immunocompromised mice described herein can be used in the methods of the present invention. Examples of mice with a weakened immune system include, but are not limited to, nude mice, RAG -/- mice, SCID (severe combined immunodeficiency) mice, SCID-Beige mice, NOD (insulin-dependent diabetes)-SCID mice, NOG or NSG mice, etc.
Будет понятно, что система CRISPR-Cas, описываемая в данном документе, не встречается в природе в указанной клетке, т. e. является сконструированной или экзогенной относительно указанной клетки. Система CRISPR-Cas, упоминаемая в данном документе, была введена в указанную клетку. Способы введения системы CRISPR-Cas в клетку известны из уровня техники, и они дополнительно описаны в других разделах данного документа. Клетка, содержащая систему CRISPR-Cas, или имеющая введенную систему CRISPR-Cas, в соответствии с настоящим изобретением предусматривает или способна к экспрессии отдельных компонентов системы CRISPR-Cas для создания функционального комплекса CRISPR, способного модифицировать (как, например, расщеплять) целевую последовательность ДНК. В соответствии с этим, как упоминается в данном документе, клетка, содержащая систему CRISPR-Cas, может представлять собой клетку, содержащую отдельные компоненты системы CRISPR-Cas для создания функционального комплекса CRISPR, способного модифицировать (как, например, расщеплять) целевую последовательность ДНК. Альтернативно как упоминается в данном документе, и предпочтительно, клетка, содержащая систему CRISPR-Cas, может представлять собой клетку, содержащую одну или несколько молекул нуклеиновой кислоты, кодирующих отдельные компоненты системы CRISPR-Cas, которые могут экспрессироваться в клетке для создания функционального комплекса CRISPR, способного модифицировать (как, например, расщеплять) целевую последовательность ДНК.It will be understood that the CRISPR-Cas system described herein does not naturally occur in the cell in question, i.e., is engineered or exogenous to the cell in question. The CRISPR-Cas system referred to herein has been introduced into the cell in question. Methods for introducing a CRISPR-Cas system into a cell are known in the art and are further described elsewhere in this document. A cell comprising a CRISPR-Cas system or having an introduced CRISPR-Cas system according to the present invention comprises or is capable of expressing individual components of the CRISPR-Cas system to create a functional CRISPR complex capable of modifying (such as cleaving) a target DNA sequence. Accordingly, as mentioned herein, a cell comprising a CRISPR-Cas system may be a cell comprising individual components of a CRISPR-Cas system for creating a functional CRISPR complex capable of modifying (such as cleaving) a target DNA sequence. Alternatively, as mentioned herein, and preferably, a cell comprising a CRISPR-Cas system may be a cell comprising one or more nucleic acid molecules encoding individual components of a CRISPR-Cas system that can be expressed in the cell for creating a functional CRISPR complex capable of modifying (such as cleaving) a target DNA sequence.
Используемый в данном документе термин "crRNA", или "направляющая РНК", или "одиночная направляющая РНК", или "sgRNA", или "один или несколько компонентов на основе нуклеиновой кислоты" эффекторного белка локуса CRISPR-Cas V типа или VI типа предусматривает любую полинуклеотидную последовательность, характеризующуюся достаточной комплементарностью с целевой последовательностью нуклеиновой кислоты для гибридизации с целевой последовательностью нуклеиновой кислоты и управления специфичным к последовательности связыванием комплекса нацеливания на нуклеиновую кислоту с целевой последовательностью нуклеиновой кислоты. В некоторых вариантах осуществления при оптимальном выравнивании с применением подходящего алгоритма выравнивания степень комплементарности составляет приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% или больше. Оптимальное выравнивание можно определять с применением любого подходящего алгоритма для выравнивания последовательностей, к неограничивающим примерам которого относится алгоритм Смита-Ватермана, алгоритм Нидлмана-Вунша, алгоритмы, основанные на преобразовании Барроуза-Уилера (например, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies; доступный на сайте www.novocraft.com), ELAND (Illumina, Сан-Диего, Калифорния), SOAP (доступный на сайте soap.genomics.org.cn) и Maq (доступный на сайте maq.sourceforge.net). Способность направляющей последовательности (в рамках направляющей РНК для нацеливания на нуклеиновую кислоту) управлять специфичным к последовательности связыванием комплекса нацеливания на нуклеиновую кислоту с целевой последовательностью нуклеиновой кислоты можно оценивать с помощью любого подходящего анализа. Например, компоненты системы CRISPR для нацеливания на нуклеиновую кислоту, достаточные для образования комплекса нацеливания на нуклеиновую кислоту, в том числе направляющая последовательность, подлежащую тестированию, могут обеспечиваться в клетке-хозяине, имеющей соответствующую целевую последовательность нуклеиновой кислоты, как, например, с помощью трансфекции векторами, кодирующими компоненты комплекса нацеливания на нуклеиновую кислоту, с последующей оценкой предпочтительного нацеливания (например, расщепления) в пределах целевой последовательности нуклеиновой кислоты, как, например, с помощью анализа с использованием нуклеазы Surveyor, описываемого в данном документе. Аналогично, расщепление целевой последовательности нуклеиновой кислоты можно определять в пробирке путем обеспечения целевой последовательности нуклеиновой кислоты, компонентов комплекса нацеливания на нуклеиновую кислоту, в том числе направляющей последовательности, подлежащей тестированию, и контрольной направляющей последовательности, отличной от тестируемой направляющей последовательности, и сравнения связывания или степени расщепления целевой последовательности в случае реакций с тестируемой и контрольной направляющей последовательностью. Возможны и другие анализы, и они могут быть выполнены специалистами в данной области. Направляющая последовательность и, следовательно, направляющая РНК для нацеливания на нуклеиновую кислоту, может быть выбрана для нацеливания на любую целевую последовательность нуклеиновой кислоты. Целевая последовательность может представлять собой ДНК. Целевая последовательность может представлять собой любую последовательность РНК. В некоторых вариантах осуществления целевая последовательность может представлять собой последовательность в пределах молекулы РНК, выбранной из группы, состоящей из матричной РНК (мРНК), pre-mRNA, рибосомальной РНК (rRNA), транспортной РНК (tRNA), микро-РНК (miRNA), малой интерферирующей РНК (siRNA), малой ядерной РНК (snRNA), малой ядрышковой РНК (snoRNA), двухнитевой РНК (dsRNA), некодирующей РНК (ncRNA), длинной некодирующей РНК (lncRNA) и малой цитоплазматической РНК (scRNA). В некоторых предпочтительных вариантах осуществления целевая последовательность может представлять собой последовательность в пределах молекулы РНК, выбранной из группы, состоящей из мРНК, pre-mRNA и rRNA. В некоторых предпочтительных вариантах осуществления целевая последовательность может представлять собой последовательность в пределах молекулы РНК, выбранной из группы, состоящей из ncRNA и lncRNA. В некоторых более предпочтительных вариантах осуществления целевая последовательность может представлять собой последовательность в пределах молекулы мРНК или молекулы pre-mRNA.As used herein, the term "crRNA" or "guide RNA" or "single guide RNA" or "sgRNA" or "one or more nucleic acid components" of a Type V or Type VI CRISPR-Cas locus effector protein includes any polynucleotide sequence that has sufficient complementarity to a target nucleic acid sequence to hybridize to the target nucleic acid sequence and direct sequence-specific binding of a nucleic acid targeting complex to the target nucleic acid sequence. In some embodiments, when optimally aligned using a suitable alignment algorithm, the degree of complementarity is about or greater than about 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%, or more. An optimal alignment can be determined using any suitable sequence alignment algorithm, including, but not limited to, the Smith-Waterman algorithm, the Needleman-Wunsch algorithm, algorithms based on the Burrows-Wheeler transform (e.g., Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies; available at www.novocraft.com), ELAND (Illumina, San Diego, CA), SOAP (available at soap.genomics.org.cn), and Maq (available at maq.sourceforge.net). The ability of a guide sequence (within a nucleic acid targeting guide RNA) to direct sequence-specific binding of a nucleic acid targeting complex to a target nucleic acid sequence can be assessed using any suitable assay. For example, nucleic acid targeting components of a CRISPR system sufficient to form a nucleic acid targeting complex, including a guide sequence to be tested, can be provided to a host cell having a corresponding target nucleic acid sequence, such as by transfection with vectors encoding components of the nucleic acid targeting complex, followed by assessment of preferential targeting (e.g., cleavage) within the target nucleic acid sequence, such as by the Surveyor nuclease assay described herein. Similarly, cleavage of a target nucleic acid sequence can be determined in vitro by providing a target nucleic acid sequence, components of a nucleic acid targeting complex, including a guide sequence to be tested and a control guide sequence different from the test guide sequence, and comparing the binding or extent of cleavage of the target sequence in reactions with the test and control guide sequences. Other assays are possible and can be performed by those skilled in the art. The guide sequence, and hence the guide RNA for targeting the nucleic acid, can be selected to target any target nucleic acid sequence. The target sequence can be DNA. The target sequence can be any RNA sequence. In some embodiments, the target sequence may be a sequence within an RNA molecule selected from the group consisting of messenger RNA (mRNA), pre-mRNA, ribosomal RNA (rRNA), transfer RNA (tRNA), micro RNA (miRNA), small interfering RNA (siRNA), small nuclear RNA (snRNA), small nucleolar RNA (snoRNA), double-stranded RNA (dsRNA), non-coding RNA (ncRNA), long non-coding RNA (lncRNA), and small cytoplasmic RNA (scRNA). In some preferred embodiments, the target sequence may be a sequence within an RNA molecule selected from the group consisting of mRNA, pre-mRNA, and rRNA. In some preferred embodiments, the target sequence may be a sequence within an RNA molecule selected from the group consisting of ncRNA and lncRNA. In some more preferred embodiments, the target sequence may be a sequence within an mRNA molecule or a pre-mRNA molecule.
В некоторых вариантах осуществления направляющая РНК для нацеливания на нуклеиновую кислоту выбраны для снижения доли вторичной структуры в пределах направляющей РНК для нацеливания на РНК. В некоторых вариантах осуществления приблизительно или менее чем приблизительно 75%, 50%, 40%, 30%, 25%, 20%, 15%, 10%, 5%, 1% или меньше нуклеотидов направляющей РНК для нацеливания на нуклеиновую кислоту участвуют в самокомплементарном образовании пар оснований при оптимальном сворачивании. Оптимальное сворачивание можно определить с помощью любого подходящего алгоритма сворачивания полинуклеотида. Некоторые программы основаны на вычислении минимальной свободной энергии Гиббса. Примером одного такого алгоритма является mFold, который описан Zuker и Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Другим примером алгоритма сворачивания является доступный в режиме онлайн веб-сервер RNAfold, разработанный в Институте теоретической химии при Венском университете, использующий алгоритм прогнозирования структуры на основе центроидного способа (см., например, A.R. Gruber et al., 2008, Cell 106(1): 23-24; и PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62).In some embodiments, the nucleic acid targeting guide RNA is selected to reduce the proportion of secondary structure within the nucleic acid targeting guide RNA. In some embodiments, about or less than about 75%, 50%, 40%, 30%, 25%, 20%, 15%, 10%, 5%, 1%, or less of the nucleotides of the nucleic acid targeting guide RNA participate in self-complementary base pairing during optimal folding. Optimal folding can be determined using any suitable polynucleotide folding algorithm. Some programs are based on calculating the minimum Gibbs free energy. An example of one such algorithm is mFold, which is described by Zuker and Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Another example of a folding algorithm is the online web server RNAfold, developed at the Institute for Theoretical Chemistry at the University of Vienna, which uses a centroid-based structure prediction algorithm (see, e.g., A.R. Gruber et al., 2008, Cell 106(1): 23–24; and P.A. Carr and G.M. Church, 2009, Nature Biotechnology 27(12): 1151–62).
В определенных вариантах осуществления направляющая РНК или crRNA может предусматривать, состоять, по сути, из или состоять из последовательности прямого повтора (DR) и направляющей последовательности или спейсерной последовательности. В определенных вариантах осуществления направляющая РНК или crRNA может предусматривать, состоять, по сути, из или состоять из последовательности прямого повтора, слитой или связанной с направляющей последовательностью или спейсерной последовательностью. В определенных вариантах осуществления последовательность прямого повтора может быть расположена выше (т.е. в направлении 5') от направляющей последовательности или спейсерной последовательности. В других вариантах осуществления последовательность прямого повтора может быть расположена ниже (т.е. в направлении 3') от направляющей последовательности или спейсерной последовательности.In certain embodiments, a guide RNA or crRNA may comprise, consist essentially of, or consist of a direct repeat (DR) sequence and a guide sequence or spacer sequence. In certain embodiments, a guide RNA or crRNA may comprise, consist essentially of, or consist of a direct repeat sequence fused to or linked to a guide sequence or spacer sequence. In certain embodiments, the direct repeat sequence may be located upstream (i.e., in the 5' direction) of the guide sequence or spacer sequence. In other embodiments, the direct repeat sequence may be located downstream (i.e., in the 3' direction) of the guide sequence or spacer sequence.
В определенных вариантах осуществления crRNA содержит "петлю-на-стебле", предпочтительно одну "петлю-на-стебле". В определенных вариантах осуществления последовательность прямого повтора образует "петлю-на-стебле", предпочтительно одну "петлю-на-стебле".In certain embodiments, the crRNA comprises a stem-loop, preferably one stem-loop. In certain embodiments, the direct repeat sequence forms a stem-loop, preferably one stem-loop.
В определенных вариантах осуществления длина спейсера направляющей РНК составляет от 15 до 35 нуклеотидов. В определенных вариантах осуществления длина спейсера направляющей РНК составляет по меньшей мере 15 нуклеотидов. В определенных вариантах осуществления длина спейсера составляет от 15 до 17 нуклеотидов, например, 15, 16 или 17 нуклеотидов, от 17 до 20 нуклеотидов, например, 17, 18, 19 или 20 нуклеотидов, от 20 до 24 нуклеотидов, например, 20, 21, 22, 23 или 24 нуклеотида, от 23 до 25 нуклеотидов, например, 23, 24 или 25 нуклеотидов, от 24 до 27 нуклеотидов, например, 24, 25, 26 или 27 нуклеотидов, 27-30 нуклеотидов, например, 27, 28, 29 или 30 нуклеотидов, 30-35 нуклеотидов, например, 30, 31, 32, 33, 34 или 35 нуклеотидов, или 35 нуклеотидов или больше.In certain embodiments, the length of the guide RNA spacer is between 15 and 35 nucleotides. In certain embodiments, the length of the guide RNA spacer is at least 15 nucleotides. In certain embodiments, the length of the spacer is from 15 to 17 nucleotides, such as 15, 16 or 17 nucleotides, from 17 to 20 nucleotides, such as 17, 18, 19 or 20 nucleotides, from 20 to 24 nucleotides, such as 20, 21, 22, 23 or 24 nucleotides, from 23 to 25 nucleotides, such as 23, 24 or 25 nucleotides, from 24 to 27 nucleotides, such as 24, 25, 26 or 27 nucleotides, 27-30 nucleotides, such as 27, 28, 29 or 30 nucleotides, 30-35 nucleotides, such as 30, 31, 32, 33, 34 or 35 nucleotides, or 35 nucleotides or more.
Последовательность "tracrRNA" или аналогичные термины включают любую полинуклеотидную последовательность, которая характеризуется достаточной комплементарностью с последовательностью crRNA для возможности гибридизации. В некоторых вариантах осуществления степень комплементарности между последовательностью tracrRNA и последовательностью crRNA по всей длине более короткой из двух при оптимальном выравнивании составляет приблизительно или более чем приблизительно 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97,5%, 99% или больше. В некоторых вариантах осуществления длина tracr-последовательность составляет приблизительно или более чем приблизительно 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 или более нуклеотидов. В некоторых вариантах осуществления последовательность crRNA и парная tracr-последовательность содержатся в одном транскрипте, так что при гибридизация между ними двумя образуется транскрипт со вторичной структурой, такой как "шпилька". В одном варианте осуществления настоящего изобретения транскрипт или транскрибированная полинуклеотидная последовательность имеют по меньшей мере две или более "шпилек". В предпочтительных вариантах осуществления транскрипт имеет две, три, четыре или пять "шпилек". В дополнительном варианте осуществления настоящего изобретения транскрипт имеет не более пяти "шпилек". В шпилечной структуре часть последовательности в 5'-направлении по отношению к концевому "N" и выше петли соответствует парной tracr-последовательности, а часть последовательности в 3'-направлении по отношению к петле соответствует tracr-последовательности.A "tracrRNA" sequence or similar terms includes any polynucleotide sequence that has sufficient complementarity with a crRNA sequence to allow hybridization. In some embodiments, the degree of complementarity between a tracrRNA sequence and a crRNA sequence over the entire length of the shorter of the two when optimally aligned is about or greater than about 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97.5%, 99%, or more. In some embodiments, the tracr sequence is about or greater than about 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50, or more nucleotides in length. In some embodiments, the crRNA sequence and the tracr mate sequence are contained in a single transcript such that hybridization between the two produces a transcript with a secondary structure such as a hairpin. In one embodiment of the invention, the transcript or transcribed polynucleotide sequence has at least two or more hairpins. In preferred embodiments, the transcript has two, three, four or five hairpins. In a further embodiment, the transcript has no more than five hairpins. In the hairpin structure, the portion of the sequence in the 5' direction relative to the terminal "N" and upstream of the loop corresponds to the tracr mate sequence, and the portion of the sequence in the 3' direction relative to the loop corresponds to the tracr sequence.
В целом, система CRISPR-Cas, CRISPR-Cas9 или CRISPR может представлять собой таковую, применяемую в вышеупомянутых документах, таких как WO 2014/093622 (PCT/US2013/074667), и обозначать в совокупности транскрипты и другие элементы, вовлеченные в экспрессию или управление активностью CRISPR-ассоциированных ("Cas") генов, включая последовательности, кодирующие ген Cas, в частности ген Cas9 в случае CRISPR-Cas9, tracr-(транс-активирующую CRISPR) последовательность (например, tracrRNA или активную частичную tracrRNA), парную tracr-последовательность (охватывающую "прямой повтор" и tracrRNA-процессированный частичный прямой повтор в контексте эндогенной системы CRISPR), направляющую последовательность (также обозначаемую как "спейсер" в контексте эндогенной системы CRISPR) или "РНК", как данный термин используется в данном документе (например, РНК для направления Cas9, например РНК CRISPR и транс-активирующую (tracr) РНК, или одиночную направляющую РНК (sgRNA) (химерную РНК)) или другие последовательности и транскрипты из локуса CRISPR. В целом, система CRISPR характеризуется элементами, которые содействуют образованию комплекса CRISPR в сайте целевой последовательности (также называемой протоспейсер в контексте эндогенной системы CRISPR). В контексте образования комплекса CRISPR "целевая последовательность" обозначает последовательность, относительно которой разрабатывается направляющая последовательность таким образом, чтобы обладать комплементарностью, при этом гибридизация между целевой последовательностью и направляющей последовательностью содействует образованию комплекса CRISPR. Отрезок направляющей последовательности, на протяжении которого комплементарность с целевой последовательностью важна для активности расщепления, обозначается в данном документе как затравочная последовательность. Целевая последовательность может содержать любой полинуклеотид, как, например, полинуклеотиды ДНК или РНК. В некоторых вариантах осуществления целевая последовательность находится в ядре или цитоплазме клетки, и она может включать нуклеиновые кислоты в митохондриях, органеллах, везикулах, липосомах или частицах, присутствующих в пределах клетки, или из них. В некоторых вариантах осуществления, особенно в случае вариантов применения не в ядре, NLS не являются предпочтительными. В некоторых вариантах осуществления прямые повторы можно идентифицировать in silico посредством поиска повторяющихся мотивов, которые соответствуют какому-либо или всем из следующих критериев: 1. находятся в окне размером 2 т. о. в геномной последовательности, фланкирующей локус CRISPR II типа; 2. охватывают от 20 до 50 п. о. и 3. чередуются с фрагментами из 20-50 п. о. В некоторых вариантах осуществления могут применяться 2 из этих критериев, например, 1 и 2, 2 и 3 или 1 и 3. В некоторых вариантах осуществления могут применяться все 3 критерия.In general, a CRISPR-Cas, CRISPR-Cas9 or CRISPR system may be as used in the above-mentioned documents such as WO 2014/093622 (PCT/US2013/074667) and refer collectively to transcripts and other elements involved in the expression or control of the activity of CRISPR-associated (“Cas”) genes, including sequences encoding a Cas gene, in particular the Cas9 gene in the case of CRISPR-Cas9, a tracr (trans-activating CRISPR) sequence (e.g., tracrRNA or active partial tracrRNA), a tracr mate sequence (encompassing a “direct repeat” and a tracrRNA-processed partial direct repeat in the context of an endogenous CRISPR system), a guide sequence (also referred to as a “spacer” in the context of an endogenous CRISPR system) or “RNA” as that term is used herein (e.g., RNA for Cas9 directions, such as CRISPR RNA and trans-activating (tracr) RNA, or single guide RNA (sgRNA) (chimeric RNA), or other sequences and transcripts from the CRISPR locus. In general, a CRISPR system is characterized by elements that facilitate the formation of a CRISPR complex at the site of a target sequence (also called a protospacer in the context of the endogenous CRISPR system). In the context of CRISPR complex formation, a "target sequence" refers to a sequence to which a guide sequence is designed to be complementary, whereby hybridization between the target sequence and the guide sequence facilitates the formation of the CRISPR complex. The stretch of the guide sequence over which complementarity with the target sequence is important for cleavage activity is referred to herein as the seed sequence. The target sequence may comprise any polynucleotide, such as DNA or RNA polynucleotides. In some embodiments, the target sequence is in the nucleus or cytoplasm of the cell, and may include nucleic acids in or from mitochondria, organelles, vesicles, liposomes, or particles present within the cell. In some embodiments, particularly for non-nuclear applications, NLSs are not preferred. In some embodiments, direct repeats can be identified in silico by searching for repeat motifs that meet any or all of the following criteria: 1. are within a 2 kb window of genomic sequence flanking the Type II CRISPR locus; 2. span between 20 and 50 bp; and 3. are interspersed with 20-50 bp fragments. In some embodiments, 2 of these criteria may apply, such as 1 and 2, 2 and 3, or 1 and 3. In some embodiments, all 3 criteria may apply.
В вариантах осуществления настоящего изобретения термины направляющая последовательность и направляющая РНК, т.е. РНК, способная направлять Cas на целевой локус генома, используются взаимозаменяемо, как в вышеупомянутых процитированных документах, таких как WO 2014/093622 (PCT/US2013/074667). В целом, направляющая последовательность представляет собой любую полинуклеотидную последовательность, обладающую достаточной комплементарностью с целевой полинуклеотидной последовательностью для гибридизации с целевой последовательностью и управления специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью. В некоторых вариантах осуществления степень комплементарности между направляющей последовательностью и ее соответствующей целевой последовательностью при оптимальном выравнивании с применением подходящего алгоритма выравнивания составляет приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% или больше. Оптимальное выравнивание можно определять с применением любого подходящего алгоритма для выравнивания последовательностей, к неограничивающим примерам которого относится алгоритм Смита-Ватермана, алгоритм Нидлмана-Вунша, алгоритмы, основанные на преобразовании Барроуза-Уилера (например, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies; доступный на сайте www.novocraft.com), ELAND (Illumina, Сан-Диего, Калифорния), SOAP (доступный на сайте soap.genomics.org.cn) и Maq (доступный на сайте maq.sourceforge.net). В некоторых вариантах осуществления длина направляющей последовательности составляет приблизительно или более чем приблизительно 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 или более нуклеотидов. В некоторых вариантах осуществления длина направляющей последовательности составляет менее чем приблизительно 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 или менее нуклеотидов. Предпочтительно длина направляющей последовательности составляет 10-30 нуклеотидов. Способность направляющей последовательности управлять специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью можно оценить с помощью любого подходящего анализа. Например, компоненты системы CRISPR, достаточные для образования комплекса CRISPR, в том числе направляющая последовательность, подлежащая тестированию, могут быть обеспечены в клетке-хозяине, имеющей соответствующую целевую последовательностью, как, например, с помощью трансфекции векторами, кодирующими компоненты последовательности CRISPR, с последующей оценкой предпочтительного расщепления в пределах целевой последовательности, как, например, с помощью анализа с использованием нуклеазы Surveyor, описываемого в данном документе. Аналогично, расщепление целевой полинуклеотидной последовательности можно определять в пробирке путем обеспечения целевой последовательности, компонентов комплекса CRISPR, в том числе направляющей последовательности, подлежащей тестированию, и контрольной направляющей последовательности, отличной от тестируемой направляющей последовательности, и сравнения связывания или степени расщепления целевой последовательности в случае реакций с тестируемой и контрольной направляющей последовательностью. Возможны и другие анализы, и они могут быть выполнены специалистами в данной области.In embodiments of the present invention, the terms guide sequence and guide RNA, i.e., RNA capable of directing Cas to a target locus in the genome, are used interchangeably, as in the above-mentioned cited documents such as WO 2014/093622 (PCT/US2013/074667). In general, a guide sequence is any polynucleotide sequence that has sufficient complementarity to a target polynucleotide sequence to hybridize to the target sequence and direct sequence-specific binding of a CRISPR complex to the target sequence. In some embodiments, the degree of complementarity between a guide sequence and its corresponding target sequence when optimally aligned using a suitable alignment algorithm is about or greater than about 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%, or more. An optimal alignment can be determined using any suitable sequence alignment algorithm, including, but not limited to, the Smith-Waterman algorithm, the Needleman-Wunsch algorithm, algorithms based on the Burrows-Wheeler transform (e.g., Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies; available at www.novocraft.com), ELAND (Illumina, San Diego, CA), SOAP (available at soap.genomics.org.cn), and Maq (available at maq.sourceforge.net). In some embodiments, the length of the guide sequence is about or more than about 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 or more nucleotides. In some embodiments, the length of the guide sequence is less than about 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 or less nucleotides. Preferably, the length of the guide sequence is 10-30 nucleotides. The ability of the guide sequence to direct sequence-specific binding of the CRISPR complex to a target sequence can be assessed using any suitable assay. For example, components of a CRISPR system sufficient to form a CRISPR complex, including a guide sequence to be tested, can be provided to a host cell having an appropriate target sequence, such as by transfection with vectors encoding components of the CRISPR sequence, followed by assessment of preferential cleavage within the target sequence, such as by the Surveyor nuclease assay described herein. Similarly, cleavage of a target polynucleotide sequence can be determined in vitro by providing a target sequence, components of a CRISPR complex, including a guide sequence to be tested, and a control guide sequence different from the test guide sequence, and comparing binding or the extent of cleavage of the target sequence in reactions with the test and control guide sequences. Other assays are possible and can be performed by those skilled in the art.
В некоторых вариантах осуществления систем CRISPR-Cas степень комплементарности между направляющей и ее соответствующей целевой последовательностью может составлять приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% или 100%; причем длина направляющей РНК или sgRNA может составлять приблизительно или более чем приблизительно 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 или более нуклеотидов; или длина направляющей РНК или sgRNA может составлять менее чем приблизительно 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 или менее нуклеотидов; и преимущественно длина tracrRNA составляет 30 или 50 нуклеотидов. Однако аспект настоящего изобретения направлен на снижение нецелевых взаимодействий, например, снижение взаимодействия направляющей с целевой последовательностью, характеризующейся низкой комплементарностью. Действительно, в примерах показано, что настоящее изобретение предусматривает мутации, которые приводят к тому, что система CRISPR-Cas способна распознавать целевую и нецелевую последовательности, которые характеризуются от более чем 80% до приблизительно 95% комплементарностью, например, 83%-84%, или 88-89%, или 94-95% комплементарностью (к примеру, различать целевую последовательность длиной 18 нуклеотидов от нецелевой последовательности длиной 18 нуклеотидов с 1, 2 или 3 несовпадениями). В соответствии с этим, в контексте настоящего изобретения степень комплементарности между направляющей последовательностью и ее соответствующей целевой последовательностью составляет более чем 94,5%, или 95%, или 95,5%, или 96%, или 96,5%, или 97%, или 97,5%, или 98%, или 98,5%, или 99%, или 99,5%, или 99,9%, или 100%. Нецелевой локус характеризуется менее чем 100%, или 99,9%, или 99,5%, или 99%, или 99%, или 98,5%, или 98%, или 97,5%, или 97%, или 96,5%, или 96%, или 95,5%, или 95%, или 94,5%, или 94%, или 93%, или 92%, или 91%, или 90%, или 89%, или 88%, или 87%, или 86%, или 85%, или 84%, или 83%, или 82%, или 81%, или 80% комплементарностью между его последовательностью и направляющей, при этом преимущественно, чтобы нецелевой локус характеризовался 100%, или 99,9%, или 99,5%, или 99%, или 99%, или 98,5%, или 98%, или 97,5%, или 97%, или 96,5%, или 96%, или 95,5%, или 95%, или 94,5% комплементарностью между его последовательностью и направляющей.In some embodiments of the CRISPR-Cas systems, the degree of complementarity between a guide and its corresponding target sequence can be about or greater than about 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%, or 100%; wherein the length of the guide RNA or sgRNA can be about or greater than about 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 or more nucleotides; or the length of the guide RNA or sgRNA may be less than about 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 or less nucleotides; and preferably the length of the tracrRNA is 30 or 50 nucleotides. However, an aspect of the present invention is directed to reducing off-target interactions, for example, reducing the interaction of the guide with a target sequence characterized by low complementarity. Indeed, the examples show that the present invention provides mutations that cause the CRISPR-Cas system to be able to recognize target and non-target sequences that are characterized by greater than 80% to about 95% complementarity, such as 83%-84%, or 88-89%, or 94-95% complementarity (e.g., distinguishing between an 18 nucleotide long target sequence and an 18 nucleotide long non-target sequence with 1, 2, or 3 mismatches). Accordingly, in the context of the present invention, the degree of complementarity between a guide sequence and its corresponding target sequence is more than 94.5%, or 95%, or 95.5%, or 96%, or 96.5%, or 97%, or 97.5%, or 98%, or 98.5%, or 99%, or 99.5%, or 99.9%, or 100%. The non-target locus has less than 100%, or 99.9%, or 99.5%, or 99%, or 99%, or 98.5%, or 98%, or 97.5%, or 97%, or 96.5%, or 96%, or 95.5%, or 95%, or 94.5%, or 94%, or 93%, or 92%, or 91%, or 90%, or 89%, or 88%, or 87%, or 86%, or 85%, or 84%, or 83%, or 82%, or 81%, or 80% complementarity between its sequence and the guide, wherein it is preferable that the non-target locus has 100%, or 99.9%, or 99.5%, or 99%, or 99%, or 98.5%, or 98%, or 97.5%, or 97%, or 96.5%, or 96%, or 95.5%, or 95%, or 94.5% complementarity between its sequence and the guide.
В особенно предпочтительных вариантах осуществления в соответствии с настоящим изобретением направляющая РНК (способная направлять Cas на целевой локус) может содержать (1) направляющую последовательность, способную гибридизироваться с целевым локусом генома в эукариотической клетке; (2) tracr-последовательность; и (3) парную tracr-последовательность. Все из (1)-(3) могут находиться в одиночной РНК, т.е. sgRNA (расположенной в ориентации 5' - 3'), или tracrRNA может представлять собой РНК, отличную от РНК, содержащей направляющую и tracr-последовательность. Tracr-последовательность гибридизируется c парной tracr-последовательностью и направляет комплекс CRISPR/Cas к целевой последовательности.In particularly preferred embodiments according to the present invention, the guide RNA (capable of directing Cas to a target locus) may comprise (1) a guide sequence capable of hybridizing to a target locus of the genome in a eukaryotic cell; (2) a tracr sequence; and (3) a tracr mate sequence. All of (1)-(3) may be in a single RNA, i.e., an sgRNA (located in a 5'-3' orientation), or the tracrRNA may be an RNA different from the RNA containing the guide and tracr sequence. The tracr sequence hybridizes to the tracr mate sequence and directs the CRISPR/Cas complex to the target sequence.
Способы в соответствии с настоящим изобретением, описываемые в данном документе, охватывают индуцирование одной или нескольких мутаций в эукариотической клетке (in vitro, т.е. в выделенной эукариотической клетке), обсуждаемое в данном документе, предусматривающее доставку в клетку вектора, обсуждаемого в данном документе. Мутация(мутации) может(могут) включать введение, делецию или замену одного или нескольких нуклеотидов в каждой целевой последовательности клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 1-75 нуклеотидов в каждой целевой последовательности указанной клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 1, 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 или 75 нуклеотидов в каждой целевой последовательности указанной клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 или 75 нуклеотидов в каждой целевой последовательности указанной клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA. Мутации включают введение, делецию или замену 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 или 75 нуклеотидов в каждой целевой последовательности указанной клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 или 75 нуклеотидов в каждой целевой последовательности указанной клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 40, 45, 50, 75, 100, 200, 300, 400 или 500 нуклеотидов в каждой целевой последовательности указанной клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA.The methods of the present invention described herein encompass inducing one or more mutations in a eukaryotic cell (in vitro, i.e., in an isolated eukaryotic cell) as discussed herein, comprising delivering to the cell a vector as discussed herein. The mutation(s) may comprise the introduction, deletion, or substitution of one or more nucleotides in each target sequence of the cell(s) using a guide(s) RNA or sgRNA. The mutations may comprise the introduction, deletion, or substitution of 1-75 nucleotides in each target sequence of said cell(s) using a guide(s) RNA or sgRNA. Mutations may include the introduction, deletion or substitution of 1, 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 or 75 nucleotides in each target sequence of the specified cell(s) using guide RNA or sgRNA. Mutations may include the introduction, deletion or substitution of 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 or 75 nucleotides in each target sequence of the specified cell(s) using guide RNA or sgRNA. Mutations include the introduction, deletion or substitution of 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 or 75 nucleotides in each target sequence of the specified cell(s) using guide(s) RNA or sgRNA. The mutations may include the introduction, deletion or substitution of 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 or 75 nucleotides in each target sequence of said cell(s) using guide(s) RNA or sgRNA. The mutations may include the introduction, deletion or substitution of 40, 45, 50, 75, 100, 200, 300, 400 or 500 nucleotides in each target sequence of said cell(s) using guide(s) RNA or sgRNA.
Для сведения к минимуму токсичности и нецелевого эффекта рекомендуется контролировать концентрацию доставляемых мРНК Cas и направляющей РНК. Оптимальные концентрации мРНК Cas и направляющей РНК можно определить путем тестирования различных концентраций на клеточной модели или модели отличного от человека животного-эукариотического организма и применения глубокого секвенирования для анализа степени модификации в потенциальных нецелевых локусах генома. Альтернативно для сведения в минимуму уровня токсичности и нецелевого эффекта мРНК никазы Cas (например, Cas9 S. pyogenes с мутацией D10A) можно доставлять с парой направляющих РНК, нацеливающихся на представляющий интерес сайт. Направляющие последовательности и стратегии сведения к минимуму токсичности и нецелевых эффектов могут быть такими, как в WO 2014/093622 (PCT/US2013/074667); или с помощью мутации, как указано в данном документе.To minimize toxicity and off-target effects, it is recommended to control the concentration of the delivered Cas mRNA and guide RNA. Optimal concentrations of Cas mRNA and guide RNA can be determined by testing different concentrations in a cellular or non-human animal-eukaryotic model and using deep sequencing to analyze the degree of modification at potential off-target loci in the genome. Alternatively, to minimize the level of toxicity and off-target effects, Cas nickase mRNA (e.g., S. pyogenes Cas9 with the D10A mutation) can be delivered with a pair of guide RNAs targeting the site of interest. Guide sequences and strategies to minimize toxicity and off-target effects can be as in WO 2014/093622 (PCT/US2013/074667); or by mutation as described herein.
Как правило, в контексте эндогенной системы CRISPR образование комплекса CRISPR (содержащего направляющую последовательность, гибридизированую с целевой последовательностью и находящуюся в комплексе с одним или несколькими белками Cas) приводит к расщеплению одной или обеих нитей в (к примеру, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар оснований) целевой последовательности или рядом с ней. Не вдаваясь в теорию, полагают, что tracr-последовательность, которая может содержать всю или часть tracr-последовательности дикого типа или состоять из нее (например, приблизительно или более чем приблизительно 20, 26, 32, 45, 48, 54, 63, 67, 85 или более нуклеотидов tracr-последовательности дикого типа), может также формировать часть комплекса CRISPR, как, например, путем гибридизации по меньшей мере части tracr-последовательности со всей или частью парной tracr-последовательности, которая функционально связана с направляющей последовательностью.Typically, in the context of an endogenous CRISPR system, formation of a CRISPR complex (containing a guide sequence hybridized to a target sequence and complexed with one or more Cas proteins) results in cleavage of one or both strands at or near (e.g., within 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 or more base pairs) the target sequence. Without wishing to be bound by theory, it is believed that a tracr sequence, which may comprise or consist of all or a portion of a wild-type tracr sequence (e.g., about or more than about 20, 26, 32, 45, 48, 54, 63, 67, 85 or more nucleotides of a wild-type tracr sequence), may also form part of a CRISPR complex, such as by hybridizing at least a portion of the tracr sequence to all or a portion of a mate tracr sequence that is operably linked to a guide sequence.
Местоположение доменов RuvCI, RuvCII, RuvCIII и HNH указано на фигуре 22A-C. Используемый в данном документе термин "домен RuvCI" предпочтительно обозначает домен, содержащий аминокислоты 1-60 из Cas9 Streptococcus pyogenes (SpCas9) или соответствующий участок в другом ортологе Cas9 или нуклеазе CRISPR, отличной от Cas9. Используемый в данном документе термин "домен RuvCII" предпочтительно обозначает домен, содержащий аминокислоты 718-775 из Cas9 Streptococcus pyogenes (SpCas9) или соответствующий участок в другом ортологе Cas9 или нуклеазе CRISPR, отличной от Cas9. Используемый в данном документе термин "домен RuvCIII" предпочтительно обозначает домен, содержащий аминокислоты 909-1099 из Cas9 Streptococcus pyogenes (SpCas9) или соответствующий участок в другом ортологе Cas9 или нуклеазе CRISPR, отличной от Cas9. Используемый в данном документе термин "домен HNH" предпочтительно обозначает домен, содержащий аминокислоты 776-908 из Cas9 Streptococcus pyogenes (SpCas9) или соответствующий участок в другом ортологе Cas9 или нуклеазе CRISPR, отличной от Cas9. Бороздка между доменами RuvC и HNH обозначает бороздку между этими доменами в трехмерной структуре не встречающегося в природе фермента CRISPR, описываемого в данном документе. На фигуре 25D показана кристаллическая структура SaCas9, где показана бороздка между доменами HNH и RuvC в трехмерной структуре SaCas9.The location of the RuvCI, RuvCII, RuvCIII and HNH domains is shown in Figure 22A-C. As used herein, the term "RuvCI domain" preferably refers to a domain comprising amino acids 1-60 of Streptococcus pyogenes Cas9 (SpCas9) or the corresponding region in another Cas9 ortholog or CRISPR nuclease other than Cas9. As used herein, the term "RuvCII domain" preferably refers to a domain comprising amino acids 718-775 of Streptococcus pyogenes Cas9 (SpCas9) or the corresponding region in another Cas9 ortholog or CRISPR nuclease other than Cas9. As used herein, the term "RuvCIII domain" preferably refers to a domain comprising amino acids 909-1099 of Streptococcus pyogenes Cas9 (SpCas9) or the corresponding region in another Cas9 ortholog or CRISPR nuclease other than Cas9. As used herein, the term "HNH domain" preferably refers to a domain comprising amino acids 776-908 of Streptococcus pyogenes Cas9 (SpCas9) or the corresponding region in another Cas9 ortholog or CRISPR nuclease other than Cas9. The groove between the RuvC and HNH domains refers to the groove between these domains in the three-dimensional structure of the non-naturally occurring CRISPR enzyme described herein. Figure 25D shows the crystal structure of SaCas9, which shows the groove between the HNH and RuvC domains in the three-dimensional structure of SaCas9.
АптамерыAptamers
Одна направляющая с первой парой аптамер/РНК-связывающий белок может быть связана или слита с активатором, тогда как вторая направляющая с второй парой аптамер/РНК-связывающий белок может быть связана или слита с репрессором. Направляющие предназначены для различных мишеней (локусов), поэтому это обеспечивает возможность активировать один ген и репрессировать другой ген. Например, такой подход показан на следующей схеме:One guide with the first aptamer/RNA-binding protein pair can be linked or fused to an activator, while the second guide with the second aptamer/RNA-binding protein pair can be linked or fused to a repressor. The guides are designed for different targets (loci), so this provides the ability to activate one gene and repress another gene. For example, this approach is shown in the following diagram:
направляющая 1-аптамер MS2-------РНК-связывающий белок MS2-------активатор VP64; иguide 1-aptamer MS2-------RNA-binding protein MS2-------VP64 activator; and
направляющая 2 - аптамер PP7-------РНК-связывающий белок PP7-------репрессор SID4x.guide 2 - aptamer PP7-------RNA-binding protein PP7-------repressor SID4x.
Настоящее изобретение также относится к ортогональному нацеливанию на гены с помощью PP7/MS2. В данном примере sgRNA, нацеливающаяся на различные локусы, модифицирована с помощью отличающихся петель РНК для рекрутирования MS2-VP64 или PP7-SID4X, которые соответственно активируют и репрессируют свои целевые локусы. PP7 представляет собой РНК-связывающий белок оболочки бактериофага Pseudomonas. Аналогично MS2, он связывает специфическую последовательность и вторичную структуру РНК. Мотив распознавания РНК у PP7 отличается от такового у MS2. Вследствие этого PP7 и MS2 можно подвергать мультиплексированию, чтобы опосредовать отличающиеся эффекты в различных локусах генома одновременно. Например, sgRNA, нацеливающуюся на локус A, можно модифицировать с помощью петель MS2, рекрутирующих активаторы MS2-VP64, в то время как другую sgRNA, нацеливающуюся на локус B, можно модифицировать с помощью петель PP7, рекрутирующих репрессорные домены PP7-SID4X. Таким образом, dCas9 может опосредовать ортогональные специфичные к локусу модификации в одной и той же клетке. Этот принцип можно расширить для включения других ортогональных РНК-связывающих белков, таких как Q-бета.The present invention also relates to orthogonal gene targeting by PP7/MS2. In this example, an sgRNA targeting different loci is modified with distinct RNA loops to recruit MS2-VP64 or PP7-SID4X, which respectively activate and repress their target loci. PP7 is an RNA-binding protein of the Pseudomonas bacteriophage coat. Like MS2, it binds a specific sequence and secondary structure of RNA. The RNA recognition motif of PP7 differs from that of MS2. Therefore, PP7 and MS2 can be multiplexed to mediate distinct effects at different loci of the genome simultaneously. For example, an sgRNA targeting locus A can be modified by MS2 loops recruiting MS2-VP64 activators, while another sgRNA targeting locus B can be modified by PP7 loops recruiting PP7-SID4X repressor domains. Thus, dCas9 can mediate orthogonal locus-specific modifications in the same cell. This principle can be extended to include other orthogonal RNA-binding proteins such as Q-beta.
Альтернативный метод ортогональной репрессии включает введение в направляющую некодирующих петель РНК с транс-активной репрессорной функцией (либо в положения, аналогичные петлям MS2/PP7, интегрированным в направляющую, либо в 3'-конец направляющей последовательности). К примеру, разрабатывали направляющие с некодирующими (но, как известно, репрессорными) петлями РНК (например, с применением репрессора Alu (в РНК), который нарушает функционирование РНК-полимеразы II в клетках млекопитающих). Последовательность РНК Alu размещали: вместо последовательностей РНК MS2, используемых в данном документе (например, в тетрапетле и/или "петле-на-стебле" 2); и/или на 3'-конце направляющей. Это обеспечивает возможные комбинации из MS2, PP7 или Alu на положениях тетрапетли и/или "петли-на-стебле" 2, а также, необязательно, добавление Alu на 3'-конце направляющей (с линкером или без него).An alternative method of orthogonal repression involves the introduction of non-coding RNA loops with trans-acting repressor function into the guide (either at positions analogous to the MS2/PP7 loops integrated into the guide or at the 3' end of the guide sequence). For example, guides with non-coding (but known to be repressor) RNA loops have been designed (e.g., using the Alu repressor (in RNA), which disrupts RNA polymerase II function in mammalian cells). The Alu RNA sequence was placed: in place of the MS2 RNA sequences used here (e.g., in a tetraloop and/or stem-loop 2); and/or at the 3' end of the guide. This allows for possible combinations of MS2, PP7 or Alu at the tetraloop and/or stem-loop 2 positions, as well as the optional addition of Alu at the 3' end of the guide (with or without a linker).
Применение двух различных аптамеров (отличающихся РНК) обеспечивает возможность применения слияния активатор-адаптерный белок и слияния репрессор-адаптерный белок с различными направляющими элементами для активации экспрессии одного гена, и в тоже время с репрессией другого. Их, вместе с их различными направляющими элементами, можно вводить вместе или практически вместе при подходе мультиплексирования. Одновременно можно применять множество таких модифицированных направляющих элементов, например, 10, или 20, или 30 и т.д., при этом следует доставлять только один (или по меньшей мере минимальное количество) Cas9, поскольку сравнительно небольшое количество Cas9 можно применять с большим количеством модифицированных направляющих элементов. Адаптерный белок может быть ассоциирован (предпочтительно связан или слит) с одним или несколькими активаторами или одним или несколькими репрессорами. Например, адаптерный белок может быть ассоциирован с первым активатором и вторым активатором. Первый и второй активаторы могут быть одинаковыми, но предпочтительно они являются различными активаторами. Например, один мог бы быть VP64, тогда как другой мог бы быть p65, хотя это всего лишь примеры и предусмотрены другие активаторы транскрипции. Можно применять три или более или даже четыре или более активаторов (или репрессоров), но размер упаковки может служить ограничением, так что количество не превышает 5 различных функциональных доменов. Предпочтительно применяются линкеры, а не прямое слияние с адаптерным белком, при этом с адаптерным белком ассоциированы два или более функциональных домена. Подходящие линкеры могут включать линкер GlySer.The use of two different aptamers (different RNAs) allows the use of an activator-adaptor protein fusion and a repressor-adaptor protein fusion with different targeting elements to activate the expression of one gene while repressing the other. These, together with their different targeting elements, can be administered together or substantially together in a multiplexing approach. A plurality of such modified targeting elements can be used simultaneously, for example 10 or 20 or 30 etc., while only one (or at least a minimal amount) of Cas9 needs to be delivered, since a relatively small amount of Cas9 can be used with a large number of modified targeting elements. The adapter protein can be associated (preferably linked or fused) to one or more activators or one or more repressors. For example, the adapter protein can be associated with a first activator and a second activator. The first and second activators can be the same, but preferably they are different activators. For example, one might be VP64 while another might be p65, although these are just examples and other transcriptional activators are envisaged. Three or more, or even four or more activators (or repressors) may be used, but the size of the package may be a limitation so that the number does not exceed 5 different functional domains. Linkers are preferably used rather than direct fusion to the adaptor protein, with two or more functional domains associated with the adaptor protein. Suitable linkers may include a GlySer linker.
Также предусмотрено, что комплекс фермент-направляющий элемент в целом может быть ассоциирован с двумя или более функциональными доменами. Например, два или более функциональных доменов могут быть ассоциированы с ферментом, или два или более функциональных доменов могут быть ассоциированы с направляющим элементом (с помощью одного или нескольких адаптерных белков), или один или несколько функциональных доменов могут быть ассоциированы с ферментом и один или несколько функциональный доменов могут быть ассоциированы с направляющим элементом (с помощью одного или нескольких адаптерных белков).It is also envisaged that the enzyme-targeting element complex as a whole may be associated with two or more functional domains. For example, two or more functional domains may be associated with an enzyme, or two or more functional domains may be associated with a targeting element (via one or more adaptor proteins), or one or more functional domains may be associated with an enzyme and one or more functional domains may be associated with a targeting element (via one or more adaptor proteins).
Слияние между адаптерным белком и активатором или репрессором может включать линкер. Например, могут применяться линкеры GlySer, GGGS. Их можно применять в повторах по 3 ((GGGGS)3) или 6, 9 или даже 12 или более для обеспечения, при необходимости, подходящей длины. Линкеры можно применять между РНК-связывающим белком и функциональным доменом (активатором или репрессором), или между ферментом CRISPR (Cas9) и функциональным доменом (активатором или репрессором). Линкеры применяют для конструирования молекулы с достаточной степенью "механической гибкости".The fusion between the adaptor protein and the activator or repressor may include a linker. For example, GlySer, GGGS linkers may be used. They may be used in repeats of 3 ((GGGGS) 3 ) or 6, 9 or even 12 or more to provide the appropriate length, if necessary. Linkers may be used between the RNA-binding protein and the functional domain (activator or repressor), or between the CRISPR enzyme (Cas9) and the functional domain (activator or repressor). Linkers are used to construct a molecule with a sufficient degree of "mechanical flexibility".
Нефункциональные направляющие: в настоящем изобретении можно применять направляющие РНК, содержащие нефункциональную направляющую последовательностьNon-functional guides: The present invention may employ guide RNAs containing a non-functional guide sequence.
В одном аспекте настоящего изобретения предусмотрены направляющие последовательности, которые модифицированы таким способом, который обеспечивает возможность образования комплекса CRISPR и успешное связывание с мишенью, при этом в то же время не обеспечивают успешной нуклеазной активности (т.е. лишенные нуклеазной активности/без активности в отношении образования вставок/делеций). Что касается объяснений, такие модифицированные направляющие последовательности обозначены как "нефункциональные направляющие" или "нефункциональные направляющие последовательности". Эти нефункциональные направляющие или нефункциональные направляющие последовательности можно считать каталитически неактивными или конформационно неактивными с точки зрения нуклеазной активности. Нуклеазную активность можно измерять с применением анализа с использованием нуклеазы Surveyor, или глубокого секвенирования, обычно применяемых в уровне техники, предпочтительно анализа с использованием нуклеазы Surveyor. Аналогично, нефункциональные направляющие последовательности не могут в достаточной степени участвовать в продуктивном образовании пар оснований с точки зрения способности содействия каталитической активности или распознавания активности целевого и нецелевого связывания. Вкратце, анализ с использованием нуклеазы Surveyor включает очистку и амплификацию целевого сайта CRISPR в гене и образование гетеродуплексов с праймерами, обеспечивающими амплификацию целевого сайта CRISPR. После повторной гибридизации продукты обрабатывали нуклеазой SURVEYOR и энхансером S SURVEYOR (Transgenomics) согласно протоколам, рекомендованным производителем, анализировали на гелях и оценивали количественно, исходя из относительной интенсивности окрашивания полосок.In one aspect of the present invention, there are provided guide sequences that are modified in a manner that allows formation of a CRISPR complex and successful binding to a target, while at the same time not providing successful nuclease activity (i.e., lacking nuclease activity/no insertion/deletion activity). For explanations, such modified guide sequences are referred to as "non-functional guides" or "non-functional guide sequences". These non-functional guides or non-functional guide sequences can be considered catalytically inactive or conformationally inactive in terms of nuclease activity. Nuclease activity can be measured using the Surveyor nuclease assay or deep sequencing commonly used in the art, preferably the Surveyor nuclease assay. Likewise, non-functional guide sequences may not sufficiently participate in productive base pairing in terms of the ability to facilitate catalytic activity or discriminate between target and non-target binding activity. Briefly, the Surveyor Nuclease assay involves purification and amplification of a CRISPR target site in a gene and the formation of heteroduplexes with primers that amplify the CRISPR target site. Following rehybridization, products were treated with SURVEYOR Nuclease and SURVEYOR S Enhancer (Transgenomics) according to the manufacturer's recommended protocols, analyzed on gels, and quantified based on the relative intensity of band staining.
Следовательно, в родственном аспекте настоящего изобретения предусмотрена не встречающаяся в природе или сконструированная композиция из системы CRISPR-Cas на основе Cas9, содержащая функциональный Cas9, описываемый в данном документе, и направляющую РНК (gRNA), где gRNA предусматривает нефункциональную направляющую последовательность, в результате чего gRNA способна гибридизироваться с целевой последовательностью, так что система CRISPR-Cas на основе Cas9 направляется в представляющий интерес локус генома в клетке, при этом отсутствует обнаруживаемая активность в отношении образования вставок/делеций, возникающая в результате нуклеазной активности немутантного фермента Cas9 системы, как определено с помощью анализа с использованием нуклеазы SURVEYOR. Вкратце, gRNA, содержащая нефункциональную направляющую последовательность, в результате чего gRNA способна гибридизироваться с целевой последовательностью, так что система CRISPR-Cas на основе Cas9 направляется в представляющий интерес локус генома в клетке, при этом отсутствует обнаруживаемая активность в отношении образования вставок/делеций, возникающая в результате нуклеазной активности немутантного фермента Cas9 системы, как определено с помощью анализа с использованием нуклеазы SURVEYOR, в данном документе называется "нефункциональная gRNA". Следует понимать, что любую из gRNA в соответствии с настоящим изобретением, описываемую в другом разделе данного документа, можно применять в качестве нефункциональных gRNA/gRNA, содержащих нефункциональную направляющую последовательность, описываемую в данном документе ниже. Любые из способов, продуктов, композиций и вариантов применения, описываемых в других разделах данного документа, одинаково применимы с нефункциональными gRNA/gRNA, содержащими нефункциональную направляющую последовательность, как дополнительно подробно описано ниже. С целью дополнительного руководства приводятся следующие конкретные аспекты и варианты осуществления.Accordingly, in a related aspect of the present invention, there is provided a non-naturally occurring or engineered composition of a Cas9-based CRISPR-Cas system comprising a functional Cas9 as described herein and a guide RNA (gRNA), wherein the gRNA provides a non-functional guide sequence such that the gRNA is capable of hybridizing to a target sequence such that the Cas9-based CRISPR-Cas system is targeted to a genomic locus of interest in a cell, while lacking detectable insertion/deletion forming activity resulting from the nuclease activity of a wild-type Cas9 enzyme of the system, as determined by the SURVEYOR nuclease assay. Briefly, a gRNA comprising a non-functional guide sequence, whereby the gRNA is capable of hybridizing to a target sequence such that a Cas9-based CRISPR-Cas system is directed to a genomic locus of interest in a cell, while lacking detectable insertion/deletion forming activity resulting from the nuclease activity of a wild-type Cas9 enzyme of the system, as determined by the SURVEYOR nuclease assay, is referred to herein as a "non-functional gRNA". It should be understood that any of the gRNAs of the present invention described elsewhere herein can be used as non-functional gRNAs/gRNAs comprising a non-functional guide sequence described herein below. Any of the methods, products, compositions, and uses described elsewhere herein are equally applicable to non-functional gRNAs/gRNAs comprising a non-functional guide sequence, as further detailed below. For further guidance, the following specific aspects and implementation options are provided.
Способность нефункциональной направляющей последовательности управлять специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью можно оценить с помощью любого подходящего анализа. Например, компоненты системы CRISPR, достаточные для образования комплекса CRISPR, в том числе нефункциональная направляющая последовательность, подлежащая тестированию, могут быть обеспечены в клетке-хозяине, имеющей соответствующую целевую последовательностью, как, например, с помощью трансфекции векторами, кодирующими компоненты последовательности CRISPR, с последующей оценкой предпочтительного расщепления в пределах целевой последовательности, как, например, с помощью анализа с использованием нуклеазы Surveyor, описываемого в данном документе. Аналогично, расщепление целевой полинуклеотидной последовательности можно определять в пробирке путем обеспечения целевой последовательности, компонентов комплекса CRISPR, в том числе нефункциональной направляющей последовательности, подлежащей тестированию, и контрольной направляющей последовательности, отличной от тестируемой нефункциональной направляющей последовательности, и сравнения связывания или степени расщепления целевой последовательности в случае реакций с тестируемой и контрольной направляющей последовательностью. Возможны и другие анализы, и они могут быть выполнены специалистами в данной области. Может быть выбрана нефункциональная направляющая последовательность для нацеливания на любую целевую последовательность. В некоторых вариантах осуществления целевая последовательность является последовательностью в пределах генома клетки.The ability of a non-functional guide sequence to direct sequence-specific binding of a CRISPR complex to a target sequence can be assessed using any suitable assay. For example, components of a CRISPR system sufficient to form a CRISPR complex, including a non-functional guide sequence to be tested, can be provided to a host cell having an appropriate target sequence, such as by transfection with vectors encoding components of the CRISPR sequence, followed by assessment of preferential cleavage within the target sequence, such as by the Surveyor nuclease assay described herein. Similarly, cleavage of a target polynucleotide sequence can be determined in vitro by providing a target sequence, components of a CRISPR complex, including a non-functional guide sequence to be tested, and a control guide sequence different from the non-functional guide sequence being tested, and comparing the binding or degree of cleavage of the target sequence in reactions with the test and control guide sequences. Other assays are possible and can be performed by those skilled in the art. A non-functional guide sequence can be selected to target any target sequence. In some embodiments, the target sequence is a sequence within the genome of the cell.
Как дополнительно объясняется в данном документе, некоторые параметры структуры обеспечивают возможность достижения правильного остова у таких нефункциональных направляющих. Нефункциональные направляющие последовательности короче соответствующих направляющих последовательностей, которые приводят к активному специфическому образованию вставок/делеций под действием Cas9. Нефункциональные направляющие на 5%, 10%, 20%, 30%, 40%, 50% короче соответствующих направляющих, которые управляют тем же Cas9, приводящим к активному специфическому образованию вставок/делеций под действием Cas9.As further explained in this paper, several design parameters ensure that the correct scaffold is achieved in such non-functional guides. The non-functional guide sequences are shorter than the corresponding guide sequences that drive active specific insertion/deletion formation by Cas9. The non-functional guides are 5%, 10%, 20%, 30%, 40%, 50% shorter than the corresponding guides that drive the same Cas9, leading to active specific insertion/deletion formation by Cas9.
Как объясняется ниже и известно из уровня техники, один аспект специфичности gRNA-Cas9 определяется последовательностью прямого повтора, которая должна быть соответствующим образом связана с такими направляющими. В частности, это означает, что последовательности прямого повтора разрабатывают в зависимости от организма, от которого происходит Cas9. Таким образом, структурные данные, доступные для проверенных нефункциональных направляющих последовательностей, можно применять для разработки эквивалентов, специфичных для Cas9. Структурное сходство между, например, ортологичными нуклеазными доменами RuvC двух или более эффекторных белков Cas9, можно применять для переноса дизайна на эквивалентные нефункциональные направляющие. Таким образом, нефункциональную направляющую в данном документе можно соответствующим образом модифицировать в отношении длины и последовательности в соответствии с такими специфичными для Cas9 эквивалентами, что обеспечивает возможность образования комплекса CRISPR и успешное связывание с мишенью, при этом в то же время не обеспечивает успешную нуклеазную активность.As explained below and known in the art, one aspect of the specificity of gRNA-Cas9 is determined by the direct repeat sequence, which must be suitably linked to such guides. In particular, this means that the direct repeat sequences are designed depending on the organism from which Cas9 is derived. Thus, the structural data available for the validated non-functional guide sequences can be used to design Cas9-specific equivalents. Structural similarities between, for example, the orthologous RuvC nuclease domains of two or more Cas9 effector proteins can be used to transfer the design to equivalent non-functional guides. Thus, the non-functional guide herein can be suitably modified in length and sequence to match such Cas9-specific equivalents, allowing for CRISPR complex formation and successful target binding, while not allowing for successful nuclease activity.
Применение нефункциональных направляющих в контексте данного документа, а также существующий уровень техники, обеспечивают удивительную и непредусмотренную платформу для биологии сетей и/или биологии систем в приложениях in vitro, ex vivo и in vivo одновременно, обеспечивая возможность мультиплексного нацеливания на гены и, в частности, двунаправленного мультиплексного нацеливания на гены. До применения нефункциональных направляющих воздействие на множественные мишени, например, для активации, репрессии и/или сайленсинга генной активности, представляло собой проблему и в некоторых случаях было невозможным. С применением нефункциональных направляющих появилась возможность воздействовать на множественные мишени и, таким образом, на множественные виды активности, например, в одной и той же клетке, у одного и того же животного, или у одного и того же пациента. Такое мультиплексирование может происходить в одно и то же время или быть распределено в течение требуемого периода времени.The use of non-functional guides in the context of this document, as well as the existing state of the art, provide a surprising and unforeseen platform for network biology and/or systems biology in in vitro, ex vivo and in vivo applications simultaneously, allowing multiplexed gene targeting and, in particular, bidirectional multiplexed gene targeting. Before the use of non-functional guides, targeting multiple targets, for example, to activate, repress and/or silence gene activity, was challenging and in some cases impossible. With the use of non-functional guides, it is possible to target multiple targets and thus multiple activities, for example, in the same cell, in the same animal, or in the same patient. Such multiplexing can occur at the same time or be distributed over a desired period of time.
Например, в настоящее время нефункциональные направляющие впервые обеспечивают возможность применять gRNA в качестве средства для нацеливания на ген без последствий в виде нуклеазной активности, при этом в то же время обеспечивая направленные средства для активации или репрессии. Направляющая РНК, предусматривающая нефункциональную направляющую, может быть модифицирована таким образом, чтобы дополнительно включать элементы, которые обеспечивают возможность активации или репрессии генной активности, в частности, адаптерные белки (например, аптамеры), описываемые в других разделах данного документа, обеспечивающие возможность функционального размещения генных эффекторов (например, активаторов или репрессоров генной активности). Одним примером является введение аптамеров, как объясняется в данном документе и в уровне техники. Путем конструирования gRNA, предусматривающей нефункциональную направляющую, с включением аптамеров, взаимодействующих с белками (Konermann et al., "Genome-scale transcription activation by an engineered CRISPR-Cas9 complex," doi:10.1038/nature14136, включенный в данный документ посредством ссылки), можно собрать синтетический комплекс активации транскрипции, состоящий из множественных отличающихся эффекторных доменов. Их можно моделировать в соответствии с естественными процессами активации транскрипции. Например, аптамер, который селективно связывает эффектор (например, активатор или репрессор; димеризованные белки оболочки бактериофага MS2 в качестве слитых белков с активатором или репрессором), или белок, который сам по себе связывает эффектор (например, активатор или репрессор), могут быть прикреплены к тетрапетле и/или "петле-на-стебле" 2 нефункциональной gRNA. В случае MS2 слитый белок MS2-VP64 связывается с тетрапетлей и/или "петлей-на-стебле" 2 и в свою очередь опосредует активацию транскрипции, например, для Neurog2. Другие активаторы транскрипции, например, представляют собой VP64, P65, HSF1 и MyoD1. Исключительно в качестве примера данной концепции, замещение "петель-на-стебле" MS2 на "петли-на-стебле", взаимодействующие с PP7, можно применять для рекрутирования репрессорных элементов.For example, non-functional guides now provide for the first time the ability to use gRNA as a means for gene targeting without the consequences of nuclease activity, while still providing targeted means for activation or repression. A guide RNA providing a non-functional guide can be modified to further include elements that allow for the activation or repression of gene activity, in particular adaptor proteins (e.g., aptamers) described elsewhere in this document that allow for the functional placement of gene effectors (e.g., activators or repressors of gene activity). One example is the introduction of aptamers, as explained herein and in the prior art. By engineering a gRNA that includes a non-functional guide and incorporating protein-interacting aptamers (Konermann et al., "Genome-scale transcription activation by an engineered CRISPR-Cas9 complex," doi:10.1038/nature14136, incorporated herein by reference), a synthetic transcriptional activation complex can be assembled consisting of multiple distinct effector domains. These can be modeled after natural transcriptional activation processes. For example, an aptamer that selectively binds an effector (e.g., an activator or repressor; dimerized bacteriophage MS2 coat proteins as fusion proteins with an activator or repressor) or a protein that itself binds an effector (e.g., an activator or repressor) can be attached to the tetraloop and/or stem-loop 2 of a non-functional gRNA. In the case of MS2, the MS2-VP64 fusion protein binds to tetraloop and/or stem-loop 2 and in turn mediates transcriptional activation, for example for Neurog2. Other transcriptional activators include VP64, P65, HSF1, and MyoD1. As a pure example of this concept, replacing MS2 stem-loops with PP7-interacting stem-loops can be used to recruit repressor elements.
Таким образом, одним аспектом настоящего изобретения является gRNA, которая предусматривает нефункциональную направляющую, где gRNA дополнительно содержит модификации, которые обеспечивают возможность активации или репрессии гена, как описано в данном документе. Нефункциональные gRNA могут содержать один или несколько аптамеров. Аптамеры могут быть специфичными к генным эффекторам, генным активаторам или генным репрессорам. Альтернативно аптамеры могут быть специфичными к белку, который, в свою очередь, является специфичным к генным эффекторам, генным активаторам или генным репрессорам и рекрутирует/связывает их. Если имеются множественные сайты для рекрутирования активаторов или репрессоров, предпочтительно, чтобы сайты были специфичными либо к активаторам, либо к репрессорам. Если имеются множественные сайты для связывания активаторов или репрессоров, сайты могут быть специфичными к одним и тем же активаторам или одним и тем же репрессорам. Сайты также могут быть специфичны к различным активаторам или различным репрессорам. Генные эффекторы, генные активаторы, генные репрессоры могут присутствовать в форме слитых белков.Thus, one aspect of the present invention is a gRNA that provides a non-functional guide, wherein the gRNA further comprises modifications that allow for gene activation or repression as described herein. Non-functional gRNAs may comprise one or more aptamers. The aptamers may be specific for gene effectors, gene activators, or gene repressors. Alternatively, the aptamers may be specific for a protein that in turn is specific for and recruits/binds gene effectors, gene activators, or gene repressors. If there are multiple sites for recruiting activators or repressors, it is preferred that the sites are specific for either activators or repressors. If there are multiple sites for binding activators or repressors, the sites may be specific for the same activators or the same repressors. The sites may also be specific for different activators or different repressors. Gene effectors, gene activators, and gene repressors may be present in the form of fusion proteins.
В одном варианте осуществления нефункциональная gRNA, описываемая в данном документе, или комплекс CRISPR-Cas на основе Cas9, описываемый в данном документе, включают не встречающуюся в природе или сконструированную композицию, содержащую два или более адаптерных белков, где каждый белок ассоциируется с одним или несколькими функциональными доменами, и где адаптерный белок связывается с отличающейся последовательностью(последовательностями) РНК, вставленной (вставленными) по меньшей мере в одну петлю нефункциональной gRNA.In one embodiment, the non-functional gRNA described herein or the Cas9-based CRISPR-Cas complex described herein comprises a non-naturally occurring or engineered composition comprising two or more adaptor proteins, wherein each protein is associated with one or more functional domains, and wherein the adaptor protein binds to a distinct RNA sequence(s) inserted into at least one loop of the non-functional gRNA.
Следовательно, в одном аспекте предусмотрена не встречающаяся в природе или сконструированная композиция, содержащая направляющую РНК (gRNA), предусматривающую нефункциональную направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, где нефункциональная направляющая последовательность определена в данном документе, Cas9, содержащую по меньшей мере одну или несколько последовательностей ядерной локализации, где Cas9 необязательно содержит по меньшей мере одну мутацию, где по меньшей мере одна петля нефункциональной gRNA модифицирована путем вставки отличающейся последовательности(последовательностей) РНК, которая связывается с одним или несколькими адаптерными белками, и где адаптерный белок ассоциируется с одним или несколькими функциональными доменами; или где нефункциональная gRNA модифицирована так, что она имеет по меньшей мере одну некодирующую функциональную петлю, и где композиция содержит два или более адаптерных белков, где каждый белок ассоциируется с одним или несколькими функциональными доменами.Therefore, in one aspect, there is provided a non-naturally occurring or engineered composition comprising a guide RNA (gRNA) comprising a non-functional guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell, wherein the non-functional guide sequence is defined herein, a Cas9 comprising at least one or more nuclear localization sequences, wherein the Cas9 optionally comprises at least one mutation, wherein at least one loop of the non-functional gRNA is modified by insertion of a different RNA sequence(s) that binds to one or more adaptor proteins, and wherein the adaptor protein is associated with one or more functional domains; or wherein the non-functional gRNA is modified such that it has at least one non-coding functional loop, and wherein the composition comprises two or more adaptor proteins, wherein each protein is associated with one or more functional domains.
В определенных вариантах осуществления адаптерный белок представляет собой слитый белок, содержащий функциональный домен, причем слитый белок необязательно содержит линкер между адаптерным белком и функциональным доменом, при этом линкер необязательно включает линкер GlySer.In certain embodiments, the adapter protein is a fusion protein comprising a functional domain, wherein the fusion protein optionally comprises a linker between the adapter protein and the functional domain, wherein the linker optionally comprises a GlySer linker.
В определенных вариантах осуществления по меньшей мере одна петля нефункциональной gRNA не является модифицированной путем вставки отличающейся последовательности(последовательностей) РНК, которая связывается с двумя или более адаптерными белками.In certain embodiments, at least one loop of the non-functional gRNA is not modified by insertion of a different RNA sequence(s) that binds to two or more adaptor proteins.
В определенных вариантах осуществления один или несколько функциональных доменов, ассоциированных с адаптерным белком, представляют собой домен активации транскрипции.In certain embodiments, one or more functional domains associated with the adapter protein is a transcriptional activation domain.
В определенных вариантах осуществления один или несколько функциональный доменов, ассоциированных с адаптерным белком, представляют собой домен активации транскрипции, предусматривающий VP64, p65, MyoD1, HSF1, RTA или SET7/9.In certain embodiments, one or more functional domains associated with the adapter protein are a transcriptional activation domain comprising VP64, p65, MyoD1, HSF1, RTA, or SET7/9.
В определенных вариантах осуществления один или несколько функциональных доменов, ассоциированных с адаптерным белком, представляют собой домен репрессии транскрипции.In certain embodiments, one or more functional domains associated with the adaptor protein are a transcriptional repression domain.
В определенных вариантах осуществления домен репрессии транскрипции представляет собой домен KRAB.In certain embodiments, the transcriptional repression domain is a KRAB domain.
В определенных вариантах осуществления домен репрессии транскрипции представляет собой домен NuE, домен NcoR, домен SID или домен SID4X.In certain embodiments, the transcriptional repression domain is a NuE domain, a NcoR domain, a SID domain, or a SID4X domain.
В определенных вариантах осуществления по меньшей мере один из одного или нескольких функциональных доменов, ассоциированных с адаптерным белком, характеризуется одной или несколькими видами активности, предусматривающими метилазную активность, деметилазную активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность интеграции ДНК, активность расщепления РНК, активность расщепления ДНК или активность связывания нуклеиновой кислоты.In certain embodiments, at least one of the one or more functional domains associated with the adapter protein is characterized by one or more activities comprising methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, DNA integration activity, RNA cleavage activity, DNA cleavage activity, or nucleic acid binding activity.
В определенных вариантах осуществления активность расщепления ДНК обусловлена нуклеазой Fok1.In certain embodiments, the DNA cleavage activity is mediated by the Fok1 nuclease.
В определенных вариантах осуществления нефункциональная gRNA модифицирована таким образом, что после того, как нефункциональная gRNA связывает адаптерный белок и далее связывается с Cas9 и мишенью, функциональный домен находится в пространственной ориентации, которая позволяет функциональному домен действовать с присущей ему функцией.In certain embodiments, the non-functional gRNA is modified such that after the non-functional gRNA binds the adaptor protein and subsequently binds to Cas9 and the target, the functional domain is in a spatial orientation that allows the functional domain to perform its intended function.
В определенных вариантах осуществления по меньшей мере одна петля нефункциональной gRNA представляет собой тетрапетлю и/или петлю 2. В определенных вариантах осуществления тетрапетля и петля 2 нефункциональной gRNA модифицированы путем вставки отличающейся последовательности (последовательностей) РНК.In certain embodiments, at least one loop of the non-functional gRNA is a tetraloop and/or loop 2. In certain embodiments, the tetraloop and loop 2 of the non-functional gRNA are modified by insertion of different RNA sequence(s).
В определенных вариантах осуществления вставка отличающейся последовательность(последовательности) РНК, которая связывается с одним или несколькими адаптерными белками, представляет собой аптамерную последовательность. В определенных вариантах осуществления аптамерная последовательность представляет собой две или более аптамерные последовательности, специфичные к одному и тому же адаптерному белку. В определенных вариантах осуществления аптамерная последовательность представляет собой две или более аптамерные последовательности, специфичные к различным адаптерным белкам.In certain embodiments, the insertion of a distinct RNA sequence(s) that binds to one or more adapter proteins is an aptamer sequence. In certain embodiments, the aptamer sequence is two or more aptamer sequences specific for the same adapter protein. In certain embodiments, the aptamer sequence is two or more aptamer sequences specific for different adapter proteins.
В определенных вариантах осуществления адаптерный белок предусматривает MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, фCb5, фCb8r, фCb12r, фCb23r, 7s, PRR1.In certain embodiments, the adapter protein comprises MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, fCb5, fCb8r, fCb12r, fCb23r, 7s, PRR1.
В определенных вариантах осуществления клетка является эукариотической клеткой. В определенных вариантах осуществления эукариотическая клетка является клеткой млекопитающего, необязательно клеткой мыши. В определенных вариантах осуществления клетка млекопитающего является клеткой человека.In certain embodiments, the cell is a eukaryotic cell. In certain embodiments, the eukaryotic cell is a mammalian cell, optionally a mouse cell. In certain embodiments, the mammalian cell is a human cell.
В определенных вариантах осуществления первый адаптерный белок ассоциируется с доменом p65, а второй адаптерный белок ассоциируется с доменом HSF1.In certain embodiments, the first adapter protein associates with the p65 domain and the second adapter protein associates with the HSF1 domain.
В определенных вариантах осуществления композиция содержит комплекс CRISPR-Cas на основе Cas9, имеющий по меньшей мере три функциональных домена, по меньшей мере один из которых ассоциируется с Cas9 и по меньшей мере два из которых ассоциируются с нефункциональной gRNA.In certain embodiments, the composition comprises a Cas9-based CRISPR-Cas complex having at least three functional domains, at least one of which associates with Cas9 and at least two of which associate with a non-functional gRNA.
В определенных вариантах осуществления композиция дополнительно содержит вторую gRNA, где вторая gRNA представляет собой функциональную gRNA, способную гибридизироваться со второй целевой последовательностью, так что вторая система CRISPR-Cas на основе Cas9 направляется ко второму представляющему интерес локусу генома в клетке, при этом присутствует обнаруживаемая активность в отношении образования вставок/делеций во втором локусе генома, возникающая в результате нуклеазной активности фермента Cas9 системы.In certain embodiments, the composition further comprises a second gRNA, wherein the second gRNA is a functional gRNA capable of hybridizing to a second target sequence such that the second Cas9-based CRISPR-Cas system is directed to a second genomic locus of interest in a cell, wherein there is detectable insertion/deletion activity in the second genomic locus resulting from the nuclease activity of the Cas9 enzyme of the system.
В определенных вариантах осуществления композиция дополнительно содержит несколько нефункциональных gRNA и/или несколько функциональных gRNA.In certain embodiments, the composition further comprises multiple non-functional gRNAs and/or multiple functional gRNAs.
Один аспект настоящего изобретения предусматривает извлечение пользы из модульности и настраиваемости каркаса gRNA для создания серии каркасов gRNA с разными сайтами связывания (в частности, аптамерами) для рекрутирования отличающихся типов эффекторов ортогональным способом. Опять-таки, что касается примера и иллюстрации более широкой концепции, замещение "петель-на-стебле" MS2 на "петли-на-стебле", взаимодействующие с PP7, можно применять для связывания/рекрутирования репрессорных элементов, обеспечивающих мультиплексный двунаправленный контроль транскрипции. Таким образом, в целом, gRNA, предусматривающую нефункциональную направляющую, можно использовать для обеспечения мультиплексного контроля транскрипции и предпочтительно двунаправленного контроля транскрипции. Такой контроль транскрипции является наиболее предпочтительным для генов. Например, одну или несколько gRNA, предусматривающих нефункциональную(нефункциональные) направляющую(направляющие), можно использовать в нацеливании на активацию одного или нескольких целевых генов. В то же самое время, одну или несколько gRNA, предусматривающих нефункциональную (нефункциональные) направляющую (направляющие), можно использовать в нацеливании на репрессию одного или нескольких целевых генов. Такую последовательность можно применять в целом ряде различных комбинаций, например, целевые гены вначале подвергают репрессии, а затем через соответствующий период времени другие мишени активируют, или выбранные гены подвергают репрессии, в то время как выбранные гены активируют, с последующей дополнительной активацией и/или репрессией. В результате этого, на множественные компоненты одной или нескольких биологических систем можно преимущественно воздействовать совместно.One aspect of the present invention is to take advantage of the modularity and tunability of the gRNA scaffold to create a series of gRNA scaffolds with different binding sites (particularly aptamers) to recruit different types of effectors in an orthogonal manner. Again, by way of example and illustration of the broader concept, the replacement of the MS2 stem loops with PP7 interacting stem loops can be used to bind/recruit repressor elements to provide multiplex bidirectional transcriptional control. Thus, in general, a gRNA providing a non-functional guide can be used to provide multiplex transcriptional control and preferably bidirectional transcriptional control. Such transcriptional control is most advantageous for genes. For example, one or more gRNAs providing non-functional guide(s) can be used to target the activation of one or more target genes. At the same time, one or more gRNAs providing a non-functional guide(s) can be used to target the repression of one or more target genes. Such a sequence can be used in a variety of different combinations, for example, target genes are initially repressed and then after an appropriate period of time other targets are activated, or selected genes are repressed while selected genes are activated, followed by additional activation and/or repression. As a result, multiple components of one or more biological systems can be advantageously targeted together.
В одном аспекте настоящего изобретения предусмотрена молекула(молекулы) нуклеиновой кислоты, кодирующая(кодирующие) нефункциональную gRNA, или комплекс CRISPR-Cas на основе Cas9, или композицию, описываемые в данном документе.In one aspect, the present invention provides a nucleic acid molecule(s) encoding a non-functional gRNA, or a Cas9-based CRISPR-Cas complex, or a composition as described herein.
В одном аспекте настоящего изобретения предусмотрена векторная система, содержащая: молекулу нуклеиновой кислоты, кодирующую нефункциональную направляющую РНК, определяемую в данном документе. В определенных вариантах осуществления векторная система дополнительно содержит молекулу(молекулы) нуклеиновой кислоты, кодирующую(кодирующие) Cas9. В определенных вариантах осуществления векторная система дополнительно содержит молекулу(молекулы) нуклеиновой кислоты, кодирующую(кодирующие) (функциональную) gRNA. В определенных вариантах осуществления молекула нуклеиновой кислоты или вектор дополнительно содержат регуляторный(регуляторные) элемент(элементы), функциональный в эукариотической клетке, функционально связанный с молекулой нуклеиновой кислоты, кодирующей направляющую последовательность (gRNA), и/или молекулой нуклеиновой кислоты, кодирующей Cas9, и/или необязательной последовательностью(последовательностями) ядерной локализации.In one aspect of the present invention, there is provided a vector system comprising: a nucleic acid molecule encoding a non-functional guide RNA as defined herein. In certain embodiments, the vector system further comprises a nucleic acid molecule(s) encoding Cas9. In certain embodiments, the vector system further comprises a nucleic acid molecule(s) encoding a (functional) gRNA. In certain embodiments, the nucleic acid molecule or vector further comprises a regulatory element(s) functional in a eukaryotic cell operably linked to a nucleic acid molecule encoding a guide sequence (gRNA) and/or a nucleic acid molecule encoding Cas9 and/or optional nuclear localization sequence(s).
В другом аспекте для исследования взаимодействий между нефункциональной направляющей и активной нуклеазой Cas9, которые обеспечивают связывание ДНК, но не разрезание ДНК, можно применять структурный анализ. При этом определяют аминокислоты, важные для нуклеазной активности Cas9. Модификация таких аминокислот обеспечивает улучшенные ферменты Cas9, применяемые для редактирования генов.In another aspect, structural analysis can be used to study the interactions between the non-functional guide and the active Cas9 nuclease that mediate DNA binding but not DNA cleavage. This identifies amino acids that are important for the Cas9 nuclease activity. Modification of these amino acids provides improved Cas9 enzymes for gene editing.
Дополнительный аспект заключается в комбинировании применения нефункциональных направляющих, изложенных в данном документе, с другими применениями CRISPR, изложенными в данном документе, а также известными из уровня техники. Например, gRNA, предусматривающую нефункциональную(нефункциональные) направляющую(направляющие) для нацеленной мультиплексной активации или репрессии генов или нацеленной мультиплексной двунаправленной активации/репрессии генов, можно комбинировать с gRNA, предусматривающей направляющие, которые поддерживают нуклеазную активность, как изложено в данном документе. Такие gRNA, предусматривающие направляющие, которые поддерживают нуклеазную активность, могут дополнительно включать модификации, которые обеспечивают репрессию генной активности (например, аптамеры), или могут не включать такие модификации. Такие gRNA, предусматривающие направляющие, которые поддерживают нуклеазную активность, могут дополнительно включать модификации, которые обеспечивают активацию генной активности (например, аптамеры), или могут не включать такие модификации. Таким образом, вводятся дополнительные средства для мультиплексного генного контроля (например, мультиплексная нацеленная активация гена без нуклеазной активности/без активности в отношении образования вставок/делеций может обеспечиваться одновременно или в комбинации с нацеленной репрессией гена с нуклеазной активностью).A further aspect is the combination of the use of non-functional guides as described herein with other uses of CRISPR as described herein and as known in the art. For example, a gRNA providing non-functional guide(s) for targeted multiplex gene activation or repression or targeted multiplex bidirectional gene activation/repression can be combined with a gRNA providing guides that support nuclease activity as described herein. Such gRNAs providing guides that support nuclease activity may further comprise modifications that provide for repression of gene activity (e.g., aptamers), or may not comprise such modifications. Such gRNAs providing guides that support nuclease activity may further comprise modifications that provide for activation of gene activity (e.g., aptamers), or may not comprise such modifications. Thus, additional means for multiplex gene control are introduced (e.g. multiplex targeted activation of a gene without nuclease activity/without insertion/deletion activity can be provided simultaneously or in combination with targeted repression of a gene with nuclease activity).
Например, 1) применение одной или нескольких gRNA (например, 1-50, 1-40, 1-30, 1-20, предпочтительно 1-10, более предпочтительно 1-5), предусматривающих нефункциональную(нефункциональные) направляющую(направляющие), нацеленную(нацеленные) на один или несколько генов и дополнительно модифицированную(модифицированные) с помощью соответствующих аптамеров для рекрутирования генных активаторов; 2) можно комбинировать с одной или несколькими gRNA (например, 1-50, 1-40, 1-30, 1-20, предпочтительно 1-10, более предпочтительно 1-5), предусматривающими нефункциональную(нефункциональные) направляющую (направляющие), нацеленную(нацеленные) на один или несколько генов и дополнительно модифицированную(модифицированные) с помощью соответствующих аптамеров для рекрутирования генных репрессоров. 1) и/или 2) затем можно комбинировать с 3) одной или несколькими gRNA (например, 1-50, 1-40, 1-30, 1-20, предпочтительно 1-10, более предпочтительно 1-5), нацеленными на один или несколько генов. Эту комбинацию затем можно осуществлять по порядку в виде 1) + 2) + 3) с 4) одной или несколькими gRNA (например, 1-50, 1-40, 1-30, 1-20, предпочтительно 1-10, более предпочтительно 1-5), нацеленными на один или несколько генов и дополнительно модифицированными с помощью соответствующих аптамеров для рекрутирования генных активаторов. Эту комбинацию затем можно осуществлять по порядку в виде 1) + 2) + 3) + 4) с 5) одной или несколькими gRNA (например, 1-50, 1-40, 1-30, 1-20, предпочтительно 1-10, более предпочтительно 1-5), нацеленными на один или несколько генов и дополнительно модифицированными с помощью соответствующих аптамеров для рекрутирования генных репрессоров. В результате этого, в настоящее изобретение включены различные варианты применения и комбинации. Например, комбинация 1) + 2); комбинация 1) + 3); комбинация 2) + 3); комбинация 1) + 2) + 3); комбинация 1) + 2) +3) +4); комбинация 1) + 3) + 4); комбинация 2) + 3) +4); комбинация 1) + 2) + 4); комбинация 1) + 2) +3) +4) + 5); комбинация 1) + 3) + 4) +5); комбинация 2) + 3) +4) +5); комбинация 1) + 2) + 4) +5); комбинация 1) + 2) +3) + 5); комбинация 1) + 3) +5); комбинация 2) + 3) +5); комбинация 1) + 2) +5).For example, 1) the use of one or more gRNAs (e.g. 1-50, 1-40, 1-30, 1-20, preferably 1-10, more preferably 1-5) providing non-functional guide(s) targeting one or more genes and further modified with appropriate aptamers to recruit gene activators; 2) can be combined with one or more gRNAs (e.g. 1-50, 1-40, 1-30, 1-20, preferably 1-10, more preferably 1-5) providing non-functional guide(s) targeting one or more genes and further modified with appropriate aptamers to recruit gene repressors. 1) and/or 2) can then be combined with 3) one or more gRNAs (e.g. 1-50, 1-40, 1-30, 1-20, preferably 1-10, more preferably 1-5) targeting one or more genes. This combination can then be performed in order as 1) + 2) + 3) with 4) one or more gRNAs (e.g. 1-50, 1-40, 1-30, 1-20, preferably 1-10, more preferably 1-5) targeting one or more genes and further modified with appropriate aptamers to recruit gene activators. This combination can then be carried out in order as 1) + 2) + 3) + 4) with 5) one or more gRNAs (e.g. 1-50, 1-40, 1-30, 1-20, preferably 1-10, more preferably 1-5) targeting one or more genes and further modified with appropriate aptamers to recruit gene repressors. As a result, various uses and combinations are included in the present invention. For example, a combination of 1) + 2); combination 1) + 3); combination 2) + 3); combination 1) + 2) + 3); combination 1) + 2) + 3) +4); combination 2) + 3) +4); combination 1) + 2) + 4); combination 1) + 2) + 3) +4) + 5); combination 1) + 3) + 4) +5); combination 2) + 3) +4) +5); combination 1) + 2) + 4) +5); combination 1) + 2) +3) + 5); combination 1) + 3) +5); combination 2) + 3) +5); combination 1) + 2) +5).
В одном аспекте настоящего изобретения предусмотрен алгоритм для разработки, оценки или отбора нацеливающей последовательности на основе нефункциональной направляющей РНК (нефункциональная направляющая последовательность) для направления системы CRISPR-Cas на основе Cas9 к целевому генному локусу. В частности, было определено, что специфичность нефункциональной направляющей РНК зависит от i) содержания GC и ii) длины нацеливающей последовательности и ее можно оптимизировать, варьируя данные параметры. В одном аспекте настоящего изобретения предусмотрен алгоритм для разработки или оценки нацеливающей последовательности на основе нефункциональной направляющей РНК, которая сводит к минимуму нецелевое связывание или взаимодействие нефункциональной направляющей РНК. В одном варианте осуществления настоящего изобретения алгоритм выбора нацеливающей последовательности на основе нефункциональной направляющей РНК для направления системы CRISPR на генный локус в организме предусматривает a) определение местоположения одного или нескольких мотивов CRISPR в генном локусе, анализ последовательности длиной 20 нуклеотидов, расположенной ниже каждого мотива CRISPR, путем i) определения содержания GC в последовательности; и ii) определения того, имеются ли в геноме организма нецелевые совпадения из 15 нижерасположенных нуклеотидов, ближайших к мотиву CRISPR, и c) выбор 15-нуклеотидной последовательности для применения в нефункциональной направляющей РНК, если содержание GC последовательности составляет 70% или меньше и не идентифицированы нецелевые совпадения. В одном варианте осуществления последовательность выбирают в качестве нацеливающей последовательности, если содержание GC составляет 60% или меньше. В определенных вариантах осуществления последовательность выбирают в качестве нацеливающей последовательности, если содержание GC составляет 55% или меньше, 50% или меньше, 45% или меньше, 40% или меньше, 35% или меньше, или 30% или меньше. В одном варианте осуществления анализируют две или более последовательностей генного локуса и выбирают последовательность с самым низким содержанием GC, или последовательность на втором месте по самому низкому содержанию GC, или последовательность на третьем месте по самому низкому содержанию GC. В одном варианте осуществления последовательность выбрана в качестве нацеливающей последовательности, если в геноме организма не идентифицированы нецелевые совпадения. В одном варианте осуществления нацеливающую последовательность выбирают, если в геноме организма не идентифицированы нецелевые совпадения.In one aspect of the present invention, there is provided an algorithm for designing, evaluating or selecting a targeting sequence based on a non-functional guide RNA (non-functional guide sequence) for directing a Cas9-based CRISPR-Cas system to a target gene locus. In particular, it was determined that the specificity of the non-functional guide RNA depends on i) the GC content and ii) the length of the targeting sequence and can be optimized by varying these parameters. In one aspect of the present invention, there is provided an algorithm for designing or evaluating a targeting sequence based on a non-functional guide RNA that minimizes off-target binding or interaction of the non-functional guide RNA. In one embodiment of the present invention, an algorithm for selecting a targeting sequence based on a non-functional guide RNA for targeting a CRISPR system to a gene locus in an organism comprises a) determining the location of one or more CRISPR motifs in a gene locus, analyzing a 20-nucleotide sequence downstream of each CRISPR motif by i) determining the GC content of the sequence; and ii) determining whether there are off-target matches in the 15 nucleotides downstream closest to the CRISPR motif in the genome of the organism, and c) selecting the 15-nucleotide sequence for use in a non-functional guide RNA if the GC content of the sequence is 70% or less and no off-target matches are identified. In one embodiment, the sequence is selected as a targeting sequence if the GC content is 60% or less. In certain embodiments, a sequence is selected as a targeting sequence if the GC content is 55% or less, 50% or less, 45% or less, 40% or less, 35% or less, or 30% or less. In one embodiment, two or more sequences of a gene locus are analyzed and the sequence with the lowest GC content, or the sequence with the second lowest GC content, or the sequence with the third lowest GC content, is selected. In one embodiment, a sequence is selected as a targeting sequence if no off-target matches are identified in the genome of the organism. In one embodiment, a targeting sequence is selected if no off-target matches are identified in the genome of the organism.
В одном аспекте настоящего изобретения предусмотрен способ выбора нацеливающей последовательности на основе нефункциональной направляющей РНК для направления функционализированной системы CRISPR на генный локус в организме, который включает: a) определение местоположения одного или нескольких мотивов CRISPR в генном локусе; b) анализ последовательности длиной 20 нуклеотидов, расположенной ниже каждого мотива CRISPR, путем: i) определения содержания GC в последовательности; и ii) определения того, имеются ли в геноме организма нецелевые совпадения с первыми 15 нуклеотидами последовательности; c) выбор последовательность для применения в направляющей РНК, если содержание GC в последовательности составляет 70% или меньше и не идентифицированы нецелевые совпадения. В одном варианте осуществления последовательность выбирают, если содержание GC составляет 50% или меньше. В одном варианте осуществления последовательность выбирают, если содержание GC составляет 40% или меньше. В одном варианте осуществления последовательность выбирают, если содержание GC составляет 30% или меньше. В одном варианте осуществления анализируют две или более последовательностей и выбирают последовательность с самым низким содержанием GC. В одном варианте осуществления нецелевые совпадения определяют в регуляторных последовательностях организма. В одном варианте осуществления генный локус представляет собой регуляторный участок. В одном аспекте предусмотрена нефункциональная направляющая РНК, предусматривающая нацеливающую последовательность, выбранную в соответствии с вышеупомянутыми способами.In one aspect, the present invention provides a method for selecting a targeting sequence based on a non-functional guide RNA for directing a functionalized CRISPR system to a gene locus in an organism, the method comprising: a) determining the location of one or more CRISPR motifs in the gene locus; b) analyzing a 20 nucleotide sequence downstream of each CRISPR motif by: i) determining the GC content of the sequence; and ii) determining whether there are off-target matches to the first 15 nucleotides of the sequence in the genome of the organism; c) selecting the sequence for use in the guide RNA if the GC content of the sequence is 70% or less and no off-target matches are identified. In one embodiment, the sequence is selected if the GC content is 50% or less. In one embodiment, the sequence is selected if the GC content is 40% or less. In one embodiment, the sequence is selected if the GC content is 30% or less. In one embodiment, two or more sequences are analyzed and the sequence with the lowest GC content is selected. In one embodiment, off-target matches are determined in regulatory sequences of the organism. In one embodiment, the gene locus is a regulatory region. In one aspect, a non-functional guide RNA is provided that provides a targeting sequence selected according to the above methods.
В одном аспекте настоящего изобретения предусмотрена нефункциональная направляющая РНК для нацеливания функционализированной системы CRISPR на генный локус в организме. В одном варианте осуществления настоящего изобретения нефункциональная направляющая РНК предусматривает нацеливающую последовательность, где содержание CG в целевой последовательность составляет 70% или меньше, и первые 15 нуклеотидов нацеливающей последовательности не совпадают с нецелевой последовательностью, расположенной ниже мотива CRISPR в регуляторной последовательности из другого генного локуса в организме. В определенных вариантах осуществления содержание GC в нацеливающей последовательности составляет 60% или меньше, 55% или меньше, 50% или меньше, 45% или меньше, 40% или меньше, 35% или меньше, или 30% или меньше. В определенных вариантах осуществления содержание GC в нацеливающей последовательности составляет от 70% до 60%, или от 60% до 50%, или от 50% до 40%, или от 40% до 30%. В одном варианте осуществления нацеливающая последовательность характеризуется самым низким содержанием CG среди потенциальных нацеливающих последовательностей для локуса.In one aspect of the present invention, a non-functional guide RNA is provided for targeting a functionalized CRISPR system to a gene locus in an organism. In one embodiment of the present invention, the non-functional guide RNA provides a targeting sequence, wherein the CG content of the target sequence is 70% or less, and the first 15 nucleotides of the targeting sequence do not match a non-target sequence located downstream of a CRISPR motif in a regulatory sequence from another gene locus in the organism. In certain embodiments, the GC content of the targeting sequence is 60% or less, 55% or less, 50% or less, 45% or less, 40% or less, 35% or less, or 30% or less. In certain embodiments, the GC content of the targeting sequence is from 70% to 60%, or from 60% to 50%, or from 50% to 40%, or from 40% to 30%. In one embodiment, the targeting sequence has the lowest CG content among potential targeting sequences for a locus.
В одном варианте осуществления настоящего изобретения первые 15 нуклеотидов нефункциональной направляющей совпадают с целевой последовательностью. В другом варианте осуществления первые 14 нуклеотидов нефункциональной направляющей совпадают с целевой последовательностью. В другом варианте осуществления первые 13 нуклеотидов нефункциональной направляющей совпадают с целевой последовательностью. В другом варианте осуществления первые 12 нуклеотидов нефункциональной направляющей совпадают с целевой последовательностью. В другом варианте осуществления первые 11 нуклеотидов нефункциональной направляющей совпадают с целевой последовательностью. В другом варианте осуществления первые 10 нуклеотидов нефункциональной направляющей совпадают с целевой последовательностью. В одном варианте осуществления настоящего изобретения первые 15 нуклеотидов нефункциональной направляющей не совпадают с нецелевой последовательностью, расположенной ниже мотива CRISPR в регуляторном участке другого генного локуса. В других вариантах осуществления первые 14 нуклеотидов, или первые 13 нуклеотидов нефункциональной направляющей, или первые 12 нуклеотидов направляющей, или первые 11 нуклеотидов нефункциональной направляющей, или первые 10 нуклеотидов нефункциональной направляющей не совпадают с нецелевой последовательностью, расположенной ниже мотива CRISPR в регуляторном участке другого генного локуса. В других вариантах осуществления первые 15 нуклеотидов, или 14 нуклеотидов, или 13 нуклеотидов, или 12 нуклеотидов, или 11 нуклеотидов нефункциональной направляющей не совпадают с нецелевой последовательностью, расположенной ниже мотива CRISPR в геноме.In one embodiment of the present invention, the first 15 nucleotides of the non-functional guide match the target sequence. In another embodiment, the first 14 nucleotides of the non-functional guide match the target sequence. In another embodiment, the first 13 nucleotides of the non-functional guide match the target sequence. In another embodiment, the first 12 nucleotides of the non-functional guide match the target sequence. In another embodiment, the first 11 nucleotides of the non-functional guide match the target sequence. In another embodiment, the first 10 nucleotides of the non-functional guide match the target sequence. In one embodiment, the first 15 nucleotides of the non-functional guide do not match a non-target sequence located downstream of the CRISPR motif in the regulatory region of another gene locus. In other embodiments, the first 14 nucleotides, or the first 13 nucleotides of the non-functional guide, or the first 12 nucleotides of the guide, or the first 11 nucleotides of the non-functional guide, or the first 10 nucleotides of the non-functional guide do not match a non-target sequence located downstream of the CRISPR motif in a regulatory region of another gene locus. In other embodiments, the first 15 nucleotides, or 14 nucleotides, or 13 nucleotides, or 12 nucleotides, or 11 nucleotides of the non-functional guide do not match a non-target sequence located downstream of the CRISPR motif in the genome.
В определенных вариантах осуществления нефункциональная направляющая РНК включает дополнительные нуклеотиды на 3'-конце, которые не совпадают с целевой последовательностью. Таким образом, нефункциональная направляющая РНК, которая включает первые 15 нуклеотидов, или 14 нуклеотидов, или 13 нуклеотидов, или 12 нуклеотидов, или 11 нуклеотидов, расположенных ниже мотива CRISPR, может быть увеличена по длине на 3'-конце на 12 нуклеотидов, 13 нуклеотидов, 14 нуклеотидов, 15 нуклеотидов, 16 нуклеотидов, 17 нуклеотидов, 18 нуклеотидов, 19 нуклеотидов, 20 нуклеотидов или больше.In certain embodiments, the non-functional guide RNA includes additional nucleotides at the 3' end that do not match the target sequence. Thus, a non-functional guide RNA that includes the first 15 nucleotides, or 14 nucleotides, or 13 nucleotides, or 12 nucleotides, or 11 nucleotides located downstream of the CRISPR motif can be extended in length at the 3' end by 12 nucleotides, 13 nucleotides, 14 nucleotides, 15 nucleotides, 16 nucleotides, 17 nucleotides, 18 nucleotides, 19 nucleotides, 20 nucleotides, or more.
В настоящем изобретении предусмотрен способ направления системы CRISPR-Cas на основе Cas9, в том числе без ограничения нефункционирующей системы на основе Cas9 (dCas9) или функционализированной системы на основе Cas9 (которая может предусматривать функционализированный Cas9 или функционализированную направляющую), в генный локус. В одном аспекте настоящего изобретения предусмотрен способ выбора нацеливающей последовательности на основе нефункциональной направляющей РНК и направления функционализированной системы CRISPR к генному локусу в организме. В одном аспекте настоящего изобретения предусмотрен способ выбора нацеливающей последовательности на основе нефункциональной направляющей РНК и осуществления генной регуляции целевого генного локуса с помощью функционализированной системы CRISPR-Cas на основе Cas9. В определенных вариантах осуществления способ применяют для осуществления регуляции целевого гена, при этом сводя к минимуму нецелевые эффекты. В одном аспекте настоящего изобретения предусмотрен способ выбора двух или более нацеливающих последовательностей на основе нефункциональных направляющих РНК и осуществления генной регуляции двух или более целевых генных локусов с помощью функционализированной системы CRISPR-Cas на основе Cas9. В определенных вариантах осуществления способ применяют для осуществления регуляции двух или более целевых генных локусов, при этом сводя к минимуму нецелевые эффектыThe present invention provides a method for directing a Cas9-based CRISPR-Cas system, including but not limited to a non-functional Cas9-based system (dCas9) or a functionalized Cas9-based system (which may include a functionalized Cas9 or a functionalized guide), to a gene locus. In one aspect, the present invention provides a method for selecting a targeting sequence based on a non-functional guide RNA and directing the functionalized CRISPR system to a gene locus in an organism. In one aspect, the present invention provides a method for selecting a targeting sequence based on a non-functional guide RNA and performing gene regulation of a target gene locus using a functionalized Cas9-based CRISPR-Cas system. In certain embodiments, the method is used to perform regulation of a target gene while minimizing off-target effects. In one aspect of the present invention, there is provided a method for selecting two or more targeting sequences based on non-functional guide RNAs and gene regulation of two or more target gene loci using a functionalized Cas9-based CRISPR-Cas system. In certain embodiments, the method is used to regulate two or more target gene loci while minimizing off-target effects.
В одном аспекте настоящего изобретения предусмотрен способ выбора нацеливающей последовательности на основе нефункциональной направляющей РНК для направления функционализированного Cas9 к генному локусу в организме, который включает: a) определение местоположения одного или нескольких мотивов CRISPR в генном локусе; b) анализ последовательности, расположенной ниже каждого мотива CRISPR, путем: i) выбора 10-15 нуклеотидов, смежных с мотивом CRISPR, ii) определение содержания GC в последовательности; и c) выбор последовательности длиной 10-15 нуклеотидов в качестве нацеливающей последовательности для применения в направляющей РНК, если содержание GC последовательности составляет 40% или больше. В одном варианте осуществления последовательность выбирают, если содержание GC составляет 50% или больше. В одном варианте осуществления последовательность выбирают, если содержание GC составляет 60% или больше. В одном варианте осуществления последовательность выбирают, если содержание GC составляет 70% или больше. В одном варианте осуществления анализируют две или более последовательностей и выбирают последовательность с самым высоким содержанием GC. В одном варианте осуществления способ дополнительно включает добавление к 3'-концу выбранной последовательности нуклеотидов, которые не совпадают с последовательностью, расположенной ниже мотива CRISPR. В одном аспекте предусмотрена нефункциональная направляющая РНК, предусматривающая нацеливающую последовательность, выбранную в соответствии с вышеупомянутыми способами.In one aspect of the present invention, there is provided a method for selecting a targeting sequence based on a non-functional guide RNA for directing a functionalized Cas9 to a gene locus in an organism, which comprises: a) determining the location of one or more CRISPR motifs in the gene locus; b) analyzing a sequence located downstream of each CRISPR motif by: i) selecting 10-15 nucleotides adjacent to the CRISPR motif, ii) determining the GC content of the sequence; and c) selecting a sequence of 10-15 nucleotides in length as a targeting sequence for use in the guide RNA if the GC content of the sequence is 40% or greater. In one embodiment, the sequence is selected if the GC content is 50% or greater. In one embodiment, the sequence is selected if the GC content is 60% or greater. In one embodiment, the sequence is selected if the GC content is 70% or greater. In one embodiment, two or more sequences are analyzed and the sequence with the highest GC content is selected. In one embodiment, the method further comprises adding to the 3' end of the selected sequence of nucleotides that do not match the sequence located downstream of the CRISPR motif. In one aspect, a non-functional guide RNA is provided that provides a targeting sequence selected in accordance with the above-mentioned methods.
В одном аспекте настоящего изобретения предусмотрена нефункциональная направляющая РНК для направления функционализированной системы CRISPR на генный локус в организме, где нацеливающая последовательность на основе нефункциональной направляющей РНК состоит из 10-15 нуклеотидов, смежных с мотивом CRISPR в генном локусе, где содержание CG в целевой последовательности составляет 50% или больше. В определенных вариантах осуществления нефункциональная направляющая РНК дополнительно содержит нуклеотиды, добавленные к 3'-концу нацеливающей последовательность, которые не совпадают с последовательностью, расположенной ниже мотива CRISPR в генном локусе.In one aspect of the present invention, a non-functional guide RNA is provided for directing a functionalized CRISPR system to a gene locus in an organism, wherein the targeting sequence based on the non-functional guide RNA consists of 10-15 nucleotides adjacent to a CRISPR motif in the gene locus, wherein the CG content of the target sequence is 50% or more. In certain embodiments, the non-functional guide RNA further comprises nucleotides added to the 3' end of the targeting sequence that do not match a sequence located downstream of the CRISPR motif in the gene locus.
В одном аспекте настоящего изобретения предусмотрен одиночный эффектор, подлежащий направлению к одному или более, или двум или более генным локусам. В определенных вариантах осуществления эффектор ассоциируется с Cas9, а одну или более, или две или более выбранных нефункциональных направляющих РНК применяют для направления Cas9-ассоциированного эффектора к одному или более, или двум или более выбранным целевым генным локусам. В определенных вариантах осуществления эффектор ассоциируется с одной или более, или двумя или более выбранными нефункциональными направляющими РНК, причем каждая выбранная нефункциональная направляющая РНК, находящаяся в комплексе с ферментом Cas9, приводит к тому, что ассоциированный с ней эффектов размещается на мишени нефункциональной направляющей РНК. Один неограничивающий пример таких систем CRISPR модулирует активность одного или более, или двух или более генных локусов, подлежащих регуляции с помощью одного и того же фактора транскрипции.In one aspect of the present invention, a single effector is provided that is targeted to one or more, or two or more gene loci. In certain embodiments, the effector is associated with Cas9, and one or more, or two or more selected non-functional guide RNAs are used to target the Cas9-associated effector to one or more, or two or more selected target gene loci. In certain embodiments, the effector is associated with one or more, or two or more selected non-functional guide RNAs, wherein each selected non-functional guide RNA, when complexed with a Cas9 enzyme, causes its associated effector to be located on the target of the non-functional guide RNA. One non-limiting example of such CRISPR systems modulates the activity of one or more, or two or more gene loci that are subject to regulation by the same transcription factor.
В одном аспекте настоящего изобретения предусмотрены два или более эффекторов, подлежащие направлению на один или несколько генных локусов. В определенных вариантах осуществления используют две или более нефункциональные направляющие РНК, причем каждый из двух или более эффекторов ассоциируется с выбранной нефункциональной направляющей РНК, при этом каждый из двух или более эффекторов размещается на выбранной мишени для его нефункциональной направляющей РНК. Один неограничивающий пример таких систем CRISPR модулирует активность одного или более, или двух или более генных локусов, подлежащих регуляции с помощью различных факторов транскрипции. Таким образом, в одном неограничивающем варианте осуществления два или более факторов транскрипции локализованы в различных регуляторных последовательностях одного гена. В другом неограничивающем варианте осуществления два или более факторов транскрипции локализованы в различных регуляторных последовательностях различных генов. В определенных вариантах осуществления один фактор транскрипции является активатором. В определенных вариантах осуществления один фактор транскрипции является ингибитором. В определенных вариантах осуществления один фактор транскрипции является активатором, а другой фактор транскрипции является ингибитором. В определенных вариантах осуществления регулируются генные локусы, экспрессирующие различные компоненты одного и того же регуляторного пути. В определенных вариантах осуществления регулируются генные локусы, экспрессирующие компоненты различных регуляторных путей.In one aspect, the present invention provides two or more effectors to be directed to one or more gene loci. In certain embodiments, two or more non-functional guide RNAs are used, wherein each of the two or more effectors is associated with a selected non-functional guide RNA, wherein each of the two or more effectors is located at a selected target for its non-functional guide RNA. One non-limiting example of such CRISPR systems modulates the activity of one or more, or two or more gene loci to be regulated by different transcription factors. Thus, in one non-limiting embodiment, the two or more transcription factors are located in different regulatory sequences of a single gene. In another non-limiting embodiment, the two or more transcription factors are located in different regulatory sequences of different genes. In certain embodiments, one transcription factor is an activator. In certain embodiments, one transcription factor is an inhibitor. In certain embodiments, one transcription factor is an activator and the other transcription factor is an inhibitor. In certain embodiments, gene loci expressing different components of the same regulatory pathway are regulated. In certain embodiments, gene loci expressing components of different regulatory pathways are regulated.
В одном аспекте настоящего изобретения также предусмотрен способ и алгоритм для разработки и выбора нефункциональных направляющих РНК, которые являются специфичными в отношении расщепления целевой ДНК или связывания мишени и генной регуляции, опосредуемых активной системой CRISPR-Cas на основе Cas9. В определенных вариантах осуществления система CRISPR-Cas на основе Cas9 обеспечивает ортогональный генный контроль с применением активного Cas9, который расщепляет целевую ДНК в одном генном локусе, при этом в то же самое время связывается с другим генным локусом и содействует его регуляции.In one aspect of the present invention, there is also provided a method and algorithm for designing and selecting non-functional guide RNAs that are specific for target DNA cleavage or target binding and gene regulation mediated by an active Cas9-based CRISPR-Cas system. In certain embodiments, a Cas9-based CRISPR-Cas system provides orthogonal gene control using an active Cas9 that cleaves target DNA at one gene locus while simultaneously binding to and regulating another gene locus.
В одном аспекте настоящего изобретения предусмотрен способ выбора нацеливающей последовательности на основе нефункциональной направляющей РНК для направления функционализированного Cas9 к генному локусу в организме без его расщепления, который включает: a) определение местоположения одного или нескольких мотивов CRISPR в генном локусе; b) анализ последовательности, расположенной ниже каждого мотива CRISPR, путем: i) выбора 10-15 нуклеотидов, смежных с мотивом CRISPR, ii) определение содержания GC в последовательности; и c) выбор последовательности длиной 10-15 нуклеотидов в качестве нацеливающей последовательности для применения в нефункциональной направляющей РНК, если содержание GC в последовательности составляет 30% или больше, 40% или больше. В определенных вариантах осуществления содержание GC в нацеливающей последовательности составляет 35% или больше, 40% или больше, 45% или больше, 50% или больше, 55% или больше, 60% или больше, 65% или больше, или 70% или больше. В определенных вариантах осуществления содержание GC в нацеливающей последовательности составляет от 30% до 40%, или от 40% до 50%, или от 50% до 60%, или от 60% до 70%. В одном варианте осуществления настоящего изобретения анализируют две или более последовательностей в генном локусе и выбирают последовательность с самым высоким содержанием GC.In one aspect of the present invention, there is provided a method for selecting a targeting sequence based on a non-functional guide RNA for directing a functionalized Cas9 to a gene locus in an organism without cleavage thereof, which comprises: a) determining the location of one or more CRISPR motifs in the gene locus; b) analyzing the sequence located downstream of each CRISPR motif by: i) selecting 10-15 nucleotides adjacent to the CRISPR motif, ii) determining the GC content of the sequence; and c) selecting a sequence of 10-15 nucleotides in length as a targeting sequence for use in a non-functional guide RNA if the GC content of the sequence is 30% or more, 40% or more. In certain embodiments, the GC content of the targeting sequence is 35% or greater, 40% or greater, 45% or greater, 50% or greater, 55% or greater, 60% or greater, 65% or greater, or 70% or greater. In certain embodiments, the GC content of the targeting sequence is from 30% to 40%, or from 40% to 50%, or from 50% to 60%, or from 60% to 70%. In one embodiment of the present invention, two or more sequences at a gene locus are analyzed and the sequence with the highest GC content is selected.
В одном варианте осуществления настоящего изобретения часть нацеливающей последовательности, в которой оценивают содержание GC, составляет 10-15 смежных нуклеотидов из 15 целевых нуклеотидов, ближайших к PAM. В одном варианте осуществления настоящего изобретения часть направляющей, в которой учитывают содержание GC, составляет 10-11 нуклеотидов, или 11-12 нуклеотидов, или 12-13 нуклеотидов, или 13, или 14, или 15 смежных нуклеотидов из 15 нуклеотидов, ближайших к PAM.In one embodiment of the present invention, the portion of the targeting sequence in which the GC content is assessed is 10-15 contiguous nucleotides of the 15 target nucleotides closest to the PAM. In one embodiment of the present invention, the portion of the guide in which the GC content is taken into account is 10-11 nucleotides, or 11-12 nucleotides, or 12-13 nucleotides, or 13, or 14, or 15 contiguous nucleotides of the 15 nucleotides closest to the PAM.
В одном аспекте настоящего изобретения дополнительно предусмотрен алгоритм идентификации нефункциональных направляющих РНК, которые содействуют расщеплению генного локуса системы CRISPR, при этом не допуская функциональной активации или ингибирования. Замечено, что повышенное содержание GC в нефункциональных направляющих РНК длиной 16-20 нуклеотидов совпадает с повышенным расщеплением ДНК и сниженной функциональной активацией.In one aspect of the present invention, an algorithm is further provided for identifying non-functional guide RNAs that promote cleavage of a gene locus of a CRISPR system without allowing functional activation or inhibition. It is observed that increased GC content in non-functional guide RNAs of 16-20 nucleotides in length coincides with increased DNA cleavage and decreased functional activation.
Также в данном документе продемонстрировано, что эффективность функционализированного Cas9 может быть повышена путем добавления нуклеотидов к 3'-концу направляющей РНК, которая не совпадает с целевой последовательностью, расположенной ниже мотива CRISPR. Например, что касается нефункциональных направляющих РНК длиной 11-15 нуклеотидов, более короткие направляющие могут с меньшей вероятностью содействовать расщеплению мишени, но они также являются менее эффективными в содействии связыванию системы CRISPR и функциональному контролю. В определенных вариантах осуществления добавление нуклеотидов, которые не совпадают с целевой последовательностью, к 3'-концу нефункциональной направляющей РНК повышает эффективность активации, при этом повышая нежелательное расщепление мишени. В одном аспекте настоящего изобретения также предусмотрен способ и алгоритм идентификации улучшенных нефункциональных направляющих РНК, которые эффективно содействуют функции системы CRISPRP в отношении связывания ДНК и генной регуляции, при этом они не содействуют расщеплению ДНК. Таким образом, в определенных вариантах осуществления настоящего изобретения предусмотрена нефункциональная направляющая РНК, которая включает первые 15 нуклеотидов, или 14 нуклеотидов, или 13 нуклеотидов, или 12 нуклеотидов, или 11 нуклеотидов, расположенных ниже мотива CRISPR, и ее увеличивают по длине на 3'-конце с помощью нуклеотидов, которые не совпадают с мишенью, на 12 нуклеотидов, 13 нуклеотидов, 14 нуклеотидов, 15 нуклеотидов, 16 нуклеотидов, 17 нуклеотидов, 18 нуклеотидов, 19 нуклеотидов, 20 нуклеотидов или больше.It is also demonstrated herein that the efficiency of a functionalized Cas9 can be improved by adding nucleotides to the 3' end of the guide RNA that do not match the target sequence downstream of the CRISPR motif. For example, for non-functional guide RNAs that are 11-15 nucleotides long, shorter guides may be less likely to promote target cleavage, but they are also less effective in promoting CRISPR system binding and functional control. In certain embodiments, adding nucleotides that do not match the target sequence to the 3' end of a non-functional guide RNA improves activation efficiency while increasing unwanted target cleavage. In one aspect, the present invention also provides a method and algorithm for identifying improved non-functional guide RNAs that effectively promote the function of the CRISPR system in DNA binding and gene regulation while not promoting DNA cleavage. Thus, in certain embodiments of the present invention, a non-functional guide RNA is provided that includes the first 15 nucleotides, or 14 nucleotides, or 13 nucleotides, or 12 nucleotides, or 11 nucleotides located downstream of a CRISPR motif, and is extended in length at the 3' end by nucleotides that do not match the target by 12 nucleotides, 13 nucleotides, 14 nucleotides, 15 nucleotides, 16 nucleotides, 17 nucleotides, 18 nucleotides, 19 nucleotides, 20 nucleotides or more.
В одном аспекте настоящего изобретения предусмотрен способ осуществления селективного ортогонального генного контроля. Как будет понятно из раскрытия в данном документе, выбор нефункциональной направляющей в соответствии с настоящим изобретением, с учетом длины направляющей и содержания GC, обеспечивает эффективный и селективный контроль транскрипции с помощью функциональной системы CRISPR-Cas на основе Cas9, например, регуляцию транскрипции генного локуса путем активации или ингибирования и сведения к минимуму нецелевых эффектов. В соответствии с этим, с помощью обеспечения эффективной регуляции отдельных целевых локусов в настоящем изобретении также предусмотрена эффективная ортогональная регуляция двух или более целевых локусов.In one aspect, the present invention provides a method for performing selective orthogonal gene control. As will be appreciated from the disclosure herein, the selection of a non-functional guide according to the present invention, taking into account the guide length and GC content, provides for efficient and selective transcriptional control by a functional Cas9-based CRISPR-Cas system, such as regulation of transcription of a gene locus by activation or inhibition and minimization of off-target effects. Accordingly, by providing efficient regulation of individual target loci, the present invention also provides for efficient orthogonal regulation of two or more target loci.
В определенных вариантах осуществления ортогональный генный контроль выполняется путем активации или ингибирования двух или более целевых локусов. В определенных вариантах осуществления ортогональный генный контроль выполняется путем активации или ингибирования одного или нескольких целевых локусов и расщепления одного или нескольких целевых локусов.In certain embodiments, orthogonal gene control is performed by activating or inhibiting two or more target loci. In certain embodiments, orthogonal gene control is performed by activating or inhibiting one or more target loci and cleaving one or more target loci.
В одном аспекте настоящего изобретения предусмотрена клетка, содержащая не встречающуюся в природе систему CRISPR-Cas на основе Cas9, содержащую одну или несколько нефункциональных направляющих РНК, раскрытых или полученных в соответствии со способом или алгоритмом, описанными в данном документе, где экспрессия одного или нескольких продуктов гена была изменена. В одном варианте осуществления настоящего изобретения экспрессия в клетке двух или более продуктов гена была изменена. В настоящем изобретении также предусмотрена линия клеток, полученная из такой клетки.In one aspect, the present invention provides a cell comprising a non-naturally occurring Cas9-based CRISPR-Cas system comprising one or more non-functional guide RNAs disclosed or produced according to the method or algorithm described herein, wherein the expression of one or more gene products has been altered. In one embodiment, the present invention alters the expression of two or more gene products in the cell. The present invention also provides a cell line derived from such a cell.
В одном аспекте настоящего изобретения предусмотрен многоклеточный организм, содержащий одну или несколько клеток, содержащих не встречающуюся в природе систему CRISPR-Cas на основе Cas9, содержащую одну или несколько нефункциональных направляющих РНК, раскрытых или полученных в соответствии со способом или алгоритмом, описанными в данном документе. В одном аспекте настоящего изобретения предусмотрен продукт, полученный из клетки, линии клеток или многоклеточного организма, содержащих не встречающуюся в природе систему CRISPR-Cas на основе Cas9, содержащую одну или несколько нефункциональных направляющих РНК, раскрытых или полученных в соответствии со способом или алгоритмом, описанными в данном документе.In one aspect of the present invention, there is provided a multicellular organism comprising one or more cells comprising a non-naturally occurring Cas9-based CRISPR-Cas system comprising one or more non-functional guide RNAs disclosed or produced according to the method or algorithm described herein. In one aspect of the present invention, there is provided a product obtained from a cell, cell line, or multicellular organism comprising a non-naturally occurring Cas9-based CRISPR-Cas system comprising one or more non-functional guide RNAs disclosed or produced according to the method or algorithm described herein.
Дополнительным аспектом настоящего изобретения является применение gRNA, предусматривающей нефункциональную(нефункциональные) направляющую (направляющие), описываемую(описываемые) в данном документе, необязательно в комбинации с gRNA, предусматривающей направляющую(направляющие), описываемую(описываемые) в данном документе или в уровне техники, в комбинации с системами (например, клетками, трансгенными животными, трансгенными мышами, индуцируемыми трансгенными животными, индуцируемыми трансгенными мышами), которые сконструированы либо для сверхэкспрессии Cas9, либо, предпочтительно, нокина Cas9. В результате этого, отдельная система (например, трансгенное животное, клетка) может служить основой для мультиплексных модификаций гена в системной/сетевой биологии. Благодаря нефункциональным направляющим теперь это возможно осуществлять in vitro, ex vivo и in vivo.A further aspect of the present invention is the use of a gRNA comprising the non-functional guide(s) described herein, optionally in combination with a gRNA comprising the guide(s) described herein or in the prior art, in combination with systems (e.g., cells, transgenic animals, transgenic mice, inducible transgenic animals, inducible transgenic mice) that are engineered to either overexpress Cas9 or, preferably, a Cas9 knockin. As a result, a single system (e.g., transgenic animal, cell) can serve as a basis for multiplexed gene modifications in systems/network biology. With the non-functional guides, this can now be done in vitro, ex vivo and in vivo.
Например, после обеспечения Cas9 можно обеспечивать одну или несколько нефункционирующих gRNA для управления мультиплексной генной регуляцией и предпочтительно мультиплексной двунаправленной генной регуляцией. Одну или несколько нефункциональных gRNA, при необходимости или желании, можно обеспечивать способом, который подходит в пространственном и временном отношении (например, с помощью тканеспецифичной индукции экспрессии Cas9). Благодаря тому, что трансгенный/индуцируемый Cas9 обеспечивается (например, экспрессируется) в клетке, ткани, представляющем интерес животном, как gRNA, предусматривающие нефункциональные направляющие, так и gRNA, предусматривающие направляющие, являются одинаково эффективными. Аналогичным образом, дополнительным аспектом настоящего изобретения является применение gRNA, предусматривающей нефункциональную(нефункциональные) направляющую(направляющие), описываемую (описываемые) в данном документе, необязательно в комбинации с gRNA, предусматривающей направляющую(направляющие), описываемую(описываемые) в данном документе или в уровне техники, в комбинации с системами (например, клетками, трансгенными животными, трансгенными мышами, индуцируемыми трансгенными животными, индуцируемыми трансгенными мышами), которые сконструированы для нокаута CRISPR-Cas на основе Cas9.For example, after providing Cas9, one or more non-functional gRNAs can be provided to direct multiplex gene regulation, and preferably multiplex bidirectional gene regulation. The one or more non-functional gRNAs can be provided in a spatially and temporally appropriate manner (e.g., by tissue-specific induction of Cas9 expression), if necessary or desired. Because the transgenic/inducible Cas9 is provided (e.g., expressed) in a cell, tissue, animal of interest, both gRNAs providing non-functional guides and gRNAs providing guides are equally effective. Similarly, a further aspect of the present invention is the use of a gRNA comprising the non-functional guide(s) described herein, optionally in combination with a gRNA comprising the guide(s) described herein or in the art, in combination with systems (e.g., cells, transgenic animals, transgenic mice, inducible transgenic animals, inducible transgenic mice) that are engineered to knock out Cas9-based CRISPR-Cas.
В результате этого, комбинация нефункциональных направляющих, описываемых в данном документе, с применениями CRISPR, описанными в данном документе, и применениями CRISPR, известными из уровня техники, обеспечивает высокоэффективное и точное средство для мультиплексного скрининга систем (например, сетевой биологии). Такой скрининг, например, обеспечивает возможность идентификации специфических комбинаций видов генной активности для идентификации генов, ответственных за заболевания (например, комбинации "включения/выключения"), в частности генетических заболеваний. Предпочтительным применением такого скрининга является рак. Аналогичным образом, в настоящее изобретение включен скрининг в отношении лечения таких заболеваний. На клетки или животных можно воздействовать аномальными условиями, которые приводят к заболеванию или эффектам, напоминающим заболевание. Можно обеспечивать кандидатные композиции и подвергать их скринингу в отношении эффекта в требуемом мультиплексном окружении. Например, раковые клетки пациента можно подвергать скринингу в отношении того, какие генные комбинации будут вызывать их гибель, и затем применять данную информацию для разработки соответствующих видов терапии.As a result, the combination of the non-functional guides described herein with the CRISPR applications described herein and CRISPR applications known in the art provides a highly efficient and accurate means for multiplexed screening of systems (e.g., network biology). Such screening, for example, enables the identification of specific combinations of gene activities to identify genes responsible for diseases (e.g., "on/off" combinations), in particular genetic diseases. A preferred application of such screening is cancer. Likewise, screening for the treatment of such diseases is included in the present invention. Cells or animals can be exposed to abnormal conditions that lead to a disease or disease-like effects. Candidate compositions can be provided and screened for effect in a desired multiplexed environment. For example, a patient's cancer cells can be screened for which gene combinations will cause their death, and this information can then be used to develop appropriate therapies.
В одном аспекте настоящего изобретения предусмотрен набор, содержащий один или несколько компонентов, описанных в данном документе. Набор может включать нефункциональные направляющие, описываемые в данном документе, с направляющими, описываемыми в данном документе, или без них.In one aspect of the present invention, a kit is provided comprising one or more components described herein. The kit may include non-functional guides described herein, with or without guides described herein.
Информация о структуре, предусмотренная в данном документе, обеспечивает возможность детального изучения взаимодействия нефункциональной gRNA с целевой ДНК и Cas9, предоставляя возможность конструирования или изменения структуры нефункциональной gRNA для оптимизации функциональности всей системы CRISPR-Cas на основе Cas9. Например, петли в нефункциональной gRNA можно увеличивать без перекрывания с белком Cas9 путем вставки адаптерных белков, которые могут связываться с РНК. Такие адаптерные белки могут дополнительно рекрутировать эффекторные белки или продукты слияния, которые содержат один или несколько функциональных доменов.The structural information provided herein enables detailed study of the interaction of the non-functional gRNA with target DNA and Cas9, providing the ability to engineer or modify the structure of the non-functional gRNA to optimize the functionality of the overall Cas9-based CRISPR-Cas system. For example, loops in the non-functional gRNA can be increased without overlapping with the Cas9 protein by inserting adaptor proteins that can bind to the RNA. Such adaptor proteins can further recruit effector proteins or fusion products that contain one or more functional domains.
В некоторых предпочтительных вариантах осуществления функциональный домен представляет собой домен активации транскрипции, предпочтительно VP64. В некоторых вариантах осуществления функциональный домен представляет собой домен репрессии транскрипции, предпочтительно KRAB. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой SID или конкатемеры SID (например, SID4X). В некоторых вариантах осуществления функциональный домен представляет собой домен эпигенетического модифицирования, так что обеспечивается фермент эпигенетического модифицирования. В некоторых вариантах осуществления функциональный домен представляет собой домен активации, который может представлять собой домен активации P65.In some preferred embodiments, the functional domain is a transcriptional activation domain, preferably VP64. In some embodiments, the functional domain is a transcriptional repression domain, preferably KRAB. In some embodiments, the transcriptional repression domain is SID or SID concatemers (e.g., SID4X). In some embodiments, the functional domain is an epigenetic modification domain, such that an epigenetic modification enzyme is provided. In some embodiments, the functional domain is an activation domain, which may be a P65 activation domain.
Один аспект настоящего изобретения заключается в том, что вышеупомянутые элементы содержатся в одной композиции или содержатся в отдельных композициях. Эти композиции преимущественно могут быть применимы в отношении хозяина для индуцирования функционального эффекта на уровне генома.One aspect of the present invention is that the above-mentioned elements are contained in a single composition or are contained in separate compositions. These compositions can advantageously be applied to a host to induce a functional effect at the genome level.
В целом, нефункциональные gRNA модифицируют таким способом, который обеспечивает специфические сайты связывания (например, аптамеры) для адаптерных белков, содержащих один или несколько функциональных доменов (например, посредством образования слитого белка) для связывания. Модифицированные нефункциональные gRNA модифицированы таким образом, что как только нефункциональная gRNA образует комплекс CRISPR (т.е. Cas9 связывается с нефункциональной gRNA и мишенью) происходит связывание адаптерных белков, и функциональный домен на адаптерном белке располагается в пространственной ориентации, которая является преимущественной для эффективности присущей ему функции. Например, если функциональный домен представляет собой активатор транскрипции (например, VP64 или p65), то активатор транскрипции размещается в пространственной ориентации, которая позволяет ему влиять на транскрипцию мишени. Подобным образом, репрессор транскрипции будет размещаться преимущественно, чтобы воздействовать на транскрипцию мишени, а нуклеаза (например, Fok1) будет размещаться преимущественно для расщепления или частичного расщепления мишени.In general, non-functional gRNAs are modified in a manner that provides specific binding sites (e.g., aptamers) for adaptor proteins containing one or more functional domains (e.g., through formation of a fusion protein) to bind. The modified non-functional gRNAs are modified such that once the non-functional gRNA forms a CRISPR complex (i.e., Cas9 binds to the non-functional gRNA and the target), binding of the adaptor proteins occurs and the functional domain on the adaptor protein is positioned in a spatial orientation that is advantageous for the efficiency of its inherent function. For example, if the functional domain is a transcriptional activator (e.g., VP64 or p65), the transcriptional activator is positioned in a spatial orientation that allows it to influence the transcription of the target. Similarly, a transcriptional repressor will be positioned preferentially to affect transcription of the target, and a nuclease (e.g., Fok1) will be positioned preferentially to cleave or partially cleave the target.
Специалисту в данной области будет понятно, что модификации в нефункциональной gRNA, которые обеспечивают возможность связывания адаптер + функциональный домен, но не обеспечивают надлежащее размещение адаптор + функциональный домен (например, из-за стерического несоответствия в трехмерной структуре комплекса CRISPR), представляют собой модификации, которые не подразумеваются. Одна или несколько модифицированных нефункциональных gRNA могут быть модифицированы по тетрапетле, "петле-на-стебле" 1, "петле-на-стебле" 2 или "петле-на-стебле" 3, описываемым в данном документе, предпочтительно либо по тетрапетле, либо по "петле-на-стебле" 2, и наиболее предпочтительно как по тетрапетле, так и по "петле-на-стебле" 2.It will be appreciated by those skilled in the art that modifications in a non-functional gRNA that allow binding of the adapter + functional domain but do not allow proper placement of the adapter + functional domain (e.g., due to steric hindrance in the three-dimensional structure of the CRISPR complex) are modifications that are not intended. The one or more modified non-functional gRNAs may be modified at a tetraloop, stem-loop 1, stem-loop 2, or stem-loop 3 described herein, preferably at either the tetraloop or stem-loop 2, and most preferably at both the tetraloop and stem-loop 2.
Как объясняется в данном документе, функциональные домены могут представлять собой, например, один или несколько доменов из группы, состоящей из доменов с метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, активностью расщепления РНК, активностью расщепления ДНК, активностью связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). В некоторых случаях предпочтительно, чтобы дополнительно обеспечивался по меньшей мере один NLS. В некоторых случаях предпочтительно положение NLS на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными.As explained herein, the functional domains may be, for example, one or more domains from the group consisting of domains with methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, RNA cleavage activity, DNA cleavage activity, nucleic acid binding activity, and molecular switches (e.g., light-inducible). In some cases, it is preferable that at least one NLS is additionally provided. In some cases, the position of the NLS at the N-terminus is preferable. When more than one functional domain is included, the functional domains may be the same or different.
Нефункциональная gRNA может быть разработана с включением множественных связывающих сайтов распознавания (например, аптамеров), специфических в отношении одного и того же или разных адаптерных белков. Нефункциональная gRNA может быть разработана так, чтобы связываться с промоторным участком, расположенным на -1000 - +1 нуклеотидов выше сайта начала транскрипции (т.е. TSS), предпочтительно -200 нуклеотидов. Такое размещение улучшает функциональные домены, которые влияют на активацию гена (например, активаторы транскрипции) или ингибирование гена (например, репрессоры транскрипции). Модифицированная нефункциональная gRNA может представлять собой одну или несколько модифицированных нефункциональных gRNA (например, по меньшей мере 1 gRNA, по меньшей мере 2 gRNA, по меньшей мере 5 gRNA, по меньшей мере 10 gRNA, по меньшей мере 20 gRNA, по меньшей мере 30 gRNA, по меньшей мере 50 gRNA), нацеленных на один или несколько целевых локусов, содержащихся в композиции.The non-functional gRNA can be designed to include multiple binding recognition sites (e.g., aptamers) specific for the same or different adaptor proteins. The non-functional gRNA can be designed to bind to a promoter region located -1000 to +1 nucleotides upstream of the transcription start site (i.e., TSS), preferably -200 nucleotides. This placement improves functional domains that affect gene activation (e.g., transcriptional activators) or gene inhibition (e.g., transcriptional repressors). The modified non-functional gRNA can be one or more modified non-functional gRNAs (e.g., at least 1 gRNA, at least 2 gRNA, at least 5 gRNA, at least 10 gRNA, at least 20 gRNA, at least 30 gRNA, at least 50 gRNA) targeting one or more target loci contained in the composition.
Адаптерный белок может представлять собой любой из ряда белков, который связывается с аптамером или сайтом распознавания, введенным в модифицированную нефункциональную gRNA, и который обеспечивает возможность правильного размещения одного или нескольких функциональных доменов, после того как нефункциональная gRNA встроилась в комплекс CRISPR, чтобы воздействовать на мишень в пределах присущей ему функции. Как подробно объясняется в настоящей заявке, они могут представлять собой белки оболочки, предпочтительно белки оболочки бактериофагов. Функциональные домены, ассоциированные с такими адаптерными белками (например, в форме слитого белка), могут включать, например, один или несколько доменов из группы, состоящей из доменов с метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, активностью расщепления РНК, активностью расщепления ДНК, активностью связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). Предпочтительными доменами являются Fok1, VP64, P65, HSF1, MyoD1. В случае, если функциональный домен представляет собой активатор транскрипции или репрессор транскрипции, преимущественным является обеспечение дополнительно по меньшей мере NLS и предпочтительно на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными. В адаптерном белке можно использовать известные линкеры для прикрепления таких функциональных доменов.The adaptor protein may be any of a number of proteins that bind to an aptamer or recognition site introduced into the modified non-functional gRNA and that allows one or more functional domains to be correctly positioned after the non-functional gRNA has been incorporated into the CRISPR complex to act on the target within its intended function. As explained in detail in this application, they may be coat proteins, preferably bacteriophage coat proteins. Functional domains associated with such adapter proteins (e.g. in the form of a fusion protein) may comprise, for example, one or more domains from the group consisting of domains with methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, RNA cleavage activity, DNA cleavage activity, nucleic acid binding activity and molecular switches (e.g. inducible by light). Preferred domains are Fok1, VP64, P65, HSF1, MyoD1. In case the functional domain is a transcriptional activator or a transcriptional repressor, it is advantageous to additionally provide at least an NLS and preferably at the N-terminus. When including more than one functional domain, the functional domains may be the same or different. Known linkers can be used in the adapter protein to attach such functional domains.
Таким образом, все из модифицированной нефункциональной gRNA, инактивированного Cas9 (с функциональными доменами или без них) и связывающего белка с одним или несколькими функциональными доменами могут по отдельности содержаться в композиции и их можно вводить хозяину по отдельности или совместно. Альтернативно эти компоненты могут обеспечиваться в одной композиции для введения хозяину. Введение в хозяина может осуществляться с помощью вирусных векторов, известных специалисту или описываемых в данном документе для доставки хозяину (например, лентивирусного вектора, аденовирусного вектора, вектора на основе AAV). Как объясняется в данном документе, применение различных маркеров отбора (например, для отбора лентивирусной gRNA) и различной концентрации gRNA (например, в зависимости от того, применяются ли множественные gRNA) может быть предпочтительным для индуцирования улучшенного эффекта.Thus, the modified non-functional gRNA, the inactivated Cas9 (with or without functional domains) and the binding protein with one or more functional domains may each be separately contained in a composition and may be administered to the host separately or together. Alternatively, these components may be provided in a single composition for administration to the host. Administration to the host may be accomplished using viral vectors known to the skilled artisan or described herein for delivery to the host (e.g., a lentiviral vector, an adenoviral vector, an AAV-based vector). As explained herein, the use of different selection markers (e.g., for lentiviral gRNA selection) and different gRNA concentrations (e.g., depending on whether multiple gRNAs are used) may be advantageous to induce an improved effect.
Исходя из этой концепции для индукции преобразования в локусе генома подходят несколько вариантов, включая расщепление ДНК, активацию гена или дезактивацию гена. С применением предусмотренных композиций специалист в данной области сможет осуществить эффективное и специфическое нацеливание на один или множественные локусы с помощью одинаковых или различных функциональных доменов для индукции одного или нескольких преобразований в локусе генома. Композиции можно применять в целом ряде способов скрининга библиотек в клетках и функционального моделирования in vivo (например, активации генов lincRNA и идентификации функций; моделирования мутации с приобретением функции; моделирования мутации с потерей функции; применения композиций в соответствии с настоящим изобретением для создания линий клеток и трансгенных животных в целях оптимизации и скрининга).Based on this concept, several options are suitable for inducing a transformation at a genomic locus, including DNA cleavage, gene activation, or gene inactivation. Using the provided compositions, one skilled in the art will be able to efficiently and specifically target one or multiple loci using the same or different functional domains to induce one or more transformations at a genomic locus. The compositions can be used in a variety of methods for screening libraries in cells and functional modeling in vivo (e.g., lincRNA gene activation and function identification; gain-of-function mutation modeling; loss-of-function mutation modeling; use of the compositions of the present invention to generate cell lines and transgenic animals for optimization and screening purposes).
Настоящее изобретение охватывает применение композиций по настоящему изобретению для создания и использования трансгенных клеток/животных с зависимой от условия или индуцируемой CRISPR, о которых нельзя было и надеяться до осуществления настоящего изобретения или заявки. Например, целевая клетка содержит зависимый от условия или индуцируемый Cas9 (например, в форме Cre-зависимых конструкций) и/или зависимый от условий или индуцируемый адаптерный белок, и при экспрессии вектора, введенного в целевую клетку, вектор экспрессирует то, что индуцирует или обеспечивает условие для экспрессии фермента Cas9 и/или экспрессии адаптера в целевой клетке. За счет применения идей и композиций по настоящему изобретению с известным способом создания комплекса CRISPR индуцируемые преобразования генома, на которые воздействуют функциональные домены, также являются аспектом настоящего изобретения. Одним из примеров этого является создание трансгенного животного с нокином CRISPR/зависимой от условий экспрессией (например, мыши, содержащей, например, кассету Lox-Stop-polyA-Lox(LSL)) и последующую доставку одной или нескольких композиций, обеспечивающих одну или несколько модифицированных нефункциональных gRNA (например, -200 нуклеотидов до TSS в представляющем интерес целевом гене для целей активации гена), описываемых в данном документе (например, модифицированных нефункциональных gRNA с одним или несколькими аптамерами, распознаваемыми белками оболочки, например, MS2), одного или нескольких адаптерных белков, описываемых в данном документе (MS2-связывающий белок, связанный с одним или несколькими VP64), и средств для индуцирования животного с зависимой от условий экспрессией (например, рекомбиназы Cre для обеспечения индуцируемой экспрессии Cas9). Альтернативно адаптерный белок может обеспечиваться как зависимый от условия или индуцируемый элемент с зависимым от условий или индуцируемым Cas9, чтобы обеспечить эффективную модель для целей скрининга, которой преимущественно требуется только минимальная разработка и введение специфических нефункциональных gRNA для целого ряда применений.The present invention encompasses the use of the compositions of the present invention for the creation and use of transgenic cells/animals with conditionally dependent or inducible CRISPR that could not have been expected prior to the practice of the present invention or application. For example, the target cell comprises a conditionally dependent or inducible Cas9 (e.g., in the form of Cre-dependent constructs) and/or a conditionally dependent or inducible adapter protein, and when the vector introduced into the target cell is expressed, the vector expresses that which induces or provides a condition for the expression of the Cas9 enzyme and/or the expression of the adapter in the target cell. By using the teachings and compositions of the present invention with a known method for creating a CRISPR complex, inducible genome transformations that are affected by the functional domains are also an aspect of the present invention. One example of this is the generation of a CRISPR knockin/conditionally expressing transgenic animal (e.g., a mouse containing, e.g., a Lox-Stop-polyA-Lox (LSL) cassette) and subsequent delivery of one or more compositions providing one or more modified non-functional gRNAs (e.g., -200 nucleotides to the TSS in a target gene of interest for gene activation purposes) described herein (e.g., modified non-functional gRNAs with one or more aptamers recognized by coat proteins, e.g., MS2), one or more adaptor proteins described herein (MS2 binding protein linked to one or more VP64), and means for inducing the animal to have conditionally expressing (e.g., Cre recombinase to provide inducible expression of Cas9). Alternatively, the adaptor protein can be provided as a condition-dependent or inducible element with condition-dependent or inducible Cas9 to provide an efficient model for screening purposes that advantageously requires only minimal engineering and introduction of specific non-functional gRNAs for a variety of applications.
В другом аспекте нефункциональные направляющие дополнительно модифицируют для улучшения специфичности. Можно синтезировать защищенные нефункциональные направляющие, при этом вторичную структуру вводят в 3'-конец нефункциональной направляющей для улучшения ее специфичности. Защищенная направляющая РНК (pgRNA) содержит направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, и защитную нить, где защитная нить необязательно комплементарна направляющей последовательности, и где направляющая последовательность в какой-то степени может гибридизироваться с защитной нитью. pgRNA необязательно включает удлиняющую последовательность. Термодинамика гибридизации pgRNA-целевой ДНК определяется количеством оснований, комплементарных между направляющей РНК и целевой ДНК. С использованием "термодинамической защиты" специфичность нефункциональной gRNA можно улучшать путем добавления защитной последовательности. Например, в одном способе комплементарная защитная нить варьирующей длины добавляется к 3'-концу направляющей последовательности в пределах нефункциональной gRNA. В результате этого, защитная нить связывается по меньшей мере с частью нефункциональной gRNA и обеспечивает защищенную gRNA (pgRNA). В свою очередь, нефункциональные gRNA, упомянутые в данном документе, можно легко защитить с применением описанных вариантов осуществления с получением pgRNA. Защитная нить может представлять собой либо отдельный РНК-транскрипт или нить, либо химерную версию, присоединенную к 3'-концу направляющей последовательности на основе нефункциональной gRNA.In another aspect, the non-functional guides are further modified to improve specificity. Protected non-functional guides can be synthesized, wherein a secondary structure is introduced into the 3' end of the non-functional guide to improve its specificity. A protected guide RNA (pgRNA) comprises a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell, and a protection strand, wherein the protection strand is optionally complementary to the guide sequence, and wherein the guide sequence can hybridize to some extent to the protection strand. The pgRNA optionally includes an extension sequence. The thermodynamics of pgRNA-target DNA hybridization is determined by the number of bases complementary between the guide RNA and the target DNA. Using "thermodynamic protection", the specificity of a non-functional gRNA can be improved by adding a protection sequence. For example, in one method, a complementary protection strand of variable length is added to the 3' end of a guide sequence within a non-functional gRNA. As a result, the protection strand binds to at least a portion of the non-functional gRNA and provides a protected gRNA (pgRNA). In turn, the non-functional gRNAs mentioned herein can be readily protected using the described embodiments to produce pgRNA. The protection strand can be either a separate RNA transcript or strand, or a chimeric version, attached to the 3' end of a guide sequence based on a non-functional gRNA.
Тандемные направляющие и варианты применения в подходе мультиплексного (тандемного) нацеливанияTandem guides and application options in the multiplex (tandem) targeting approach
Авторы настоящего изобретения показали, что ферменты CRISPR, определяемые в данном документе, могут использовать более одной направляющей РНК без потери активности. Это делает возможным применение ферментов, систем или комплексов CRISPR, определяемых в данном документе, для нацеливания на множественные ДНК-мишени, гены или генные локусы с помощью одного фермента, системы или комплекса, определяемых в данном документе. Направляющие РНК можно располагать тандемно, необязательно разделенными нуклеотидной последовательностью, такой как прямой повтор, определяемый в данном документе. Положение различных направляющих РНК в тандеме не влияет на активность. Следует отметить, что термины "система CRISPR-Cas", "комплекс CRISP-Cas", "комплекс CRISPR" и "система CRISPR" используются взаимозаменяемо. Также термины "фермент CRISPR", "фермент Cas" или "фермент CRISPR-Cas" могут использоваться взаимозаменяемо. В предпочтительных вариантах осуществления указанный фермент CRISPR, фермент CRISP-Cas или фермент Cas представляет собой Cas9 или любой из его модифицированных или мутированных вариантов, описанных в других разделах данного документа.The inventors have shown that the CRISPR enzymes defined herein can use more than one guide RNA without loss of activity. This enables the use of the CRISPR enzymes, systems, or complexes defined herein to target multiple DNA targets, genes, or gene loci with a single enzyme, system, or complex defined herein. The guide RNAs can be arranged in tandem, optionally separated by a nucleotide sequence, such as a direct repeat defined herein. The position of the different guide RNAs in tandem does not affect activity. It should be noted that the terms "CRISPR-Cas system," "CRISP-Cas complex," "CRISPR complex," and "CRISPR system" are used interchangeably. Also, the terms "CRISPR enzyme," "Cas enzyme," or "CRISPR-Cas enzyme" may be used interchangeably. In preferred embodiments, said CRISPR enzyme, CRISP-Cas enzyme or Cas enzyme is Cas9 or any of its modified or mutated variants described elsewhere herein.
В одном аспекте настоящего изобретения предусмотрен не встречающийся в природе или сконструированный фермент CRISPR, предпочтительно фермент CRISPR 2 класса, предпочтительно фермент CRISPR V или VI типа, описываемый в данном документе, такой как без ограничения Cas9, описываемый в других разделах данного документа, применяемый для тандемного или мультиплексного нацеливания. Следует понимать, что в таком подходе может применяться любое из ферментов, комплексов или систем CRISPR (или CRISPR-Cas или Cas) в соответствии с настоящим изобретением, описываемых в других разделах данного документа. Любые из способов, продуктов, композиций и вариантов применения, описываемые в других разделах данного документа, равным образом применимы в подходе мультиплексного или тандемного нацеливания, дополнительно подробно описанного ниже. С целью дополнительного руководства приводятся следующие конкретные аспекты и варианты осуществления.In one aspect, the present invention provides a non-naturally occurring or engineered CRISPR enzyme, preferably a class 2 CRISPR enzyme, preferably a type V or VI CRISPR enzyme, as described herein, such as but not limited to Cas9 as described elsewhere herein, used for tandem or multiplex targeting. It will be appreciated that any of the CRISPR (or CRISPR-Cas or Cas) enzymes, complexes or systems of the present invention described elsewhere herein may be used in such an approach. Any of the methods, products, compositions and uses described elsewhere herein are equally applicable to the multiplex or tandem targeting approach described in further detail below. For purposes of additional guidance, the following specific aspects and embodiments are provided.
В одном аспекте настоящего изобретения предусмотрено применение фермента, комплекса или системы Cas9, определяемых в данном документе, для нацеливания на множественные генные локусы. В одном варианте осуществления это можно осуществить путем применения множественных (тандемных или мультиплексных) последовательностей направляющих РНК (gRNA).In one aspect of the present invention, there is provided the use of the Cas9 enzyme, complex or system as defined herein for targeting multiple gene loci. In one embodiment, this can be accomplished by using multiple (tandem or multiplex) guide RNA (gRNA) sequences.
В одном аспекте настоящего изобретения предусмотрены способы применения одного или нескольких элементов фермента, комплекса или системы Cas9, определяемых в данном документе, для тандемного или мультиплексного нацеливания, где указанная система CRISP содержит последовательности множественных направляющих РНК. Предпочтительно указанные последовательности gRNA разделены нуклеотидной последовательностью, такой как прямой повтор, определяемой в других разделах данного документа.In one aspect of the present invention, methods are provided for using one or more elements of a Cas9 enzyme, complex or system as defined herein for tandem or multiplex targeting, wherein said CRISP system comprises multiple guide RNA sequences. Preferably, said gRNA sequences are separated by a nucleotide sequence, such as a direct repeat, as defined elsewhere herein.
Фермент, система или комплекс Cas9, определяемые в данном документе, обеспечивают эффективные средства для модифицирования множественных целевых полинуклеотидов. Фермент, система или комплекс Cas9, определяемые в данном документе, характеризуются большим разнообразием применений, включая модифицирование (например, образование делеции, вставки, транслокации, инактивацию, активацию) одного или нескольких целевых полинуклеотидов в множестве типов клеток. В связи с этим, определяемые в данном документе фермент, система или комплекс Cas9 по настоящему изобретению имеют широкий спектр применений, например, в генной терапии, скрининге лекарственных средств, диагностике и определении прогноза заболевания, включая нацеливание на множественные генные локусы в пределах одной системы CRISPR.The Cas9 enzyme, system or complex defined herein provides effective means for modifying multiple target polynucleotides. The Cas9 enzyme, system or complex defined herein is characterized by a wide variety of applications, including modification (e.g., formation of deletions, insertions, translocations, inactivation, activation) of one or more target polynucleotides in a variety of cell types. In this regard, the Cas9 enzyme, system or complex defined herein of the present invention has a wide range of applications, such as in gene therapy, drug screening, diagnosis and determination of disease prognosis, including targeting multiple gene loci within a single CRISPR system.
В одном аспекте настоящего изобретения предусмотрен фермент, система или комплекс Cas9, определяемые в данном документе, т.е. комплекс CRISPR-Cas на основе Cas9, содержащий белок Cas9, имеющий по меньшей мере один ассоциированный с ним домен дестабилизации, и множественные направляющие РНК, которые нацеливаются на множественные молекулы нуклеиновой кислоты, такие как молекулы ДНК, в результате чего каждая из указанных множественных направляющих РНК специфически нацеливается на свою соответствующую молекулу нуклеиновой кислоты, например, молекулу ДНК. Каждая целевая молекула нуклеиновой кислоты, например, молекула ДНК, может кодировать продукт гена или охватывать генный локус. Следовательно, применение множественных направляющих РНК дает возможность нацеливания на множественные генные локусы или множественные гены. В некоторых вариантах осуществления фермент Cas9 может расщеплять молекулу ДНК, кодирующую продукт гена. В некоторых вариантах осуществления экспрессия продукта гена изменена. Белок Cas9 и направляющие РНК не встречаются в природе вместе. Настоящее изобретение охватывает направляющие РНК, предусматривающие расположенные тандемно направляющие последовательности. Настоящее изобретение дополнительно охватывает кодирующие последовательности для белка Cas9, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка представляет собой клетку млекопитающего, растительную клетку или клетку дрожжей, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. Экспрессия продукта гена может быть снижена. Фермент Cas9 может образовывать часть системы или комплекса CRISPR, которые дополнительно содержат расположенные тандемно направляющие РНК (gRNA), содержащие серию из 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 25, 25, 30 или более чем 30 направляющих последовательностей, при этом каждая способна специфически гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке. В некоторых вариантах осуществления функциональная система или комплекс CRISPR на основе Cas9 связываются с множественными целевыми последовательностями. В некоторых вариантах осуществления функциональная система или комплекс CRISPR могут редактировать множественные целевые последовательности, например, целевые последовательности могут предусматривать локус генома, а в некоторых вариантах осуществления может быть предусмотрено изменение экспрессии гена. В некоторых вариантах осуществления функциональная система или комплекс CRISPR могут содержать дополнительные функциональные домены. В некоторых вариантах осуществления настоящего изобретения предусмотрен способ изменения или модифицирования экспрессии множественных продуктов гена. Способ может включать их введение в клетку, содержащую указанные целевые нуклеиновые кислоты, например молекулы ДНК, или содержащую и экспрессирующую целевую нуклеиновую кислоту, например молекулы ДНК; например, целевые нуклеиновые кислоты могут кодировать продукты гена или обеспечивать экспрессию продуктов гена (например, регуляторные последовательности).In one aspect, the present invention provides a Cas9 enzyme, system or complex as defined herein, i.e., a Cas9-based CRISPR-Cas complex comprising a Cas9 protein having at least one destabilization domain associated therewith and multiple guide RNAs that target multiple nucleic acid molecules, such as DNA molecules, whereby each of said multiple guide RNAs specifically targets its respective nucleic acid molecule, such as a DNA molecule. Each target nucleic acid molecule, such as a DNA molecule, can encode a gene product or span a gene locus. Therefore, the use of multiple guide RNAs allows targeting multiple gene loci or multiple genes. In some embodiments, the Cas9 enzyme can cleave a DNA molecule encoding a gene product. In some embodiments, expression of the gene product is altered. The Cas9 protein and the guide RNAs do not occur together in nature. The present invention encompasses guide RNAs that provide tandemly arranged guide sequences. The present invention further encompasses coding sequences for a Cas9 protein that is codon-optimized for expression in a eukaryotic cell. In a preferred embodiment, the eukaryotic cell is a mammalian cell, a plant cell, or a yeast cell, and in a more preferred embodiment, the mammalian cell is a human cell. Expression of the gene product may be reduced. The Cas9 enzyme may form part of a CRISPR system or complex that further comprises tandemly arranged guide RNAs (gRNAs) comprising a series of 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 25, 25, 30, or more than 30 guide sequences, each capable of specifically hybridizing to a target sequence at a genomic locus of interest in a cell. In some embodiments, a functional Cas9-based CRISPR system or complex binds to multiple target sequences. In some embodiments, a functional CRISPR system or complex can edit multiple target sequences, for example, the target sequences can provide a genomic locus, and in some embodiments, a change in gene expression can be provided. In some embodiments, a functional CRISPR system or complex can contain additional functional domains. In some embodiments, the present invention provides a method for changing or modifying the expression of multiple gene products. The method can include introducing them into a cell containing said target nucleic acids, such as DNA molecules, or containing and expressing a target nucleic acid, such as DNA molecules; for example, the target nucleic acids can encode gene products or provide for the expression of gene products (e.g., regulatory sequences).
В предпочтительных вариантах осуществления фермент CRISPR, применяемый для мультиплексного нацеливания, представляет собой Cas9, или система или комплекс CRISPR содержат Cas9. В некоторых вариантах осуществления фермент CRISPR, применяемый для мультиплексного нацеливания, представляет собой AsCas9, или система или комплекс CRISPR, применяемые для мультиплексного нацеливания, содержат AsCas9. В некоторых вариантах осуществления фермент CRISPR представляет собой LbCas9, или система или комплекс CRISPR содержат LbCas9. В некоторых вариантах осуществления фермент Cas9, применяемый для мультиплексного нацеливания, расщепляет обе нити ДНК с образованием двухнитевого разрыва (DSB). В некоторых вариантах осуществления фермент CRISPR, применяемый для мультиплексного нацеливания, представляет собой никазу. В некоторых вариантах осуществления фермент Cas9, применяемый для мультиплексного нацеливания, представляет собой двойную никазу. В некоторых вариантах осуществления фермент Cas9, применяемый для мультиплексного нацеливания, представляет собой фермент Cas9, такой как фермент DD Cas9, определяемый в других разделах данного документа.In preferred embodiments, the CRISPR enzyme used for multiplex targeting is Cas9, or the CRISPR system or complex comprises Cas9. In some embodiments, the CRISPR enzyme used for multiplex targeting is AsCas9, or the CRISPR system or complex used for multiplex targeting comprises AsCas9. In some embodiments, the CRISPR enzyme is LbCas9, or the CRISPR system or complex comprises LbCas9. In some embodiments, the Cas9 enzyme used for multiplex targeting cleaves both strands of DNA to form a double-strand break (DSB). In some embodiments, the CRISPR enzyme used for multiplex targeting is a nickase. In some embodiments, the Cas9 enzyme used for multiplex targeting is a dual nickase. In some embodiments, the Cas9 enzyme used for multiplex targeting is a Cas9 enzyme, such as a DD Cas9 enzyme, as defined elsewhere herein.
В вариантах осуществления Cas9 можно объединять в пары, например, в виде пары никаз, например, никазы SaCas9 (никазы eSaCas9). Кроме того, Cas9 можно упаковывать с одной, или двумя, или большим числом направляющих в векторе на основе AAV. Это можно осуществлять, как описано в Friedland AE et al, Characterization of Staphylococcus aureus Cas9: a smaller Cas9 for all-in-one adeno-associated virus delivery and paired nickase applications, Genome Biol. 2015 Nov 24;16:257. doi: 10.1186/s13059-015-0817-8., раскрытие которого настоящим включено посредством ссылки.In embodiments, Cas9 can be paired, such as as a pair of nickases, such as SaCas9 nickase (eSaCas9 nickase). Additionally, Cas9 can be packaged with one or two or more guides in an AAV-based vector. This can be accomplished as described in Friedland AE et al, Characterization of Staphylococcus aureus Cas9: a smaller Cas9 for all-in-one adeno-associated virus delivery and paired nickase applications, Genome Biol. 2015 Nov 24;16:257. doi: 10.1186/s13059-015-0817-8., the disclosure of which is hereby incorporated by reference.
В некоторых общих вариантах осуществления фермент Cas9, применяемый для мультиплексного нацеливания, ассоциируется с одним или несколькими функциональными доменами. В некоторых более конкретных вариантах осуществления фермент CRISPR, применяемый для мультиплексного нацеливания, представляет собой нефункциональный Cas9, определяемый в других разделах данного документа.In some general embodiments, the Cas9 enzyme used for multiplex targeting is associated with one or more functional domains. In some more specific embodiments, the CRISPR enzyme used for multiplex targeting is a non-functional Cas9, as defined elsewhere herein.
В одном аспекте настоящего изобретения предусмотрены средства для доставки фермента, системы или комплекса Cas9 для применения в множественном нацеливании, как определено в данном документе, или полинуклеотидов, определенных в данном документе. Неограничивающие примеры таких средств доставки представляют собой, например, частицу(частицы), доставляющую(доставляющие) компонент(компоненты) комплекса, вектор(векторы), содержащие полинуклеотид(полинуклеотиды), обсуждаемые в данном документе (например, кодирующие фермент CRISPR, обеспечивающие нуклеотиды, кодирующие комплекс CRISPR). В некоторых вариантах осуществления вектором может быть плазмида или вирусный вектор, такой как AAV или лентивирус. Преимущественной может быть транзиентная трансфекция с помощью плазмид, например, клеток HEK, особенно с учетом ограничений по размеру для AAV и того, что, хотя Cas9 вмещается в AAV, в случае дополнительных направляющих РНК может быть достигнут верхний предел.In one aspect of the present invention, there are provided means for delivering a Cas9 enzyme, system or complex for use in multiple targeting as defined herein, or polynucleotides as defined herein. Non-limiting examples of such delivery means are, for example, a particle(s) delivering a component(s) of the complex, a vector(s) comprising the polynucleotide(s) discussed herein (e.g., encoding a CRISPR enzyme, providing nucleotides encoding a CRISPR complex). In some embodiments, the vector may be a plasmid or a viral vector, such as AAV or lentivirus. Transient transfection with plasmids, such as HEK cells, may be advantageous, especially given the size limitations of AAV and that, although Cas9 fits into AAV, an upper limit may be reached in the case of additional guide RNAs.
Также предусмотрены модель, в которой конститутивно экспрессируется фермент, комплекс или система Cas9, применяемые в данном документе, для применения в мультиплексном нацеливании. Организм может быть трансгенным и может быть трансфицирован с помощью векторов по настоящему изобретению или может быть потомством организма, трансфицированного таким образом. В дополнительном аспекте настоящего изобретения предусмотрены композиции, содержащие фермент, систему и комплекс CRISPR, определяемые в данном документе, или полинуклеотиды или векторы, описанные в данном документе. Также предусмотрены системы или комплексы CRISPR на основе Cas9, содержащие множественные направляющие РНК, предпочтительно в формате тандемного расположения. Указанные различные направляющие РНК могут быть разделены нуклеотидными последовательностями, такими как прямые повторы.Also provided is a model in which the Cas9 enzyme, complex or system used herein is constitutively expressed for use in multiplex targeting. The organism may be transgenic and may be transfected with the vectors of the present invention or may be a progeny of an organism so transfected. In a further aspect, the present invention provides compositions comprising the CRISPR enzyme, system and complex defined herein or the polynucleotides or vectors described herein. Also provided are Cas9-based CRISPR systems or complexes comprising multiple guide RNAs, preferably in a tandem arrangement format. Said different guide RNAs may be separated by nucleotide sequences such as direct repeats.
Также предусмотрен способ лечения субъекта, например, субъекта, нуждающегося в этом, включающий индуцирование редактирования генов путем трансформации субъекта с помощью полинуклеотида, кодирующего систему или комплекс CRISPR на основе Cas9, или любого из полинуклеотидов или векторов, описанных в данном документе, и введение их субъекту. Также может предусматриваться подходящая матрица для репарации, например, доставляемая вектором, содержащим указанную матрицу для репарации. Также предусмотрен способ лечения субъекта, например, субъекта, нуждающегося в этом, предусматривающий индуцирование активации или репрессии транскрипции множественных целевых генных локусов путем трансформации субъекта с помощью полинуклеотидов или векторов, описанных в данном документе, где указанный полинуклеотид или вектор кодирует или содержит фермент, комплекс или систему Cas9, содержащие множественные направляющие РНК, предпочтительно расположенные тандемно. В случае осуществления какой-либо обработки ex vivo, например, в культуре клеток, следует понимать, что термин "субъект" можно заменить фразой "клетка или культура клеток".Also provided is a method of treating a subject, such as a subject in need thereof, comprising inducing gene editing by transforming the subject with a polynucleotide encoding a Cas9-based CRISPR system or complex, or any of the polynucleotides or vectors described herein, and administering them to the subject. A suitable repair template may also be provided, such as delivered by a vector containing said repair template. Also provided is a method of treating a subject, such as a subject in need thereof, comprising inducing transcriptional activation or repression of multiple target gene loci by transforming the subject with the polynucleotides or vectors described herein, wherein said polynucleotide or vector encodes or comprises a Cas9 enzyme, complex or system comprising multiple guide RNAs, preferably arranged in tandem. In case any treatment is carried out ex vivo, such as in cell culture, it should be understood that the term "subject" may be replaced by the phrase "cell or cell culture".
Также предусмотрены композиции, содержащие фермент, комплекс или систему Cas9, содержащие множественные направляющие РНК, предпочтительно расположенные тандемно, или полинуклеотид или вектор, кодирующие или содержащие указанный фермент, комплекс или систему Cas9, содержащие множественные направляющие РНК, предпочтительно расположенные тандемно, для применения в способах лечения, определяемых в других разделах данного документа. Может предусматриваться набор из частей, включающих такие композиции. Также предусмотрено применение указанной композиции в производстве лекарственного препарата для таких способов лечения. В настоящем изобретении также предусмотрено применение системы CRISPR на основе Cas9 в скрининге, например, скринингах в отношении мутации приобретения функции. Клетки, в которых искусственным путем обеспечивают сверхэкспрессию гена, могут снижать экспрессию гена с течением времени (восстановление равновесия), например, с помощью отрицательных обратных связей. К моменту начала скрининга уровень экспрессии нерегулируемого гена снова может быть снижен. Применение индуцируемого активатора Cas9 позволяет индуцировать транскрипцию непосредственно перед скринингом и тем самым сводит к минимуму вероятность ложноотрицательных соответствий. Соответственно, путем применения настоящего изобретения в скрининге, например, скринингах в отношении мутации приобретения функции, вероятность ложноотрицательных результатов может быть сведена к минимуму.Also provided are compositions comprising a Cas9 enzyme, complex or system comprising multiple guide RNAs, preferably arranged in tandem, or a polynucleotide or vector encoding or comprising said Cas9 enzyme, complex or system comprising multiple guide RNAs, preferably arranged in tandem, for use in the treatment methods defined elsewhere herein. A kit of parts comprising such compositions may be provided. Also provided is the use of said composition in the manufacture of a medicament for such treatment methods. The present invention also provides the use of a Cas9-based CRISPR system in screening, such as gain-of-function mutation screens. Cells that are artificially overexpressing a gene may reduce gene expression over time (re-equilibration), such as by negative feedback. By the time screening begins, the expression level of the unregulated gene may be reduced again. The use of an inducible Cas9 activator allows transcription to be induced immediately prior to screening, thereby minimizing the likelihood of false negative hits. Accordingly, by using the present invention in screening, such as screening for a gain-of-function mutation, the likelihood of false negative results can be minimized.
В одном аспекте настоящего изобретения предусмотрена сконструированная, не встречающаяся в природе система CRISPR, содержащая белок Cas9 и множественные направляющие РНК, каждая из которых специфически нацеливается на молекулу ДНК, кодирующую продукт гена в клетке, в результате чего каждая из множественных направляющих РНК нацеливается на свою специфическую молекулу ДНК, кодирующую продукт гена, и белок Cas9 расщепляет молекулу целевой ДНК, кодирующую продукт гена, в результате чего экспрессия продукта гена изменяется; и где белок CRISPR и направляющие РНК не встречаются в природе вместе. Настоящее изобретение охватывает множественные направляющие РНК, содержащие множественные направляющие последовательности, предпочтительно разделенные нуклеотидной последовательностью, такой как прямой повтор, и необязательно слитые с tracr-последовательностью. В одном варианте осуществления настоящего изобретения белок CRISPR представляет собой белок CRISPR-Cas V или VI типа, и в более предпочтительном варианте осуществления белок CRISPR представляет собой белок Cas9. Настоящее изобретение дополнительно охватывает белок Cas9, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающего, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной.In one aspect of the present invention, there is provided an engineered, non-naturally occurring CRISPR system comprising a Cas9 protein and multiple guide RNAs, each of which specifically targets a DNA molecule encoding a gene product in a cell, whereby each of the multiple guide RNAs targets its specific DNA molecule encoding a gene product, and the Cas9 protein cleaves the target DNA molecule encoding the gene product, whereby the expression of the gene product is altered; and wherein the CRISPR protein and the guide RNAs do not occur together in nature. The present invention encompasses multiple guide RNAs comprising multiple guide sequences, preferably separated by a nucleotide sequence such as a direct repeat, and optionally fused to a tracr sequence. In one embodiment of the present invention, the CRISPR protein is a CRISPR-Cas protein of type V or VI, and in a more preferred embodiment, the CRISPR protein is a Cas9 protein. The present invention further encompasses a Cas9 protein that is codon-optimized for expression in a eukaryotic cell. In a preferred embodiment, the eukaryotic cell is a mammalian cell, and in a more preferred embodiment, the mammalian cell is a human cell. In a further embodiment of the present invention, expression of the gene product is reduced.
В другом аспекте настоящего изобретения предусмотрена сконструированная, не встречающаяся в природе векторная система, содержащая один или несколько векторов, содержащих первый регуляторный элемент, функционально связанный с множественными направляющими РНК системы CRISPR на основе Cas9, каждая из которых специфически нацеливается на молекулу ДНК, кодирующую продукт гена, и второй регуляторный элемент, функционально связанный с последовательностью, кодирующей белок CRISPR. Оба регуляторных элемента могут находиться в одном и том же векторе или в разных векторах системы. Множественные направляющие РНК нацеливаются на множественные молекулы ДНК, кодирующие множественные продукты гена в клетке, и белок CRISPR может расщеплять множественные молекулы ДНК, кодирующие продукты гена (он может расщеплять одну или обе нити или фактически не проявлять нуклеазную активность), в результате чего экспрессия множественных продуктов гена изменяется; и где белок CRISPR и множественные направляющие РНК не встречаются в природе вместе. В предпочтительном варианте осуществления белок CRISPR представляет собой белок Cas9, необязательно кодон-оптимизированный для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка представляет собой клетку млекопитающего, растительную клетку или клетку дрожжей, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия каждого из множественных продуктов гена изменена, предпочтительно снижена.In another aspect of the present invention, there is provided an engineered, non-naturally occurring vector system comprising one or more vectors comprising a first regulatory element operably linked to multiple guide RNAs of a Cas9-based CRISPR system, each of which specifically targets a DNA molecule encoding a gene product, and a second regulatory element operably linked to a sequence encoding a CRISPR protein. Both regulatory elements can be in the same vector or in different vectors of the system. Multiple guide RNAs target multiple DNA molecules encoding multiple gene products in a cell, and the CRISPR protein can cleave multiple DNA molecules encoding gene products (it can cleave one or both strands or exhibit virtually no nuclease activity), resulting in altered expression of the multiple gene products; and wherein the CRISPR protein and multiple guide RNAs do not occur together in nature. In a preferred embodiment, the CRISPR protein is a Cas9 protein, optionally codon-optimized for expression in a eukaryotic cell. In a preferred embodiment, the eukaryotic cell is a mammalian cell, a plant cell, or a yeast cell, and in a more preferred embodiment, the mammalian cell is a human cell. In a further embodiment of the present invention, the expression of each of the multiple gene products is altered, preferably reduced.
В одном аспекте настоящего изобретения предусмотрена векторная система, содержащая один или несколько векторов. В некоторых вариантах осуществления система содержит: (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше или ниже (в зависимости от того, что является подходящим) последовательности прямого повтора, где при экспрессии одна или несколько направляющих последовательностей управляют специфичным к последовательности связыванием комплекса CRISPR с одной или несколькими целевыми последовательностями в эукариотической клетке, где комплекс CRISPR содержит фермент Cas9 в комплексе с одной или несколькими направляющими последовательностями, которые гибридизируются с одной или несколькими целевыми последовательностями; и (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, кодирующей указанный фермент Cas9, предпочтительно содержащей по меньшей мере одну последовательность ядерной локализации и/или по меньшей мере одну NES; где компоненты (a) и (b) находятся в одном и том же или разных векторах системы. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR на основе Cas9 со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления комплекс CRISPR содержит одну или несколько последовательностей ядерной локализации и/или одну или несколько NES, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного комплекса CRISPR на основе Cas9 в обнаруживаемом количестве в ядре эукариотической клетки или за его пределами. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления длина каждой из направляющих последовательностей составляет по меньшей мере 16, 17, 18, 19, 20, 25 нуклеотидов или 16-30, или 16-25, или 16-20 нуклеотидов.In one aspect of the present invention, a vector system is provided, comprising one or more vectors. In some embodiments, the system comprises: (a) a first regulatory element operably linked to a direct repeat sequence and one or more insertion sites for inserting one or more guide sequences upstream or downstream (as appropriate) of the direct repeat sequence, wherein upon expression, the one or more guide sequences direct sequence-specific binding of a CRISPR complex to one or more target sequences in a eukaryotic cell, wherein the CRISPR complex comprises a Cas9 enzyme in complex with one or more guide sequences that hybridize to the one or more target sequences; and (b) a second regulatory element operably linked to an enzyme-coding sequence encoding said Cas9 enzyme, preferably comprising at least one nuclear localization sequence and/or at least one NES; wherein components (a) and (b) are in the same or different vectors of the system. If applicable, a tracr sequence may also be provided. In some embodiments, component (a) further comprises two or more guide sequences operably linked to the first regulatory element, wherein when expressed, each of the two or more guide sequences directs sequence-specific binding of a Cas9-based CRISPR complex to its target sequence in a eukaryotic cell. In some embodiments, the CRISPR complex comprises one or more nuclear localization sequences and/or one or more NESs that are sufficiently efficient to direct accumulation of said Cas9-based CRISPR complex in a detectable amount in or outside the nucleus of a eukaryotic cell. In some embodiments, the first regulatory element is a polymerase III promoter. In some embodiments, the second regulatory element is a polymerase II promoter. In some embodiments, the length of each of the guide sequences is at least 16, 17, 18, 19, 20, 25 nucleotides, or 16-30, or 16-25, or 16-20 nucleotides.
Рекомбинантные векторы экспрессии могут содержать полинуклеотиды, кодирующие фермент, систему или комплекс Cas9 для применения в множественном нацеливании, определяемом в данном документе, в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается применять для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии предполагается, что выражение "функционально связанный" обозначает то, что представляющая интерес нуклеотидная последовательность связана с регуляторным(регуляторными) элементом(элементами), так что обеспечивается возможность экспрессии нуклеотидной последовательности (например, в системе транскрипции/трансляции in vitro или в клетке-хозяине при введении вектора в клетку-хозяина).Recombinant expression vectors may comprise polynucleotides encoding a Cas9 enzyme, system or complex for use in the multiple targeting defined herein in a form suitable for expression of the nucleic acid in a host cell, which means that the recombinant expression vectors comprise one or more regulatory elements, which may be selected based on the host cells intended to be used for expression, which are operably linked to the nucleic acid sequence intended to be expressed. In the context of a recombinant expression vector, the term "operably linked" is intended to mean that the nucleotide sequence of interest is linked to the regulatory element(s) such that expression of the nucleotide sequence is allowed (e.g., in an in vitro transcription/translation system or in a host cell upon introduction of the vector into the host cell).
В некоторых вариантах осуществления клетка-хозяин является транзиентно или нетранзиентно трансфицирована с помощью одного или нескольких векторов, содержащих полинуклеотиды, кодирующие фермент, систему или комплекс Cas9 для применения при множественном нацеливании, определяемом в данном документе. В некоторых вариантах осуществления клетку трансфицируют, когда она находится в естественных условиях у субъекта. В некоторых вариантах осуществления клетка, которую трансфицируют, получена от субъекта. В некоторых вариантах осуществления клетка происходит из клеток, полученных от субъекта, как, например, линии клеток. Из уровня техники известен целый ряд линий клеток, применяемых в качестве культуры тканей, и их примеры приведены в других разделах данного документа. Линии клеток доступны из множества источников, известных специалистам в данной области (см., например, Американская коллекция типовых культур (ATCC) (Манассас, Вирджиния)). В некоторых вариантах осуществления клетку, трансфицированную с помощью одного или нескольких векторов, содержащих полинуклеотиды, кодирующие фермент, систему или комплекс Cas9 для применения при множественном нацеливании, определяемом в данном документе, применяют для получения новой линии клеток, содержащей одну или несколько полученных из вектора последовательностей. В некоторых вариантах осуществления клетку, транзиентно трансфицированную с помощью компонентов системы или комплекса CRISPR на основе Cas9 для применения при множественном нацеливании, описываемом в данном документе (как, например, путем транзиентной трансфекции с помощью одного или нескольких векторов, или трансфекции с помощью РНК), и модифицированную посредством активности системы или комплекса CRISPR на основе Cas9, применяют для получения новой линии клеток, содержащей клетки, содержащие модификацию, но в которых отсутствует любая другая экзогенная последовательность. В некоторых вариантах осуществления клетки, транзиентно или нетранзиентно трансфицированные с помощью одного или нескольких векторов, содержащих полинуклеотиды, кодирующие фермент, систему или комплекс Cas9 для применения при множественном нацеливании, определяемом в данном документе, или линии клеток, полученные из таких клеток, применяют в оценке одного или нескольких тестируемых соединений.In some embodiments, the host cell is transiently or non-transiently transfected with one or more vectors comprising polynucleotides encoding a Cas9 enzyme, system, or complex for use in multiplex targeting as defined herein. In some embodiments, the cell is transfected while it is in vivo in a subject. In some embodiments, the cell that is transfected is derived from the subject. In some embodiments, the cell is derived from cells derived from the subject, such as cell lines. A variety of cell lines useful for tissue culture are known in the art, and examples are provided elsewhere herein. Cell lines are available from a variety of sources known to those skilled in the art (see, for example, the American Type Culture Collection (ATCC) (Manassas, VA)). In some embodiments, a cell transfected with one or more vectors comprising polynucleotides encoding a Cas9 enzyme, system, or complex for use in multiple targeting as defined herein is used to generate a new cell line comprising one or more vector-derived sequences. In some embodiments, a cell transiently transfected with components of a Cas9-based CRISPR system or complex for use in multiple targeting as described herein (such as by transient transfection with one or more vectors, or transfection with RNA) and modified by the activity of the Cas9-based CRISPR system or complex is used to generate a new cell line comprising cells comprising the modification but lacking any other exogenous sequence. In some embodiments, cells transiently or non-transiently transfected with one or more vectors containing polynucleotides encoding a Cas9 enzyme, system, or complex for use in multiplex targeting as defined herein, or cell lines derived from such cells, are used in the evaluation of one or more test compounds.
Термин "регуляторные элементы" определен в других разделах данного документа.The term "regulatory elements" is defined in other sections of this document.
Преимущественные векторы включают лентивирусы и аденоассоциированные вирусы, и типы таких векторов также могут быть выбраны для нацеливания на определенные типы клеток.Preferred vectors include lentiviruses and adeno-associated viruses, and types of such vectors can also be selected to target specific cell types.
В одном аспекте настоящего изобретения предусмотрена эукариотическая клетка-хозяин, содержащая (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких последовательностей направляющей РНК выше или ниже (в зависимости от того, что является подходящим) последовательности прямого повтора, где при экспрессии направляющая(направляющие) последовательность (последовательности) управляет(управляют) специфичным к последовательности связыванием комплекса CRISPR на основе Cas9 с соответствующей целевой последовательностью(ями) в эукариотической клетке, где комплекс CRISPR на основе Cas9 содержит фермент Cas9 в комплексе с одной или несколькими направляющими последовательностями, которые гибридизируются с соответствующей(соответствующими) целевой(целевыми) последовательностью (последовательностями); и/или (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, кодирующей указанный фермент Cas9, содержащий предпочтительно по меньшей мере одну последовательность ядерной локализации и/или NES. В некоторых вариантах осуществления клетка-хозяин содержит компоненты (a) и (b). Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления компонент (a), компонент (b) или компоненты (a) и (b) стабильно интегрированы в геном эукариотической клетки-хозяина. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом и необязательно разделенных прямым повтором, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR на основе Cas9 со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления фермент Cas9 содержит одну или несколько последовательностей ядерной локализации и/или последовательностей ядерного экспорта или NES, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки и/или за его пределами.In one aspect of the present invention there is provided a eukaryotic host cell comprising (a) a first regulatory element operably linked to a direct repeat sequence and one or more insertion sites for insertion of one or more guide RNA sequences upstream or downstream (as appropriate) of the direct repeat sequence, wherein upon expression the guide sequence(s) direct(s) sequence-specific binding of a Cas9-based CRISPR complex to a corresponding target sequence(s) in a eukaryotic cell, wherein the Cas9-based CRISPR complex comprises a Cas9 enzyme in complex with one or more guide sequences that hybridize to the corresponding target sequence(s); and/or (b) a second regulatory element operably linked to an enzyme-coding sequence encoding said Cas9 enzyme, preferably comprising at least one nuclear localization sequence and/or NES. In some embodiments, the host cell comprises components (a) and (b). If applicable, a tracr sequence may also be provided. In some embodiments, component (a), component (b), or components (a) and (b) are stably integrated into the genome of a eukaryotic host cell. In some embodiments, component (a) further comprises two or more guide sequences operably linked to the first regulatory element and optionally separated by a direct repeat, wherein when expressed, each of the two or more guide sequences directs sequence-specific binding of the Cas9-based CRISPR complex to its target sequence in a eukaryotic cell. In some embodiments, the Cas9 enzyme comprises one or more nuclear localization sequences and/or nuclear export sequences or NESs characterized by sufficient efficiency to direct the accumulation of said CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell and/or outside thereof.
В некоторых вариантах осуществления фермент Cas9 представляет собой фермент системы CRISPR V или VI типа. В некоторых вариантах осуществления фермент Cas9 представляет собой фермент Cas9. В некоторых вариантах осуществления фермент Cas9 получен из Cas9 Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens или Porphyromonas macacae, и он может включать дополнительные изменения или мутации Cas9, определяемые в других разделах данного документа, и он может представлять собой химерный Cas9. В некоторых вариантах осуществления фермент Cas9 является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления длина одной или нескольких направляющих последовательностей составляет (или длина каждой составляет) по меньшей мере 16, 17, 18, 19, 20, 25 нуклеотидов, или 16-30, или 16-25, или 16-20 нуклеотидов. При применении множественных направляющих РНК они предпочтительно разделены последовательностью прямого повтора. В одном аспекте настоящего изобретения предусмотрен эукариотический организм, отличный от человека; предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина в соответствии с любым из описанных вариантов осуществления. В других аспектах настоящего изобретения предусмотрен эукариотический организм, предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина в соответствии с любым из описанных вариантов осуществления. В некоторых вариантах осуществления этих аспектов организм может представлять собой животное; например, млекопитающее. Также организм может представлять собой членистоногое, такое как насекомое. Организм также может представлять собой растение. Кроме того, организм может представлять собой гриб.In some embodiments, the Cas9 enzyme is a type V or type VI CRISPR system enzyme. In some embodiments, the Cas9 enzyme is a Cas9 enzyme. In some embodiments, the Cas9 enzyme is derived from the Cas9 of Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens, or Porphyromonas macacae, and may include additional Cas9 alterations or mutations defined elsewhere herein, and may be a chimeric Cas9. In some embodiments, the Cas9 enzyme is codon optimized for expression in a eukaryotic cell. In some embodiments, the CRISPR enzyme directs single or double strand cleavage at a specific position in a target sequence. In some embodiments, the first regulatory element is a polymerase III promoter. In some embodiments, the second regulatory element is a polymerase II promoter. In some embodiments, the length of one or more guide sequences is (or the length of each is) at least 16, 17, 18, 19, 20, 25 nucleotides, or 16-30, or 16-25, or 16-20 nucleotides. When multiple guide RNAs are used, they are preferably separated by a direct repeat sequence. In one aspect of the present invention, a eukaryotic organism other than a human is provided; preferably a multicellular eukaryotic organism comprising a eukaryotic host cell according to any of the described embodiments. In other aspects of the present invention, a eukaryotic organism is provided, preferably a multicellular eukaryotic organism comprising a eukaryotic host cell according to any of the described embodiments. In some embodiments of these aspects, the organism may be an animal; for example, a mammal. The organism may also be an arthropod, such as an insect. The organism may also be a plant. In addition, the organism may be a fungus.
В одном аспекте настоящего изобретения предусмотрен набор, содержащий один или несколько компонентов, описанных в данном документе. В некоторых вариантах осуществления набор содержит векторную систему и инструкции по применению набора. В некоторых вариантах осуществления векторная система содержит (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше или ниже (в зависимости от того, что является подходящим) последовательности прямого повтора, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR на основе Cas9 с целевой последовательностью в эукариотической клетке, где комплекс CRISPR на основе Cas9 содержит фермент Cas9 в комплексе с направляющей последовательностью, которая гибридизируется с целевой последовательностью; и/или (b) второй регуляторный элемент, функционально связанный фермент-кодирующей последовательностью, кодирующей указанный фермент Cas9, содержащий последовательность ядерной локализации. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления набор содержит компоненты (a) и (b), находящиеся в одном и том же или разных векторах системы. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления фермент Cas9 содержит одну или несколько последовательностей ядерной локализации, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент CRISPR представляет собой фермент системы CRISPR V или VI типа. В некоторых вариантах осуществления фермент CRISPR представляет собой фермент Cas9. В некоторых вариантах осуществления фермент Cas9 получен из Cas9 Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens или Porphyromonas macacae (например, модифицированный так, что он имеет по меньшей мере один DD или имеет способность к ассоциации с ним), и он может включать дополнительное изменение или мутацию Cas9 и может представлять собой химерный Cas9. В некоторых вариантах осуществления фермент DD-CRISPR является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент DD-CRISPR управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления фермент DD-CRISPR не обладает или фактически не обладает активностью расщепления нити ДНК (например, характеризуется не более чем 5% нуклеазной активности по сравнению с ферментом дикого типа или ферментом без мутации или изменения, которые снижают нуклеазную активность). В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления длина направляющей последовательности составляет по меньшей мере 16, 17, 18, 19, 20, 25 нуклеотидов, или 16-30, или 16-25, или 16-20 нуклеотидов.In one aspect of the present invention, a kit is provided comprising one or more components described herein. In some embodiments, the kit comprises a vector system and instructions for using the kit. In some embodiments, the vector system comprises (a) a first regulatory element operably linked to a direct repeat sequence and one or more insertion sites for inserting one or more guide sequences upstream or downstream (as appropriate) of the direct repeat sequence, wherein when expressed, the guide sequence directs sequence-specific binding of a Cas9-based CRISPR complex to a target sequence in a eukaryotic cell, wherein the Cas9-based CRISPR complex comprises a Cas9 enzyme in complex with a guide sequence that hybridizes to the target sequence; and/or (b) a second regulatory element operably linked by an enzyme-coding sequence encoding said Cas9 enzyme comprising a nuclear localization sequence. If applicable, a tracr sequence may also be provided. In some embodiments, the kit comprises components (a) and (b) located in the same or different vectors of the system. In some embodiments, component (a) further comprises two or more guide sequences operably linked to the first regulatory element, wherein when expressed, each of the two or more guide sequences directs sequence-specific binding of a CRISPR complex to its target sequence in a eukaryotic cell. In some embodiments, the Cas9 enzyme comprises one or more nuclear localization sequences that are sufficiently efficient to direct the accumulation of said CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell. In some embodiments, the CRISPR enzyme is a type V or type VI CRISPR system enzyme. In some embodiments, the CRISPR enzyme is a Cas9 enzyme. In some embodiments, the Cas9 enzyme is derived from the Cas9 of Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens, or Porphyromonas macacae (e.g., modified to have or have the ability to associate with at least one DD), and may include an additional alteration or mutation of Cas9 and may be a chimeric Cas9. In some embodiments, the DD-CRISPR enzyme is codon-optimized for expression in a eukaryotic cell. In some embodiments, the DD-CRISPR enzyme directs cleavage of one or both strands at a specific position in a target sequence. In some embodiments, the DD-CRISPR enzyme does not have or has substantially no DNA strand cleavage activity (e.g., has no more than 5% of the nuclease activity of the wild-type enzyme or the enzyme without a mutation or alteration that reduces nuclease activity). In some embodiments, the first regulatory element is a polymerase III promoter. In some embodiments, the second regulatory element is a polymerase II promoter. In some embodiments, the length of the guide sequence is at least 16, 17, 18, 19, 20, 25 nucleotides, or 16-30, or 16-25, or 16-20 nucleotides.
В одном аспекте настоящего изобретения предусмотрен способ модифицирования множественных целевых полинуклеотидов в клетке-хозяине, такой как эукариотическая клетка. В некоторых вариантах осуществления способ предусматривает обеспечение связывания комплекса CRISPR на основе Cas9 с множественными целевыми полинуклеотидами, например, для осуществления расщепления указанных множественных целевых полинуклеотидов, за счет чего обеспечивается модифицирование множественных целевых полинуклеотидов, где комплекс CRISPR на основе Cas9 содержит фермент Cas9 в комплексе с множественными направляющими последовательностями, каждая из которых гибридизируется со специфической целевой последовательностью в пределах указанного целевого полинуклеотида, где указанные множественные направляющие последовательности связаны с последовательностью прямого повтора. Если применимо, также может быть предусмотрена tracr-последовательность (например, для обеспечения одиночной направляющей РНК, sgRNA). В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении каждой целевой последовательности с помощью указанного фермента Cas9. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции множественных целевых генов. В некоторых вариантах осуществления способ дополнительно предусматривает репарацию одного или нескольких указанных расщепленных целевых полинуклеотидов с помощью гомологичной рекомбинации с экзогенной полинуклеотидной матрицей, где указанная репарация приводит к мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в одном или нескольких указанных целевых полинуклеотидов. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот в белке, экспрессируемом с гена, содержащего одну или несколько целевых последовательностей. В некоторых вариантах осуществления способ дополнительно предусматривает доставку одного или нескольких векторов в указанную эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента Cas9 и последовательностей множественных направляющих РНК, связанных с последовательностью прямого повтора. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления указанные векторы доставляются в эукариотическую клетку в субъекте. В некоторых вариантах осуществления указанное модифицирование происходит в указанной эукариотической клетке в культуре клеток. В некоторых вариантах осуществления способ дополнительно включает выделение указанной эукариотической клетки из организма субъекта перед проведением указанного модифицирования. В некоторых вариантах осуществления способ дополнительно включает возвращение указанной эукариотической клетки и/или клеток, происходящих из нее, указанному субъекту.In one aspect, the present invention provides a method for modifying multiple target polynucleotides in a host cell, such as a eukaryotic cell. In some embodiments, the method comprises causing a Cas9-based CRISPR complex to bind to multiple target polynucleotides, such as to cleave said multiple target polynucleotides, thereby causing the multiple target polynucleotides to be modified, wherein the Cas9-based CRISPR complex comprises a Cas9 enzyme in complex with multiple guide sequences, each of which hybridizes to a specific target sequence within said target polynucleotide, wherein said multiple guide sequences are linked to a direct repeat sequence. If applicable, a tracr sequence may also be provided (e.g., to provide a single guide RNA, sgRNA). In some embodiments, said cleavage comprises cleaving one or both strands at a specific position of each target sequence using said Cas9 enzyme. In some embodiments, said cleavage results in reduced transcription of multiple target genes. In some embodiments, the method further comprises repairing one or more of said cleaved target polynucleotides by homologous recombination with an exogenous polynucleotide template, wherein said repair results in a mutation involving an insertion, deletion or substitution of one or more nucleotides in one or more of said target polynucleotides. In some embodiments, said mutation results in a change in one or more amino acids in a protein expressed from a gene comprising one or more target sequences. In some embodiments, the method further comprises delivering one or more vectors to said eukaryotic cell, wherein the one or more vectors direct expression of one or more of: a Cas9 enzyme and multiple guide RNA sequences linked to a direct repeat sequence. If applicable, a tracr sequence may also be provided. In some embodiments, said vectors are delivered to a eukaryotic cell in a subject. In some embodiments, said modification occurs in said eukaryotic cell in cell culture. In some embodiments, the method further comprises isolating said eukaryotic cell from the subject's body prior to performing said modification. In some embodiments, the method further comprises returning said eukaryotic cell and/or cells derived therefrom to said subject.
В одном аспекте настоящего изобретения предусмотрен способ модифицирования экспрессии множественных полинуклеотидов в эукариотической клетке. В некоторых вариантах осуществления способ предусматривает обеспечение связывания комплекса CRISPR на основе Cas9 c множественными полинуклеотидами, так что указанное связывание приводит к повышенной или сниженной экспрессии указанных полинуклеотидов; где комплекс CRISPR на основе Cas9 содержит фермент Cas9 в комплексе с множественными направляющими последовательностями, каждая из которых специфически гибридизируется с ее собственной целевой последовательностью в пределах указанного полинуклеотида, где указанные направляющие последовательности связаны с последовательностью прямого повтора. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанные эукариотические клетки, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента Cas9 и множественных направляющих последовательностей, связанных с последовательностями прямого повтора. Если применимо, также может быть предусмотрена tracr-последовательность.In one aspect of the present invention, there is provided a method for modifying the expression of multiple polynucleotides in a eukaryotic cell. In some embodiments, the method comprises causing a Cas9-based CRISPR complex to bind to multiple polynucleotides, such that said binding results in increased or decreased expression of said polynucleotides; wherein the Cas9-based CRISPR complex comprises a Cas9 enzyme in a complex with multiple guide sequences, each of which specifically hybridizes to its own target sequence within said polynucleotide, wherein said guide sequences are linked to a direct repeat sequence. If applicable, a tracr sequence may also be provided. In some embodiments, the method further comprises delivering one or more vectors to said eukaryotic cells, wherein the one or more vectors direct the expression of one or more of: a Cas9 enzyme and multiple guide sequences linked to direct repeat sequences. If applicable, a tracr sequence may also be provided.
В одном аспекте настоящего изобретения предусмотрен рекомбинантный полинуклеотид, содержащий последовательности множественных направляющих РНК выше или ниже (в зависимости от того, что является подходящим) последовательности прямого повтора, где каждая из направляющих последовательностей при экспрессии управляет специфичным к последовательности связыванием комплекса CRISPR на основе Cas9 с его соответствующей целевой последовательностью, присутствующей в эукариотической клетке. В некоторых вариантах осуществления целевой последовательностью является вирусная последовательность, присутствующая в эукариотической клетке. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления целевая последовательность представляет собой протоонкоген или онкоген.In one aspect of the present invention, there is provided a recombinant polynucleotide comprising multiple guide RNA sequences upstream or downstream (as appropriate) of a direct repeat sequence, wherein each of the guide sequences, when expressed, directs sequence-specific binding of a Cas9-based CRISPR complex to its corresponding target sequence present in a eukaryotic cell. In some embodiments, the target sequence is a viral sequence present in a eukaryotic cell. If applicable, a tracr sequence may also be provided. In some embodiments, the target sequence is a proto-oncogene or an oncogene.
Аспекты настоящего изобретения охватывают не встречающуюся в природе или сконструированную композицию, которая может содержать направляющую РНК (gRNA), предусматривающую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, и фермент Cas9, определяемый в данном документе, который может содержать по меньшей мере одну или более последовательностей ядерной локализации.Aspects of the present invention include a non-naturally occurring or engineered composition that may comprise a guide RNA (gRNA) comprising a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell, and a Cas9 enzyme as defined herein, which may comprise at least one or more nuclear localization sequences.
Один аспект настоящего изобретения охватывает способы модифицирования представляющего интерес локуса генома для изменения экспрессии гена в клетке путем введения в клетку любой из композиций, описываемых в данном документе.One aspect of the present invention encompasses methods of modifying a genomic locus of interest to alter gene expression in a cell by introducing into the cell any of the compositions described herein.
Один аспект настоящего изобретения заключается в том, что вышеупомянутые элементы содержатся в одной композиции или содержатся в отдельных композициях. Эти композиции преимущественно могут быть применимы в отношении хозяина для индуцирования функционального эффекта на уровне генома.One aspect of the present invention is that the above-mentioned elements are contained in a single composition or are contained in separate compositions. These compositions can advantageously be applied to a host to induce a functional effect at the genome level.
Используемый в данном документе термин "направляющая РНК" или "gRNA" имеет значение, применяемое в других разделах данного документа, и предусматривает любую полинуклеотидную последовательность, характеризующуюся достаточной комплементарностью с целевой последовательностью нуклеиновой кислоты, чтобы гибридизироваться с целевой последовательностью нуклеиновой кислоты и управлять специфичным к последовательности связыванием комплекса нацеливания на нуклеиновую кислоту с целевой последовательностью нуклеиновой кислоты. Каждая gRNA может быть разработана с включением множественных связывающих сайтов распознавания (например, аптамеров), специфических в отношении одного и того же или разных адаптерных белков. Каждая gRNA может быть разработана так, чтобы связываться с промоторным участком, расположенным на -1000 - +1 нуклеотидов выше сайта начала транскрипции (т.е. TSS), предпочтительно -200 нуклеотидов. Такое размещение улучшает функциональные домены, которые воздействуют на активацию гена (например, активаторы транскрипции) или ингибирование гена (например, репрессоры транскрипции). Модифицированная gRNA может представлять собой одну или несколько модифицированных gRNA (например, по меньшей мере 1 gRNA, по меньшей мере 2 gRNA, по меньшей мере 5 gRNA, по меньшей мере 10 gRNA, по меньшей мере 20 gRNA, по меньшей мере 30 gRNA, по меньшей мере 50 gRNA), нацеленных на один или несколько целевых локусов, содержащихся в композиции. Указанные последовательности множественных gRNA могут быть расположены тандемно и предпочтительно разделены прямым повтором.As used herein, the term "guide RNA" or "gRNA" has the meaning used elsewhere herein and includes any polynucleotide sequence that has sufficient complementarity to a target nucleic acid sequence to hybridize to the target nucleic acid sequence and direct sequence-specific binding of a nucleic acid targeting complex to the target nucleic acid sequence. Each gRNA may be designed to include multiple binding recognition sites (e.g., aptamers) specific for the same or different adaptor proteins. Each gRNA may be designed to bind to a promoter region located -1000 to +1 nucleotides upstream of a transcription start site (i.e., TSS), preferably -200 nucleotides. This placement enhances functional domains that affect gene activation (e.g., transcriptional activators) or gene inhibition (e.g., transcriptional repressors). The modified gRNA may be one or more modified gRNAs (e.g., at least 1 gRNA, at least 2 gRNAs, at least 5 gRNAs, at least 10 gRNAs, at least 20 gRNAs, at least 30 gRNAs, at least 50 gRNAs) targeting one or more target loci contained in the composition. Said sequences of multiple gRNAs may be arranged in tandem and are preferably separated by a direct repeat.
Таким образом, каждый из gRNA, фермента CRISPR, определяемых в данном документе, могут по отдельности содержаться в композиции и их можно вводить хозяину по отдельности или совместно. Альтернативно эти компоненты могут обеспечиваться в одной композиции для введения хозяину. Введение хозяину может быть выполнено посредством вирусных векторов, известных специалисту или описываемых в данном документе для доставки хозяину (например, лентивирусного вектора, аденовирусного вектора, вектора на основе AAV). Как объясняется в данном документе, применение различных маркеров отбора (например, для отбора лентивирусной sgRNA) и различной концентрации gRNA (например, в зависимости от того, применяются ли множественные gRNA) может быть предпочтительным для индуцирования улучшенного эффекта. Исходя из этой концепции для индукции преобразования в локусе генома подходят несколько вариантов, включая расщепление ДНК, активацию гена или дезактивацию гена. С применением предусмотренных композиций специалист в данной области сможет осуществить эффективное и специфическое нацеливание на один или множественные локусы с помощью одинаковых или различных функциональных доменов для индукции одного или нескольких преобразований в локусе генома. Композиции можно применять в целом ряде способов скрининга библиотек в клетках и функционального моделирования in vivo (например, активации генов lincRNA и идентификации функций; моделирования мутации с приобретением функции; моделирования мутации с потерей функции; применения композиций в соответствии с настоящим изобретением для создания линий клеток и трансгенных животных в целях оптимизации и скрининга).Thus, each of the gRNA, the CRISPR enzyme defined herein may be individually contained in a composition and may be administered to the host individually or together. Alternatively, these components may be provided in a single composition for administration to the host. Administration to the host may be accomplished via viral vectors known to the skilled artisan or described herein for delivery to the host (e.g., a lentiviral vector, an adenoviral vector, an AAV-based vector). As explained herein, the use of different selection markers (e.g., for lentiviral sgRNA selection) and different gRNA concentrations (e.g., depending on whether multiple gRNAs are used) may be advantageous to induce an improved effect. Based on this concept, several options are suitable for inducing transformation at a genomic locus, including DNA cleavage, gene activation, or gene inactivation. Using the provided compositions, a person skilled in the art will be able to efficiently and specifically target one or multiple loci using the same or different functional domains to induce one or more transformations at a genomic locus. The compositions can be used in a variety of methods for screening libraries in cells and functional modeling in vivo (e.g., lincRNA gene activation and function identification; gain-of-function modeling; loss-of-function modeling; using the compositions of the present invention to create cell lines and transgenic animals for optimization and screening purposes).
Настоящее изобретение охватывает применение композиций по настоящему изобретению для создания и использования трансгенных клеток/животных с зависимой от условия или индуцируемой CRISPR; см, например, Platt et al., Cell (2014), 159(2): 440-455, или патентные публикации согласно PCT, процитированные в данном документе, такие как WO 2014/093622 (PCT/US2013/074667). Например, клетки или животные, такие как отличные от человека животные, например, позвоночные или млекопитающие, такие как грызуны, например, мыши, крысы, или другие лабораторные или внелабораторные животные, например, кошки, собаки, овцы и т.д., могут характеризоваться состоянием "нокин", в результате чего у животного в зависимости от условий или индуцируемо экспрессируется Cas9, как описано в Platt et al. Таким образом целевая клетка или животное содержат зависимый от условия или индуцируемый (например, в форме Cre-зависимых конструкций) фермент CRISPR (например, Cas9) (например, в форме Cre-зависимых конструкций), при экспрессии вектора, введенного в целевую клетку, вектор экспрессирует то, что индуцирует или обеспечивает условие для экспрессии фермента CRISPR (например, Cas9) в целевой клетке. С применением идей и композиций, определяемых в данном документе, с известным способом создания комплекса CRISPR индуцируемые преобразования генома также являются аспектом настоящего изобретения. Примеры таких индуцируемых преобразований были описаны в других разделах данного документа.The present invention encompasses the use of the compositions of the present invention to generate and use transgenic cells/animals with conditionally or inducibly expressed CRISPR; see, e.g., Platt et al., Cell (2014), 159(2):440-455, or the PCT patent publications cited therein, such as WO 2014/093622 (PCT/US2013/074667). For example, cells or animals, such as non-human animals, e.g., vertebrates or mammals, such as rodents, e.g., mice, rats, or other laboratory or non-laboratory animals, e.g., cats, dogs, sheep, etc., can be characterized by a "knock-in" state, whereby the animal conditionally or inducibly expresses Cas9, as described in Platt et al. Thus, the target cell or animal contains a conditionally dependent or inducible (e.g., in the form of Cre-dependent constructs) CRISPR enzyme (e.g., Cas9) (e.g., in the form of Cre-dependent constructs), when expressing the vector introduced into the target cell, the vector expresses that which induces or provides a condition for the expression of the CRISPR enzyme (e.g., Cas9) in the target cell. Using the ideas and compositions defined in this document with a known method for creating a CRISPR complex, inducible genome transformations are also an aspect of the present invention. Examples of such inducible transformations have been described in other sections of this document.
В некоторых вариантах осуществления фенотипическое изменение предпочтительно является результатом модификации генома при осуществлении нацеливания на генетическое заболевание, особенно в способах терапии, и предпочтительно, если обеспечивается матрица для репарации для коррекции или изменения фенотипа.In some embodiments, the phenotypic change is preferably the result of modification of the genome in targeting a genetic disease, particularly in therapeutic methods, and preferably if a repair template is provided to correct or alter the phenotype.
В некоторых вариантах осуществления заболевания, на которые можно осуществлять нацеливание, включают заболевания, которые обусловлены патогенными дефектами сплайсинга.In some embodiments, diseases that can be targeted include diseases that are caused by pathogenic splicing defects.
В некоторых вариантах осуществления клеточные цели включают в себя гемопоэтические стволовые клетки/клетки-предшественники (CD34+); человеческие T-клетки и клетки глаза (клетки сетчатки), например, фоторецепторные клетки-предшественники.In some embodiments, cellular targets include hematopoietic stem/progenitor cells (CD34+); human T cells, and ocular cells (retinal cells), such as photoreceptor progenitor cells.
В некоторых вариантах осуществления гены-мишени включают: ген бета-глобина человека - HBB (для лечения серповидноклеточной анемии, в том числе путем стимуляции конверсии генов (с использованием близкородственного гена HBD в качестве эндогенной матрицы)); CD3 (T-клетки) и CEP920 - сетчатка (глаза).In some embodiments, target genes include: human beta globin gene - HBB (for the treatment of sickle cell anemia, including by stimulating gene conversion (using the closely related HBD gene as an endogenous template)); CD3 (T cells) and CEP920 - retina (eyes).
В некоторых вариантах осуществления заболевания-мишени также включают рак; серповидноклеточную анемию (обусловленную точечной мутацией); HBV, HIV; бета-талассемию; а также офтальмологическое или глазное заболевание, например, врожденный амавроз Лебера (LCA), вызванный дефектом сплайсинга.In some embodiments, the target diseases also include cancer; sickle cell anemia (caused by a point mutation); HBV, HIV; beta-thalassemia; and an ophthalmologic or eye disease, such as Leber congenital amaurosis (LCA), caused by a splicing defect.
В некоторых вариантах осуществления способы доставки включают опосредованную катионным липидом "прямую" доставку комплекса фермент-направляющая (рибонуклеопротеин) и электропорацию плазмидной ДНК.In some embodiments, delivery methods include cationic lipid-mediated "direct" delivery of the enzyme-targeting (ribonucleoprotein) complex and electroporation of plasmid DNA.
Способы, продукты и варианты применения, описанные в данном документе, можно применять для целей, не связанных с терапией. Кроме того, любой из способов, описанных в данном документе, можно применять in vitro и ex vivo.The methods, products, and uses described herein may be used for purposes other than therapy. In addition, any of the methods described herein may be used in vitro and ex vivo.
В одном аспекте предусмотрена не встречающаяся в природе или сконструированная композиция, содержащая:In one aspect, there is provided a non-naturally occurring or engineered composition comprising:
I. две или более полинуклеотидные последовательности системы CRISPR-Cas, предусматривающиеI. two or more polynucleotide sequences of the CRISPR-Cas system, providing
(a) первую направляющую последовательность, способную гибридизироваться с первой целевой последовательностью в полинуклеотидном локусе,(a) a first guide sequence capable of hybridizing to a first target sequence at a polynucleotide locus,
(b) вторую направляющую последовательность, способную гибридизироваться со второй целевой последовательностью в полинуклеотидном локусе,(b) a second guide sequence capable of hybridizing to a second target sequence at the polynucleotide locus,
(c) последовательность прямого повтора,(c) direct repeat sequence,
иAnd
II. фермент Cas9 или вторую полинуклеотидную последовательность, кодирующую его,II. the Cas9 enzyme or a second polynucleotide sequence encoding it,
где будучи транскрибированными, первая и вторая направляющие последовательности управляют специфичным к последовательности связыванием первого и второго комплекса CRISPR на основе Cas9 с первой и второй целевыми последовательностями соответственно,wherein, when transcribed, the first and second guide sequences direct sequence-specific binding of the first and second Cas9-based CRISPR complexes to the first and second target sequences, respectively,
где первый комплекс CRISPR содержит фермент Cas9 в комплексе с первой направляющей последовательностью, которая может гибридизироваться с первой целевой последовательностью,wherein the first CRISPR complex comprises a Cas9 enzyme in complex with a first guide sequence that can hybridize to a first target sequence,
где второй комплекс CRISPR содержит фермент Cas9 в комплексе со второй направляющей последовательностью, которая может гибридизироваться со второй целевой последовательностью, иwherein the second CRISPR complex comprises a Cas9 enzyme in complex with a second guide sequence that can hybridize to a second target sequence, and
где первая направляющая последовательность управляет расщеплением одной нити ДНК-дуплекса возле первой целевой последовательности, и вторая направляющая последовательность управляет расщеплением другой нити возле второй целевой последовательности, при этом индуцируется двухнитевой разрыв, за счет чего обеспечивается модифицирование организма, или отличного от человеческого, или отличного от животного организма. Аналогично могут быть предусмотрены композиции, содержащие более двух направляющих РНК, например, каждая из которых специфична в отношении одной мишени, и они расположены тандемно в композиции или системе или комплексе CRISPR, описываемых в данном документе.wherein the first guide sequence directs cleavage of one strand of a DNA duplex near a first target sequence, and the second guide sequence directs cleavage of the other strand near a second target sequence, thereby inducing a double-strand break, thereby providing modification of an organism, either non-human or non-animal. Similarly, compositions may be provided that contain more than two guide RNAs, for example, each specific for one target, and they are arranged in tandem in the CRISPR composition or system or complex described herein.
В другом варианте осуществления Cas9 доставляется в клетку в виде белка. В другом и особенно предпочтительном варианте осуществления Cas9 доставляется в клетку в виде белка или в виде нуклеотидной последовательности, кодирующей его. Доставка в клетку в виде белка может включать доставку рибонуклеопротеинового (RNP) комплекса, в котором белок находится в комплексе с множественными направляющими.In another embodiment, Cas9 is delivered to the cell as a protein. In another and particularly preferred embodiment, Cas9 is delivered to the cell as a protein or as a nucleotide sequence encoding it. Delivery to the cell as a protein may include delivery of a ribonucleoprotein (RNP) complex in which the protein is in a complex with multiple guides.
В одном аспекте предусмотрены клетки-хозяева и линии клеток, модифицированные с помощью композиций, систем или модифицированных ферментов по настоящему изобретению или содержащие их, в том числе стволовые клетки и их потомство.In one aspect, host cells and cell lines modified with or containing the compositions, systems or modified enzymes of the present invention are provided, including stem cells and their progeny.
В одном аспекте предусмотрены способы клеточной терапии, при которых, например, отдельную клетку или популяцию клеток отбирают или культивируют, где такую клетку или клетки модифицируют или они были модифицированы ex vivo, как описано в данном документе, а затем возвращают (отобранные клетки) или вводят (культивируемые клетки) в организм. Стволовые клетки, будь то эмбриональные, индуцированные плюрипотентные или тотипотентные стволовые клетки, также особенно предпочтительны в этом отношении. Но, разумеется, также предусматриваются варианты осуществления in vivo.In one aspect, methods of cell therapy are provided in which, for example, a single cell or population of cells is isolated or cultured, wherein such cell or cells are or have been modified ex vivo as described herein, and then returned (selected cells) or introduced (cultured cells) into the body. Stem cells, whether embryonic, induced pluripotent or totipotent stem cells, are also particularly preferred in this regard. But, of course, in vivo embodiments are also contemplated.
Способы в соответствии с настоящим изобретением могут дополнительно предусматривать доставку матриц, таких как матрицы для репарации, которые могут представлять собой dsODN или ssODN, см. ниже. Доставка матриц может осуществляться одновременно или отдельно от доставки какого-либо или всех из фермента CRISPR или направляющих РНК и с помощью одного и того же или различных механизмов доставки. В некоторых вариантах осуществления предпочтительно, чтобы матрица доставлялась вместе с направляющими РНК и, предпочтительно, также с ферментом CRISPR. Примером может служить вектор на основе AAV, при этом фермент CRISPR представляет собой AsCas9 или LbCas9.The methods according to the present invention may further comprise delivery of templates, such as repair templates, which may be dsODN or ssODN, see below. Delivery of templates may be carried out simultaneously or separately from delivery of any or all of the CRISPR enzyme or guide RNAs and by the same or different delivery mechanisms. In some embodiments, it is preferred that the template is delivered together with guide RNAs and, preferably, also with the CRISPR enzyme. An example is an AAV-based vector, wherein the CRISPR enzyme is AsCas9 or LbCas9.
Способы в соответствии с настоящим изобретением могут дополнительно включать: (a) доставку в клетку двухнитевого олигодезоксинуклеотида (dsODN), содержащего "липкие" концы, комплементарные "липким" концам, создаваемым с помощью указанного двухнитевого разрыва, где указанный dsODN интегрируется в представляющий интерес локус; или (b) доставку в клетку однонитевого олигодезоксинуклеотида (ssODN), где указанный ssODN действует как матрица для гомологичной репарации указанного двухнитевого разрыва. Способы в соответствии с настоящим изобретением можно применять для предупреждения или лечения заболевания у индивидуума, при этом необязательно указанное заболевание вызвано дефектом в указанном представляющем интерес локусе. Способы в соответствии с настоящим изобретением можно выполнять in vivo у индивидуума или ex vivo в отношении клетки, извлеченной из индивидуума, где необязательно указанную клетку возвращают в организм индивидуума.The methods of the present invention may further comprise: (a) delivering to a cell a double-stranded oligodeoxynucleotide (dsODN) comprising sticky ends complementary to the sticky ends created by said double-strand break, wherein said dsODN integrates into a locus of interest; or (b) delivering to a cell a single-stranded oligodeoxynucleotide (ssODN), wherein said ssODN acts as a template for homologous repair of said double-strand break. The methods of the present invention may be used to prevent or treat a disease in an individual, optionally wherein said disease is caused by a defect in said locus of interest. The methods of the present invention may be performed in vivo in an individual or ex vivo on a cell removed from an individual, optionally wherein said cell is returned to the individual.
Настоящее изобретение также охватывает продукты, полученные в результате применения фермента CRISPR, или фермента Cas, или фермента Cas9, или фермента CRISPR-CRISPR, или системы CRISPR-Cas, или системы CRISPR-Cas9, для применения в тандеме или при множественном нацеливании, определяемых в данном документе.The present invention also encompasses products obtained by using a CRISPR enzyme, or a Cas enzyme, or a Cas9 enzyme, or a CRISPR-CRISPR enzyme, or a CRISPR-Cas system, or a CRISPR-Cas9 system, for use in tandem or in multiple targeting, as defined herein.
Сопровождаемые направляющие для системы CRISPR-Cas на основе Cas9 в соответствии с настоящим изобретениемGuided RNAs for a Cas9-based CRISPR-Cas system according to the present invention
В одном аспекте настоящего изобретения предусмотрены сопровождаемые системы или комплексы CRISPR-Cas на основе Cas9, в частности, такая система, включающая сопровождаемую направляющую системы CRISPR-Cas на основе Cas9. Под "сопровождаемой" подразумевается, что система, или комплекс CRISPR-Cas на основе Cas9, или направляющая доставляются в определенное время или место в клетке, так что активность системы или комплекса CRISPR-Cas на основе Cas9 или направляющей контролируются в пространственном или временном отношении. Например, активность и местоназначение системы или комплекса CRISPR-Cas на основе Cas9 или направляющей могут контролироваться с помощью аптамерной последовательности сопровождающей РНК, которая характеризуется аффинностью связывания в отношении лиганда аптамера, такого как белок клеточной поверхности или другой локализованный клеточный компонент. Альтернативно сопровождающий аптамер, например, может реагировать на эффектор аптамера на клетке или в ней, такой как временный эффектор, такой как внешний источник энергии, который прилагают к клетке в определенное время.In one aspect, the present invention provides chaperoned Cas9-based CRISPR-Cas systems or complexes, in particular such a system comprising a chaperoned guide of a Cas9-based CRISPR-Cas system. By "chaperoned" is meant that the Cas9-based CRISPR-Cas system or complex or guide is delivered at a specific time or location in the cell such that the activity of the Cas9-based CRISPR-Cas system or complex or guide is spatially or temporally controlled. For example, the activity and location of the Cas9-based CRISPR-Cas system or complex or guide can be controlled by an aptamer sequence of the chaperone RNA that has a binding affinity for an aptamer ligand, such as a cell surface protein or other localized cellular component. Alternatively, the chaperone aptamer, for example, may respond to an effector of the aptamer on or in the cell, such as a transient effector such as an external energy source that is applied to the cell at a specific time.
Сопровождаемые системы или комплексы CRISPR-Cas на основе Cas9 имеют gRNA с функциональной структурой, разработанной для улучшения структуры, архитектуры, стабильности, генетической экспрессии gRNA или любой их комбинации. Такая структура может включать аптамер.Cas9-based CRISPR-Cas escort systems or complexes have a gRNA with a functional structure designed to improve the gRNA structure, architecture, stability, genetic expression, or any combination thereof. Such a structure may include an aptamer.
Аптамеры представляют собой биомолекулы, которые можно разрабатывать или отбирать так, чтобы они крепко связывались с другими лигандами, например, с применением методики, называемой систематическая эволюция лигандов с помощью экспоненциального обогащения (SELEX; Tuerk C, Gold L: "Systematic evolution of ligands by exponential enrichment: RNA ligands to bacteriophage T4 DNA polymerase." Science 1990, 249:505-510). Аптамеры на основе нуклеиновых кислот, например, можно отбирать из пулов олигонуклеотидов со случайной последовательностью, которые характеризуются высокой аффинностью связывания и специфичностью для целого ряда мишеней, значимых с биомедицинской точки зрения, что предполагает целый ряд терапевтических вариантов использования аптамеров (Keefe, Anthony D., Supriya Pai, and Andrew Ellington. "Aptamers as therapeutics." Nature Reviews Drug Discovery 9.7 (2010): 537-550). Эти характеристики также предполагают целый ряд применений аптамеров в качестве средств доставки лекарственных средств (Levy-Nissenbaum, Etgar, et al. "Nanotechnology and aptamers: applications in drug delivery." Trends in biotechnology 26.8 (2008): 442-449; и Hicke BJ, Stephens AW. "Escort aptamers: a delivery service for diagnosis and therapy." J Clin Invest 2000, 106:923-928.). Также можно конструировать аптамеры, которые функционируют как молекулярные переключатели, реагирующие на гашение сигнала путем изменения свойств, такие как РНК-аптамеры, которые связывают флуорофоры с имитацией активности зеленого флуоресцентного белка (Paige, Jeremy S., Karen Y. Wu, and Samie R. Jaffrey. "RNA mimics of green fluorescent protein." Science 333.6042 (2011): 642-646). Также предполагалось, что аптамеры можно применять как компоненты нацеленных терапевтических систем доставки siRNA, например, для нацеливания на белки клеточной поверхности (Zhou, Jiehua, and John J. Rossi. "Aptamer-targeted cell-specific RNA interference." Silence 1.1 (2010): 4).Aptamers are biomolecules that can be designed or selected to bind tightly to other ligands, for example using a technique called systematic evolution of ligands by exponential enrichment (SELEX; Tuerk C, Gold L: "Systematic evolution of ligands by exponential enrichment: RNA ligands to bacteriophage T4 DNA polymerase." Science 1990, 249:505-510). Nucleic acid-based aptamers, for example, can be selected from pools of randomly sequenced oligonucleotides that exhibit high binding affinity and specificity for a variety of biomedically relevant targets, suggesting a range of therapeutic uses for aptamers (Keefe, Anthony D., Supriya Pai, and Andrew Ellington. "Aptamers as therapeutics." Nature Reviews Drug Discovery 9.7 (2010): 537-550). These characteristics also suggest a variety of applications for aptamers as drug delivery vehicles (Levy-Nissenbaum, Etgar, et al. "Nanotechnology and aptamers: applications in drug delivery." Trends in biotechnology 26.8 (2008): 442-449; and Hicke BJ, Stephens AW. "Escort aptamers: a delivery service for diagnosis and therapy." J Clin Invest 2000, 106:923-928.). It is also possible to design aptamers that function as molecular switches that respond to signal quenching by changing properties, such as RNA aptamers that link fluorophores to mimic the activity of green fluorescent protein (Paige, Jeremy S., Karen Y. Wu, and Samie R. Jaffrey. "RNA mimics of green fluorescent protein." Science 333.6042 (2011): 642–646). It has also been suggested that aptamers could be used as components of targeted siRNA therapeutic delivery systems, for example to target cell surface proteins (Zhou, Jiehua, and John J. Rossi. "Aptamer-targeted cell-specific RNA interference." Silence 1.1 (2010): 4).
В соответствии с этим в данном документе предусмотрена gRNA, модифицированная, например, с помощью одного или нескольких аптамеров, разработанных для улучшения доставки gRNA, включая доставку через клеточную мембрану, во внутриклеточные компартменты или в ядро. Такая структура может включать, либо в дополнение к одному или нескольким аптамерам, либо без такого одного или нескольких аптамеров, фрагмент(фрагменты), (который)которые (придает)придают направляющей возможность доставки, индукции или реакции на выбранный эффектор. В соответствии с этим настоящее изобретение охватывает gRNA, которая реагирует на нормальные или патологические физиологические условия, включая без ограничения pH, гипоксию, концентрацию O2, температуру, концентрацию белка, концентрацию фермента, структуру липида, воздействие света, механическое разрушение (например, ультразвуковые волны), магнитные поля, электрические поля или электромагнитное излучение.Accordingly, provided herein is a gRNA modified, for example, with one or more aptamers designed to improve delivery of the gRNA, including delivery across the cell membrane, into intracellular compartments or into the nucleus. Such a structure may include, either in addition to one or more aptamers or without such one or more aptamers, a moiety(s) that (impart) impart to the guide the ability to deliver, induce or respond to a selected effector. Accordingly, the present invention encompasses a gRNA that responds to normal or pathological physiological conditions, including but not limited to pH, hypoxia, O2 concentration, temperature, protein concentration, enzyme concentration, lipid structure, exposure to light, mechanical disruption (e.g., ultrasound waves), magnetic fields, electric fields or electromagnetic radiation.
В одном аспекте настоящего изобретения предусмотрена не встречающаяся в природе или сконструированная композиция, содержащая сопровождаемую направляющую РНК (egRNA), содержащую:In one aspect of the present invention, there is provided a non-naturally occurring or engineered composition comprising an escorted guide RNA (egRNA) comprising:
направляющую последовательность РНК, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке; иa guide RNA sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell; and
сопровождающую аптамерную последовательность РНК, где сопровождающий аптамер характеризуется аффинностью связывания в отношении лиганда аптамера на клетке или в ней, или сопровождающий аптамер реагирует на локализованный эффектор аптамера на клетке или в ней, где присутствие лиганда или эффектора аптамера на клетке или в ней является ограниченным во временном или пространственном отношении.a chaperone aptamer RNA sequence, wherein the chaperone aptamer has a binding affinity for an aptamer ligand on or in a cell, or the chaperone aptamer is responsive to a localized effector of the aptamer on or in a cell, wherein the presence of the aptamer ligand or effector on or in a cell is limited in time or space.
Сопровождающий аптамер, например, может изменять конформацию в ответ на взаимодействие c лигандом или эффектором аптамера в клетке.A chaperone aptamer, for example, can change conformation in response to interaction with a ligand or an aptamer effector in the cell.
Сопровождающий аптамер может характеризоваться специфической аффинностью связывания в отношении лиганда аптамера.The chaperone aptamer may be characterized by a specific binding affinity for the aptamer ligand.
Лиганд аптамера может локализоваться в определенном положении или компартменте клетки, например, на мембране клетки или в ней. В соответствии с этим связывание сопровождающего аптамера с лигандом аптамера может направлять egRNA в представляющее интерес местоположение в клетке, как, например, внутреннее пространство клетки посредством связывания с лигандом аптамера, который представляет собой лиганд клеточной поверхности. Таким образом, можно обеспечивать нацеливание на различные ограниченные пространственно местоположения в пределах клетки, такие как ядро клетки или митохондрии.The aptamer ligand may be localized to a specific location or compartment of the cell, such as on or in the cell membrane. Accordingly, binding of the chaperone aptamer to the aptamer ligand may direct the egRNA to a location of interest in the cell, such as the interior of the cell, via binding to the aptamer ligand, which is a cell surface ligand. In this way, targeting of various spatially restricted locations within the cell, such as the cell nucleus or mitochondria, may be achieved.
После того, как запланированные изменения были введены, как, например, путем редактирования запланированных копий гена в геноме клетки, продолжение экспрессии CRISPR/Cas9 в данной клетке более не является необходимым. Действительно, длительная экспрессия была бы нежелательной в случае нецелевых эффектов в сайтах генома, не предназначенных для редактирования и т.д. Таким образом, целесообразной была бы ограниченная во времени экспрессия. Одним подходом к решению служит индуцируемая экспрессия, но помимо этого заявители сконструировали самоинактивирующуюся систему CRISPR-Cas с применением Cas9, которая основана на применении некодирующей направляющей целевой последовательности в пределах самого вектора, несущего CRISPR. Таким образом, после того как экспрессия началась, система CRISPR будет вызывать собственное разрушение, но перед тем как разрушение завершится, у нее будет достаточно времени для редактирования геномных копий целевого гена (для чего, с точки зрения нормальной точечной мутации в диплоидной клетке, потребуется не более двух редактирований). Проще говоря, самоинактивирующаяся система CRISPR-Cas с применением Cas9 включает дополнительную РНК (т. e. направляющую РНК), которая нацеливается на кодирующую последовательность самого фермента CRISPR или которая нацеливается на одну или несколько некодирующих направляющих целевых последовательностей, комплементарных уникальным последовательностям, присутствующим в одном или нескольких из следующих: (a) в пределах промотора, управляющего экспрессией элементов некодирующей РНК, (b) в пределах промотора, управляющего экспрессией гена Cas9, (c) в пределах 100 п. о. стартового кодона трансляции ATG в последовательности, кодирующей Cas9, (d) в пределах инвертированного концевого повтора (iTR) вирусного вектора доставки, например, в геноме AAV.Once the intended changes have been introduced, such as by editing the intended copies of a gene in the cell's genome, continued CRISPR/Cas9 expression in that cell is no longer necessary. Indeed, long-term expression would be undesirable in the event of off-target effects at sites in the genome not intended for editing, etc. Thus, time-limited expression would be desirable. Inducible expression is one approach, but the applicants have also constructed a self-inactivating Cas9-based CRISPR-Cas system that relies on the use of a non-coding targeting guide sequence within the CRISPR vector itself. Thus, once expression has begun, the CRISPR system will cause its own destruction, but before the destruction is complete, it will have sufficient time to edit the genomic copies of the target gene (which, in terms of a normal point mutation in a diploid cell, would require no more than two edits). In simple terms, the self-inactivating CRISPR-Cas system using Cas9 comprises an additional RNA (i.e., a guide RNA) that targets the coding sequence of the CRISPR enzyme itself or that targets one or more non-coding guide target sequences that are complementary to unique sequences present in one or more of the following: (a) within a promoter driving expression of non-coding RNA elements, (b) within a promoter driving expression of the Cas9 gene, (c) within 100 bp of the ATG translation start codon in the Cas9 coding sequence, (d) within an inverted terminal repeat (iTR) of a viral delivery vector, such as in the AAV genome.
egRNA может включать аптамерную связывающую последовательность РНК, функционально связывающую сопровождающую последовательность РНК с направляющей последовательностью РНК.An egRNA may include an aptamer RNA binding sequence that operably links the chaperone RNA sequence to the guide RNA sequence.
В вариантах осуществления egRNA может включать одну или несколько фотолабильных связей или не встречающихся в природе остатков.In embodiments, the egRNA may include one or more photolabile linkages or non-naturally occurring residues.
В одном аспекте сопровождающая аптамерная последовательность РНК может быть комплементарна целевой miRNA, которая может присутствовать в клетке или может не присутствовать в ней, так что, только когда целевая miRNA присутствует, наблюдается связывание сопровождающей аптамерной последовательности РНК с целевой miRNA, что приводит к расщеплению egRNA с помощью индуцируемого РНК комплекса сайленсинга (RISC) в клетке.In one aspect, the chaperone aptamer RNA sequence may be complementary to a target miRNA, which may or may not be present in the cell, such that only when the target miRNA is present is binding of the chaperone aptamer RNA sequence to the target miRNA observed, resulting in cleavage of the egRNA by the RNA-induced silencing complex (RISC) in the cell.
В вариантах осуществления длина сопровождающей аптамерной последовательности РНК может составлять, например, от 10 до 200 нуклеотидов, и egRNA может включать более одной сопровождающей аптамерной последовательности РНК.In embodiments, the length of the chaperone RNA aptamer sequence may be, for example, from 10 to 200 nucleotides, and the egRNA may include more than one chaperone RNA aptamer sequence.
Следует понимать, что любые из направляющих последовательностей РНК, описываемых в других разделах данного документа, можно применять в egRNA, описываемой в данном документе. В определенных вариантах осуществления настоящего изобретения направляющая РНК или зрелая crRNA предусматривает, состоит, по сути, из или состоит из последовательности прямого повтора и направляющей последовательности или спейсерной последовательности. В определенных вариантах осуществления направляющая РНК или зрелая crRNA предусматривает, состоит, по сути, из или состоит из последовательности прямого повтора, связанной с направляющей последовательностью или спейсерной последовательностью. В определенных вариантах осуществления направляющая РНК или зрелая crRNA содержит 19 нуклеотидов частичного прямого повтора, за которыми следуют 23-25 нуклеотидов направляющей последовательности или спейсерной последовательности. В определенных вариантах осуществления эффекторный белок представляет собой эффекторный белок FnCas9, и требуется направляющая последовательность длиной по меньшей мере 16 нуклеотидов, чтобы достигнуть обнаруживаемого расщепления ДНК, и направляющая последовательность длиной минимум 17 нуклеотидов, чтобы достичь эффективного расщепления ДНК in vitro. В определенных вариантах осуществления последовательность прямого повтора расположена выше (т.е. в направлении 5') направляющей последовательности или спейсерной последовательности. В предпочтительном варианте осуществления затравочная последовательность (т.е. последовательность, критически важная для распознавания и/или гибридизации с последовательностью в целевом локусе) направляющей РНК для FnCas9 находится примерно в пределах первых 5 нуклеотидов на 5'-конце направляющей последовательности или спейсерной последовательности.It should be understood that any of the guide RNA sequences described elsewhere herein can be used in the egRNA described herein. In certain embodiments of the present invention, a guide RNA or mature crRNA comprises, consists essentially of, or consists of a direct repeat sequence and a guide sequence or spacer sequence. In certain embodiments, a guide RNA or mature crRNA comprises, consists essentially of, or consists of a direct repeat sequence associated with a guide sequence or spacer sequence. In certain embodiments, a guide RNA or mature crRNA comprises 19 nucleotides of a partial direct repeat followed by 23-25 nucleotides of a guide sequence or spacer sequence. In certain embodiments, the effector protein is an FnCas9 effector protein, and a guide sequence of at least 16 nucleotides in length is required to achieve detectable DNA cleavage, and a guide sequence of at least 17 nucleotides in length is required to achieve efficient DNA cleavage in vitro. In certain embodiments, the direct repeat sequence is located upstream (i.e., in the 5' direction) of the guide sequence or spacer sequence. In a preferred embodiment, the seed sequence (i.e., a sequence critical for recognition and/or hybridization to a sequence at a target locus) of the FnCas9 guide RNA is within approximately the first 5 nucleotides at the 5' end of the guide sequence or spacer sequence.
egRNA может быть включена в не встречающуюся в природе или сконструированную композицию с комплексом CRISPR-Cas на основе Cas9 вместе с Cas9, который может включать по меньшей мере одну мутацию, например, мутацию, в результате которой Cas9 характеризуется не более чем 5% нуклеазной активности Cas9, не имеющего по меньшей мере одной мутации, например, характеризуется нуклеазной активностью, сниженной по меньшей мере на 97% или 100% по сравнению с Cas9, не имеющей по меньшей мере одной мутации. Cas9 может также включать одну или несколько последовательностей ядерной локализации. Мутированные ферменты Cas9 с модулированной активностью, такой как сниженная нуклеазная активность, описаны в других разделах данного документа.The egRNA may be included in a non-naturally occurring or engineered composition with a Cas9-based CRISPR-Cas complex together with a Cas9 that may include at least one mutation, such as a mutation that results in the Cas9 having no more than 5% of the nuclease activity of a Cas9 lacking the at least one mutation, such as having a nuclease activity that is reduced by at least 97% or 100% compared to a Cas9 lacking the at least one mutation. The Cas9 may also include one or more nuclear localization sequences. Mutated Cas9 enzymes with modulated activity, such as reduced nuclease activity, are described elsewhere herein.
Сконструированная композиция с CRISPR-Cas на основе Cas9 может быть обеспечена в клетке, такой как эукариотическая клетка, клетка млекопитающего или клетка человека.The engineered Cas9-based CRISPR-Cas composition can be provided in a cell such as a eukaryotic cell, a mammalian cell, or a human cell.
В вариантах осуществления композиции, описанные в данном документе, содержат комплекс CRISPR-Cas на основе Cas9 по меньшей мере с тремя функциональными доменами, причем по меньшей мере один из них ассоциируется с Cas9 и по меньшей мере два из них ассоциируются с egRNA.In embodiments, the compositions described herein comprise a Cas9-based CRISPR-Cas complex with at least three functional domains, at least one of which associates with Cas9 and at least two of which associate with egRNA.
Композиции, описанные в данном документе, можно применять для введения преобразования локуса генома в клетку-хозяина, такую как эукариотическая клетка, в частности, клетка млекопитающего или отличного от человеческого эукариотического организма, в частности, отличного от человека млекопитающего, такого как мышь, in vivo. Преобразование локуса генома может предусматривать воздействие на активацию гена, ингибирование гена или расщепление в локусе. Композиции, описанные в данном документе, также можно применять для модифицирования представляющего интерес локуса генома, чтобы изменить экспрессию гена в клетке. Способы введения преобразования локуса генома в клетку-хозяина с применением фермента Cas9, предусмотренного в данном документе, описаны подробно в других разделах данного документа. Доставка композиции может осуществляться, например, посредством доставки молекулы(молекул) нуклеиновой кислоты, кодирующей(кодирующих) композицию, при этом молекула(молекулы) нуклеиновой кислоты функционально связана(связаны) с регуляторной последовательностью(последовательностями), и экспрессии молекулы (молекул) нуклеиновой кислоты in vivo, например, с помощью лентивируса, аденовируса или AAV.The compositions described herein can be used to introduce a genomic locus transformation into a host cell, such as a eukaryotic cell, in particular a mammalian cell or a non-human eukaryotic organism, in particular a non-human mammal such as a mouse, in vivo. Transformation of a genomic locus can involve affecting gene activation, gene inhibition, or cleavage at the locus. The compositions described herein can also be used to modify a genomic locus of interest to alter gene expression in the cell. Methods for introducing a genomic locus transformation into a host cell using the Cas9 enzyme provided herein are described in detail elsewhere in this document. Delivery of the composition can be accomplished, for example, by delivering a nucleic acid molecule(s) encoding the composition, wherein the nucleic acid molecule(s) is(are) operably linked to a regulatory sequence(s), and expressing the nucleic acid molecule(s) in vivo, for example, using a lentivirus, adenovirus, or AAV.
В настоящем изобретении предусмотрены композиции и способы, с помощью которых можно адаптировать активность gRNA-опосредованного редактирования генов. В настоящем изобретении предусмотрены вторичные структуры gRNA, которые улучшают эффективность разрезания путем увеличения gRNA и/или увеличения количества РНК, доставляемой в клетку. gRNA может включать светолабильные или индуцируемые нуклеотиды.The present invention provides compositions and methods by which gRNA-mediated gene editing activity can be tailored. The present invention provides gRNA secondary structures that improve cleavage efficiency by increasing gRNA and/or increasing the amount of RNA delivered to a cell. gRNA may include light-labile or inducible nucleotides.
Чтобы повысить эффективность gRNA, например gRNA, доставляемой с помощью вирусной или невирусной технологии, заявители добавили в gRNA вторичные структуры, которые усиливают ее стабильность и улучшают редактирование генов. Помимо этого, чтобы преодолеть отсутствие эффективной доставки, заявители модифицировали gRNA с помощью проникающих в клетку РНК-аптамеров; при этом аптамеры связываются с рецепторами клеточной поверхности и содействуют проникновению gRNA в клетки. Примечательно, что проникающие в клетку аптамеры можно разрабатывать так, чтобы они нацеливались на специфические клеточные рецепторы для опосредования специфичной в отношении клетки доставки. Заявители также создали направляющие, которые являются индуцируемыми.To improve the efficiency of gRNA, such as gRNA delivered via viral or non-viral technology, applicants have added secondary structures to gRNA that enhance its stability and improve gene editing. Additionally, to overcome the lack of efficient delivery, applicants have modified gRNA with cell-penetrating RNA aptamers; wherein the aptamers bind to cell surface receptors and facilitate the entry of gRNA into cells. Notably, cell-penetrating aptamers can be engineered to target specific cellular receptors to mediate cell-specific delivery. Applicants have also created guides that are inducible.
Чувствительность к свету у индуцируемой системы можно обеспечивать путем активации и связывания криптохрома-2 и CIB1. Стимуляция голубым светом индуцирует активирующее конформационное изменение в криптохроме-2, что приводит к рекрутированию его партнера по связыванию CIB1. Данное связывание является быстрым и обратимым, достигая насыщения за <15 сек после импульсной стимуляции и возвращаясь к исходному состоянию <15 мин. после окончания стимуляции. Эта быстрая кинетика связывания приводит к тому, что система ограничивается во временном отношении только скоростью транскрипции/трансляции и распада транскрипта/белка, а не захватом и выведением индуцирующих средств. Активация криптохрома-2 также является высокочувствительной, что позволяет использовать стимуляцию светом слабой интенсивности и снижает риски фототоксичности. Более того, в таком контексте, как интактный головной мозг млекопитающего, различную интенсивность света можно применять для контроля размера стимулируемого участка, что обеспечивает возможность большей точности, чем может обеспечивать векторная доставка сама по себе.Light sensitivity of the inducible system can be achieved by activation and binding of cryptochrome-2 and CIB1. Blue light stimulation induces an activating conformational change in cryptochrome-2, which leads to recruitment of its binding partner CIB1. This binding is rapid and reversible, reaching saturation <15 sec after a stimulation pulse and returning to baseline <15 min after the end of stimulation. These rapid binding kinetics result in the system being time-limited only by the rate of transcription/translation and transcript/protein decay, rather than by the uptake and clearance of inducing agents. Cryptochrome-2 activation is also highly sensitive, allowing the use of low-intensity light stimulation and reducing the risks of phototoxicity. Moreover, in a context such as the intact mammalian brain, varying light intensities can be used to control the size of the stimulated region, allowing for greater precision than vector delivery alone can provide.
В настоящем изобретении предусмотрены источники энергии, такие как электромагнитное излучение, энергия звука или тепловая энергия, для индуцирования направляющей. Преимущественно, электромагнитное излучение является компонентом видимого света. В предпочтительном варианте осуществления свет представляет собой голубой свет с длиной волны, составляющей от приблизительно 450 до приблизительно 495 нм. В особенно предпочтительном варианте осуществления длина волны составляет приблизительно 488 нм. В другом предпочтительном варианте осуществления стимуляцию светом проводят путем импульсного облучения. Мощность света может варьировать в диапазоне приблизительно 0-9 мВт/см2. В предпочтительном варианте осуществления разновидность стимуляции, заключающаяся в не более 0,25 секунд стимуляции через каждые 15 секунд, должна приводить к максимальной активации.The present invention provides energy sources such as electromagnetic radiation, sound energy or thermal energy for inducing the guide. Advantageously, the electromagnetic radiation is a component of visible light. In a preferred embodiment, the light is blue light with a wavelength of about 450 to about 495 nm. In a particularly preferred embodiment, the wavelength is about 488 nm. In another preferred embodiment, the stimulation with light is carried out by pulsed irradiation. The light power can vary in the range of about 0-9 mW/cm 2 . In a preferred embodiment, a stimulation pattern consisting of no more than 0.25 seconds of stimulation every 15 seconds should lead to maximum activation.
Клетки, предусмотренные в осуществлении настоящего изобретения на практике, могут представлять собой прокариотическую клетку или эукариотическую клетку, преимущественно клетку животного, растительную клетку или клетку дрожжей, более преимущественно клетку млекопитающего.The cells envisaged in the practice of the present invention may be a prokaryotic cell or a eukaryotic cell, preferably an animal cell, a plant cell or a yeast cell, more preferably a mammalian cell.
Химически чувствительная или чувствительная к изменению энергии направляющая может подвергаться конформационному изменению после индуцирования вследствие связывания химического источника или под действием энергии, что позволяет ей действовать в качестве направляющей и функционировать в системе или комплексе CRISPR-Cas на основе Cas9. Настоящее изобретение может предусматривать применение химического источника или источника энергии, чтобы обеспечить функционирование направляющей и системы или комплекса CRISPR-Cas на основе Cas9; и необязательно дополнительно определить, что экспрессия локуса генома является измененной.A chemically sensitive or energy-sensitive guide may undergo a conformational change upon induction by binding of a chemical source or by exposure to energy, which allows it to act as a guide and function in a Cas9-based CRISPR-Cas system or complex. The present invention may provide for the use of a chemical source or an energy source to ensure the function of the guide and the Cas9-based CRISPR-Cas system or complex; and optionally further determining that the expression of the genomic locus is altered.
Существует несколько различных конструкций этой химически индуцируемой системы: 1. система на основе ABI-PYL, индуцируемая абсцизовой кислотой (ABA) (см, например, http://stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2), 2. система на основе FKBP-FRB, индуцируемая рапамицином (или родственными химическими соединениями на основе рапамицина) (см., например, http://www.nature.com/nmeth/journal/v2/n6/full/nmeth763.html), 3. система на основе GID1-GAI, индуцируемая гиббереллином (GA) (см., например, http://www.nature.com/nchembio/journal/v8/n5/full/nchembio.922.html).There are several different designs of this chemically inducible system: 1. the ABI-PYL-based system, inducible by abscisic acid (ABA) (see, e.g., http://stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2), 2. the FKBP-FRB-based system, inducible by rapamycin (or related rapamycin-based chemicals) (see, e.g., http://www.nature.com/nmeth/journal/v2/n6/full/nmeth763.html), 3. the GID1-GAI-based system, inducible by gibberellin (GA) (see, e.g., http://www.nature.com/nchembio/journal/v8/n5/full/nchembio.922.html).
Другая система, предусматриваемая настоящим изобретением, представляет собой химически индуцируемую систему, основанную на изменении субклеточной локализации. Заявители также разработали систему, в которой полипептид включает ДНК-связывающий домен, содержащий по меньшей мере пять или более мономеров эффекторов, подобных активаторам транскрипции (TALE), и по меньшей мере один или более полумономеров, специфично расположенных для нацеливания на представляющий интерес локус генома, связанный по меньшей мере с одним или более эффекторными доменами, дополнительно связаны с чувствительным к химическим веществам или энергии белком. Этот белок будет приводить к изменению субклеточной локализации всего полипептида (т.е. транспорт всего полипептида из цитоплазмы в ядро клеток) после связывания химического вещества или при переносе энергии с чувствительным к химическим веществам или энергии белком. Такой транспорт всего полипептида из одних субклеточных компартментов или органелл, в которых его активность блокирована вследствие отсутствия субстрата для эффекторного домена, в другие, в которых субстрат присутствует, позволит всему полипептиду вступать в контакт с требуемым для него субстратом (т.е. геномной ДНК в ядре млекопитающего), и это приводит к активации или репрессии экспрессии целевого гена.Another system envisaged by the present invention is a chemically inducible system based on a change in subcellular localization. Applicants have also developed a system in which the polypeptide comprises a DNA-binding domain comprising at least five or more transcription activator-like effector (TALE) monomers and at least one or more semi-monomers specifically positioned to target a genomic locus of interest associated with at least one or more effector domains, further linked to a chemically or energy-sensitive protein. This protein will result in a change in subcellular localization of the entire polypeptide (i.e., transport of the entire polypeptide from the cytoplasm to the nucleus of cells) upon binding of a chemical or upon energy transfer with the chemically or energy-sensitive protein. Such transport of the entire polypeptide from one subcellular compartment or organelle in which its activity is blocked due to the absence of a substrate for the effector domain to another in which the substrate is present will allow the entire polypeptide to come into contact with its required substrate (i.e., genomic DNA in the mammalian nucleus), and this leads to activation or repression of target gene expression.
Систему данного типа также можно было бы применять для индуцирования расщепления представляющего интерес локуса генома в клетке, где эффекторный домен представляет собой нуклеазу.A system of this type could also be used to induce cleavage of a genomic locus of interest in a cell where the effector domain is a nuclease.
Химически индуцируемая система может представлять собой систему на основе эстрогенового рецептора (ER), индуцируемую 4-гидрокситамоксифеном (4OHT) (см., например, http://www.pnas.org/content/104/3/1027.abstract). Мутированный лиганд-связывающий домен эстрогенового рецептора, называемый ERT2, транслоцируется в ядро клеток после связывания 4-гидрокситамоксифена. В дополнительных вариантах осуществления настоящего изобретения любое встречающееся в природе или сконструированное производное любого ядерного рецептора, рецептора тиреоидного гормона, рецептора ретиноевой кислоты, эстрогенового рецептора, рецептора родственного эстрогену соединения, глюкокортикоидного рецептора, прогестеронового рецептора, андрогенового рецептора можно применять в индуцируемых системах, аналогичных индуцируемой системе на основе ER.The chemically inducible system may be an estrogen receptor (ER)-based system induced by 4-hydroxytamoxifen (4OHT) (see, e.g., http://www.pnas.org/content/104/3/1027.abstract). The mutated ligand binding domain of the estrogen receptor, called ERT2, translocates to the nucleus of cells upon binding of 4-hydroxytamoxifen. In further embodiments of the present invention, any naturally occurring or engineered derivative of any nuclear receptor, thyroid hormone receptor, retinoic acid receptor, estrogen receptor, estrogen-related compound receptor, glucocorticoid receptor, progesterone receptor, androgen receptor may be used in inducible systems similar to the ER-based inducible system.
Другая индуцируемая система основана на конструкции с применением системы на основе ионных каналов транзиторного рецепторного потенциала (TRP), индуцируемой энергией, теплом или радиоволнами (см., например, http://www.sciencemag.org/content/336/6081/604). Эти белки системы TRP реагируют на различные стимулы, включая свет и тепло. Когда этот белок активируется под действием света или тепла, ионный канал будет открываться и обеспечивать возможность проникновения ионов, таких как ионы кальция, внутрь плазматической мембраны. Этот входящий поток ионов будет связываться с внутриклеточными партнерами, взаимодействующими с ионами, связанными с полипептидом, в том числе с направляющей и другими компонентами комплекса или системы CRISPR-Cas на основе Cas9, и связывание будет индуцировать изменение субклеточной локализации полипептида, приводя к тому, что весь полипептид проникает в ядро клеток. После попадания внутрь ядра направляющий белок и другие компоненты комплекса CRISPR-Cas на основе Cas9 будут активными и станут модулировать экспрессию целевого гена в клетках.Another inducible system is based on a design using a transient receptor potential (TRP) ion channel system induced by energy, heat, or radio waves (see, for example, http://www.sciencemag.org/content/336/6081/604). These TRP proteins respond to a variety of stimuli, including light and heat. When this protein is activated by light or heat, the ion channel will open and allow ions, such as calcium, to enter the plasma membrane. This influx of ions will bind to intracellular ion-interacting partners associated with the polypeptide, including the guide and other components of the Cas9-based CRISPR-Cas complex or system, and the binding will induce a change in the subcellular localization of the polypeptide, causing the entire polypeptide to enter the cell nucleus. Once inside the nucleus, the targeting protein and other components of the Cas9-based CRISPR-Cas complex will be active and will modulate the expression of the target gene in cells.
Систему данного типа также можно было бы применять для индуцирования расщепления представляющего интерес локуса генома в клетке; и, в связи с этим, следует отметить, что фермент Cas9 является нуклеазой. Свет можно генерировать с помощью лазера или других форм источников энергии. Тепло можно генерировать путем повышения температуры, обусловленного источником энергии или наночастицами, которые высвобождают тепло после поглощения энергии из источника энергии, доставляемой в форме радиоволн.A system of this type could also be used to induce cleavage of a genomic locus of interest in a cell; and in this regard, it should be noted that the Cas9 enzyme is a nuclease. Light can be generated by laser or other forms of energy sources. Heat can be generated by increasing the temperature caused by the energy source or by nanoparticles that release heat after absorbing energy from the energy source, delivered in the form of radio waves.
Хотя активация светом может представлять собой преимущественный вариант осуществления, иногда она может быть неблагоприятной, в частности для in vivo применений, при которых свет не может проникать через кожу или другие органы. В данном случае предусмотрены способы применения других видов энергии активации, в частности, энергии электрического поля и/или ультразвука, которые будут оказывать аналогичный эффект.Although activation by light may be an advantageous embodiment, it may sometimes be disadvantageous, particularly for in vivo applications where light cannot penetrate the skin or other organs. In this case, methods are envisaged for using other types of activation energy, particularly electric field energy and/or ultrasound, which will have a similar effect.
Энергию электрического поля предпочтительно применяют, фактически как описано в уровне техники, с применением одного или нескольких электрических импульсов, составляющих от приблизительно 1 Вольт/см до приблизительно 10 кВольт/см в условиях in vivo. Вместо или вдобавок к импульсам электрическое поле может доставляться непрерывным способом. Электрический импульс можно прилагать в течение от 1 мкс до 500 миллисекунд, предпочтительно от 1 мкс до 100 миллисекунд. Электрическое поле можно прилагать непрерывно или импульсным способом в течение приблизительно 5 минут.The electric field energy is preferably applied, essentially as described in the prior art, by applying one or more electric pulses of about 1 Volt/cm to about 10 kVolt/cm under in vivo conditions. Instead of or in addition to pulses, the electric field can be delivered in a continuous manner. The electric pulse can be applied for 1 μs to 500 milliseconds, preferably 1 μs to 100 milliseconds. The electric field can be applied continuously or in a pulsed manner for about 5 minutes.
Используемая в данном документе "энергия электрического поля" представляет собой электрическую энергию, которая воздействует на клетку. Предпочтительно электрическое поле характеризуется напряженностью, составляющей от приблизительно 1 Вольт/см до приблизительно 10 кВольт/см или более в условиях in vivo (см. WO97/49450).As used herein, "electric field energy" is electrical energy that is applied to a cell. Preferably, the electric field has a strength of about 1 volt/cm to about 10 kvolt/cm or more under in vivo conditions (see WO97/49450).
Используемый в данном документе термин "электрическое поле" включает один или несколько импульсов при варьирующей емкости и напряжении и включает экспоненциальные и/или квадратные формы волны, и/или модулированные формы волны и/или модулированные квадратные формы волны. Ссылки на электрические поля и электричество следует принимать как включающие ссылку на наличие разницы электрических потенциалов в окружающей среде клетки. Такая окружающая среда может быть создана с помощью статического электричества, переменного тока (AC), постоянного тока (DC) и т.д., как известно из уровня техники. Электрическое поле может быть однородным, неоднородным или иным, и может варьировать по напряженности и/или направлению зависимым от времени образом.As used herein, the term "electric field" includes one or more pulses of varying capacitance and voltage, and includes exponential and/or square waveforms, and/or modulated waveforms and/or modulated square waveforms. References to electric fields and electricity should be taken to include reference to the presence of an electrical potential difference in the environment of the cell. Such an environment may be created by static electricity, alternating current (AC), direct current (DC), etc., as is known in the art. The electric field may be uniform, non-uniform, or otherwise, and may vary in strength and/or direction in a time-dependent manner.
Также возможны однократные или множественные приложения электрического поля, а также однократные или множественные приложения ультразвука в любом порядке и в любой комбинации. Ультразвук и/или электрическое поле можно доставлять в виде однократных или множественных непрерывных приложений или в виде импульсов (импульсная доставка).Single or multiple applications of the electric field, as well as single or multiple applications of ultrasound in any order and in any combination, are also possible. Ultrasound and/or the electric field can be delivered as single or multiple continuous applications or as pulses (pulsed delivery).
Электропорацию применяли как в in vitro, так и в in vivo процедурах для введения чужеродного материала в живые клетки. В случае in vitro применений образец с живыми клетками вначале смешивают с представляющим интерес средством и помещают между электродами, такими как параллельные пластины. Затем электроды прилагают электрическое поле к смеси клетки/вводимый материал. Примеры систем, с помощью которых осуществляют in vitro электропорацию, включают прибор Electro Cell Manipulator ECM600 и Electro Square Porator T820, оба произведены подразделением BTX из Genetronics, Inc (см. патент США № 5869326).Electroporation has been used in both in vitro and in vivo procedures to introduce foreign material into living cells. In in vitro applications, a living cell sample is first mixed with the agent of interest and placed between electrodes, such as parallel plates. The electrodes then apply an electric field to the cell/injection mixture. Examples of systems that perform in vitro electroporation include the Electro Cell Manipulator ECM600 and the Electro Square Porator T820, both manufactured by the BTX Division of Genetronics, Inc. (see U.S. Patent No. 5,869,326).
Известные методики электропорации (как in vitro, так и in vivo) действуют при приложении короткого импульса высокого напряжения к электродам, расположенным вокруг участка обработки. Электрическое поле, генерируемое между электродами, временно образует поры в клеточных мембранах, вследствие чего молекулы представляющего интерес средства проникают в клетки. При известных применениях электропорации это электрическое поле предусматривает однократный импульс квадратной волны порядка 1000 В/см, продолжительностью приблизительно 100 мкс. Такой импульс может генерироваться, например, в известных применениях Electro Square Porator T820.Known electroporation techniques (both in vitro and in vivo) operate by applying a short high voltage pulse to electrodes positioned around the treatment site. The electric field generated between the electrodes temporarily creates pores in the cell membranes, causing molecules of the agent of interest to penetrate the cells. In known electroporation applications, this electric field provides a single square wave pulse of about 1000 V/cm, lasting approximately 100 μs. Such a pulse can be generated, for example, in known applications of the Electro Square Porator T820.
Предпочтительно электрическое поле характеризуется напряженностью от приблизительно 1 В/см до приблизительно 10 кВ/см в условиях in vitro. Таким образом, электрическое поле может характеризоваться напряженностью, составляющей 1 В/см, 2 В/см, 3 В/см, 4 В/см, 5 В/см, 6 В/см, 7 В/см, 8 В/см, 9 В/см, 10 В/см, 20 В/см, 50 В/см, 100 В/см, 200 В/см, 300 В/см, 400 В/см, 500 В/см, 600 В/см, 700 В/см, 800 В/см, 900 В/см, 1 кВ/см, 2 кВ/см, 5 кВ/см, 10 кВ/см, 20 кВ/см, 50 кВ/см или больше. Более предпочтительно от приблизительно 0,5 кВ/см до приблизительно 4,0 кВ/см в условиях in vitro. Предпочтительно электрическое поле характеризуется напряженностью от приблизительно 1 В/см до приблизительно 10 кВ/см в условиях in vivo. Однако напряженность электрического поля может быть снижена, если увеличивается количество импульсов, доставляемых в целевой сайт. Таким образом, предусмотрена импульсная доставка электрических полей при более низкой напряженности поля.Preferably, the electric field has a strength of from about 1 V/cm to about 10 kV/cm under in vitro conditions. Thus, the electric field can have a strength of 1 V/cm, 2 V/cm, 3 V/cm, 4 V/cm, 5 V/cm, 6 V/cm, 7 V/cm, 8 V/cm, 9 V/cm, 10 V/cm, 20 V/cm, 50 V/cm, 100 V/cm, 200 V/cm, 300 V/cm, 400 V/cm, 500 V/cm, 600 V/cm, 700 V/cm, 800 V/cm, 900 V/cm, 1 kV/cm, 2 kV/cm, 5 kV/cm, 10 kV/cm, 20 kV/cm, 50 kV/cm or more. More preferably, from about 0.5 kV/cm to about 4.0 kV/cm in vitro. Preferably, the electric field has a strength of from about 1 V/cm to about 10 kV/cm in vivo. However, the electric field strength can be reduced if the number of pulses delivered to the target site is increased. Thus, pulsed delivery of electric fields at lower field strengths is envisaged.
Предпочтительно предусмотрено приложение электрического поля в форме множественных импульсов, как, например, двойных импульсов одинаковой напряженности и емкости или последовательных импульсов с разной напряженностью и/или емкостью. Используемый в данном документе термин "импульс" включает один или несколько электрических импульсов при варьирующей емкости и напряжении и включает экспоненциальные и/или квадратные формы волны и/или модулированные формы волны/квадратные формы волны.Preferably, the electric field is applied in the form of multiple pulses, such as double pulses of the same strength and capacitance or successive pulses of different strength and/or capacitance. The term "pulse" as used herein includes one or more electric pulses at varying capacitance and voltage and includes exponential and/or square waveforms and/or modulated waveforms/square waveforms.
Предпочтительно электрический импульс доставляется в виде формы волны, выбранной из экспоненциальной формы волны, квадратной формы волны, модулированной формы волны и модулированной квадратной формы волны.Preferably, the electrical pulse is delivered in the form of a waveform selected from an exponential waveform, a square waveform, a modulated waveform, and a modulated square waveform.
В предпочтительном варианте осуществления используется постоянный ток при низком напряжении. Таким образом, заявители раскрывают применение электрического поля, прилагаемого к клетке, ткани или тканевой массе при напряженности поля, составляющей от 1 В/см до 20 В/см, в течение периода, составляющего 100 миллисекунд или более, предпочтительно 15 минут или более.In a preferred embodiment, direct current at low voltage is used. Thus, the applicants disclose the use of an electric field applied to a cell, tissue or tissue mass at a field strength of 1 V/cm to 20 V/cm for a period of 100 milliseconds or more, preferably 15 minutes or more.
Ультразвук преимущественно применяют при уровне мощности, составляющем от приблизительно 0,05 Вт/см2 до приблизительно 100 Вт/см2. Можно применять диагностический или терапевтический ультразвук или их комбинации.Ultrasound is preferably used at a power level of approximately 0.05 W/ cm2 to approximately 100 W/ cm2 . Diagnostic or therapeutic ultrasound or a combination of both may be used.
Используемый в данном документе термин "ультразвук" обозначает форму энергии, которая состоит из механических вибраций, частота которых настолько высока, что они находятся за пределами слуха человека. Нижняя граница частоты для ультразвукового спектра в целом может приниматься как приблизительно 20 кГц. В большинстве диагностических применений ультразвука используются частоты в диапазоне от 1 до 15 МГц (из Ultrasonics in Clinical Diagnosis, P. N. T. Wells, ed., 2nd. Edition, Publ. Churchill Livingstone [Edinburgh, London & NY, 1977]).As used in this document, the term "ultrasound" refers to a form of energy that consists of mechanical vibrations whose frequency is so high that they are beyond the range of human hearing. The lower frequency limit of the ultrasound spectrum as a whole may be taken as approximately 20 kHz. Most diagnostic applications of ultrasound use frequencies in the range of 1 to 15 MHz (from Ultrasonics in Clinical Diagnosis, P. N. T. Wells, ed., 2nd. Edition, Publ. Churchill Livingstone [Edinburgh, London & NY, 1977]).
Ультразвук применялся как в диагностических, так и в терапевтических применениях. При применении в качестве диагностического инструмента ("диагностический ультразвук"), ультразвук, как правило, применяют при плотности энергии в диапазоне до приблизительно 100 мВт/см2 (рекомендация FDA), хотя применялись плотности энергии до 750 мВт/см2. В физиотерапии ультразвук, как правило, применяют в качестве источника энергии в диапазоне до приблизительно 3-4 Вт/см2 (рекомендация WHO). При других терапевтических применениях можно использовать более высокую интенсивность ультразвука, например, HIFU с параметрами от 100 Вт/см до 1 кВт/см2 (или даже выше) в течение коротких периодов времени. Предусмотрено, что используемый в настоящем описании термин "ультразвук" охватывает диагностический, терапевтический и фокусированный ультразвук.Ultrasound has been used in both diagnostic and therapeutic applications. When used as a diagnostic tool ("diagnostic ultrasound"), ultrasound is typically used at energy densities in the range of up to approximately 100 mW/ cm2 (FDA recommendation), although energy densities up to 750 mW/ cm2 have been used. In physical therapy, ultrasound is typically used as an energy source in the range of up to approximately 3-4 W/ cm2 (WHO recommendation). Other therapeutic applications may use higher ultrasound intensities, such as HIFU with parameters of 100 W/cm2 to 1 kW/ cm2 (or even higher) for short periods of time. As used herein, the term "ultrasound" is intended to encompass diagnostic, therapeutic, and focused ultrasound.
Фокусированный ультразвук (FUS) обеспечивает доставку тепловой энергии без инвазивного зонда (см. Morocz et al 1998 Journal of Magnetic Resonance Imaging Vol.8, No. 1, pp.136-142. Другой формой фокусированного ультразвука является фокусированный ультразвук высокой интенсивности (HIFU), обзор которого приведен у Moussatov et al в Ultrasonics (1998) Vol.36, No.8, pp.893-900 и TranHuuHue et al in Acustica (1997) Vol.83, No.6, pp.1103-1106.Focused ultrasound (FUS) provides delivery of thermal energy without an invasive probe (see Morocz et al 1998 Journal of Magnetic Resonance Imaging Vol.8, No. 1, pp.136-142. Another form of focused ultrasound is high-intensity focused ultrasound (HIFU), reviewed by Moussatov et al in Ultrasonics (1998) Vol.36, No.8, pp.893-900 and TranHuuHue et al in Acustica (1997) Vol.83, No.6, pp.1103-1106.
Предпочтительно используют комбинацию диагностического ультразвука и терапевтического ультразвука. Однако эта комбинация не подразумевается как ограничивающая, и квалифицированный читатель будет понимать, что можно применять любую из множества комбинаций ультразвука. Кроме того, можно варьировать плотность энергии, частоту колебаний ультразвука и период воздействия.Preferably, a combination of diagnostic ultrasound and therapeutic ultrasound is used. However, this combination is not intended to be limiting, and the skilled reader will recognize that any of a variety of ultrasound combinations may be used. In addition, the energy density, the frequency of ultrasound oscillation, and the period of exposure may be varied.
Предпочтительно воздействие источника ультразвуковой энергии происходит при плотности потока энергии, составляющей от приблизительно 0,05 до приблизительно 100 Вт см-2. Даже более предпочтительно воздействие источника ультразвуковой энергии происходит при плотности потока энергии, составляющей от приблизительно 1 до приблизительно 15 Вт см-2.Preferably, the ultrasonic energy source is applied at a power flux density of from about 0.05 to about 100 W cm -2 . Even more preferably, the ultrasonic energy source is applied at a power flux density of from about 1 to about 15 W cm -2 .
Предпочтительно воздействие источника ультразвуковой энергии происходит при частоте колебаний, составляющей от приблизительно 0,015 до приблизительно 10,0 МГц. Более предпочтительно воздействие источника ультразвуковой энергии происходит при частоте колебаний, составляющей от приблизительно 0,02 до приблизительно 5,0 МГц или приблизительно 6,0 МГц. Наиболее предпочтительно ультразвук прилагают при частоте колебаний, составляющей 3 МГц.Preferably, the ultrasonic energy source is applied at an oscillation frequency of about 0.015 to about 10.0 MHz. More preferably, the ultrasonic energy source is applied at an oscillation frequency of about 0.02 to about 5.0 MHz or about 6.0 MHz. Most preferably, the ultrasound is applied at an oscillation frequency of 3 MHz.
Предпочтительно воздействие происходит в течение периода времени, составляющего от приблизительно 10 миллисекунд до приблизительно 60 минут. Предпочтительно воздействие происходит в течение периода времени, составляющего от приблизительно 1 секунды до приблизительно 5 минут. Более предпочтительно ультразвук прилагают в течение приблизительно 2 минут. Однако в зависимости от конкретной целевой клетки, которую необходимо разрушить, воздействие может иметь большую продолжительность, например, 15 минут.Preferably, the exposure occurs for a period of time of about 10 milliseconds to about 60 minutes. Preferably, the exposure occurs for a period of time of about 1 second to about 5 minutes. More preferably, the ultrasound is applied for about 2 minutes. However, depending on the specific target cell to be destroyed, the exposure may have a longer duration, such as 15 minutes.
Преимущественно, на целевую ткань воздействуют с помощью источника ультразвуковой энергии при плотности акустического потока энергии, составляющей от приблизительно 0,05 Вт см-2 до приблизительно 10 Вт см-2, с частотой колебаний в диапазоне от приблизительно 0,015 до приблизительно 10 МГц (см. WO 98/52609). Однако также возможны альтернативы, например, воздействие источником ультразвуковой энергии при плотности акустического потока энергии, составляющей более 100 Вт см-2, но в течение укороченных периодов времени, например, 1000 Вт см-2 в течение периодов в диапазоне миллисекунд или менее.Preferably, the target tissue is exposed to an ultrasonic energy source at an acoustic flux density of from about 0.05 W cm -2 to about 10 W cm -2 , with an oscillation frequency in the range of from about 0.015 to about 10 MHz (see WO 98/52609). However, alternatives are also possible, such as exposure to an ultrasonic energy source at an acoustic flux density of more than 100 W cm -2 , but for shorter periods of time, such as 1000 W cm -2 for periods in the range of milliseconds or less.
Предпочтительно приложение ультразвука происходит в форме множественных импульсов; таким образом, как непрерывные волны, так и импульсные волны (импульсная доставка ультразвука) можно использовать в любой комбинации. Например, можно применять ультразвук с непрерывной волной, а затем ультразвук с импульсной волной, или наоборот. Это можно повторять любое число раз, в любом порядке и комбинации. Ультразвук с импульсной волной можно применять на фоне ультразвука с непрерывной волной, и можно применять любое число импульсов в любом числе групп.Preferably, the ultrasound is applied in the form of multiple pulses; thus, both continuous waves and pulsed waves (pulsed ultrasound delivery) can be used in any combination. For example, continuous wave ultrasound can be applied followed by pulsed wave ultrasound, or vice versa. This can be repeated any number of times, in any order and combination. Pulsed wave ultrasound can be applied on top of continuous wave ultrasound, and any number of pulses can be applied in any number of groups.
Предпочтительно ультразвук может предусматривать ультразвук с импульсной волной. В очень предпочтительном варианте осуществления ультразвук прилагают при плотности потока энергии, составляющей 0,7 Вт см-2 или 1,25 Вт см-2, в виде непрерывной волны. Более высокие плотности потока энергии можно использовать при применении ультразвука с импульсной волной.Preferably, the ultrasound may comprise pulsed wave ultrasound. In a very preferred embodiment, the ultrasound is applied at a power flux density of 0.7 W cm -2 or 1.25 W cm -2 in the form of a continuous wave. Higher power flux densities may be used when using pulsed wave ultrasound.
Применение ультразвука является преимущественным, поскольку подобно свету его можно точно фокусировать на мишени. Более того, ультразвук является преимущественным, поскольку его можно фокусировать более глубоко в тканях, чем свет. Следовательно, он лучше подходит для терапии с проникновением через всю ткань (как, например, без ограничения доля печени) или весь орган (как, например, без ограничения печень целиком или мышца целиком, как, например, сердце). Другим важным преимуществом является то, что ультразвук представляет собой неинвазивное воздействие, которое применяют при самых разных диагностических и терапевтических применениях. Для примера, ультразвук хорошо известен в методиках медицинской визуализации и, кроме того, в ортопедической терапии. Кроме того, приборы, подходящие для приложения ультразвука к подвергаемому воздействию субъекту-позвоночному, широко доступны и их применение хорошо известно из уровня техники.The use of ultrasound is advantageous because, like light, it can be focused precisely on a target. Moreover, ultrasound is advantageous because it can be focused deeper into tissue than light. It is therefore better suited for therapy that penetrates an entire tissue (such as, for example, an unlimited lobe of the liver) or an entire organ (such as, for example, an unlimited whole liver or an entire muscle, such as the heart). Another important advantage is that ultrasound is a non-invasive treatment that is used in a wide variety of diagnostic and therapeutic applications. For example, ultrasound is well known in medical imaging techniques and, in addition, in orthopedic therapy. In addition, devices suitable for applying ultrasound to a subject-vertebral body to be treated are widely available and their use is well known in the art.
Быстрый транскрипционный ответ и эндогенное нацеливание по настоящему изобретению делают их идеальной системой для изучения динамики транскрипции. Например, настоящее изобретение можно применять для изучения динамики вариантной выработки после индуцированной экспрессии целевого гена. На другом полюсе цикла транскрипции, исследования распада мРНК зачастую проводятся в ответ на сильный внеклеточный стимул, вызывающий изменения уровня экспрессии множества генов. Настоящее изобретение можно использовать для обратимого индуцирования транскрипции эндогенной мишени, после чего точечную стимуляцию можно прекращать и можно отслеживать кинетику разрушения отдельной мишени.The rapid transcriptional response and endogenous targeting of the present invention make it an ideal system for studying transcriptional dynamics. For example, the present invention can be used to study the dynamics of variant production following induced expression of a target gene. At the other end of the transcription cycle, mRNA decay studies are often conducted in response to a strong extracellular stimulus that causes changes in the expression levels of multiple genes. The present invention can be used to reversibly induce transcription of an endogenous target, after which the punctate stimulation can be stopped and the kinetics of degradation of a single target can be monitored.
Временная точность в настоящем изобретении может обеспечивать возможность зависимой от времени генетической регуляции, согласованной с экспериментальными вмешательствами. Например, мишени с предполагаемым влиянием на долговременную потенциацию (LTP) можно модулировать в органоподобной или диссоциированной культурах нейронов, но только во время стимула для индукции LTP, чтобы не препятствовать нормальному развитию клеток. Аналогично, в клеточных моделях, проявляющих фенотипы заболевания, мишени, которые предположительно влияют на эффективность конкретной терапии, можно модулировать только во время лечения. Наоборот, генетические мишени можно модулировать только во время патологического стимула. Любое число экспериментов, в которых важен выбор момента времени для запуска генетических изменений в ответ на внешние экспериментальные стимулы, могут потенциально получать пользу от настоящего изобретения.The temporal precision of the present invention may enable time-dependent genetic regulation that is consistent with experimental interventions. For example, targets putatively affecting long-term potentiation (LTP) may be modulated in organ-like or dissociated neuronal cultures, but only during the stimulus to induce LTP, so as not to interfere with normal cell development. Similarly, in cellular models that exhibit disease phenotypes, targets putatively affecting the efficacy of a particular therapy may be modulated only during treatment. Conversely, genetic targets may be modulated only during a pathological stimulus. Any number of experiments in which the timing of the triggering of genetic changes in response to external experimental stimuli is important may potentially benefit from the present invention.
In vivo контекст обеспечивает аналогичные обширные возможности для контроля экспрессии гена в рамках настоящего изобретения. Фотоиндуцируемость обеспечивает потенциал для точности в пространственном отношении. Используя преимущество развития технологии оптродов, стимулирующий оптоволоконный электрод можно помещать в определенный участок головного мозга. Затем размер участка стимуляции может быть отрегулирован с помощью интенсивности света. Это можно осуществлять в сочетании с доставкой системы или комплекса CRISPR-Cas на основе Cas9 по настоящему изобретению, или, в случае трансгенных по Cas9 животных, может доставляться направляющая РНК по настоящему изобретению и технология оптродов может обеспечивать возможность модуляции экспрессии гена в определенных участках головного мозга. Пропускающий свет организм, экспрессрующий Cas9, может иметь направляющую РНК по настоящему изобретению, введенную в него, и затем можно вызвать очень точные локальные изменения экспрессии гена, индуцированные лазером.The in vivo context provides similarly broad possibilities for controlling gene expression within the scope of the present invention. Photoinducibility provides the potential for spatial precision. Taking advantage of developments in optrode technology, a stimulating fiber optic electrode can be placed in a specific region of the brain. The size of the stimulation region can then be adjusted using light intensity. This can be done in combination with delivery of the Cas9-based CRISPR-Cas system or complex of the present invention, or, in the case of Cas9 transgenic animals, the guide RNA of the present invention can be delivered and optrode technology can provide the ability to modulate gene expression in specific regions of the brain. A light-transmitting organism expressing Cas9 can have the guide RNA of the present invention introduced into it and very precise localized laser-induced changes in gene expression can then be induced.
Питательная среда для культивирования клеток-хозяев включает среду, обычно применяемую для культуры тканей, такую как M199-основание Эрла, среда Игла MEM (E-MEM), среда Дульбекко MEM (DMEM), SC-UCM102, UP-SFM (GIBCO BRL), EX-CELL302 (Nichirei), EX-CELL293-S (Nichirei), TFBM-01 (Nichirei), ASF104, среди прочих. Подходящие питательные среды для определенных типов клеток можно найти в Американской коллекции типовых культур (ATCC) или Европейской коллекции культур клеток (ECACC). Питательные среды можно дополнить аминокислотами, такими как L-глутамин, солями, противогрибковыми или антибактериальными средствами, такими как Fungizone®, пенициллин-стрептомицин, животной сывороткой и т.п. Среда для культур клеток необязательно может быть бессывороточной.The culture medium for culturing the host cells includes a medium commonly used for tissue culture, such as M199-Earle's base, Eagle's MEM (E-MEM), Dulbecco's MEM (DMEM), SC-UCM102, UP-SFM (GIBCO BRL), EX-CELL302 (Nichirei), EX-CELL293-S (Nichirei), TFBM-01 (Nichirei), ASF104, among others. Suitable culture media for specific cell types can be found in the American Type Culture Collection (ATCC) or the European Collection of Cell Cultures (ECACC). The culture media can be supplemented with amino acids such as L-glutamine, salts, antifungal or antibacterial agents such as Fungizone®, penicillin-streptomycin, animal serum, etc. The cell culture medium may optionally be serum-free.
Настоящее изобретение также может обеспечивать важную временную точность in vivo. Настоящее изобретение можно применять для изменения экспрессии гена во время конкретной стадии развития. Настоящее изобретение можно применять для выбора момента времени для запуска генетических изменений в конкретный промежуток времени проведения эксперимента. Например, гены, вовлеченные в условный рефлекс, можно подвергать сверхэкспрессии или репрессии только во время подачи условного стимула в определенный участок интактного головного мозга грызуна или примата. Кроме того, настоящее изобретение можно применять для индуцирования изменений экспрессии гена только во время конкретных стадий развития заболевания. Например, онкоген можно подвергать сверхэкспрессии только после того, как опухоль достигнет конкретного размера или стадии метастазирования. Наоборот, белки, которые предположительно влияют на развитие болезни Альцгеймера, можно подвергнуть нокдауну только в заданные моменты времени жизни животного и в пределах конкретного участка головного мозга. Хотя эти примеры не являются исчерпывающим перечнем потенциальных применений настоящего изобретения, они указывают на некоторые области, в которых настоящее изобретение может представлять собой перспективную технологию.The present invention can also provide important temporal precision in vivo. The present invention can be used to alter gene expression during a specific stage of development. The present invention can be used to select the time point for initiating genetic changes at a specific time during an experiment. For example, genes involved in a conditioned response can be overexpressed or repressed only during the delivery of a conditioned stimulus to a specific region of the intact brain of a rodent or primate. In addition, the present invention can be used to induce changes in gene expression only during specific stages of disease development. For example, an oncogene can be overexpressed only after a tumor has reached a specific size or metastatic stage. Conversely, proteins suspected of influencing the development of Alzheimer's disease can be knocked down only at specific times in an animal's life and within a specific region of the brain. Although these examples are not an exhaustive list of potential applications of the present invention, they indicate some areas in which the present invention may represent a promising technology.
Защищенные направляющие: ферменты в соответствии с настоящим изобретением можно применять в комбинации c защищенными направляющими РНКProtected guides: The enzymes of the present invention can be used in combination with protected guide RNAs.
В одном аспекте целью настоящего изобретения является дальнейшее усиление специфичности отдельных направляющих РНК с учетом Cas9 с помощью термодинамического регулирования специфичности связывания направляющей РНК с целевой ДНК. Речь идет об общем подходе к введению несовпадений, удлинения или усечения в направляющую последовательность для повышения/снижения числа комплементарных оснований относительно несовпадающих оснований, общих у геномной мишени и ее потенциальных нецелевых локусов, чтобы обеспечить термодинамическое преимущество нацеливаемым локусам генома над нецелевыми локусами генома.In one aspect, the present invention aims to further enhance the specificity of individual guide RNAs with respect to Cas9 by thermodynamically controlling the binding specificity of the guide RNA to the target DNA. This is a general approach to introducing mismatches, extensions or truncations into the guide sequence to increase/decrease the number of complementary bases relative to the mismatched bases shared by the genomic target and its potential non-target loci, in order to provide a thermodynamic advantage to the target loci of the genome over the non-target loci of the genome.
В одном аспекте настоящего изобретения предусмотрена направляющая последовательность, которую модифицируют с помощью вторичной структуры для усиления специфичности системы CRISPR-Cas на основе Cas9, и в результате этого вторичная структура может защищать от экзонуклеазной активности и обеспечивать возможность добавлений на 3'-конце направляющей последовательности.In one aspect of the present invention, a guide sequence is provided that is modified with a secondary structure to enhance the specificity of the Cas9-based CRISPR-Cas system, and as a result, the secondary structure can protect against exonuclease activity and allow for additions at the 3' end of the guide sequence.
В одном аспекте настоящего изобретении предусмотрена гибридизация "защитной РНК" с направляющей последовательностью, где "защитная РНК" представляет собой нить РНК, комплементарную 5'-концу направляющей РНК (gRNA), для образования тем самым частично двухнитевой gRNA. В одном варианте осуществления настоящего изобретения защита несовпадающих оснований с помощью абсолютно комплементарной защитной последовательности снижает вероятность связывания целевой ДНК с несовпадающими парами оснований на 3'-конце. В вариантах осуществления настоящего изобретения также могут присутствовать дополнительные последовательности, предусматривающие увеличенную длину.In one aspect of the present invention, a "guard RNA" is hybridized to a guide sequence, wherein the "guard RNA" is a strand of RNA complementary to the 5' end of a guide RNA (gRNA), thereby forming a partially double-stranded gRNA. In one embodiment of the present invention, protection of mismatched bases by a perfectly complementary guard sequence reduces the likelihood of binding of target DNA to mismatched base pairs at the 3' end. In embodiments of the present invention, additional sequences may also be present to provide increased length.
Удлинения направляющей РНК (gRNA), совпадающие с геномной мишенью, обеспечивают защиту и усиливают специфичность gRNA. Предусмотрено, что удлинение gRNA с помощью совпадающей последовательности, дистальной относительно конца затравочной последовательности спейсера для отдельных геномных мишеней, обеспечивает повышенную специфичность. Совпадающие удлинения gRNA, которые усиливают специфичность, наблюдали в клетках без применения усечения. Прогнозирование структуры gRNA, сопровождающей эти стабильные удлинения, показало, что стабильные формы возникают из защищенных состояний, где удлинение образует замкнутую петлю с затравочной последовательностью gRNA благодаря комплементарным последовательностям в удлинении спейсера и затравочной последовательности спейсера. Эти результаты демонстрируют, что концепция защищенной направляющей также включает последовательности, совпадающие с целевой последовательностью генома, дистальные относительно 20-мерного участка связывания спейсера. Для прогнозирования полностью совпадающих или частично совпадающих удлинений направляющей, которые приводят к защищенным состояниям gRNA, можно применять термодинамическое прогнозирование. Это расширяет концепцию защищенных gRNA до взаимодействия между X и Z, где длина X обычно будет составлять 17-20 нуклеотидов, а длина Z составляет 1-30 нуклеотидов. Термодинамическое прогнозирование можно применять для определения оптимального состояния удлинения для Z, потенциального введения небольших количеств несовпадений в Z, чтобы содействовать образованию защищенных конформаций между X и Z. На протяжении настоящей заявки термины "X" и "длина затравочной" последовательности (SL) используются взаимозаменяемо с термином "открытая длина" (EpL), который обозначает число нуклеотидов, доступных для связывания целевой ДНК; термины "Y" и "защитная длина" (PL) используются взаимозаменяемо для обозначения длины защитной последовательности; а термины "Z", "E", "E'" и "EL" используются взаимозаменяемо и соответствуют термину "удлинение" (ExL), который обозначает число нуклеотидов, на которое удлинена целевая последовательность.Guide RNA (gRNA) extensions that match a genomic target provide protection and enhance gRNA specificity. Extension of gRNA with a matching sequence distal to the end of a spacer seed sequence for individual genomic targets is predicted to provide enhanced specificity. Matched gRNA extensions that enhance specificity were observed in cells without truncation. Prediction of the gRNA structure accompanying these stable extensions revealed that stable forms arise from protected states where the extension forms a closed loop with the gRNA seed sequence due to complementary sequences in the spacer extension and the spacer seed sequence. These results demonstrate that the protected guide concept also includes sequences matching the target genomic sequence distal to the 20-mer spacer binding site. Thermodynamic prediction can be used to predict fully matched or partially matched guide extensions that result in protected states of gRNA. This extends the concept of protected gRNAs to the interaction between X and Z, where X will typically be 17-20 nucleotides long and Z will be 1-30 nucleotides long. Thermodynamic prediction can be used to determine the optimal extension state for Z, potentially introducing small amounts of mismatches in Z to promote the formation of protected conformations between X and Z. Throughout this application, the terms "X" and "seed" sequence length (SL) are used interchangeably with the term "open length" (EpL), which refers to the number of nucleotides available for binding to target DNA; the terms "Y" and "protection length" (PL) are used interchangeably to refer to the length of the protection sequence; and the terms "Z", "E", "E'" and "EL" are used interchangeably and correspond to the term "extension" (ExL), which denotes the number of nucleotides by which the target sequence is extended.
Удлиняющая последовательность, которая соответствует удлинению (ExL), может необязательно быть прикреплена напрямую к направляющей последовательности на 3'-конце защищенной направляющей последовательности. Длина удлиняющей последовательности может составлять 2-12 нуклеотидов. Предпочтительно ExL может обозначать 0, 2, 4, 6, 8, 10 или 12 нуклеотидов в длину. В предпочтительном варианте осуществления ExL обозначает 0 или 4 нуклеотида в длину. В более предпочтительном варианте осуществления длина ExL составляет 4 нуклеотида. Удлиняющая последовательность может быть комплементарна целевой последовательности или может не быть комплементарна ей.The extension sequence, which corresponds to the extension (ExL), may optionally be attached directly to the guide sequence at the 3' end of the protected guide sequence. The length of the extension sequence may be 2-12 nucleotides. Preferably, ExL may be 0, 2, 4, 6, 8, 10 or 12 nucleotides in length. In a preferred embodiment, ExL is 0 or 4 nucleotides in length. In a more preferred embodiment, ExL is 4 nucleotides in length. The extension sequence may or may not be complementary to the target sequence.
Удлиняющая последовательность также необязательно может быть прикреплена напрямую к направляющей последовательности на 5'-конце защищенной направляющей последовательности, а также к 3'-концу защищающей последовательности. В результате этого, удлиняющая последовательность служит в качестве связующей последовательности между защищенной последовательностью и защищающей последовательностью. Не вдаваясь в теорию, полагают, что такая связь может размещать защищающую последовательность возле защищенной последовательности для улучшения связывания защищающей последовательности с защищенной последовательностью.The extension sequence may also optionally be attached directly to the guide sequence at the 5' end of the protected guide sequence, as well as at the 3' end of the protector sequence. As a result, the extension sequence serves as a linking sequence between the protected sequence and the protector sequence. Without being bound by theory, it is believed that such a linking may position the protector sequence near the protector sequence to improve the binding of the protector sequence to the protector sequence.
Добавление несовпадений gRNA на дистальном конце gRNA может демонстрировать усиленную специфичность. Введение незащищенных дистальных несовпадений в Y или удлинение gRNA с помощью дистальных несовпадений (Z) может демонстрировать усиленную специфичность. Эта концепция, как упоминается, привязана к компонентам X, Y и Z, применяемым в защищенных gRNA. Концепцию незащищенных несовпадений можно дополнительно обобщить до концепций X, Y и Z, описанных для защищенных направляющих РНК.Addition of gRNA mismatches at the distal end of the gRNA can demonstrate enhanced specificity. Introduction of unprotected distal mismatches into Y or extension of the gRNA with distal mismatches (Z) can demonstrate enhanced specificity. This concept is mentioned to be related to the X, Y, and Z components used in protected gRNAs. The unprotected mismatch concept can be further generalized to the X, Y, and Z concepts described for protected guide RNAs.
Cas9Cas9 В одном аспекте настоящего изобретения предусмотрена усиленная специфичность Cas9Cas9, где двухнитевой 3'-конец защищенной направляющей РНК (pgRNA) обеспечивает возможность двух возможных исходов: (1) будет происходить обмен направляющая РНК-защитная РНК на направляющая РНК-целевая нить ДНК и направляющая будет полностью связываться с мишенью, или (2) направляющая РНК не сможет полностью связаться с мишенью, и поскольку целевое расщепление под действием Cas9 представляет собой многостадийную кинетическую реакцию, при которой требуется связывание направляющая РНК:целевая ДНК для активации образования Cas9-катализируемых DSB, при этом расщепление под действием Cas9 не происходит, если направляющая РНК не связалась правильным образом. В соответствии с конкретными вариантами осуществления защищенная направляющая РНК улучшает специфичность связывания мишени по сравнению с встречающейся в природе системой CRISPR-Cas. В соответствии с конкретными вариантами осуществления защищенная модифицированная направляющая РНК улучшает стабильность по сравнению с встречающейся в природе CRISPR-Cas. В соответствии с конкретными вариантами осуществления длина защитной последовательности составляет от 3 до 120 нуклеотидов, и она содержит 3 или более смежных нуклеотидов, комплементарных другой последовательности направляющей или защитной последовательности. В соответствии с конкретными вариантами осуществления защитная последовательность образует шпильку. В соответствии с конкретными вариантами осуществления направляющая РНК дополнительно содержит защищенную последовательность и открытую последовательность. В соответствии с конкретными вариантами осуществления открытая последовательность имеет 1-19 нуклеотидов. Более конкретно, открытая последовательность по меньшей мере на 75%, по меньшей мере на 90% или на приблизительно 100% комплементарна целевой последовательности. В соответствии с конкретными вариантами осуществления направляющая последовательность по меньшей мере на 90% или на приблизительно 100% комплементарна защитной нити. В соответствии с конкретными вариантами осуществления направляющая последовательность по меньшей мере на 75%, по меньшей мере на 90% или на приблизительно 100% комплементарна целевой последовательности. В соответствии с конкретными вариантами осуществления направляющая РНК дополнительно содержит удлиняющую последовательность. Более конкретно, удлиняющая последовательность функционально связана с 3'-концом защищенной направляющей последовательности, и необязательно напрямую связана с 3'-концом защищенной направляющей последовательности. В соответствии с конкретными вариантами осуществления удлиняющая последовательность имеет 1-12 нуклеотидов. В соответствии с конкретными вариантами осуществления удлиняющая последовательность функционально связана с направляющей последовательностью на 3'-конце защищенной направляющей последовательности и 5'-конце защитной нити и необязательно напрямую связана с 3’-концом защищенной направляющей последовательности и 3'-концом защитной нити, где удлиняющая последовательность представляет собой связывающую последовательность между защищенной последовательностью и защитной нитью. В соответствии с конкретными вариантами осуществления удлиняющая последовательность не является комплементарной защитной нити на 100%, необязательно не является комплементарной защитной нити по меньшей мере на 95%, по меньшей мере на 90%, по меньшей мере на 80%, по меньшей мере на 70%, по меньшей мере на 60%, или по меньшей мере на 50%. В соответствии с конкретными вариантами осуществления направляющая последовательность дополнительно содержит несовпадающие основания, прикрепленные к концу направляющей последовательности, где несовпадающие основания термодинамически оптимизируют специфичность.Cas9Cas9 In one aspect of the present invention, enhanced specificity of Cas9Cas9 is provided, wherein the double-stranded 3' end of the protected guide RNA (pgRNA) allows for two possible outcomes: (1) the guide RNA-protective RNA will be exchanged for the guide RNA-target DNA strand and the guide will fully bind to the target, or (2) the guide RNA will fail to fully bind to the target, and since Cas9-mediated target cleavage is a multi-step kinetic reaction that requires guide RNA:target DNA binding to activate Cas9-catalyzed DSB formation, Cas9-mediated cleavage does not occur if the guide RNA is not bound correctly. According to certain embodiments, the protected guide RNA improves target binding specificity compared to a naturally occurring CRISPR-Cas system. According to particular embodiments, the protected modified guide RNA improves stability compared to naturally occurring CRISPR-Cas. According to particular embodiments, the length of the protection sequence is from 3 to 120 nucleotides and comprises 3 or more contiguous nucleotides complementary to another sequence of the guide or protection sequence. According to particular embodiments, the protection sequence forms a hairpin. According to particular embodiments, the guide RNA further comprises a protected sequence and an opening sequence. According to particular embodiments, the opening sequence has 1-19 nucleotides. More particularly, the opening sequence is at least 75%, at least 90%, or about 100% complementary to the target sequence. According to particular embodiments, the guide sequence is at least 90% or about 100% complementary to the protection strand. According to particular embodiments, the guide sequence is at least 75%, at least 90%, or about 100% complementary to the target sequence. According to particular embodiments, the guide RNA further comprises an extension sequence. More particularly, the extension sequence is operably linked to the 3' end of the protected guide sequence, and optionally directly linked to the 3' end of the protected guide sequence. According to particular embodiments, the extension sequence has 1-12 nucleotides. According to particular embodiments, the extension sequence is operably linked to the guide sequence at the 3' end of the protected guide sequence and the 5' end of the guard strand, and optionally directly linked to the 3' end of the protected guide sequence and the 3' end of the guard strand, wherein the extension sequence is a linking sequence between the protected sequence and the guard strand. According to particular embodiments, the extension sequence is not 100% complementary to the guard strand, optionally is not at least 95% complementary to the guard strand, at least 90% complementary to the guard strand, at least 80% complementary to the guard strand, at least 70% complementary to the guard strand, at least 60% complementary to the guard strand, or at least 50% complementary to the guard strand. According to particular embodiments, the guide sequence further comprises mismatched bases attached to the end of the guide sequence, wherein the mismatched bases thermodynamically optimize specificity.
В одном аспекте настоящего изобретения предусмотрена сконструированная, не встречающаяся в природе система CRISPR-Cas, содержащая белок Cas9 и защищенную направляющую РНК, которая нацеливается на молекулу ДНК, кодирующую продукт гена в клетке, в результате чего защищенная направляющая РНК нацеливается на молекулу ДНК, кодирующую продукт гена, а белок Cas9 расщепляет молекулу ДНК, кодирующую продукт гена, в результате чего экспрессия продукта гена изменяется; и где белок Cas9 и защищенная направляющая РНК не встречаются в природе вместе. Настоящее изобретение охватывает защищенную направляющую РНК, предусматривающую направляющую последовательность, слитую на 3'-конце с последовательностью прямого повтора. Настоящее изобретение дополнительно охватывает белок Cas9, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка представляет собой клетку млекопитающего, растительную клетку или клетку дрожжей, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium или Francisella Novicida и может включать мутированный Cas9, происходящий из этих организмов. Фермент может быть дополнительным гомологом или ортологом Cas9. В некоторых вариантах осуществления нуклеотидная последовательность, кодирующая фермент Cfp1, является кодон-оптимизированной для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент Cas9 управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В целом и на протяжении данного описания термин "вектор" обозначает молекулу нуклеиновой кислоты, способную переносить другую нуклеиновую кислоту, с которой она была связана. Векторы включают без ограничения молекулы нуклеиновой кислоты, которые являются однонитевыми, двухнитевыми или частично двухнитевыми; молекулы нуклеиновой кислоты, которые содержат один или несколько свободных концов, не содержат свободных концов (например, кольцевые); молекулы нуклеиновой кислоты, которые содержат ДНК, РНК или и ту, и другую; и другие разновидности полинуклеотидов, известные из уровня техники. Одним типом вектора является "плазмида", которая означает кольцевую петлю двухнитевой ДНК, в которую можно встраивать дополнительные сегменты ДНК, как, например, с помощью стандартных методик молекулярного клонирования. Другим типом вектора является вирусный вектор, где полученные из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (например, ретровирусы, ретровирусы с дефектной системой репликации, аденовирусы, аденовирусы с дефектной системой репликации и аденоассоциированные вирусы). Вирусные векторы также включают полинуклеотиды, переносимые вирусом для трансфекции в клетку-хозяина. Определенные векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы с бактериальной точкой начала репликации и эписомные векторы для млекопитающих). Другие векторы (например, векторы для млекопитающих, отличные от эписомных) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и, таким образом, реплицируются вместе с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы в данном документе обозначены как "векторы экспрессии". Общепринятые пригодные для методик рекомбинантной ДНК векторы экспрессии часто находятся в форме плазмид.In one aspect, the present invention provides an engineered, non-naturally occurring CRISPR-Cas system comprising a Cas9 protein and a protected guide RNA that targets a DNA molecule encoding a gene product in a cell, whereby the protected guide RNA targets the DNA molecule encoding the gene product, and the Cas9 protein cleaves the DNA molecule encoding the gene product, whereby expression of the gene product is altered; and wherein the Cas9 protein and the protected guide RNA do not occur together in nature. The present invention encompasses a protected guide RNA that includes a guide sequence fused at the 3' end to a direct repeat sequence. The present invention further encompasses a Cas9 protein that is codon-optimized for expression in a eukaryotic cell. In a preferred embodiment, the eukaryotic cell is a mammalian cell, a plant cell, or a yeast cell, and in a more preferred embodiment, the mammalian cell is a human cell. In a further embodiment of the present invention, expression of the gene product is reduced. In some embodiments, the Cas9 enzyme is Cas9 of Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium or Francisella Novicida and may include a mutated Cas9 derived from these organisms. The enzyme may be an additional homolog or ortholog of Cas9. In some embodiments, the nucleotide sequence encoding the Cfp1 enzyme is codon optimized for expression in a eukaryotic cell. In some embodiments, the Cas9 enzyme directs single or double strand cleavage at a specific position in the target sequence. In some embodiments, the first regulatory element is a polymerase III promoter. In some embodiments, the second regulatory element is a polymerase II promoter. Generally and throughout this specification, the term "vector" refers to a nucleic acid molecule capable of transporting another nucleic acid to which it has been linked. Vectors include, but are not limited to, nucleic acid molecules that are single-stranded, double-stranded, or partially double-stranded; nucleic acid molecules that contain one or more free ends, do not contain free ends (e.g., circular); nucleic acid molecules that contain DNA, RNA, or both; and other types of polynucleotides known in the art. One type of vector is a "plasmid," which refers to a circular loop of double-stranded DNA into which additional DNA segments can be inserted, such as by standard molecular cloning techniques. Another type of vector is a viral vector, wherein virally derived DNA or RNA sequences are present in the vector for packaging into a virus (e.g., retroviruses, replication-deficient retroviruses, adenoviruses, replication-deficient adenoviruses, and adeno-associated viruses). Viral vectors also include polynucleotides carried by a virus for transfection into a host cell. Certain vectors are capable of autonomous replication within the host cell into which they are introduced (e.g., bacterial vectors with a bacterial origin of replication and episomal mammalian vectors). Other vectors (e.g., non-episomal mammalian vectors) integrate into the host cell genome upon introduction into the host cell and thus replicate along with the host genome. Furthermore, certain vectors are capable of directing the expression of genes to which they are functionally linked. Such vectors are referred to herein as "expression vectors." Common expression vectors suitable for recombinant DNA techniques are often in the form of plasmids.
Рекомбинантные векторы экспрессии могут содержать нуклеиновую кислоту по настоящему изобретению в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается применять для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии предполагается, что выражение "функционально связанный" обозначает то, что представляющая интерес нуклеотидная последовательность связана с регуляторным(регуляторными) элементом(элементами), так что обеспечивается возможность экспрессии нуклеотидной последовательности (например, в системе транскрипции/трансляции in vitro или в клетке-хозяине при введении вектора в клетку-хозяина).Recombinant expression vectors may comprise a nucleic acid of the present invention in a form suitable for expression of the nucleic acid in a host cell, which means that the recombinant expression vectors comprise one or more regulatory elements, which may be selected taking into account the host cells that are intended to be used for expression, which are operably linked to the nucleic acid sequence that is intended to be expressed. In the context of a recombinant expression vector, the term "operably linked" is intended to mean that the nucleotide sequence of interest is linked to the regulatory element(s) such that expression of the nucleotide sequence is allowed (e.g. in an in vitro transcription/translation system or in a host cell upon introduction of the vector into the host cell).
Преимущественные векторы включают лентивирусы и аденоассоциированные вирусы, и типы таких векторов также могут быть выбраны для нацеливания на определенные типы клеток.Preferred vectors include lentiviruses and adeno-associated viruses, and types of such vectors can also be selected to target specific cell types.
В одном аспекте настоящего изобретения предусмотрена эукариотическая клетка-хозяин, содержащая (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей ниже последовательности прямого повтора, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR в комплексе с направляющей РНК, предусматривающей направляющую последовательность, которая гибридизируется с целевой последовательностью, и/или (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, кодирующей указанный фермент Cas9, содержащий последовательность ядерной локализации. В некоторых вариантах осуществления клетка-хозяин содержит компоненты (a) и (b). В некоторых вариантах осуществления компонент (a), компонент (b) или компоненты (a) и (b) стабильно интегрированы в геном эукариотической клетки-хозяина. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления фермент Cas9 управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления фермент Cas9 не обладает активностью расщепления нити ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II.In one aspect of the present invention, there is provided a eukaryotic host cell comprising (a) a first regulatory element operably linked to a direct repeat sequence and one or more insertion sites for inserting one or more guide sequences downstream of the direct repeat sequence, wherein, when expressed, the guide sequence directs sequence-specific binding of a CRISPR complex to a target sequence in the eukaryotic cell, wherein the CRISPR complex comprises a CRISPR enzyme in complex with a guide RNA providing a guide sequence that hybridizes to the target sequence, and/or (b) a second regulatory element operably linked to an enzyme-coding sequence encoding said Cas9 enzyme comprising a nuclear localization sequence. In some embodiments, the host cell comprises components (a) and (b). In some embodiments, component (a), component (b), or components (a) and (b) are stably integrated into the genome of the eukaryotic host cell. In some embodiments, component (a) further comprises two or more guide sequences operably linked to the first regulatory element, wherein, when expressed, each of the two or more guide sequences directs sequence-specific binding of the CRISPR complex to its target sequence in a eukaryotic cell. In some embodiments, the Cas9 enzyme directs cleavage of one or two strands at a specific position of the target sequence. In some embodiments, the Cas9 enzyme does not have DNA strand cleavage activity. In some embodiments, the first regulatory element is a polymerase III promoter. In some embodiments, the second regulatory element is a polymerase II promoter.
В одном аспекте настоящего изобретения предусмотрен эукариотический организм, отличный от человека; предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина в соответствии с любым из описанных вариантов осуществления. В других аспектах настоящего изобретения предусмотрен эукариотический организм, предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина в соответствии с любым из описанных вариантов осуществления. В некоторых вариантах осуществления этих аспектов организм может представлять собой животное; например, млекопитающее. Также организм может представлять собой членистоногое, такое как насекомое. Организм также может представлять собой растение или дрожжи. Кроме того, организм может представлять собой гриб.In one aspect of the present invention, a eukaryotic organism other than a human is provided; preferably a multicellular eukaryotic organism comprising a eukaryotic host cell according to any of the described embodiments. In other aspects of the present invention, a eukaryotic organism is provided, preferably a multicellular eukaryotic organism comprising a eukaryotic host cell according to any of the described embodiments. In some embodiments of these aspects, the organism may be an animal; for example, a mammal. The organism may also be an arthropod, such as an insect. The organism may also be a plant or yeast. In addition, the organism may be a fungus.
В одном аспекте настоящего изобретения предусмотрен набор, содержащий один или несколько компонентов, описанных в данном документе выше. В некоторых вариантах осуществления набор содержит векторную систему и инструкции по применению набора. В некоторых вариантах осуществления векторная система содержит (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей ниже последовательности прямого повтора, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR на основе Cas9 с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент Cas9 в комплексе с защищенной направляющей РНК, предусматривающей направляющую последовательность, которая гибридизируется с целевой последовательностью, и/или (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, кодирующей указанный фермент Cas9, содержащий последовательность ядерной локализации. В некоторых вариантах осуществления набор содержит компоненты (a) и (b), находящиеся в одном и том же или разных векторах системы. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления фермент Cas9 содержит одну или несколько последовательностей ядерной локализации, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного фермента Cas9 в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020 или Francisella tularensis 1 Novicida и может включать мутированный Cas9, происходящий из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления фермент CRISPR кодон-оптимизирован для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления фермент CRISPR не обладает активностью расщепления нитей ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II.In one aspect of the present invention, a kit is provided comprising one or more components as described herein above. In some embodiments, the kit comprises a vector system and instructions for using the kit. In some embodiments, the vector system comprises (a) a first regulatory element operably linked to a direct repeat sequence and one or more insertion sites for inserting one or more guide sequences downstream of the direct repeat sequence, wherein, when expressed, the guide sequence directs sequence-specific binding of a Cas9-based CRISPR complex to a target sequence in a eukaryotic cell, wherein the CRISPR complex comprises a Cas9 enzyme in complex with a protected guide RNA comprising a guide sequence that hybridizes to the target sequence, and/or (b) a second regulatory element operably linked to an enzyme-coding sequence encoding said Cas9 enzyme comprising a nuclear localization sequence. In some embodiments, the kit comprises components (a) and (b) located in the same or different vectors of the system. In some embodiments, component (a) further comprises two or more guide sequences operably linked to the first regulatory element, wherein when expressed, each of the two or more guide sequences directs sequence-specific binding of the CRISPR complex to its target sequence in a eukaryotic cell. In some embodiments, the Cas9 enzyme comprises one or more nuclear localization sequences characterized by sufficient efficiency to direct accumulation of said Cas9 enzyme in a detectable amount in the nucleus of a eukaryotic cell. In some embodiments, the Cas9 enzyme is Cas9 of Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, or Francisella tularensis 1 Novicida, and may include a mutated Cas9 derived from these organisms. The enzyme may be a homolog or ortholog of Cas9. In some embodiments, the CRISPR enzyme is codon-optimized for expression in a eukaryotic cell. In some embodiments, the CRISPR enzyme directs the cleavage of one or two strands at a specific position in the target sequence. In some embodiments, the CRISPR enzyme does not have DNA strand cleavage activity. In some embodiments, the first regulatory element is a polymerase III promoter. In some embodiments, the second regulatory element is a polymerase II promoter.
В одном аспекте настоящего изобретения предусмотрен способ модифицирования целевого полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида, за счет чего обеспечивается модифицирование целевого полинуклеотида, где комплекс CRISPR содержит фермент Cas9 в комплексе с защищенной направляющей РНК, предусматривающей направляющую последовательность, гибридизируемую с целевой последовательностью в пределах указанного целевого полинуклеотида. В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении целевой последовательности с помощью указанного фермента Cas9. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида с помощью механизмов генной вставки на основе негомологичного соединения концов (NHEJ), более конкретно, с применением экзогенной полинуклеотидной матрицы, где указанная репарация приводит к мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в указанном целевом полинуклеотиде. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот в белке, экспрессируемом с гена, содержащего целевую последовательность. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанную эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента Cas9, защищенной направляющей РНК, предусматривающей направляющую последовательность, связанную с последовательностью прямого повтора. В некоторых вариантах осуществления указанные векторы доставляются в эукариотическую клетку в субъекте. В некоторых вариантах осуществления указанное модифицирование происходит в указанной эукариотической клетке в культуре клеток. В некоторых вариантах осуществления способ дополнительно включает выделение указанной эукариотической клетки из организма субъекта перед проведением указанного модифицирования. В некоторых вариантах осуществления способ дополнительно включает возвращение указанной эукариотической клетки и/или клеток, происходящих из нее, указанному субъекту.In one aspect of the present invention, there is provided a method for modifying a target polynucleotide in a eukaryotic cell. In some embodiments, the method comprises causing a CRISPR complex to bind to the target polynucleotide to effect cleavage of said target polynucleotide, thereby effecting modification of the target polynucleotide, wherein the CRISPR complex comprises a Cas9 enzyme in a complex with a protected guide RNA that provides a guide sequence hybridizable to a target sequence within said target polynucleotide. In some embodiments, said cleavage comprises cleavage of one or two strands at a specific position of the target sequence using said Cas9 enzyme. In some embodiments, said cleavage results in reduced transcription of the target gene. In some embodiments, the method further comprises repairing said cleaved target polynucleotide using non-homologous end joining (NHEJ) gene insertion mechanisms, more particularly using an exogenous polynucleotide template, wherein said repair results in a mutation involving an insertion, deletion or substitution of one or more nucleotides in said target polynucleotide. In some embodiments, said mutation results in a change in one or more amino acids in a protein expressed from a gene comprising the target sequence. In some embodiments, the method further comprises delivering one or more vectors to said eukaryotic cell, wherein the one or more vectors direct the expression of one or more of: a Cas9 enzyme, a protected guide RNA comprising a guide sequence linked to a direct repeat sequence. In some embodiments, said vectors are delivered to a eukaryotic cell in a subject. In some embodiments, said modification occurs in said eukaryotic cell in cell culture. In some embodiments, the method further comprises isolating said eukaryotic cell from the subject's body prior to performing said modification. In some embodiments, the method further comprises returning said eukaryotic cell and/or cells derived therefrom to said subject.
В одном аспекте настоящего изобретения предусмотрен способ модифицирования экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR на основе Cas9 с полинуклеотидом, так что указанное связывание приводит к повышенной или сниженной экспрессии указанного полинуклеотида; где комплекс CRISPR содержит фермент Cas9 в комплексe с защищенной направляющей РНК, предусматривающей направляющую последовательность, гибридизируемую с целевой последовательностью в пределах указанного полинуклеотида. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанные эукариотические клетки, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента Cas9 и защищенной направляющей РНК.In one aspect of the present invention, there is provided a method for modifying the expression of a polynucleotide in a eukaryotic cell. In some embodiments, the method comprises causing a Cas9-based CRISPR complex to bind to the polynucleotide, such that said binding results in increased or decreased expression of said polynucleotide; wherein the CRISPR complex comprises a Cas9 enzyme in a complex with a protected guide RNA that provides a guide sequence hybridizable to a target sequence within said polynucleotide. In some embodiments, the method further comprises delivering one or more vectors to said eukaryotic cells, wherein the one or more vectors direct the expression of one or more of: the Cas9 enzyme and the protected guide RNA.
В одном аспекте настоящего изобретения предусмотрен способ получения модельной эукариотической клетки, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) введение одного или нескольких векторов в эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из: фермента Cas9 и защищенной направляющей РНК, предусматривающей направляющую последовательность, связанную с последовательностью прямого повтора; и (b) обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в пределах указанного гена, ответственного за развитие заболевания, где комплекс CRISPR содержит фермент Cas9 в комплексe с направляющей РНК, предусматривающей последовательность, которая гибридизируется с целевой последовательностью в пределах целевого полинуклеотида, с получением тем самым модельной эукариотической клетки, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении целевой последовательности с помощью указанного фермента Cas9. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида с помощью механизмов генной вставки на основе негомологичного соединения концов (NHEJ) с применением экзогенной полинуклеотидной матрицы, где указанная репарация приводит к мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в указанном целевом полинуклеотиде. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот при экспрессии белка с гена, содержащего целевую последовательность.In one aspect of the present invention, there is provided a method for producing a model eukaryotic cell comprising a mutated gene responsible for developing a disease. In some embodiments, the gene responsible for developing a disease is any gene associated with an increased risk of having or developing a disease. In some embodiments, the method comprises (a) introducing one or more vectors into a eukaryotic cell, wherein the one or more vectors direct the expression of one or more of: a Cas9 enzyme and a protected guide RNA providing a guide sequence linked to a direct repeat sequence; and (b) causing a CRISPR complex to bind to a target polynucleotide to effect cleavage of the target polynucleotide within said gene responsible for developing a disease, wherein the CRISPR complex comprises a Cas9 enzyme in a complex with a guide RNA providing a sequence that hybridizes to a target sequence within the target polynucleotide, thereby producing a model eukaryotic cell comprising a mutated gene responsible for developing a disease. In some embodiments, said cleavage comprises cleaving one or two strands at a specific position of a target sequence using said Cas9 enzyme. In some embodiments, said cleavage results in reduced transcription of a target gene. In some embodiments, the method further comprises repairing said cleaved target polynucleotide using non-homologous end joining (NHEJ) gene insertion mechanisms using an exogenous polynucleotide template, wherein said repair results in a mutation involving the insertion, deletion or substitution of one or more nucleotides in said target polynucleotide. In some embodiments, said mutation results in a change in one or more amino acids in the expression of a protein from a gene comprising the target sequence.
В одном аспекте настоящего изобретения предусмотрен способ разработки биологически активного средства, которое модулирует событие передачи сигнала в клетке, ассоциированное с геном, ответственным за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) приведение тестируемого соединения в контакт с модельной клеткой по любому из описанных вариантов осуществления; и (b) обнаружение изменения считываемого показания, что указывает на снижение или возрастание события передачи сигнала в клетке, ассоциированного с указанной мутацией в указанном гене, ответственном за развитие заболевания, с получением тем самым указанного биологически активного средства, которое модулирует указанное событие передачи сигнала в клетке, ассоциированное с указанным геном, ответственным за развитие заболевания.In one aspect of the present invention, there is provided a method for developing a biologically active agent that modulates a cellular signaling event associated with a disease-promoting gene. In some embodiments, the disease-promoting gene is any gene associated with an increased risk of having or developing a disease. In some embodiments, the method comprises (a) contacting a test compound with a model cell according to any of the described embodiments; and (b) detecting a change in a readout that indicates a decrease or increase in a cellular signaling event associated with said mutation in said disease-promoting gene, thereby obtaining said biologically active agent that modulates said cellular signaling event associated with said disease-promoting gene.
В одном аспекте настоящего изобретения предусмотрен рекомбинантный полинуклеотид, содержащий защищенную направляющую последовательность ниже последовательности прямого повтора, где, будучи экспрессированной, защищенная направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с соответствующей целевой последовательностью, присутствующей в эукариотической клетке. В некоторых вариантах осуществления целевой последовательностью является вирусная последовательность, присутствующая в эукариотической клетке. В некоторых вариантах осуществления целевая последовательность представляет собой протоонкоген или онкоген.In one aspect of the present invention, there is provided a recombinant polynucleotide comprising a protected guide sequence downstream of a direct repeat sequence, wherein, when expressed, the protected guide sequence directs sequence-specific binding of a CRISPR complex to a corresponding target sequence present in a eukaryotic cell. In some embodiments, the target sequence is a viral sequence present in a eukaryotic cell. In some embodiments, the target sequence is a proto-oncogene or an oncogene.
В одном аспекте настоящего изобретения предусмотрен способ отбора одной или нескольких клеток путем введения одной или нескольких мутаций в ген в одной или нескольких клетках, причем способ включает: введение одного или нескольких векторов в клетку(клетки), где один или несколько векторов управляют экспрессией одного или нескольких из: фермента Cas9, защищенной направляющей РНК, предусматривающей направляющую последовательность, и матрицы редактирования; где матрица редактирования содержит одну или несколько мутаций, которые отменяют расщепление под действием фермента Cas9; обеспечение механизмов генной вставки на основе негомологичного соединения концов (NHEJ) матрицы редактирования с целевым полинуклеотидом в клетке(клетках), подлежащей(подлежащих) отбору; обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в пределах указанного гена, где комплекс CRISPR содержит фермент Cas9 в комплексе с защищенной направляющей РНК, предусматривающей направляющую последовательность, которая гибридизируется с целевой последовательностью в пределах целевого полинуклеотида, где связывание комплекса CRISPR с целевым полинуклеотидом индуцирует гибель клетки, тем самым обеспечивая возможность отбора одной или нескольких клеток, в которые были введены одна или несколько мутаций. В предпочтительном варианте осуществления настоящего изобретения клетка, подлежащая отбору, может представлять собой эукариотическую клетку. Аспекты настоящего изобретения предусматривают отбор специфических клеток без необходимости наличия маркера отбора или двухстадийного способа, который может включать систему негативного отбора.In one aspect of the present invention, there is provided a method of selecting one or more cells by introducing one or more mutations into a gene in one or more cells, the method comprising: introducing one or more vectors into the cell(s), wherein the one or more vectors direct the expression of one or more of: a Cas9 enzyme, a protected guide RNA providing a guide sequence, and an editing template; wherein the editing template comprises one or more mutations that abolish cleavage by the Cas9 enzyme; providing non-homologous end joining (NHEJ) gene insertion mechanisms of the editing template to a target polynucleotide in the cell(s) to be selected; allowing the CRISPR complex to bind to a target polynucleotide to effect cleavage of the target polynucleotide within said gene, wherein the CRISPR complex comprises a Cas9 enzyme in complex with a protected guide RNA providing a guide sequence that hybridizes to a target sequence within the target polynucleotide, wherein the binding of the CRISPR complex to the target polynucleotide induces cell death, thereby allowing selection of one or more cells into which one or more mutations have been introduced. In a preferred embodiment of the present invention, the cell to be selected may be a eukaryotic cell. Aspects of the present invention provide for the selection of specific cells without the need for a selection marker or a two-step method that may include a negative selection system.
Что касается мутаций в ферменте Cas9, если фермент не представляет собой FnCas9, мутации могут быть такими, как описано в других разделах данного документа; также предусмотрена консервативная замена для любой из заменяющих аминокислот. В одном аспекте настоящего изобретения предусмотрено в отношении любого, или каждого, или всех вариантов осуществления, обсуждаемых в данном документе, что фермент CRISPR содержит по меньшей мере одну или более, или по меньшей мере две или более мутаций, где по меньшей мере одна или более мутаций или по меньшей мере две или более мутаций выбраны из мутаций, описанных в других разделах данного документа.With respect to mutations in the Cas9 enzyme, if the enzyme is not FnCas9, the mutations may be as described elsewhere herein; a conservative substitution for any of the amino acids that are substituted is also provided. In one aspect, the present invention provides for any or each or all embodiments discussed herein that the CRISPR enzyme comprises at least one or more, or at least two or more mutations, wherein the at least one or more mutations or the at least two or more mutations are selected from the mutations described elsewhere herein.
В дополнительном аспекте настоящее изобретение относится к выполняемому с помощью компьютера способу идентификации или разработки потенциальных соединений для помещения или связывания с системой CRISPR-Cas9 или ее функциональной частью или наоборот (выполняемому с помощью компьютера способу идентификации или разработки потенциальных систем CRISPR-Cas9 или их функциональной части для связывания с требуемыми соединениями) или к выполняемому с помощью компьютера способу идентификации или разработки потенциальных систем CRISPR-Cas9 (например, с точки зрения прогнозирования областей системы CRISPR-Cas9, с которыми можно проводить манипуляции, например, исходя из данных кристаллической структуры или исходя из данных ортологов Cas9, или с учетом того, где можно прикрепить функциональную группу, такую как активатор или репрессор, к системе CRISPR-Cas9, или в отношении усечений Cas9 или в отношении разработки никаз), причем указанный способ включает:In a further aspect, the present invention relates to a computer-assisted method for identifying or designing potential compounds for insertion or binding to a CRISPR-Cas9 system or a functional part thereof, or vice versa (a computer-assisted method for identifying or designing potential CRISPR-Cas9 systems or a functional part thereof for binding to desired compounds) or to a computer-assisted method for identifying or designing potential CRISPR-Cas9 systems (e.g., in terms of predicting regions of a CRISPR-Cas9 system that can be manipulated, e.g., based on crystal structure data or based on Cas9 ortholog data, or taking into account where a functional group such as an activator or a repressor can be attached to a CRISPR-Cas9 system, or in relation to Cas9 truncations or in relation to the design of nickases), said method comprising:
применение компьютерной системы, например, компьютера с хранимой программой, содержащего процессор, систему хранения данных, устройство ввода и устройство вывода, стадии:the use of a computer system, such as a stored program computer, comprising a processor, a data storage system, an input device, and an output device, the stages of:
(a) ввода в компьютер с хранимой программой посредством указанного устройства ввода данных, включающих трехмерные координаты подгруппы атомов из кристаллической структуры CRISPR-Cas9 или связанных с таковой, например, в домене связывания системы CRISPR-Cas9 или альтернативно или дополнительно в доменах, которые варьируют, исходя из различий среди ортологов Cas9, или касающихся Cas9, или касающихся никаз, или касающихся функциональных групп, необязательно с информацией по структуре комплекса(комплексов) системы CRISPR-Cas9, с получением тем самым набора данных;(a) inputting into a computer with a stored program, via said input device, data comprising three-dimensional coordinates of a subset of atoms from or associated with a crystal structure of CRISPR-Cas9, for example in a binding domain of the CRISPR-Cas9 system or alternatively or additionally in domains that vary based on differences among Cas9 orthologs or concerning Cas9 or concerning niccases or concerning functional groups, optionally with information on the structure of the CRISPR-Cas9 system complex(es), thereby obtaining a data set;
(b) сравнения с применением указанного процессора указанного набора данных с компьютерной базой данных по структурам, хранящейся в указанной компьютерной системе хранения данных, например, структурам соединений, которые связываются, или предположительно связываются, или для которых требуется, чтобы они связывались с системой CRISPR-Cas9, или с ортологами Cas9 (например, Cas9s или с доменами или участками, которые варьируют среди ортологов Cas9), или с кристаллической структурой CRISPR-Cas9, или с никазами или с функциональными группами;(b) comparing, using said processor, said data set with a computer database of structures stored in said computer data storage system, such as structures of compounds that bind, or are predicted to bind, or are claimed to bind, to the CRISPR-Cas9 system, or to Cas9 orthologues (e.g., Cas9s or to domains or regions that vary among Cas9 orthologues), or to a crystal structure of CRISPR-Cas9, or to nickases or to functional groups;
(с) выбора из указанной базы данных, с применением компьютерных способов, структуры(структур), например, структур CRISPR-Cas9, которые могут связываться с требуемыми структурами, требуемых структур, которые могут связываться с определенными структурами CRISPR-Cas9, частей системы CRISPR-Cas9, с которыми можно проводить манипуляции, например, исходя из данных по другим частям кристаллической структуры CRISPR-Cas9 и/или об ортологах Cas9, усеченных Cas9, новых никазах или конкретных функциональных группах, или положений для прикрепления функциональных групп или систем функциональная группа-CRISPR-Cas9;(c) selecting from said database, using computational methods, structure(s), such as CRISPR-Cas9 structures, that can bind to desired structures, desired structures that can bind to specific CRISPR-Cas9 structures, parts of the CRISPR-Cas9 system that can be manipulated, such as based on data on other parts of the CRISPR-Cas9 crystal structure and/or on Cas9 orthologs, truncated Cas9, novel nicks or specific functional groups, or positions for attachment of functional groups or functional group-CRISPR-Cas9 systems;
(d) конструирования, с применением компьютерных способов, модели выбранной(выбранных) структуры(структур) и(d) designing, using computer methods, a model of the selected structure(s) and
(e) вывода данных по выбранной(выбранным) структуре(структурам) на указанное устройство вывода;(e) outputting data on the selected structure(s) to the specified output device;
и необязательно синтеза одной или нескольких выбранных структур;and not necessarily the synthesis of one or more selected structures;
и дополнительно необязательного тестирования указанной(указанных) синтезированной(синтезированных) выбранной(выбранных) структуры(структур) как системы CRISPR-Cas9 или таковой(таковых) в ней;and additionally optional testing of the said synthesized selected structure(s) as a CRISPR-Cas9 system or such(s) in it;
или указанный способ включает: обеспечение координат по меньшей мере двух атомов кристаллической структуры CRISPR-Cas9, например, по меньшей мере двух атомов из таблицы кристаллических структур для кристаллической структуры CRISPR-Cas9, изложенной в данном документе, или координат по меньшей мере субдомена кристаллической структуры CRISPR-Cas9 ("выбранных координат"), обеспечивающих структуру кандидатной молекулы, содержащей связывающую молекулу, или частей системы CRISPR-Cas9, с которыми можно проводить манипуляции, например, исходя из данных по другим частям кристаллической структуры CRISPR-Cas9 и/или от ортологов Cas9, или структуре функциональных групп, и подгонку структуры кандидатной молекулы к выбранным координатам, с получением тем самым данных о продукте, содержащих структуры CRISPR-Cas9, которые могут связываться с требуемыми структурами, требуемых структур, которые могут связываться с определенными структурами CRISPR-Cas9, частей системы CRISPR-Cas9, с которыми можно проводить манипуляции, усеченных Cas9, новых никаз или конкретных функциональных групп, или положений для прикрепления функциональных групп или систем функциональная группа-CRISPR-Cas9, с выводом данных о них; и необязательно синтез соединения(соединений) на основании указанных данных о продукте и дополнительно необязательно включает тестирование указанного (указанных) синтезированного (синтезированных) соединения(соединений) как системы CRISPR-Cas9 или такового(таковых) в ней.or the method comprises: providing coordinates of at least two atoms of a CRISPR-Cas9 crystal structure, such as at least two atoms from a table of crystal structures for the CRISPR-Cas9 crystal structure set forth herein, or coordinates of at least a subdomain of a CRISPR-Cas9 crystal structure ("selected coordinates") that provide the structure of a candidate molecule comprising a binding molecule or parts of the CRISPR-Cas9 system that can be manipulated, such as from data on other parts of the CRISPR-Cas9 crystal structure and/or from Cas9 orthologs or the structure of functional groups, and fitting the structure of the candidate molecule to the selected coordinates, thereby obtaining product data comprising CRISPR-Cas9 structures that can bind to desired structures, desired structures that can bind to certain CRISPR-Cas9 structures, parts of the CRISPR-Cas9 system that can be manipulated, truncated Cas9, novel nickases or specific functional groups, or positions for attachment of functional groups or functional group-CRISPR-Cas9 systems, with output data about them; and optionally synthesizing the compound(s) based on said product data and further optionally including testing said synthesized compound(s) as a CRISPR-Cas9 system or the same therein.
Тестирование может предусматривать анализ системы CRISPR-Cas9, полученной на основании указанной(указанных) синтезированной(синтезированных) выбранной (выбранных) структуры(структур), например, в отношении связывания или выполнения требуемой функции.Testing may include analysis of the CRISPR-Cas9 system obtained from the said synthesized selected structure(s), for example, with respect to binding or performance of the required function.
Выводная информация в вышеупомянутые способах может предусматривать передачу данных, например, передачу информации через телекоммуникацию, телефон, видеоконференцию, средства массовой информации, например, презентацию, такую как компьютерная презентация (например, POWERPOINT), Интернет, электронную почту, сообщение с помощью документов, таких как документ компьютерной программы (например, WORD) и т.п. В соответствии с этим, настоящее изобретение также охватывает машиночитаемые носители, содержащие данные по атомным координатам в соответствии с кристаллической структурой, приведенной в данном документе, причем указанные данные определяют трехмерную структуру CRISPR-Cas9 или по меньшей мере одного его субдомена, или данные по структурному фактору для CRISPR-Cas9, причем указанные данные по структурному фактору можно получить на основании данных по атомным координатам из кристаллической структуры, приведенной в данном документе. Машиночитаемые носители также могут содержать любые данные из вышеупомянутых способов. Настоящее изобретение дополнительно охватывает способы с использованием компьютерной системы для получения или выполнения рациональной разработки, как в вышеупомянутых способах, предусматривающей либо данные по атомным координатам в соответствии с кристаллической структурой, приведенной в данном документе, причем указанные данные определяют трехмерную структуру CRISPR-Cas9 или по меньшей мере одного его субдомена, либо данные по структурному фактору для CRISPR-Cas9, причем указанные данные по структурному фактору можно получить на основании данных по атомным координатам из кристаллической структуры, приведенной в данном документе. Настоящее изобретение дополнительно охватывает способ ведения коммерческой деятельности, включающий обеспечение пользователя компьютерной системой, или носителем, или данными трехмерной структуры CRISPR-Cas9, или по меньшей мере одного ее субдомена, или структурного фактора для CRISPR-Cas9, при этом указанная структура изложена в виде данных по атомным координатам из кристаллической структуры, приведенной в данном документе, или указанный структурный фактор, можно получить на основании таких данных, или электронным носителем, приведенным в данном документе, или передачей данных, приведенной в данном документе.The output information in the above-mentioned methods may include data transmission, such as transmission of information via telecommunication, telephone, video conference, mass media, such as a presentation such as a computer presentation (e.g. POWERPOINT), the Internet, e-mail, a message using documents such as a computer program document (e.g. WORD), etc. Accordingly, the present invention also encompasses computer-readable media containing data on atomic coordinates in accordance with the crystal structure provided herein, wherein said data define a three-dimensional structure of CRISPR-Cas9 or at least one subdomain thereof, or data on a structure factor for CRISPR-Cas9, wherein said data on a structure factor can be obtained based on the data on atomic coordinates from the crystal structure provided herein. Computer-readable media may also contain any data from the above-mentioned methods. The present invention further encompasses methods using a computer system for obtaining or performing rational design as in the above-mentioned methods, providing either data on atomic coordinates in accordance with the crystal structure provided herein, wherein said data defines a three-dimensional structure of CRISPR-Cas9 or at least one subdomain thereof, or data on a structure factor for CRISPR-Cas9, wherein said data on a structure factor is obtainable based on the data on atomic coordinates from the crystal structure provided herein. The present invention further encompasses a method of conducting business, including providing a user with a computer system, or a storage medium, or data on a three-dimensional structure of CRISPR-Cas9, or at least one subdomain thereof, or a structure factor for CRISPR-Cas9, wherein said structure is set forth in the form of data on atomic coordinates from the crystal structure provided herein, or said structure factor is obtainable based on such data, or an electronic storage medium provided herein, or a data transmission provided herein.
"Сайт связывания" или "активный сайт" предусматривает, или состоит, по сути, из, или состоит из сайта (такого как атом, функциональная группа аминокислотного остатка или множество таких атомов и/или групп) в полости или участке связывания, который может связываться с соединением, таким как молекула нуклеиновой кислоты, которое вовлекается в связывание.A "binding site" or "active site" refers to, or consists essentially of, or consists of, a site (such as an atom, a functional group of an amino acid residue, or a plurality of such atoms and/or groups) in a binding cavity or region that can bind to a compound, such as a nucleic acid molecule, that is involved in the binding.
Под "подгонкой" подразумевают определение с помощью автоматизированных или полуавтоматизированных средств взаимодействий между одним или несколькими атомами кандидатной молекулы и по меньшей мере одним атомом структуры по настоящему изобретению и вычисление степени стабильности таких взаимодействий. Взаимодействия включают притяжение и отталкивание, обусловленное зарядом, стерическими аспектами и т.п. Далее описаны различные компьютерные способы подгонки.By "fitting" is meant determining, by automated or semi-automated means, the interactions between one or more atoms of a candidate molecule and at least one atom of a structure of the present invention and calculating the degree of stability of such interactions. The interactions include attractions and repulsions due to charge, steric aspects, etc. Various computer-aided fitting methods are described below.
Под "среднеквадратичным (или rms) отклонением" подразумевается квадратный корень из арифметического среднего квадратов отклонений от среднего.By "root mean square (or rms) deviation" is meant the square root of the arithmetic mean of the squares of the deviations from the mean.
Под "компьютерной системой" подразумевают аппаратные программные средства, программные средства и средства хранения данных, применяемые для анализа данных по атомным координатам. Минимальные аппаратные средства компьютерных систем по настоящему изобретению, как правило, содержат центральный процессор (CPU), устройства ввода, устройства вывода и средства хранения данных. Для визуализации данных по структуре желательно обеспечить дисплей или монитор. Средствами хранения данных может быть RAM или средства для доступа к машиночитаемым носителям по настоящему изобретению. Примерами таких систем являются компьютер и планшетные устройства под управлением операционных систем Unix, Windows или Apple.By "computer system" is meant hardware, software, and data storage used to analyze the data by atomic coordinates. The minimum hardware of the computer systems of the present invention typically comprises a central processing unit (CPU), input devices, output devices, and data storage. For visualization of the data by structure, it is desirable to provide a display or monitor. The data storage means may be RAM or means for accessing the machine-readable media of the present invention. Examples of such systems are a computer and tablet devices running Unix, Windows, or Apple operating systems.
Под "машиночитаемыми носителями" подразумевают любой носитель или носители, которые могут быть считаны и доступ к которым может быть получен непосредственно или опосредованно с помощью компьютера, например, так, что носители подходят для применения в вышеупомянутой компьютерной системе. Такие носители включают без ограничения магнитные запоминающие устройства, такие как дискеты, запоминающее устройство в виде жесткого диска и магнитная лента; оптические запоминающие устройства, такие как оптические диски или CD-ROM; электрические запоминающие устройства, такие как RAM и ROM; флеш-накопители; устройства с облачным хранилищем данных и гибриды этих категорий, такие как магнитные/оптические запоминающие устройства.By "machine-readable media" is meant any medium or media that can be read and accessed directly or indirectly by a computer, such as such that the media are suitable for use in the aforementioned computer system. Such media include, but are not limited to, magnetic storage devices such as floppy disks, hard disk storage devices, and magnetic tape; optical storage devices such as optical disks or CD-ROMs; electrical storage devices such as RAM and ROM; flash drives; cloud storage devices, and hybrids of these categories such as magnetic/optical storage devices.
Настоящее изобретение охватывает применение защищенных направляющих, описанных в данном документе выше, в оптимизированных функциональных ферментных системах CRISPR-Cas, описанных в данном документе.The present invention encompasses the use of the protected guides described herein above in the optimized functional CRISPR-Cas enzyme systems described herein.
Образование RISC посредством конструирования направляющихRISC formation through guide design
В некоторых вариантах осуществления направляющая может быть защищенной направляющей (например, pgRNA) или сопровождаемой направляющей (например, esgRNA), как описано в данном документе. В некоторых вариантах осуществления обе из них используются в RISC. RISC представляет собой ключевой компонент RNAi. RISC (индуцируемый РНК комплекс сайленсинга) представляет собой мультибелковый, точнее говоря рибонуклеопротеиновый, комплекс, в который входит одна нить фрагмента двухнитевой РНК (dsRNA), такой как малая интерферирующая РНК (siRNA) или микроРНК (miRNA), которая действует в качестве матрицы для RISC для распознавания комплементарного траснкрипта матричной РНК (мРНК). мРНК при этом расщепляется под действием одного из компонентов RISC.In some embodiments, the guide may be a protected guide (e.g., pgRNA) or a chaperoned guide (e.g., esgRNA), as described herein. In some embodiments, both are used in RISC. RISC is a key component of RNAi. RISC (RNA-induced silencing complex) is a multiprotein, more specifically a ribonucleoprotein, complex that includes one strand of a double-stranded RNA (dsRNA) fragment, such as a small interfering RNA (siRNA) or a microRNA (miRNA), which acts as a template for RISC to recognize a complementary messenger RNA (mRNA) transcript. The mRNA is then cleaved by one of the RISC components.
В связи с этим, образование RISC является преимущественным в некоторых вариантах осуществления. Направляющие РНК в соответствии с различными аспектами настоящего изобретения, включая без ограничения защищенные и/или сопровождаемые направляющие РНК, можно адаптировать для включения РНК-нуклеотидов, которые содействуют образованию RISC, например, в комбинации с siRNA или miRNA, которые могут обеспечиваться или могут, например, уже экспрессироваться в клетке. Это может быть применимо, например, в качестве самоинактивирующейся системы для удаления или разрушения направляющей.In this regard, the formation of RISC is advantageous in some embodiments. Guide RNAs according to various aspects of the present invention, including but not limited to protected and/or escorted guide RNAs, can be adapted to include RNA nucleotides that promote the formation of RISC, for example in combination with siRNA or miRNA, which can be provided or can, for example, already be expressed in the cell. This can be useful, for example, as a self-inactivating system for removing or destroying the guide.
При этом направляющая РНК может содержать последовательность, комплементарную целевой miRNA или siRNA, которая может присутствовать в клетке или может не присутствовать в ней. Таким образом, только когда присутствует miRNA или siRNA, например, в результате экспрессии (в клетке или посредством вмешательства человека), наблюдается связывание последовательности РНК с miRNA или siRNA, что затем приводит к расщеплению направляющей РНК под действием индуцируемого РНК комплекса сайленсинга (RISC) в клетке. Следовательно, в некоторых вариантах осуществления направляющая РНК содержит последовательность РНК, комплементарную целевой miRNA или siRNA, и связывание последовательности направляющей РНК с целевой miRNA или siRNA приводит к расщеплению направляющей РНК под действием индуцируемого РНК комплекса сайленсинга (RISC) в клетке.In this case, the guide RNA may comprise a sequence complementary to a target miRNA or siRNA, which may or may not be present in the cell. Thus, only when the miRNA or siRNA is present, for example, as a result of expression (in the cell or through human intervention), is binding of the RNA sequence to the miRNA or siRNA observed, which then leads to cleavage of the guide RNA by the RNA-induced silencing complex (RISC) in the cell. Therefore, in some embodiments, the guide RNA comprises an RNA sequence complementary to the target miRNA or siRNA, and binding of the guide RNA sequence to the target miRNA or siRNA leads to cleavage of the guide RNA by the RNA-induced silencing complex (RISC) in the cell.
Это дополнительно объяснено ниже с конкретной ссылкой как на защищенные, так и на сопровождаемые направляющие.This is further explained below with specific reference to both protected and accompanied guides.
Образование RISC с применением защищенных направляющихRISC formation using protected guides
Например, защищенная направляющая может быть описана в следующем аспекте: сконструированная, не встречающаяся в природе композиция, содержащая систему CRISPR на основе (Cas), ассоциированного с короткими палиндромными повторами, регулярно расположенными группами (CRISPR) (CRISPR-Cas), с полинуклеотидной последовательностью, защищенной направляющей РНК (pgRNA), содержащей (a) защитную последовательность, (b) направляющую последовательность, способную гибридизироваться с целевой последовательностью в эукариотической клетке, (c) парную tracr-последовательность и (d) tracr-последовательность, где (a), (b), (c) и (d) расположены в ориентации 5' - 3', где защитная последовательность содержит два или более нуклеотидов, которые некомплементарны целевой последовательности, где, будучи транскрибированной, парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, где комплекс CRISPR содержит белок Cas9 II типа в комплексе с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) парной tracr-последовательностью, которая гибридизируется с tracr-последовательностью, и где полинуклеотидная последовательность одной или нескольких из направляющей, tracr- и парной tracr-последовательности модифицирована.For example, a protected guide may be described in the following aspect: an engineered, non-naturally occurring composition comprising a clustered regularly interspaced short palindromic repeats (Cas)-associated CRISPR system (CRISPR-Cas) with a polynucleotide sequence protected by a guide RNA (pgRNA) comprising (a) a guard sequence, (b) a guide sequence capable of hybridizing to a target sequence in a eukaryotic cell, (c) a tracr mate sequence, and (d) a tracr sequence, wherein (a), (b), (c), and (d) are arranged in a 5' - 3' orientation, wherein the guard sequence comprises two or more nucleotides that are non-complementary to the target sequence, wherein, when transcribed, the tracr mate sequence hybridizes to the tracr sequence, and the guide sequence directs sequence-specific binding of the CRISPR complex to the target a sequence wherein the CRISPR complex comprises a type II Cas9 protein in a complex with (1) a guide sequence that hybridizes to a target sequence and (2) a tracr mate sequence that hybridizes to the tracr sequence, and wherein the polynucleotide sequence of one or more of the guide, tracr, and tracr mate sequence is modified.
В одном аспекте данную систему с защищенной направляющей применяют для защиты с помощью вторичных структур 5'-концевых удлинений sgRNA. Например, заявители удлиняют sgRNA, вследствие чего вводится сайт связывания miRNA, чтобы сделать sgRNA активной только после обработки и разрезания сайта связывания miRNA под действием аппарата комплекса RISC. Это не будет возможным без защиты с помощью вторичных структур, поскольку экзонуклеазная обработка будет начинаться с 5'-конца и обеспечивать обрезание в направлении sgRNA. Путем добавления небольшой петли с вторичной структурой в направлении 5' от добавленного сайта miRNA, miRNA может быть защищена от обрезания под действием экзонуклеаз.In one aspect, the present protected guide system is used to provide secondary structure protection of 5' extensions of sgRNA. For example, applicants extend an sgRNA, thereby introducing a miRNA binding site, to make the sgRNA active only after the miRNA binding site is processed and cut by the RISC machinery. This would not be possible without secondary structure protection, since exonuclease processing would start at the 5' end and cut in the direction of the sgRNA. By adding a small loop with secondary structure in the 5' direction of the added miRNA site, the miRNA can be protected from cutting by exonucleases.
Образование RISC с применением сопровождаемых направляющихRISC formation using guided traces
В другом примере можно описать сопровождаемую направляющую. В частности, предусмотрены esgRNA, индуцируемые miRNA. В этом случае аптамерная последовательность сопровождаемой РНК комплементарна целевой miRNA, так что, если в клетке присутствует целевая miRNA, включенная в индуцируемый РНК комплекс сайленсинга (RISC), наблюдается связывание аптамерной последовательности сопровождаемой РНК с целевой miRNA, что приводит к расщеплению esgRNA под действием индуцируемого РНК комплекса сайленсинга (RISC) в клетке.In another example, a chaperoned guide can be described. In particular, esgRNAs inducible by miRNA are provided. In this case, the aptamer sequence of the chaperoned RNA is complementary to the target miRNA, so that if the target miRNA included in the RNA-induced silencing complex (RISC) is present in the cell, the aptamer sequence of the chaperoned RNA binds to the target miRNA, which leads to cleavage of the esgRNA by the RNA-induced silencing complex (RISC) in the cell.
В альтернативных вариантах осуществления на 5'-конце esgRNA может обеспечиваться целый ряд первичных и вторичных структур, разработанных таким образом, что комплекс RISC может получить доступ к сайту связывания miRNA. esgRNA может иметь первую и вторую линкерную последовательности, расположенные в направлении 5' от защитной последовательности. В альтернативных вариантах осуществления длина каждого из линкеров 1 и 2, например, может независимо составлять 0, 1, 2, 3, или 4 нуклеотида, при этом длина защитной последовательности составляет 0, 1 или 2 нуклеотида.In alternative embodiments, a number of primary and secondary structures may be provided at the 5' end of the esgRNA designed such that the RISC complex can gain access to the miRNA binding site. The esgRNA may have a first and second linker sequence located 5' of the guard sequence. In alternative embodiments, the length of each of linkers 1 and 2, for example, may independently be 0, 1, 2, 3, or 4 nucleotides, wherein the length of the guard sequence is 0, 1, or 2 nucleotides.
В иллюстративном варианте осуществления индукцию нацеливания на esgRNA можно проиллюстрировать с применением miR-122 в системе клеток HEK.293, в которых miR-122 нативно не экспрессируется. В отсутствие экзогенной miR-122 защищенные esgRNA не опосредуют нацеленную нуклеазную активность в отношении EMX1.3. При добавлении экзогенной miR-122 (100 нг/лунка) наблюдали нацеленное разрезание EMX1.3 (в виде отчетливых продуктов расщепления, видимых как электрофоретические варианты на гелях). Это демонстрирует, что экспрессируемые на высоком уровне эндогенные miRNA можно использовать в системах, которые обеспечивают индуцируемые генетическим образом sgRNA. Любую miRNA можно применять вместо miRNA122, при этом соответствующую последовательность легко определить.In an exemplary embodiment, the induction of esgRNA targeting can be demonstrated using miR-122 in a HEK.293 cell system in which miR-122 is not natively expressed. In the absence of exogenous miR-122, protected esgRNAs do not mediate targeted nuclease activity toward EMX1.3. Upon addition of exogenous miR-122 (100 ng/well), targeted cleavage of EMX1.3 was observed (as distinct cleavage products visible as electrophoretic variants on gels). This demonstrates that highly expressed endogenous miRNAs can be used in systems that provide genetically inducible sgRNAs. Any miRNA can be used in place of miRNA122, and the appropriate sequence is easily determined.
Например, sgRNA можно связать с аптамерной последовательностью "сопровождаемой" РНК, комплементарной эндогенной целевой miRNA. Целевая miRNA может формировать индуцируемый РНК комплекс сайленсинга (RISC) в клетке. Если в клетке присутствует целевая miRNA, происходит связывание аптамерной последовательности сопровождаемой РНК с целевой miRNA, что приводит к расщеплению esgRNA под действием индуцируемого РНК комплекса сайленсинга (RISC) в клетке. Расщепление сопровождаемой последовательности высвобождает активную sgRNA.For example, an sgRNA can bind to an aptamer sequence of a "chaperone" RNA that is complementary to an endogenous target miRNA. The target miRNA can form a RNA-induced silencing complex (RISC) in the cell. If the target miRNA is present in the cell, the aptamer sequence of the chaperone RNA binds to the target miRNA, causing the cellular RISC to cleave the esgRNA. Cleavage of the chaperone sequence releases the active sgRNA.
Например, защищенную направляющую можно описать в следующем аспекте: не встречающаяся в природе или сконструированная композиция, содержащая сопровождаемую одиночную направляющую РНК (esgRNA) CRISPR-Cas9, содержащую:For example, a protected guide may be described in the following aspect: a non-naturally occurring or engineered composition comprising an escorted single guide RNA (esgRNA) of CRISPR-Cas9 comprising:
направляющую последовательность РНК, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке; иa guide RNA sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell; and
аптамерную последовательность сопровождаемой РНК,aptamer sequence of the chaperoned RNA,
где аптамерная последовательность сопровождаемой РНК предусматривает аффинность связывания в отношении лиганда аптамера на клетке или в ней, или аптамерная последовательность сопровождаемой РНК реагирует на локализованной эффектор аптамера на клетке или в ней,wherein the aptamer sequence of the chaperoned RNA provides binding affinity for an aptamer ligand on or in a cell, or the aptamer sequence of the chaperoned RNA responds to a localized effector of the aptamer on or in a cell,
где присутствие лиганда или эффектора аптамера на клетке или в ней является ограниченным во временном или пространственном отношении.wherein the presence of the ligand or effector of the aptamer on or in the cell is limited in time or space.
Сопровождающая аптамерная последовательность РНК может быть комплементарна целевой miRNA, которая может присутствовать в клетке или может не присутствовать в ней, так что, только когда целевая miRNA присутствует, наблюдается связывание сопровождающей аптамерной последовательности РНК с целевой miRNA, что приводит к расщеплению esgRNA с помощью индуцируемого РНК комплекса сайленсинга (RISC) в клетке. Следовательно, в некоторых вариантах осуществления аптамерная последовательность сопровождаемой РНК комплементарна целевой miRNA, а связывание аптамерной последовательности сопровождаемой РНК с целевой miRNA приводит к расщеплению esgRNA под действием индуцируемого РНК комплекса сайленсинга (RISC) в клетке.The chaperone aptamer RNA sequence may be complementary to a target miRNA, which may or may not be present in the cell, such that only when the target miRNA is present is binding of the chaperone aptamer RNA sequence to the target miRNA observed, resulting in cleavage of the esgRNA by the RNA-induced silencing complex (RISC) in the cell. Therefore, in some embodiments, the aptamer sequence of the chaperone RNA is complementary to the target miRNA, and binding of the aptamer sequence of the chaperone RNA to the target miRNA results in cleavage of the esgRNA by the RNA-induced silencing complex (RISC) in the cell.
В соответствии с настоящим изобретением нуклеотидная последовательность, кодирующая по меньшей мере одно из указанной направляющей РНК или белка Cas, функционально связана в клетке с регуляторным элементом, предусматривающим промотор представляющего интерес гена, в результате чего экспрессия по меньшей мере одного компонента системы CRISPR-Cas управляется промотором представляющего интерес гена. Подразумевается, что "функционально связанный" означает, что нуклеотидная последовательность, кодирующая направляющую РНК и/или Cas, связана с регуляторным(регуляторными) элементом(элементами) таким способом, который обеспечивает возможность экспрессии нуклеотидной последовательности, как также указано в других разделах данного документа. Термин "регуляторные элементы" также описан в других разделах данного документа. В соответствии с настоящим изобретением регуляторный элемент предусматривает промотор представляющего интерес гена, как, например, предпочтительно промотор представляющего интерес эндогенного гена. В определенных вариантах осуществления промотор находится в своем эндогенном положении в геноме. В таких вариантах осуществления нуклеиновая кислота, кодирующая CRISPR и/или Cas, находится под транскрипционным контролем промотора представляющего интерес гена в своем нативном положении в геноме. В других определенных вариантах осуществления промотор обеспечивается на (отдельной) молекуле нуклеиновой кислоты, такой как вектор или плазмида, или другой внехромосомной нуклеиновой кислоте, т.е. промотор не обеспечивается в своем нативном положении в геноме. В определенных вариантах осуществления промотор интегрирован в геном в ненативном положении в геноме.According to the present invention, a nucleotide sequence encoding at least one of said guide RNA or Cas protein is operably linked in a cell to a regulatory element comprising a promoter of a gene of interest, whereby expression of at least one component of the CRISPR-Cas system is driven by the promoter of the gene of interest. "Operably linked" is intended to mean that the nucleotide sequence encoding the guide RNA and/or Cas is linked to the regulatory element(s) in a manner that allows expression of the nucleotide sequence, as also described elsewhere herein. The term "regulatory elements" is also described elsewhere herein. According to the present invention, the regulatory element comprises a promoter of a gene of interest, such as, preferably, a promoter of an endogenous gene of interest. In certain embodiments, the promoter is in its endogenous position in the genome. In such embodiments, the nucleic acid encoding the CRISPR and/or Cas is under the transcriptional control of the promoter of the gene of interest at its native location in the genome. In certain other embodiments, the promoter is provided on a (separate) nucleic acid molecule, such as a vector or plasmid, or other extrachromosomal nucleic acid, i.e., the promoter is not provided at its native location in the genome. In certain embodiments, the promoter is integrated into the genome at a non-native location in the genome.
В определенных вариантах осуществления нуклеиновая кислота, кодирующая направляющую РНК, функционально связана в клетке с регуляторным элементом, предусматривающим промотор представляющего интерес гена. В определенных вариантах осуществления нуклеиновая кислота, кодирующая Cas, функционально связана в клетке с регуляторным элементом, предусматривающим промотор представляющего интерес гена. В определенных вариантах осуществления нуклеиновая кислота, кодирующая направляющую РНК, функционально связана в клетке с регуляторным элементом, предусматривающим промотор представляющего интерес гена, и нуклеиновая кислота, кодирующая Cas, функционально связана в клетке с регуляторным элементом, предусматривающим промотор представляющего интерес гена. В последнем случае промотор, управляющий экспрессией направляющей РНК и Cas, может быть таким же, или может отличаться. В определенных вариантах осуществления нуклеиновая кислота, кодирующая направляющую РНК и/или Cas, интегрирована в геном. В определенных вариантах осуществления нуклеиновая кислота, кодирующая направляющую РНК и/или Cas, является внехромосомной или эписомной. Нуклеиновая кислота, кодирующая направляющую РНК, и нуклеиновая кислота, кодирующая Cas, могут располагаться на одной и той же или различных молекулах нуклеиновой кислоты.In certain embodiments, a nucleic acid encoding a guide RNA is operably linked in a cell to a regulatory element providing a promoter of a gene of interest. In certain embodiments, a nucleic acid encoding a Cas is operably linked in a cell to a regulatory element providing a promoter of a gene of interest. In certain embodiments, a nucleic acid encoding a guide RNA is operably linked in a cell to a regulatory element providing a promoter of a gene of interest, and a nucleic acid encoding a Cas is operably linked in a cell to a regulatory element providing a promoter of a gene of interest. In the latter case, the promoter directing the expression of the guide RNA and Cas may be the same or may be different. In certain embodiments, a nucleic acid encoding a guide RNA and/or Cas is integrated into the genome. In certain embodiments, a nucleic acid encoding a guide RNA and/or Cas is extrachromosomal or episomal. The nucleic acid encoding the guide RNA and the nucleic acid encoding Cas may be located on the same or different nucleic acid molecules.
Выбранные последовательности ДНК, на которые нацеливается(нацеливаются) направляющая(направляющие) РНК в соответствии с настоящим изобретением, могут представлять собой эндогенные последовательности ДНК или экзогенные последовательности ДНК. Выбранные последовательности ДНК, такие как экзогенные последовательности ДНК, на которые нацеливается(нацеливаются) направляющая (направляющие) РНК в соответствии с настоящим изобретением, могут быть интегрированы в геном или могут быть внехромосомными (например, обеспечиваться в плазмиде или векторе). В определенных вариантах осуществления способы, описываемые в данном документе, включают введение в клетку вектора или плазмиды с помощью средств, известных их уровня техники, как описано в других разделах данного документа, причем указанный вектор или плазмида содержит указанную выбранную последовательность ДНК, а указанный способ включает обнаружение модификации указанной выбранной последовательности ДНК в указанном векторе. Будет понятно, что указанный вектор или плазмида или по меньшей мере выбранная последовательность ДНК, содержащаяся в них, могут интегрироваться в геном, как, например, с помощью случайной интеграции или путем гомологичной рекомбинации. Если последовательность выбранной целевой ДНК представляет собой эндогенную последовательность, предпочтительно, чтобы последовательность выбирали таким образом, чтобы модификация не воздействовала на (нормальное) функционирование клетки или оказывала минимальное воздействие. Специалист в данной области легко идентифицирует такие последовательности с помощью традиционного анализа или экспериментов. В любом случае предпочтительно, чтобы такая последовательность выбранной эндогенной целевой ДНК не располагалась в кодирующей последовательности или ORF гена и/или не располагалась в регуляторных последовательностях гена (таких как промоторы, энхансеры, сайленсеры и т.д.).The selected DNA sequences targeted by the guide RNA(s) of the present invention may be endogenous DNA sequences or exogenous DNA sequences. The selected DNA sequences, such as exogenous DNA sequences targeted by the guide RNA(s) of the present invention, may be integrated into the genome or may be extrachromosomal (e.g., provided in a plasmid or vector). In certain embodiments, the methods described herein comprise introducing a vector or plasmid into a cell by means known in the art, as described elsewhere herein, wherein said vector or plasmid comprises said selected DNA sequence, and said method comprises detecting a modification of said selected DNA sequence in said vector. It will be understood that said vector or plasmid or at least a selected DNA sequence contained therein may integrate into the genome, such as by random integration or by homologous recombination. If the selected target DNA sequence is an endogenous sequence, it is preferred that the sequence is selected such that the modification does not affect the (normal) functioning of the cell or has a minimal effect. Such sequences are readily identified by a person skilled in the art by conventional analysis or experimentation. In any case, it is preferred that such a selected endogenous target DNA sequence is not located in the coding sequence or ORF of a gene and/or is not located in regulatory sequences of a gene (such as promoters, enhancers, silencers, etc.).
Как описано в других разделах данного документа, последовательность выбранной целевой ДНК модифицирована под действием функционального комплекса CRISPR (т.е. направляющая РНК находится в комплексе с белком Cas, где направляющая РНК содержит направляющую последовательность, парную tracr-последовательность и tracr-последовательность в ориентации 5' - 3', где tracr-последовательность может располагаться на той же молекуле нуклеиновой кислоты, что и направляющая последовательность и парная tracr-последовательность, или может не располагаться). Используемый в данном документе термин "модифицированная", по сути, соответствует термину "мутированная", т.е. последовательность нуклеиновой кислоты последовательности целевой ДНК изменена, как описано в других разделах данного документа, например, содержит точечные мутации, делеции, замены или вставки одного или нескольких нуклеотидов.As described elsewhere in this document, the selected target DNA sequence is modified by a functional CRISPR complex (i.e., the guide RNA is in a complex with a Cas protein, wherein the guide RNA comprises a guide sequence, a tracr mate sequence, and a tracr sequence in a 5' to 3' orientation, wherein the tracr sequence may or may not be located on the same nucleic acid molecule as the guide sequence and the tracr mate sequence). As used herein, the term "modified" is generally understood to mean "mutated," i.e., the nucleic acid sequence of the target DNA sequence is altered as described elsewhere in this document, such as by point mutations, deletions, substitutions, or insertions of one or more nucleotides.
Однако, как описано в других разделах данного документа, также будет очевидно, что в определенных вариантах осуществления выражение "модифицированный" соответствует изменениям целевых локусов, таким как активация или репрессия транскрипции гена, метилирование или деметилирование сайтов CpG и т.п., для которых могут не требоваться точечные мутации, делеции, замены или вставки одного или нескольких нуклеотидов. Более того, как описано в других разделах данного документа, также будет очевидно, что ссылка на фермент CRISPR-Cas как "изменяющий" или "модифицирующий" один или несколько целевых полинуклеотидных локусов охватывает прямое изменение или модификацию, например, посредством каталитической активности фермента самого по себе, но также непрямое изменение или модификацию, например, посредством каталитической активности, ассоциированной с ферментом CRISPR-Cas, как, например, таковой гетерологичного функционального домена, например, домена активации транскрипции. Кроме того, как будет понятно, подразумевается, что один или несколько целевых полинуклеотидных локусов, которые "изменены" или "модифицированы" под действием фермента CRISPR-Cas, могут содержаться в полинуклеотидной последовательности, комплементарной части направляющей РНК, представляющей собой направляющую последовательность, или вблизи нее, например, в вариантах осуществления, где изменение или модификация осуществляются с помощью каталитической активности фермента CRISPR-Cas самого по себе, например, расщепление ДНК с помощью нуклеазной активности фермента CRISPR-Cas. Однако также охватываются варианты осуществления, где один или несколько целевых локусов, которые необходимо "изменить" или "модифицировать", находятся в определенном положении, отличном от последовательности, комплементарной части направляющей РНК, представляющей собой направляющую последовательность, например, в вариантах осуществления, где изменение или модификация осуществляются посредством гетерологичного функционального домена, ассоциированного с ферментом CRISPR-Cas, например, активация или репрессия транскрипции гена. В связи с этим, "изменение" или "модификация" (или аналогичные термины) целевого локуса означает, что это обеспечивается посредством прямого или непрямого действия фермента CRISPR-Cas, и более того, "целевой локус", который необходимо изменить или модифицировать, и "целевая последовательность", которая комплементарна части направляющей РНК, представляющей собой направляющую последовательность, могут быть одинаковыми или могут не быть одинаковыми.However, as described elsewhere herein, it will also be appreciated that in certain embodiments, the term "modified" corresponds to alterations of target loci, such as activation or repression of gene transcription, methylation or demethylation of CpG sites, and the like, which may not require point mutations, deletions, substitutions, or insertions of one or more nucleotides. Moreover, as described elsewhere herein, it will also be appreciated that reference to a CRISPR-Cas enzyme as "altering" or "modifying" one or more target polynucleotide loci encompasses a direct alteration or modification, such as by the catalytic activity of the enzyme itself, but also an indirect alteration or modification, such as by a catalytic activity associated with the CRISPR-Cas enzyme, such as that of a heterologous functional domain, such as a transcriptional activation domain. In addition, as will be appreciated, it is contemplated that one or more target polynucleotide loci that are "altered" or "modified" by the action of a CRISPR-Cas enzyme may be contained within or near a polynucleotide sequence complementary to a portion of a guide RNA that is a guide sequence, such as in embodiments where the alteration or modification is accomplished by the catalytic activity of the CRISPR-Cas enzyme itself, such as cleavage of DNA by the nuclease activity of the CRISPR-Cas enzyme. However, embodiments are also encompassed where one or more target loci to be "altered" or "modified" are located at a specific position other than a sequence complementary to a portion of a guide RNA that is a guide sequence, such as in embodiments where the alteration or modification is accomplished by a heterologous functional domain associated with the CRISPR-Cas enzyme, such as activation or repression of gene transcription. In this regard, "altering" or "modifying" (or similar terms) a target locus means that this is achieved through the direct or indirect action of the CRISPR-Cas enzyme, and furthermore, the "target locus" to be altered or modified and the "target sequence" that is complementary to the portion of the guide RNA that is the guide sequence may or may not be the same.
В определенных вариантах осуществления в способах в соответствии с настоящим изобретением, описываемых в данном документе, система CRISPR-Cas является мультиплексной, т.е. могут обеспечиваться множественные различные направляющие РНК. Каждая направляющая РНК может нацеливаться (т.е. гибридизироваться) с отличающейся выбранной ДНК-мишенью. Экспрессия различных направляющих РНК может управляться промоторами различных представляющих интерес генов. В соответствии с этим, в определенных вариантах осуществления способы по настоящему изобретению, описываемые в данном документе, представляют собой способы определения экспрессии более чем одного, как, например, по меньшей мере двух представляющих интерес генов в клетке, включающие обеспечение клетки, содержащей систему CRISPR-Cas, причем указанная система CRISPR-Cas содержит более одной, как, например, по меньшей мере две направляющие РНК, которые нацеливаются на отличающуюся выбранную последовательность ДНК, а белок Cas способен модифицировать выбранную последовательность ДНК; при этом каждая направляющая РНК функционально связана в клетке с регуляторным элементом, предусматривающим промотор отличающегося представляющего интерес гена; и определение экспрессии указанные представляющих интерес генов исходя из обнаружения модификации указанных соответствующих выбранных последовательностей ДНК. В определенных вариантах осуществления более одной отличающейся направляющей РНК могут быть функционально связаны в клетке с регуляторным элементом, предусматривающим промотор, того же представляющего интерес гена. Разные направляющие РНК могут обеспечиваться на разных молекулах нуклеиновой кислоты или на одной и той же молекуле нуклеиновой кислоты. Соответствующие направляющие РНК можно разрабатывать таким образом, что только модификация первой выбранной целевой ДНК создает или разрушает вторую выбранную целевую ДНК.In certain embodiments, in the methods of the invention described herein, the CRISPR-Cas system is multiplexed, i.e., multiple different guide RNAs can be provided. Each guide RNA can target (i.e., hybridize to) a different selected target DNA. The expression of the different guide RNAs can be driven by promoters of different genes of interest. Accordingly, in certain embodiments, the methods of the invention described herein are methods of detecting the expression of more than one, such as at least two, genes of interest in a cell, comprising providing a cell comprising a CRISPR-Cas system, wherein the CRISPR-Cas system comprises more than one, such as at least two, guide RNAs that target a different selected DNA sequence, and the Cas protein is capable of modifying the selected DNA sequence; wherein each guide RNA is operably linked in the cell to a regulatory element that provides a promoter of a different gene of interest; and determining the expression of said genes of interest based on the detection of a modification of said respective selected DNA sequences. In certain embodiments, more than one different guide RNA may be operably linked in a cell to a regulatory element providing a promoter of the same gene of interest. The different guide RNAs may be provided on different nucleic acid molecules or on the same nucleic acid molecule. The respective guide RNAs may be designed such that only a modification of a first selected target DNA creates or destroys a second selected target DNA.
В определенных вариантах осуществления один или несколько компонентов системы CRISPR-Cas могут экспрессироваться в клетке в зависимости от условий (например, тканеспецифичная или специфичная к типу клеток экспрессия) и/или индуцируемым способом (например, химически индуцируемая экспрессия). Системы с индуцируемой зависимой от условий экспрессией описаны в других разделах данного документа. В конкретных вариантах осуществления одна или несколько направляющих РНК могут экспрессироваться в клетке в зависимости от условий и/или индуцируемым способом. В конкретных предпочтительных вариантах осуществления Cas может экспрессироваться в клетке в зависимости от условий и/или индуцируемым способом.In certain embodiments, one or more components of a CRISPR-Cas system may be expressed in a cell in a conditionally dependent manner (e.g., tissue-specific or cell type-specific expression) and/or in an inducible manner (e.g., chemically inducible expression). Conditionally inducible expression systems are described elsewhere herein. In particular embodiments, one or more guide RNAs may be expressed in a cell in a conditionally dependent manner and/or in an inducible manner. In particularly preferred embodiments, Cas may be expressed in a cell in a conditionally dependent manner and/or in an inducible manner.
Используемый в данном документе термин "нацеливание" выбранной последовательности ДНК означает, что направляющая РНК способна гибридизироваться с выбранной последовательностью ДНК. Как используется в данном документе, "гибридизация" или "осуществление гибридизации" обозначает реакцию, при которой один или несколько полинуклеотидов реагируют с образованием комплекса, который стабилизируется посредством образования водородных связей между основаниями нуклеотидных остатков. Образование водородных связей может происходить по принципу образования пар по Уотсону-Крику, Хугстиновского связывания или посредством любого другого специфичного к последовательности способа. Комплекс может содержать две нити, образующие дуплексную структуру, три или более нитей, образующих многонитевой комплекс, одиночную самогибридизирующуюся нить или любую их комбинацию. Реакция гибридизации может представлять собой стадию более масштабном процессе, такую как начальная стадия PGR или расщепление полинуклеотида под действием фермента. Последовательность, способную к гибридизации с данной последовательностью, называют "комплементарной последовательностью" для данной последовательности.As used herein, the term "targeting" a selected DNA sequence means that the guide RNA is capable of hybridizing to the selected DNA sequence. As used herein, "hybridization" or "hybridization" refers to a reaction in which one or more polynucleotides react to form a complex that is stabilized by hydrogen bonding between the bases of the nucleotide residues. The hydrogen bonding may occur by Watson-Crick base pairing, Hoogsteen bonding, or any other sequence-specific method. The complex may comprise two strands forming a duplex structure, three or more strands forming a multistranded complex, a single self-hybridizing strand, or any combination thereof. The hybridization reaction may be a step in a larger process, such as the initial step of PGR or the cleavage of a polynucleotide by an enzyme. A sequence capable of hybridizing to a given sequence is referred to as a "complementary sequence" for the sequence.
Используемое в данном документе выражение "экспрессия" или "осуществление экспрессии" означает процесс, при котором полинуклеотид транскрибируется с ДНК-матрицы (как, например, с образованием мРНК или другого РНК-транскрипта), и/или процесс, посредством которого транскрибированная мРНК далее транслируется с образованием пептидов, полипептидов или белков. Транскрипты и закодированные полипептиды можно в совокупности называть "продуктом гена". Если полинуклеотид получен из геномной ДНК, то экспрессия может включать сплайсинг мРНК в эукариотической клетке. Как используется в данном документе, "экспрессия" гена или нуклеиновой кислоты охватывает не только экспрессию генов в клетках, но также транскрипцию и трансляцию нуклеиновой(нуклеиновых) кислоты(кислот) в системах клонирования и в любом другом контексте.As used herein, the term "expression" or "causing expression" means the process by which a polynucleotide is transcribed from a DNA template (such as to form mRNA or other RNA transcripts) and/or the process by which the transcribed mRNA is further translated to form peptides, polypeptides, or proteins. The transcripts and encoded polypeptides may be referred to collectively as the "gene product." If the polynucleotide is derived from genomic DNA, expression may involve splicing of mRNA in a eukaryotic cell. As used herein, "expression" of a gene or nucleic acid encompasses not only the expression of genes in cells, but also the transcription and translation of nucleic acid(s) in cloning systems and in any other context.
Термины "полипептид", "пептид" и "белок" используются в данном документе взаимозаменяемо для обозначения полимеров из аминокислот любой длины. Полимер может быть линейным или разветвленным, он может содержать модифицированные аминокислоты, и его структура может прерываться отличными от аминокислот компонентами. Термины также охватывают полимер из аминокислот, который был модифицирован; например, образованием дисульфидных связей, гликозилированием, липидизацией, ацетилированием, фосфорилированием или любой другой манипуляцией, как, например, соединением с компонентом для мечения. Используемый в данном документе термин "аминокислота" включает природные и/или отличные от природных или синтетические аминокислоты, в том числе глицин и как D-, так и I-оптические изомеры, и аналоги аминокислот, и пептидомиметики.The terms "polypeptide", "peptide" and "protein" are used interchangeably herein to refer to polymers of amino acids of any length. The polymer may be linear or branched, it may contain modified amino acids and its structure may be interrupted by components other than amino acids. The terms also encompass a polymer of amino acids that has been modified; for example, by disulfide bonding, glycosylation, lipidation, acetylation, phosphorylation or any other manipulation such as coupling with a labeling component. As used herein, the term "amino acid" includes natural and/or non-natural or synthetic amino acids, including glycine and both the D- and I-optical isomers, and amino acid analogs and peptidomimetics.
Термины "субъект", "индивидуум" и "пациент" используются в данном документе взаимозаменяемо для обозначения позвоночного, предпочтительно млекопитающего, более предпочтительно человека. Млекопитающие включают без ограничения мышей, обезьян, людей, сельскохозяйственных животных, животных для спорта и домашних животных. Также охватываются ткани, клетки и их потомство биологического организма, полученные in vivo или культивированные in vitro.The terms "subject," "individual," and "patient" are used interchangeably herein to refer to a vertebrate, preferably a mammal, more preferably a human. Mammals include, but are not limited to, mice, monkeys, humans, farm animals, sport animals, and pets. Also included are tissues, cells, and progeny thereof, of a biological organism, whether obtained in vivo or cultured in vitro.
В определенных вариантах осуществления способы и клетки в соответствии с настоящим изобретением, описываемые в данном документе, можно применять в способах скрининга терапевтических средств и/или в диагностических способах. Кандидатные терапевтические средства могут характеризоваться различным влиянием на временные профили экспрессии, которые могут регистрироваться в соответствии со способами, описываемыми в данном документе.In certain embodiments, the methods and cells of the present invention described herein can be used in methods for screening therapeutic agents and/or diagnostic methods. Candidate therapeutic agents can have different effects on temporal expression profiles that can be recorded according to the methods described herein.
Термины "терапевтическое средство", "оказывающее терапевтический эффект средство" или "средство для лечения" используются взаимозаменяемо, и они означают молекулу или соединение, которые оказывают некоторое благоприятное воздействие при введении субъекту. Благоприятное воздействие включает возможность осуществления диагностических определений; облегчение заболевания, симптома, нарушения или патологического состояния; ослабление или предупреждение начала проявления заболевания, симптома, нарушения или состояния; а также общее противодействие заболеванию, симптому, нарушению или патологическому состоянию.The terms "therapeutic agent", "agent producing a therapeutic effect", or "agent for treating" are used interchangeably and mean a molecule or compound that produces some beneficial effect when administered to a subject. Beneficial effects include the ability to make diagnostic determinations; alleviate a disease, symptom, disorder, or condition; reduce or prevent the onset of a disease, symptom, disorder, or condition; and generally counteract a disease, symptom, disorder, or condition.
Как используется в данном документе, "лечение", или "осуществление лечения", или "временное ослабление", или "облегчение" используются взаимозаменяемо. Эти термины обозначают подход для получения благоприятных или требуемых результатов, в том числе без ограничения терапевтического эффекта и/или профилактического эффекта. Под терапевтическим эффектом понимают любое терапевтически значимое улучшение или воздействие в отношении одного или нескольких заболеваний, состояний или симптомов, лечение которых осуществляют. Для профилактического эффекта композиции можно вводить субъекту с риском развития конкретного заболевания, состояния или симптома или субъекту, который сообщает об одном или нескольких физиологических симптомах заболевания, даже если заболевание, состояние или симптом могли еще не проявиться.As used herein, "treating" or "treating" or "alleviating" or "alleviating" are used interchangeably. These terms refer to an approach to obtaining beneficial or desired results, including but not limited to a therapeutic effect and/or a prophylactic effect. A therapeutic effect is understood to mean any therapeutically significant improvement or effect with respect to one or more diseases, conditions or symptoms being treated. For a prophylactic effect, the compositions may be administered to a subject at risk of developing a particular disease, condition or symptom or to a subject who reports one or more physiological symptoms of the disease, even though the disease, condition or symptom may not have manifested yet.
Используемые в данном документе термины "химерная РНК", "химерная направляющая РНК", "направляющая РНК", "одиночная направляющая РНК" и "синтетическая направляющая РНК" обозначают полинуклеотидную последовательность, содержащую направляющую последовательность, tracr-последовательность и парную tracr-последовательность. Термин "направляющая последовательность" обозначает последовательность длиной приблизительно 20 п. о. в пределах направляющей РНК, которая определяет целевой сайт, и его можно использовать взаимозаменяемо с терминами "направляющая" или "спейсер". Термин "парная tracr-последовательность" также можно использовать взаимозаменяемо с термином "прямой(прямые) повтор(повторы)". Направляющая последовательность, tracr- и парная tracr-последовательность могут обеспечиваться на одной молекуле нуклеиновой кислоты. Альтернативно направляющая и парная tracr-последовательность могут обеспечиваться на одной молекуле нуклеиновой кислоты, тогда как tracr-последовательность обеспечивается на отдельной молекуле нуклеиновой кислоты.As used herein, the terms "chimeric RNA", "chimeric guide RNA", "guide RNA", "single guide RNA" and "synthetic guide RNA" refer to a polynucleotide sequence comprising a guide sequence, a tracr sequence and a tracr mate sequence. The term "guide sequence" refers to a sequence of approximately 20 bp within the guide RNA that defines a target site and can be used interchangeably with the terms "guide" or "spacer". The term "tracr mate sequence" can also be used interchangeably with the term "direct repeat(s)". The guide sequence, tracr and tracr mate sequence can be provided on a single nucleic acid molecule. Alternatively, the guide and tracr mate sequences may be provided on a single nucleic acid molecule, while the tracr sequence is provided on a separate nucleic acid molecule.
В целом, система CRISPR-Cas или CRISPR представляет собой применяемую в вышеупомянутых документах, таких как WO 2014/093622 (PCT/US2013/074667), и обозначает в совокупности транскрипты и другие элементы, вовлеченные в экспрессию или управление активностью CRISPR-ассоциированных ("Cas") генов, включая последовательности, кодирующие ген Cas, tracr- (транс-активирующую CRISPR) последовательность (например, tracrRNA или активную частичную tracrRNA), парную tracr-последовательность (охватывающую "прямой повтор" и tracrRNA-процессированный частичный прямой повтор в контексте эндогенной системы CRISPR), направляющую последовательность (также обозначаемую как "спейсер" в контексте эндогенной системы CRISPR), или "РНК", в смысле термина, используемого в данном документе (например, РНК для направления Cas, такого как Cas9, например, РНК CRISPR и трансактивирующая (tracr) РНК или одиночная направляющая РНК (sgRNA) (химерная РНК)), или другие последовательности и транскрипты из локуса CRISPR. В целом, система CRISPR характеризуется элементами, которые содействуют образованию комплекса CRISPR в сайте целевой последовательности (также называемой протоспейсер в контексте эндогенной системы CRISPR). В контексте образования комплекса CRISPR "целевая последовательность" обозначает последовательность, относительно которой разрабатывается направляющая последовательность таким образом, чтобы обладать комплементарностью, при этом гибридизация между целевой последовательностью и направляющей последовательностью содействует образованию комплекса CRISPR. Целевая последовательность может содержать любой полинуклеотид, как, например, полинуклеотиды ДНК или РНК. В некоторых вариантах осуществления целевая последовательность расположена в ядре или цитоплазме клетки. В некоторых вариантах осуществления прямые повторы можно идентифицировать in silico посредством поиска повторяющихся мотивов, которые соответствуют какому-либо или всем из следующих критериев: 1. находятся в окне размером 2 т. о. в геномной последовательности, фланкирующей локус CRISPR II типа; 2. охватывают от 20 до 50 п. о. и 3. чередуются с фрагментами из 20-50 п. о. В некоторых вариантах осуществления могут применяться 2 из этих критериев, например, 1 и 2, 2 и 3 или 1 и 3. В некоторых вариантах осуществления могут применяться все 3 критерия.In general, a CRISPR-Cas or CRISPR system is as used in the above-mentioned documents such as WO 2014/093622 (PCT/US2013/074667), and refers collectively to transcripts and other elements involved in the expression or control of the activity of CRISPR-associated ("Cas") genes, including sequences encoding a Cas gene, a tracr (trans-activating CRISPR) sequence (e.g., tracrRNA or active partial tracrRNA), a tracr mate sequence (encompassing a "direct repeat" and a tracrRNA-processed partial direct repeat in the context of an endogenous CRISPR system), a guide sequence (also referred to as a "spacer" in the context of an endogenous CRISPR system), or "RNA" as that term is used herein (e.g., RNA for targeting Cas such as Cas9, e.g., CRISPR RNA and trans-activating (tracr) RNA or single guide RNA (sgRNA) (chimeric RNA)), or other sequences and transcripts from a CRISPR locus. In general, a CRISPR system is characterized by elements that facilitate the formation of a CRISPR complex at the site of a target sequence (also referred to as a protospacer in the context of the endogenous CRISPR system). In the context of CRISPR complex formation, a "target sequence" refers to a sequence to which a guide sequence is designed to be complementary, wherein hybridization between the target sequence and the guide sequence facilitates the formation of a CRISPR complex. The target sequence may comprise any polynucleotide, such as DNA or RNA polynucleotides. In some embodiments, the target sequence is located in the nucleus or cytoplasm of the cell. In some embodiments, direct repeats can be identified in silico by searching for repeat motifs that meet any or all of the following criteria: 1. are within a 2 kb window of genomic sequence flanking a Type II CRISPR locus; 2. span from 20 to 50 bp; and 3. alternate with fragments of 20-50 bp. In some embodiments, 2 of these criteria may apply, such as 1 and 2, 2 and 3, or 1 and 3. In some embodiments, all 3 criteria may apply.
В вариантах осуществления настоящего изобретения термины направляющая последовательность и направляющая РНК, т.е. РНК, способная направлять Cas на целевой локус генома, используются взаимозаменяемо, как в вышеупомянутых процитированных документах, таких как WO 2014/093622 (PCT/US2013/074667). В целом, направляющая последовательность представляет собой любую полинуклеотидную последовательность, обладающую достаточной комплементарностью с целевой полинуклеотидной последовательностью для гибридизации с целевой последовательностью и управления специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью. В некоторых вариантах осуществления степень комплементарности между направляющей последовательностью и ее соответствующей целевой последовательностью при оптимальном выравнивании с применением подходящего алгоритма выравнивания составляет приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% или больше. Оптимальное выравнивание можно определять с применением любого подходящего алгоритма для выравнивания последовательностей, к неограничивающим примерам которого относится алгоритм Смита-Ватермана, алгоритм Нидлмана-Вунша, алгоритмы, основанные на преобразовании Барроуза-Уилера (например, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies; доступный на сайте www.novocraft.com), ELAND (Illumina, Сан-Диего, Калифорния), SOAP (доступный на сайте soap.genomics.org.cn) и Maq (доступный на сайте maq.sourceforge.net). В некоторых вариантах осуществления длина направляющей последовательности составляет приблизительно или более чем приблизительно 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 или более нуклеотидов. В некоторых вариантах осуществления длина направляющей последовательности составляет менее чем приблизительно 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 или менее нуклеотидов. Предпочтительно длина направляющей последовательности составляет 10-30 нуклеотидов. Способность направляющей последовательности управлять специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью можно оценить с помощью любого подходящего анализа. Например, компоненты системы CRISPR, достаточные для образования комплекса CRISPR, в том числе направляющая последовательность, подлежащая тестированию, могут быть обеспечены в клетке-хозяине, имеющей соответствующую целевую последовательностью, как, например, с помощью трансфекции векторами, кодирующими компоненты последовательности CRISPR, с последующей оценкой предпочтительного расщепления в пределах целевой последовательности, как, например, с помощью анализа с использованием нуклеазы Surveyor, описываемого в данном документе. Аналогично, расщепление целевой полинуклеотидной последовательности можно определять в пробирке путем обеспечения целевой последовательности, компонентов комплекса CRISPR, в том числе направляющей последовательности, подлежащей тестированию, и контрольной направляющей последовательности, отличной от тестируемой направляющей последовательности, и сравнения связывания или степени расщепления целевой последовательности в случае реакций с тестируемой и контрольной направляющей последовательностью. Возможны и другие анализы, и они могут быть выполнены специалистами в данной области.In embodiments of the present invention, the terms guide sequence and guide RNA, i.e., RNA capable of directing Cas to a target locus in the genome, are used interchangeably, as in the above-mentioned cited documents such as WO 2014/093622 (PCT/US2013/074667). In general, a guide sequence is any polynucleotide sequence that has sufficient complementarity to a target polynucleotide sequence to hybridize to the target sequence and direct sequence-specific binding of a CRISPR complex to the target sequence. In some embodiments, the degree of complementarity between a guide sequence and its corresponding target sequence when optimally aligned using a suitable alignment algorithm is about or greater than about 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%, or more. An optimal alignment can be determined using any suitable sequence alignment algorithm, including, but not limited to, the Smith-Waterman algorithm, the Needleman-Wunsch algorithm, algorithms based on the Burrows-Wheeler transform (e.g., Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies; available at www.novocraft.com), ELAND (Illumina, San Diego, CA), SOAP (available at soap.genomics.org.cn), and Maq (available at maq.sourceforge.net). In some embodiments, the length of the guide sequence is about or more than about 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 or more nucleotides. In some embodiments, the length of the guide sequence is less than about 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 or less nucleotides. Preferably, the length of the guide sequence is 10-30 nucleotides. The ability of the guide sequence to direct sequence-specific binding of the CRISPR complex to a target sequence can be assessed using any suitable assay. For example, components of a CRISPR system sufficient to form a CRISPR complex, including a guide sequence to be tested, can be provided to a host cell having an appropriate target sequence, such as by transfection with vectors encoding components of the CRISPR sequence, followed by assessment of preferential cleavage within the target sequence, such as by the Surveyor nuclease assay described herein. Similarly, cleavage of a target polynucleotide sequence can be determined in vitro by providing a target sequence, components of a CRISPR complex, including a guide sequence to be tested, and a control guide sequence different from the test guide sequence, and comparing binding or the extent of cleavage of the target sequence in reactions with the test and control guide sequences. Other assays are possible and can be performed by those skilled in the art.
Направляющая последовательность, т.е. РНК, способная направлять Cas в целевой локус генома, может быть выбрана так, чтобы нацеливаться на любую целевую последовательность. В некоторых вариантах осуществления целевая последовательность является последовательностью в пределах генома клетки. Иллюстративные целевые последовательности включают последовательности, которые являются уникальными в целевом геноме. Например, для Cas9 S. pyogenes уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 в виде MMMMMMMMNNNNNNNNNNNNXGG, где NNNNNNNNNNNNXGG (N представляет собой A, G, T или C; а X может быть любым) характеризуется единичным появлением в геноме. Уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 S. pyogenes в виде MMMMMMMMMNNNNNNNNNNNXGG, где NNNNNNNNNNNXGG (N представляет собой A, G, T или C; а X может быть любым) характеризуется единичным появлением в геноме. Для Cas9 CRISPR1 S. thermophilus уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 в виде MMMMMMMMNNNNNNNNNNNNXXAGAAW, где NNNNNNNNNNNNXXAGAAW (N представляет собой A, G, T или C; X может быть любым; а W представляет собой A или T) характеризуется единичным появлением в геноме. Уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 CRISPR1 S. thermophilus в виде MMMMMMMMMNNNNNNNNNNNXXAGAAW, где NNNNNNNNNNNXXAGAAW (N представляет собой A, G, T или C; X может быть любым; а W представляет собой A или T) характеризуется единичным появлением в геноме. Для Cas9 S. pyogenes уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 в виде MMMMMMMMNNNNNNNNNNNNXGGXG, где NNNNNNNNNNNNXGGXG (N представляет собой A, G, T или C; а X может быть любым) характеризуется единичным появлением в геноме. Уникальная целевая последовательность в геноме может включать целевой сайт для Cas9 S. pyogenes в виде MMMMMMMMMNNNNNNNNNNNXGGXG, где NNNNNNNNNNNXGGXG (N представляет собой A, G, T или C; а X может быть любым) характеризуется единичным появлением в геноме. В каждой из этих последовательностей "M" может представлять собой A, G, T или C и не должен учитываться при идентификации последовательности как уникальной. В некоторых вариантах осуществления направляющая последовательность выбрана для снижения доли вторичной структуры в пределах направляющей последовательности. В некоторых вариантах осуществления приблизительно или менее чем приблизительно 75%, 50%, 40%, 30%, 25%, 20%, 15%, 10%, 5%, 1% или меньше нуклеотидов направляющей последовательности участвуют в самокомплементарном образовании пар оснований при оптимальном сворачивании. Оптимальное сворачивание можно определить с помощью любого подходящего алгоритма сворачивания полинуклеотида. Некоторые программы основаны на вычислении минимальной свободной энергии Гиббса. Примером одного такого алгоритма является mFold, который описан Zuker и Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Другим примером алгоритма сворачивания является доступный в режиме онлайн веб-сервер RNAfold, разработанный в Институте теоретической химии при Венском университете, использующий алгоритм прогнозирования структуры на основе центроидного способа (см., например, A.R. Gruber et al., 2008, Cell 106(1): 23-24; и PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62).A guide sequence, i.e., an RNA capable of directing Cas to a target locus in the genome, can be selected to target any target sequence. In some embodiments, the target sequence is a sequence within the genome of a cell. Exemplary target sequences include sequences that are unique in the target genome. For example, for S. pyogenes Cas9, a unique target sequence in the genome can include a Cas9 target site of the form MMMMMMMMNNNNNNNNNNNNXGG, where NNNNNNNNNNNNXGG (N is A, G, T, or C; and X can be any) is characterized by a single occurrence in the genome. A unique target sequence in the genome may include a target site for S. pyogenes Cas9 of the form MMMMMMMMMNNNNNNNNNNNXGG, where NNNNNNNNNNNXGG (N is A, G, T, or C; and X can be anything) has a single occurrence in the genome. For S. thermophilus CRISPR1 Cas9, a unique target sequence in the genome may include a target site for Cas9 of the form MMMMMMMMNNNNNNNNNNNNXXAGAAW, where NNNNNNNNNNNNXXAGAAW (N is A, G, T, or C; X can be anything; and W is A or T) has a single occurrence in the genome. A unique target sequence in the genome may include a target site for S. thermophilus CRISPR1 Cas9 of the form MMMMMMMMMNNNNNNNNNNNXXAGAAW, where NNNNNNNNNNNXXAGAAW (N is A, G, T, or C; X can be anything; and W is A or T) has a single occurrence in the genome. For S. pyogenes Cas9, a unique target sequence in the genome may include a target site for Cas9 of the form MMMMMMMMNNNNNNNNNNNNXGGXG, where NNNNNNNNNNNNXGGXG (N is A, G, T, or C; and X can be anything) has a single occurrence in the genome. A unique target sequence in a genome may include a target site for S. pyogenes Cas9 in the form MMMMMMMMMNNNNNNNNNNNXGGXG, where NNNNNNNNNNNXGGXG (N is A, G, T, or C; and X can be any) has a single occurrence in the genome. In each of these sequences, "M" may be A, G, T, or C and should not be considered in identifying the sequence as unique. In some embodiments, the guide sequence is selected to reduce the proportion of secondary structure within the guide sequence. In some embodiments, about or less than about 75%, 50%, 40%, 30%, 25%, 20%, 15%, 10%, 5%, 1%, or less of the nucleotides of the guide sequence participate in self-complementary base pairing upon optimal folding. Optimal folding can be determined using any suitable polynucleotide folding algorithm. Some programs are based on the calculation of the minimum Gibbs free energy. An example of one such algorithm is mFold, which is described by Zuker and Stiegler (Nucleic Acids Res. 9 (1981), 133–148). Another example of a folding algorithm is the online web server RNAfold, developed at the Institute for Theoretical Chemistry at the University of Vienna, which uses a centroid-based structure prediction algorithm (see, e.g., A. R. Gruber et al., 2008, Cell 106(1): 23–24; and P. A. Carr and G. M. Church, 2009, Nature Biotechnology 27(12): 1151–62).
В целом, парная tracr-последовательность включает любую последовательность, которая характеризуется достаточной комплементарностью с tracr-последовательностью для содействия одному или нескольким из следующего: (1) вырезания направляющей последовательности, фланкированной парными tracr-последовательностями, в клетке, содержащей соответствующую tracr-последовательность; и (2) образования комплекса CRISPR в целевой последовательности, где комплекс CRISPR содержит парную tracr-последовательность, которая гибридизирована с tracr-последовательностью. В целом, степень комплементарности указана с привязкой к оптимальному выравниванию парной tracr-последовательности и tracr-последовательности по всей длине более короткой из двух последовательностей. Оптимальное выравнивание можно определить с помощью любого подходящего алгоритма выравнивания и можно дополнительно учитывать вторичные структуры, как, например, участок самокомплементарности в пределах либо tracr-последовательности, либо парной tracr-последовательности. В некоторых вариантах осуществления степень комплементарности между tracr-последовательностью и парной tracr-последовательность по всей длине более короткой из двух при оптимальном выравнивании составляет приблизительно или более чем приблизительно 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97,5%, 99% или больше. В некоторых вариантах осуществления длина tracr-последовательность составляет приблизительно или более чем приблизительно 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 или более нуклеотидов. В некоторых вариантах осуществления tracr-последовательность и парная tracr-последовательность содержатся в одном транскрипте, так что при гибридизация между ними двумя образуется транскрипт со вторичной структурой, такой как "шпилька". В одном варианте осуществления настоящего изобретения транскрипт или транскрибированная полинуклеотидная последовательность имеют по меньшей мере две или более "шпилек". В предпочтительных вариантах осуществления транскрипт имеет две, три, четыре или пять "шпилек". В дополнительном варианте осуществления настоящего изобретения транскрипт имеет не более пяти "шпилек". В шпилечной структуре часть последовательности в 5' направлении относительно концевого "N" и выше петли соответствует парной tracr-последовательности, а часть последовательности в 3' направлении относительно петли соответствует tracr-последовательности. Дополнительными неограничивающими примерами отдельных полинуклеотидов, составляющих направляющую последовательность, парную tracr-последовательность и tracr-последовательность, являются следующие (перечисленные от 5' к 3'), где "N" представляет собой основание направляющей последовательности, причем первый блок букв нижнего регистра представляет собой парную tracr-последовательность, а второй блок букв нижнего регистра представляет собой tracr-последовательность, а конечная поли-T-последовательность представляет собой терминатор транскрипции: (1) NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaagatttaGAAAtaaatcttgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT (SEQ ID NO: X); (2) NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT; (SEQ ID NO: X) (3) NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgtTTTTTT; (SEQ ID NO: X) (4) NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT; (SEQ ID NO: X) (5) NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAATAGcaagttaaaataaggctagtccgttatcaacttgaaaaagtgTTTTTTT; и (SEQ ID NO: X) (6) NNNNNNNNNNNNNNNNNNNNgttttagagctagAAATAGcaagttaaaataaggctagtccgttatcaTTTTTTTT (SEQ ID NO: X). В некоторых вариантах осуществления последовательности (1) - (3) используют в комбинации с Cas9 из CRISPR1 S. thermophilus. В некоторых вариантах осуществления последовательности (4) - (6) используют в комбинации с Cas9 из S. pyogenes. В некоторых вариантах осуществления tracr-последовательность является транскриптом, отдельным от транскрипта, содержащего парную tracr-последовательность.In general, a tracr mate sequence includes any sequence that has sufficient complementarity with a tracr sequence to facilitate one or more of the following: (1) excision of a guide sequence flanked by tracr mate sequences in a cell containing the corresponding tracr sequence; and (2) formation of a CRISPR complex at a target sequence, wherein the CRISPR complex contains a tracr mate sequence that is hybridized to the tracr sequence. In general, the degree of complementarity is specified with respect to an optimal alignment of the tracr mate sequence and the tracr sequence over the entire length of the shorter of the two sequences. The optimal alignment may be determined using any suitable alignment algorithm and may additionally take into account secondary structures, such as a region of self-complementarity within either the tracr sequence or the tracr mate sequence. In some embodiments, the degree of complementarity between the tracr sequence and the tracr mate sequence over the entire length of the shorter of the two when optimally aligned is about or more than about 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97.5%, 99% or more. In some embodiments, the length of the tracr sequence is about or more than about 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 or more nucleotides. In some embodiments, the tracr sequence and the tracr mate sequence are contained in a single transcript such that hybridization between the two produces a transcript with a secondary structure such as a hairpin. In one embodiment of the invention, the transcript or transcribed polynucleotide sequence has at least two or more hairpins. In preferred embodiments, the transcript has two, three, four or five hairpins. In a further embodiment, the transcript has no more than five hairpins. In the hairpin structure, the portion of the sequence in the 5' direction relative to the terminal "N" and upstream of the loop corresponds to the tracr mate sequence, and the portion of the sequence in the 3' direction relative to the loop corresponds to the tracr sequence. Additional non-limiting examples of individual polynucleotides comprising a guide sequence, a tracr mate sequence, and a tracr sequence are the following (listed from 5' to 3'), wherein "N" is the base of the guide sequence, the first block of lowercase letters is the tracr mate sequence, the second block of lowercase letters is the tracr sequence, and the final poly-T sequence is a transcription terminator: (1) NNNNNNNNNNNNNNNNNNNNNNgtttttgtactctcaagatttaGAAAtaaatcttgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT (SEQ ID NO: X); (2) NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT; (SEQ ID NO: X) (3) NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgtTTTTTT; (SEQ ID NO: X) (4) NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT; (SEQ ID NO: X) (5) NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAATAGcaagttaaaataaggctagtccgttatcaacttgaaaaagtgTTTTTTT; and (SEQ ID NO: X) (6) NNNNNNNNNNNNNNNNNNNNgttttagagctagAAATAGcaagttaaaataaggctagtccgttatcaTTTTTTTT (SEQ ID NO: X). In some embodiments, sequences (1) - (3) are used in combination with Cas9 from S. thermophilus CRISPR1. In some embodiments, sequences (4) - (6) are used in combination with Cas9 from S. pyogenes. In some embodiments, the tracr sequence is a transcript separate from the transcript comprising the tracr mate sequence.
В некоторых вариантах осуществления кандидатную tracrRNA можно впоследствии спрогнозировать с использованием последовательностей, которые соответствуют любому или всем из следующих критериев: 1. гомология последовательности c прямыми повторами (поиск мотива с помощью программного обеспечения Geneious с несовпадениями до 18 п. о.); 2. присутствие прогнозируемого Rho-независимого терминатора транскрипции в направлении транскрипции; и 3. устойчивая вторичная структура со "шпилькой" между tracrRNA и прямым повтором. В некоторых вариантах осуществления могут применяться 2 из этих критериев, например, 1 и 2, 2 и 3 или 1 и 3. В некоторых вариантах осуществления могут применяться все 3 критерия.In some embodiments, a candidate tracrRNA can subsequently be predicted using sequences that meet any or all of the following criteria: 1. sequence homology to direct repeats (motif search using Geneious software with mismatches of up to 18 bp); 2. the presence of a predicted Rho-independent transcription terminator in the direction of transcription; and 3. a stable hairpin secondary structure between the tracrRNA and the direct repeat. In some embodiments, 2 of these criteria may apply, such as 1 and 2, 2 and 3, or 1 and 3. In some embodiments, all 3 criteria may apply.
В некоторых вариантах осуществления конструкции химерных синтетических направляющих РНК (sgRNA) могут включать по меньшей мере 12 п. о. дуплексной структуры между прямым повтором и tracrRNA.In some embodiments, chimeric synthetic guide RNA (sgRNA) constructs may include at least a 12 bp duplex structure between the direct repeat and the tracrRNA.
РНК для направления Cas, такого как Cas9, могут предусматривать РНК CRISPR и трансактивирующую (tracr) РНК. Парная tracr- и tracr-последовательности могут быть соединены с образованием трансактивирующей (tracr) последовательности. Парную tracr- и tracr-последовательности необязательно можно разрабатывать так, чтобы они формировали одиночную направляющую РНК (sgRNA). Действительно, преимущественным является то, что РНК для направления Cas могут предусматривать химерную одиночную направляющую РНК (sgRNA). Tracr-последовательность и парная tracr-последовательность по всей длине более короткой из двух при оптимальном выравнивании могут быть комплементарны на приблизительно или более чем приблизительно 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97,5%, 99% или больше. Длина tracr-последовательности может составлять приблизительно или более чем приблизительно 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 или более нуклеотидов.RNAs for targeting Cas, such as Cas9, may comprise a CRISPR RNA and a transactivating (tracr) RNA. The tracr and tracr mate sequences may be joined to form a transactivating (tracr) sequence. The tracr and tracr mate sequences may optionally be designed to form a single guide RNA (sgRNA). Indeed, it is advantageous that the RNAs for targeting Cas may comprise a chimeric single guide RNA (sgRNA). The tracr sequence and the tracr mate sequence over the entire length of the shorter of the two, when optimally aligned, may be complementary by about or more than about 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97.5%, 99% or more. The length of the tracr sequence may be about or greater than about 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 or more nucleotides.
В классических системах CRISPR-Cas степень комплементарности между направляющей и ее соответствующей целевой последовательностью может составлять приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% или 100%; причем длина направляющей РНК или sgRNA может составлять приблизительно или более чем приблизительно 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 или более нуклеотидов; или длина направляющей РНК или sgRNA может составлять менее чем приблизительно 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 или менее нуклеотидов; и преимущественно длина tracrRNA составляет 30 или 50 нуклеотидов. Однако аспект настоящего изобретения направлен на снижение нецелевых взаимодействий, например, снижение взаимодействия направляющей с целевой последовательностью, характеризующейся низкой комплементарностью. Действительно, в примерах показано, что настоящее изобретение предусматривает мутации, которые приводят к тому, что система CRISPR-Cas способна распознавать целевую и нецелевую последовательности, которые характеризуются от более чем 80% до приблизительно 95% комплементарностью, например, 83%-84%, или 88-89%, или 94-95% комплементарностью (к примеру, различать целевую последовательность длиной 18 нуклеотидов от нецелевой последовательности длиной 18 нуклеотидов с 1, 2 или 3 несовпадениями). В соответствии с этим, в контексте настоящего изобретения степень комплементарности между направляющей последовательностью и ее соответствующей целевой последовательностью составляет более чем 94,5%, или 95%, или 95,5%, или 96%, или 96,5%, или 97%, или 97,5%, или 98%, или 98,5%, или 99%, или 99,5%, или 99,9%, или 100%. Нецелевой локус характеризуется менее чем 100%, или 99,9%, или 99,5%, или 99%, или 99%, или 98,5%, или 98%, или 97,5%, или 97%, или 96,5%, или 96%, или 95,5%, или 95%, или 94,5%, или 94%, или 93%, или 92%, или 91%, или 90%, или 89%, или 88%, или 87%, или 86%, или 85%, или 84%, или 83%, или 82%, или 81%, или 80% комплементарностью между его последовательностью и направляющей, при этом преимущественно, чтобы нецелевой локус характеризовался 100%, или 99,9%, или 99,5%, или 99%, или 99%, или 98,5%, или 98%, или 97,5%, или 97%, или 96,5%, или 96%, или 95,5%, или 95%, или 94,5% комплементарностью между его последовательностью и направляющей.In classical CRISPR-Cas systems, the degree of complementarity between a guide and its corresponding target sequence may be about or greater than about 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%, or 100%; wherein the length of the guide RNA or sgRNA may be about or greater than about 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 or more nucleotides; or the length of the guide RNA or sgRNA may be less than about 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 or less nucleotides; and preferably the length of the tracrRNA is 30 or 50 nucleotides. However, an aspect of the present invention is directed to reducing off-target interactions, for example, reducing the interaction of the guide with a target sequence characterized by low complementarity. Indeed, the examples show that the present invention provides mutations that cause the CRISPR-Cas system to be able to recognize target and non-target sequences that are characterized by greater than 80% to about 95% complementarity, such as 83%-84%, or 88-89%, or 94-95% complementarity (e.g., distinguishing between an 18 nucleotide long target sequence and an 18 nucleotide long non-target sequence with 1, 2, or 3 mismatches). Accordingly, in the context of the present invention, the degree of complementarity between a guide sequence and its corresponding target sequence is more than 94.5%, or 95%, or 95.5%, or 96%, or 96.5%, or 97%, or 97.5%, or 98%, or 98.5%, or 99%, or 99.5%, or 99.9%, or 100%. The non-target locus has less than 100%, or 99.9%, or 99.5%, or 99%, or 99%, or 98.5%, or 98%, or 97.5%, or 97%, or 96.5%, or 96%, or 95.5%, or 95%, or 94.5%, or 94%, or 93%, or 92%, or 91%, or 90%, or 89%, or 88%, or 87%, or 86%, or 85%, or 84%, or 83%, or 82%, or 81%, or 80% complementarity between its sequence and the guide, wherein it is preferable that the non-target locus has 100%, or 99.9%, or 99.5%, or 99%, or 99%, or 98.5%, or 98%, or 97.5%, or 97%, or 96.5%, or 96%, or 95.5%, or 95%, or 94.5% complementarity between its sequence and the guide.
В особенно предпочтительных вариантах осуществления в соответствии с настоящим изобретением направляющая РНК (способная направлять Cas на целевой локус) может содержать (1) направляющую последовательность, способную гибридизироваться с целевым локусом генома в эукариотической клетке; (2) tracr-последовательность; и (3) парную tracr-последовательность. Все из (1)-(3) могут находиться в одиночной РНК, т.е. sgRNA (расположенной в ориентации 5' - 3'), или tracrRNA может представлять собой РНК, отличную от РНК, содержащей направляющую и tracr-последовательность. Tracr-последовательность гибридизируется c парной tracr-последовательностью и направляет комплекс CRISPR/Cas к целевой последовательности.In particularly preferred embodiments according to the present invention, the guide RNA (capable of directing Cas to a target locus) may comprise (1) a guide sequence capable of hybridizing to a target locus of the genome in a eukaryotic cell; (2) a tracr sequence; and (3) a tracr mate sequence. All of (1)-(3) may be in a single RNA, i.e., an sgRNA (located in a 5'-3' orientation), or the tracrRNA may be an RNA different from the RNA containing the guide and tracr sequence. The tracr sequence hybridizes to the tracr mate sequence and directs the CRISPR/Cas complex to the target sequence.
Способы в соответствии с настоящим изобретением, описываемые в данном документе, охватывают индуцирование одной или нескольких мутаций в эукариотической клетке (in vitro, т.е. в выделенной эукариотической клетке), обсуждаемое в данном документе, предусматривающее доставку в клетку вектора, обсуждаемого в данном документе. Мутация(мутации) может(могут) включать введение, делецию или замену одного или нескольких нуклеотидов в каждой целевой последовательности клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 1-75 нуклеотидов в каждой целевой последовательности указанной клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 1, 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 или 75 нуклеотидов в каждой целевой последовательности указанной клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 или 75 нуклеотидов в каждой целевой последовательности указанной клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA. Мутации включают введение, делецию или замену 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 или 75 нуклеотидов в каждой целевой последовательности указанной клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 или 75 нуклеотидов в каждой целевой последовательности указанной клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA. Мутации могут включать введение, делецию или замену 40, 45, 50, 75, 100, 200, 300, 400 или 500 нуклеотидов в каждой целевой последовательности указанной клетки(клеток) с помощью направляющей(направляющих) РНК или sgRNA.The methods of the present invention described herein encompass inducing one or more mutations in a eukaryotic cell (in vitro, i.e., in an isolated eukaryotic cell) as discussed herein, comprising delivering to the cell a vector as discussed herein. The mutation(s) may comprise the introduction, deletion, or substitution of one or more nucleotides in each target sequence of the cell(s) using a guide(s) RNA or sgRNA. The mutations may comprise the introduction, deletion, or substitution of 1-75 nucleotides in each target sequence of said cell(s) using a guide(s) RNA or sgRNA. Mutations may include the introduction, deletion or substitution of 1, 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 or 75 nucleotides in each target sequence of the specified cell(s) using guide RNA or sgRNA. Mutations may include the introduction, deletion or substitution of 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 or 75 nucleotides in each target sequence of the specified cell(s) using guide RNA or sgRNA. Mutations include the introduction, deletion or substitution of 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 or 75 nucleotides in each target sequence of the specified cell(s) using guide(s) RNA or sgRNA. The mutations may include the introduction, deletion or substitution of 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 or 75 nucleotides in each target sequence of said cell(s) using guide(s) RNA or sgRNA. The mutations may include the introduction, deletion or substitution of 40, 45, 50, 75, 100, 200, 300, 400 or 500 nucleotides in each target sequence of said cell(s) using guide(s) RNA or sgRNA.
Для сведения к минимуму токсичности и нецелевого эффекта будет важно контролировать концентрацию доставляемых мРНК Cas и направляющей РНК. Оптимальные концентрации мРНК Cas и направляющей РНК можно определить путем тестирования различных концентраций на клеточной модели или модели отличного от человека животного-эукариотического организма и применения глубокого секвенирования для анализа степени модификации в потенциальных нецелевых локусах генома. Альтернативно для сведения в минимуму уровня токсичности и нецелевого эффекта мРНК никазы Cas (например, Cas9 S. pyogenes с мутацией D10A) можно доставлять с парой направляющих РНК, нацеливающихся на представляющий интерес сайт. Направляющие последовательности и стратегии сведения к минимуму токсичности и нецелевых эффектов могут быть такими, как в WO 2014/093622 (PCT/US2013/074667); или с помощью мутации, как указано в данном документе.To minimize toxicity and off-target effects, it will be important to control the concentration of Cas mRNA and guide RNA delivered. Optimal concentrations of Cas mRNA and guide RNA can be determined by testing different concentrations in a cellular or non-human animal-eukaryotic model and using deep sequencing to analyze the degree of modification at potential off-target loci in the genome. Alternatively, to minimize the level of toxicity and off-target effects, Cas nickase mRNA (e.g., S. pyogenes Cas9 with the D10A mutation) can be delivered with a pair of guide RNAs targeting the site of interest. Guide sequences and strategies to minimize toxicity and off-target effects can be as in WO 2014/093622 (PCT/US2013/074667); or by mutation as described herein.
В некоторых вариантах осуществления систему CRISPR преимущественно получают из системы CRISPR II типа. В некоторых вариантах осуществления один или несколько элементов системы CRISPR получены из определенного организма, содержащего эндогенную систему CRISPR, как, например, Streptococcus pyogenes. В предпочтительных вариантах осуществления настоящего изобретения система CRISPR представляет собой систему CRISPR II типа, а фермент Cas представляет собой Cas9, который катализирует расщепление ДНК. Неограничивающие примеры белков Cas включают Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (также известный как Csn1 и Csx12), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, их гомологи или их модифицированные версии. Предпочтительный фермент Cas может быть идентифицирован как Cas9, поскольку он может обозначать общий класс ферментов, обладающих гомологией с самой большой нуклеазой с множественными нуклеазными доменами из системы CRISPR II типа. В наиболее предпочтительном случае фермент Cas9 получен или происходит из SpCas9 или SaCas9. Следует иметь в виду, что SpCas9 или SaCas9 получены или происходят из Cas9 S. pyogenes или S. aureus. Под происходящим заявители подразумевают, что в основе происходящего фермента главным образом лежит фермент дикого типа в том смысле, что он характеризуется высокой степенью гомологии последовательности с этим ферментом, но он был некоторым образом подвергнут мутации (модифицирован), как описано в данном документе. Следует иметь в виду, что термины фермент Cas и CRISPR, как правило, используются в данном документе взаимозаменяемо, если не является очевидным иное. Фермент Cas может представлять собой, например, любой встречающийся в природе бактериальный Cas9, а также любые химерные формы, мутантные формы, гомологи или ортологи. Большинство вариантов нумераций остатков, используемых в данном документе, относятся к ферменту Cas9 из локуса CRISPR II типа Streptococcus pyogenes (альтернативно аннотированный как SpCas9 или spCas9). Однако следует понимать, что настоящее изобретение включает многие другие Cas9 из других видов микроорганизмов, например, ортологи SpCas9, или Cas9, полученные из микроорганизмов, кроме S. pyogenes, например, SaCas9, происходящий из S. aureus, St1Cas9, происходящий из S. thermophilus, и т.д. Специалист в данной области сможет определить подходящие соответствующие остатки в ферментах Cas9, отличных от SpCas9, путем сравнения релевантных аминокислотных последовательностей. Таким образом, если конкретное аминокислотное замещение обозначается с применением нумерации SpCas9, то, если из контекста не очевидно, что это не предназначено для применения в отношении других ферментов Cas9, причем подразумевается, что настоящее изобретение охватывает соответствующие модификации в других ферментах Cas9.In some embodiments, the CRISPR system is predominantly derived from a type II CRISPR system. In some embodiments, one or more elements of the CRISPR system are derived from a particular organism that contains an endogenous CRISPR system, such as Streptococcus pyogenes. In preferred embodiments of the present invention, the CRISPR system is a type II CRISPR system and the Cas enzyme is Cas9, which catalyzes DNA cleavage. Non-limiting examples of Cas proteins include Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (also known as Csn1 and Csx12), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, homologs thereof, or modified versions thereof. A preferred Cas enzyme may be identified as Cas9, as it may refer to a general class of enzymes that are homologous to the largest multiple nuclease domain nuclease of the Type II CRISPR system. Most preferably, the Cas9 enzyme is derived from or is derived from SpCas9 or SaCas9. It should be understood that SpCas9 or SaCas9 is derived from or is derived from S. pyogenes or S. aureus Cas9. By derived, applicants mean that the derived enzyme is essentially based on the wild-type enzyme in the sense that it has a high degree of sequence homology to that enzyme, but has been mutated (modified) in some way, as described herein. It should be understood that the terms Cas enzyme and CRISPR are generally used interchangeably herein, unless it is obvious otherwise. The Cas enzyme may be, for example, any naturally occurring bacterial Cas9, as well as any chimeric forms, mutant forms, homologues or orthologues. Most of the residue numbering variations used herein refer to the Cas9 enzyme from the Streptococcus pyogenes type II CRISPR locus (alternatively annotated as SpCas9 or spCas9). However, it should be understood that the present invention includes many other Cas9s from other microbial species, such as orthologs of SpCas9, or Cas9s derived from microorganisms other than S. pyogenes, such as SaCas9 from S. aureus, St1Cas9 from S. thermophilus, etc. One skilled in the art will be able to determine suitable corresponding residues in Cas9 enzymes other than SpCas9 by comparing the relevant amino acid sequences. Thus, where a particular amino acid substitution is indicated using SpCas9 numbering, unless the context clearly indicates that it is not intended to apply to other Cas9 enzymes, the present invention is intended to cover corresponding modifications in other Cas9 enzymes.
В некоторых вариантах осуществления немодифицированный Cas характеризуется активностью расщепления ДНК, подобно Cas9. В некоторых вариантах осуществления Cas управляет расщеплением одной или обеих нитей в определенном положении целевой последовательности, как, например, в пределах целевой последовательности и/или в пределах последовательности, комплементарной целевой последовательности. В некоторых вариантах осуществления Cas управляет расщеплением одной или обеих нитей в пределах приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 или более пар оснований от первого или последнего нуклеотида целевой последовательности. В некоторых вариантах осуществления вектор кодирует Cas, который является мутированным по сравнению с соответствующим ферментом дикого типа, так что мутированный Cas не обладает способностью расщеплять одну или обе нити целевого полинуклеотида, содержащего целевую последовательность. Например, замена аспартата на аланин (D10A) в каталитическом домене RuvC I Cas9 из S. pyogenes превращает Cas9 из нуклеазы, которая расщепляет обе нити, в никазу (расщепляет одну нить). Другие примеры мутаций, которые делают Cas9 никазой, включают без ограничения H840A, N854A и N863A. В качестве дополнительного примера два или более каталитических доменов Cas9 (RuvC I, RuvC II и RuvC III или домен HNH) можно подвергать мутациям с получением мутированного Cas9, у которого практически полностью отсутствует активность расщепления ДНК. В некоторых вариантах осуществления мутацию D10A объединяют с одной или несколькими из мутаций H840A, N854A или N863A с получением фермента Cas9, у которого практически полностью отсутствует активность расщепления ДНК. В некоторых вариантах осуществления считается, что у фермента Cas практически полностью отсутствует активность расщепления ДНК, если активность расщепления ДНК у мутированного фермента составляет не более чем приблизительно 25%, 10%, 5%, 1%, 0,1%, 0,01% или меньше относительно активности расщепления ДНК у немутированной формы фермента; примером может служить случай, когда активность расщепления ДНК у мутированной формы отсутствует или несущественна по сравнению с немутированной формой. Таким образом, Cas может содержать одну или несколько мутаций и может применяться в качестве универсального ДНК-связывающего белка, слитого или не слитого с функциональным доменом. Мутации могут представлять собой мутации, введенные искусственным образом, или мутации приобретения или потери функции. Мутации могут включать без ограничения мутации в одном из каталитических доменов (например, D10 и H840) в каталитических доменах RuvC и HNH соответственно; или фермент CRISPR может содержать одну или несколько мутаций, выбранных из группы, состоящей из D10A, E762A, H840A, N854A, N863A или D986A, и/или одной или нескольких мутаций в домене RuvC1 или HNH Cas, или иметь иную мутацию, обсуждаемую в данном документе. В одном аспекте настоящего изобретения фермент Cas может быть слит с белком, например TAG, и/или индуцируемым/контролируемым доменом, таким как химически индуцируемый/контролируемый домен. В настоящем изобретении Cas может представлять собой химерные белки Cas, например, Cas, характеризующийся усиленной функцией ввиду того, что он является химерой. Химерные белки Cas могут представлять собой новые Cas, содержащие фрагменты из более чем одного встречающегося в природе Cas. Они могут содержать продукты слияния N-концевого(концевых) фрагмента(фрагментов) одного гомолога Cas9 с C-концевым(концевыми) фрагментом(фрагментами) другого гомолога Cas. Cas может доставляться в клетку в форме мРНК. Экспрессия Cas может находиться под контролем индуцируемого промотора. Если фермент не является SpCas9, мутации можно осуществлять по любому или всем остаткам, соответствующим положениям 10, 762, 840, 854, 863 и/или 986 SpCas9 (которые могут быть определены, например, с помощью стандартных инструментов сравнения последовательностей). В частности, любые или все из следующих мутаций являются предпочтительными для SpCas9: D10A, E762A, H840A, N854A, N863A и/или D986A; а также предусматривается консервативная замена любой из замещаемых аминокислот. То же самое (или консервативные замены по этим мутациям) также является предпочтительным в соответствующих положениях других Cas9. Особенно предпочтительными являются D10 и H840 в SpCas9. Однако в других Cas9 остатки, соответствующие D10 и H840 SpCas9, также являются предпочтительными. Очевидно, что цель настоящего изобретения заключается в том, чтобы не охватывать известные мутации. То есть, мутации, которые, как известно из уровня техники, приводят к тому, что Cas9 становится никазой или Cas9 становится "нефункциональной", например, характеризуется небольшой, например, 5% или менее чем 5%, например, менее чем 4%, 3%, 2% или 1%, нуклеазной активностью или ее отсутствием по сравнению с немутированным Cas9, как подразумевается, не входят в объем мутаций Cas9, которые снижают или исключают взаимодействие между направляющей и нецелевой молекулами нуклеиновой кислоты, при этом заявитель оставляет за собой право использовать оговорку для исключения такой известной мутации, обуславливающей образование "никазы" или "неработающего" Cas9. Действительно, фраза "в результате чего фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом, и/или в результате чего фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом" (или подобные выражения) не подразумевает охват мутаций, которые обуславливают только образование никазы или неработающего Cas9, или известных мутаций Cas9. ОДНАКО, это не означает, что модификацию(модификации) или мутацию(мутации) по настоящему изобретению "в результате которых фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом, и/или в результате которых фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом" (или подобные выражения) нельзя комбинировать с мутациями, которые приводят к тому, что фермент является никазой или он является нефункциональным. Такой нефункциональный фермент может представлять собой улучшенное средство, связывающее молекулу нуклеиновой кислоты. И такая никаза может представлять собой улучшенную никазу. Например, изменение нейтральной(нейтральных) аминокислоты(аминокислот) в бороздке и/или возле нее, и/или других заряженных остатков в других определенных положениях в Cas9, которые находятся в непосредственной близости от нуклеиновой кислоты (например, ДНК, кДНК, РНК, sgRNA), на положительно заряженную(заряженные) аминокислоту(аминокислоты) может приводить к ситуации "в результате чего фермент в комплексе CRISPR характеризуется сниженной способность модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом и/или в результате чего фермент в комплексе CRISPR характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом", например, к большему числу разрезов. Поскольку это могут быть как усиленные целевые, так и нецелевые разрезы (сверхрежущий Cas9), применение такого фермента с тем, что известно из уровня техники как усеченная направляющая или усеченные sgRNA (см., например, Fu et al., "Improving CRISPR-Cas nuclease specificity using truncated guide RNAs," Nature Biotechnology 32, 279-284 (2014) doi:10.1038/nbt.2808, получен 17 ноября 2013 года, принят 06 января 2014 года, опубликован онлайн 26 января 2014 года, иcправлен онлайн 29 января 2014 года), для обеспечения усиленной целевой активности без повышения числа нецелевых разрезов, или для получения сверхрежущих никаз, или для комбинирования с мутацией, которая обеспечивает нефункциональный Cas9 для сверхсвязывающего средства.In some embodiments, the unmodified Cas has DNA cleavage activity similar to Cas9. In some embodiments, the Cas directs cleavage of one or both strands at a specific position of a target sequence, such as within the target sequence and/or within a sequence complementary to the target sequence. In some embodiments, the Cas directs cleavage of one or both strands within about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 or more base pairs from the first or last nucleotide of the target sequence. In some embodiments, the vector encodes a Cas that is mutated compared to the corresponding wild-type enzyme such that the mutated Cas lacks the ability to cleave one or both strands of a target polynucleotide containing the target sequence. For example, replacing aspartate with alanine (D10A) in the catalytic domain of RuvC I Cas9 from S. pyogenes converts Cas9 from a nuclease that cleaves both strands to a nickase (cleaves one strand). Other examples of mutations that make Cas9 a nickase include, but are not limited to, H840A, N854A, and N863A. As a further example, two or more of the catalytic domains of Cas9 (RuvC I, RuvC II, and RuvC III, or the HNH domain) can be mutated to produce a mutated Cas9 that substantially completely lacks DNA cleavage activity. In some embodiments, the D10A mutation is combined with one or more of the H840A, N854A, or N863A mutations to produce a Cas9 enzyme that substantially completely lacks DNA cleavage activity. In some embodiments, a Cas enzyme is considered to have substantially no DNA cleavage activity if the DNA cleavage activity of the mutated enzyme is no more than about 25%, 10%, 5%, 1%, 0.1%, 0.01% or less relative to the DNA cleavage activity of the unmutated form of the enzyme; an example would be where the DNA cleavage activity of the mutated form is absent or insignificant compared to the unmutated form. Thus, Cas may contain one or more mutations and may be used as a universal DNA binding protein, fused or not fused to a functional domain. The mutations may be artificially introduced mutations or gain-function or loss-of-function mutations. The mutations may include, but are not limited to, mutations in one of the catalytic domains (e.g., D10 and H840) in the RuvC and HNH catalytic domains, respectively; or the CRISPR enzyme may comprise one or more mutations selected from the group consisting of D10A, E762A, H840A, N854A, N863A, or D986A, and/or one or more mutations in the RuvC1 or HNH domain of Cas, or have another mutation discussed herein. In one aspect of the present invention, the Cas enzyme may be fused to a protein, such as a TAG, and/or an inducible/controllable domain, such as a chemically inducible/controllable domain. In the present invention, the Cas may be chimeric Cas proteins, such as a Cas that has enhanced function due to being a chimera. The chimeric Cas proteins may be novel Cas that contain fragments of more than one naturally occurring Cas. They may comprise fusion products of the N-terminal fragment(s) of one Cas9 homologue with the C-terminal fragment(s) of another Cas homologue. Cas may be delivered to the cell in the form of mRNA. Expression of Cas may be under the control of an inducible promoter. If the enzyme is not SpCas9, mutations may be made at any or all of the residues corresponding to positions 10, 762, 840, 854, 863, and/or 986 of SpCas9 (which may be determined, for example, using standard sequence comparison tools). In particular, any or all of the following mutations are preferred for SpCas9: D10A, E762A, H840A, N854A, N863A, and/or D986A; and conservative substitution of any of the substitutable amino acids is also contemplated. The same (or conservative substitutions for these mutations) are also preferred in the corresponding positions of other Cas9. Particularly preferred are D10 and H840 in SpCas9. However, in other Cas9, residues corresponding to D10 and H840 of SpCas9 are also preferred. It is obvious that the purpose of the present invention is not to cover known mutations. That is, mutations that are known in the art to cause Cas9 to become a nickase or Cas9 to become "non-functional", such as having little, such as 5%, or less than 5%, such as less than 4%, 3%, 2% or 1%, nuclease activity or no nuclease activity compared to unmutated Cas9, are intended to be excluded from the scope of mutations in Cas9 that reduce or eliminate the interaction between the target and non-target nucleic acid molecules, and applicant reserves the right to use a disclaimer to exclude such a known mutation that causes a "nickase" or "non-functional" Cas9. Indeed, the phrase "whereby an enzyme in a CRISPR complex has a reduced ability to modify one or more off-target loci compared to an unmodified enzyme, and/or whereby an enzyme in a CRISPR complex has an increased ability to modify one or more target loci compared to an unmodified enzyme" (or similar expressions) is not intended to encompass mutations that result only in nickase or non-functional Cas9, or known Cas9 mutations. HOWEVER, this does not mean that the modification(s) or mutation(s) of the present invention "whereby the enzyme in the CRISPR complex has a reduced ability to modify one or more off-target loci compared to an unmodified enzyme and/or whereby the enzyme in the CRISPR complex has an increased ability to modify one or more target loci compared to an unmodified enzyme" (or similar expressions) cannot be combined with mutations that cause the enzyme to be a nickase or to be non-functional. Such a non-functional enzyme may be an improved nucleic acid binding agent. And such a nickase may be an improved nickase. For example, changing a neutral amino acid(s) in and/or near a groove and/or other charged residues at other specific positions in Cas9 that are in close proximity to a nucleic acid (e.g., DNA, cDNA, RNA, sgRNA) to a positively charged amino acid(s) may result in a situation "whereby an enzyme in a CRISPR complex has a reduced ability to modify one or more off-target loci compared to an unmodified enzyme and/or whereby an enzyme in a CRISPR complex has an increased ability to modify one or more target loci compared to an unmodified enzyme," such as a higher number of cuts. Since these can be either enhanced on-target or off-target cuts (over-cutting Cas9), the use of such an enzyme with what is known in the art as truncated guide or truncated sgRNAs (see, e.g., Fu et al., "Improving CRISPR-Cas nuclease specificity using truncated guide RNAs," Nature Biotechnology 32, 279–284 (2014) doi:10.1038/nbt.2808, received 17 November 2013, accepted 06 January 2014, published online 26 January 2014, corrected online 29 January 2014) to provide enhanced on-target activity without increasing the number of off-target cuts, or to produce over-cutting nickases, or to combine with a mutation that renders Cas9 non-functional for the superbinder.
При осуществлении настоящего изобретения на практике можно применять ортологи SpCas9. Фермент Cas может быть идентифицирован как Cas9, поскольку он может обозначать общий класс ферментов, обладающих гомологией с самой большой нуклеазой с множественными нуклеазными доменами из системы CRISPR II типа. В наиболее предпочтительном случае фермент Cas9 получен или происходит из SpCas9 (Cas9 S. pyogenes) или SaCas9 (Cas9 S. aureus). "StCas9" относится к Cas9 дикого типа из S. thermophilus, при этом последовательность его белка представлена в базе данных SwissProt под номером доступа G3ECR1. Аналогично, Cas9 S. pyogenes или SpCas9 включен в SwissProt под номером доступа Q99ZW2. Под происходящим заявители подразумевают, что в основе происходящего фермента главным образом лежит фермент дикого типа в том смысле, что он характеризуется высокой степенью гомологии последовательности с этим ферментом, но он был некоторым образом подвергнут мутации (модифицирован), как описано в данном документе. Следует иметь в виду, что термины "Cas" и "фермент CRISPR" обычно используются в данном документе взаимозаменяемо, если не очевидно иное. Как упоминается выше, большинство вариантов нумераций остатков, используемых в данном документе, относятся к ферменту Cas9 из локуса CRISPR II типа Streptococcus pyogenes. Однако следует иметь в виду, что настоящее изобретение включает многие другие Cas9 из других видов микроорганизмов, как, например, SpCas9, SaCa9, St1Cas9 и т.д. Ферментативное действие Cas9, полученного из Streptococcus pyogenes, или любого близкородственного Cas9, приводит к образованию двухнитевых разрывов в последовательностях целевого сайта, которые гибридизируются с 20 нуклеотидами направляющей последовательности и которые содержат последовательность мотива, смежного с протоспейсером (PAM) (примеры включают NGG/NRG или PAM, который можно определить, как описано в данном документе) после 20 нуклеотидов целевой последовательности. Активность CRISPR, осуществляемая посредством Cas9, которая заключается в сайт-специфическом распознавании и расщеплении ДНК, определяется направляющей последовательностью, tracr-последовательностью, которая частично гибридизируется с направляющей последовательностью и последовательностью PAM. Не вдаваясь в теорию полагают, что целевая последовательность должна быть ассоциирована с PAM (мотивом, смежным с протоспейсером); то есть короткой последовательностью, узнаваемой комплексом CRISPR. Требования к точности и длине последовательности PAM отличаются в зависимости от применяемого фермента Cas, но PAM обычно представляют собой последовательности длиной 2-5 пар оснований, расположенных смежно с протоспейсером (то есть целевой последовательностью). В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида, за счет чего обеспечивается модифицирование целевого полинуклеотида, где комплекс CRISPR содержит фермент Cas в комплексе с направляющей последовательностью, гибридизированной с целевой последовательностью в пределах указанного целевого полинуклеотида, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизирована с tracr-последовательностью. Больше аспектов системы CRISPR описаны в Karginov and Hannon, The CRISPR system: small RNA-guided defense in bacteria and archaea, Mole Cell 2010, January 15; 37(1): 7. Локус CRISPR II типа происходит из Streptococcus pyogenes SF370, который содержит кластер из четырех генов Cas9, Cas1, Cas2 и Csn1, а также два элемента некодирующей РНК, tracrRNA и характерный массив повторяющихся последовательностей (прямых повторов), чередующихся с короткими фрагментами неповторяющихся последовательностей (спейсерами, приблизительно 30 п. о. каждый). В данной системе направленный двухнитевой разрыв (DSB) ДНК образуется в ходе четырех последовательных стадий. Во-первых, две некодирующие РНК, массив pre-crRNA и tracrRNA, транскрибируются с локуса CRISPR. Во-вторых, tracrRNA гибридизируется с прямыми повторами в pre-crRNA, которая затем процессируется в зрелые crRNA, содержащие отдельные спейсерные последовательности. В-третьих, комплекс зрелая crRNA:tracrRNA направляет Cas к ДНК-мишени, состоящей из протоспейсера и соответствующего PAM, посредством образования гетеродуплекса между спейсерным участком crRNA и протоспейсерной ДНК. И наконец, Cas опосредует расщепление целевой ДНК выше PAM с образованием DSB в пределах протоспейсера. Массив pre-crRNA, состоящий из одного спейсера, фланкированного двумя прямыми повторами (DR), также охватывается термином "парные tracr-последовательности". В определенных вариантах осуществления присутствие Cas может быть постоянным, или его присутствие можно индуцировать, или его присутствие зависит от условий, или его можно вводить или доставлять. Оптимизацию Cas можно применять для усиления функции или для разработки новых функций, при этом можно получать химерные белки Cas. Также Cas можно применять в качестве универсального ДНК-связывающего белка.In practicing the present invention, orthologs of SpCas9 can be used. The Cas enzyme can be identified as Cas9 because it can denote a general class of enzymes that have homology to the largest multiple nuclease domain nuclease of the type II CRISPR system. Most preferably, the Cas9 enzyme is derived from or is derived from SpCas9 (Cas9 of S. pyogenes) or SaCas9 (Cas9 of S. aureus). "StCas9" refers to the wild-type Cas9 from S. thermophilus, and its protein sequence is provided in the SwissProt database under the accession number G3ECR1. Similarly, Cas9 of S. pyogenes or SpCas9 is included in SwissProt under the accession number Q99ZW2. By "derived" we mean that the derived enzyme is essentially based on the wild-type enzyme in the sense that it has a high degree of sequence homology to that enzyme, but has been mutated (modified) in some way as described herein. It should be noted that the terms "Cas" and "CRISPR enzyme" are generally used interchangeably herein unless otherwise obvious. As mentioned above, most of the residue numbering variations used herein refer to the Cas9 enzyme from the CRISPR II locus of Streptococcus pyogenes. However, it should be noted that the present invention includes many other Cas9s from other microbial species, such as SpCas9, SaCa9, St1Cas9, etc. The enzymatic action of Streptococcus pyogenes-derived Cas9 or any closely related Cas9 results in the formation of double-strand breaks in target site sequences that hybridize to 20 nucleotides of a guide sequence and that contain a protospacer adjacent motif (PAM) sequence (examples include NGG/NRG or a PAM that can be defined as described herein) following 20 nucleotides of the target sequence. The CRISPR activity of Cas9, which consists of site-specific recognition and cleavage of DNA, is determined by a guide sequence, a tracr sequence, which partially hybridizes to the guide sequence and the PAM sequence. Without being bound by theory, it is believed that the target sequence must be associated with a PAM (protospacer adjacent motif); that is, a short sequence recognized by the CRISPR complex. The requirements for the accuracy and length of the PAM sequence vary depending on the Cas enzyme used, but PAMs are typically 2-5 base pair long sequences adjacent to the protospacer (i.e., the target sequence). In some embodiments, the method includes causing a CRISPR complex to bind to a target polynucleotide to effect cleavage of said target polynucleotide, thereby causing the target polynucleotide to be modified, wherein the CRISPR complex comprises a Cas enzyme complexed with a guide sequence hybridized to a target sequence within said target polynucleotide, wherein said guide sequence is linked to a tracr mate sequence that is in turn hybridized to the tracr sequence. More aspects of the CRISPR system are described in Karginov and Hannon, The CRISPR system: small RNA-guided defense in bacteria and archaea, Mole Cell 2010, January 15; 37(1): 7. The type II CRISPR locus is derived from Streptococcus pyogenes SF370, which contains a cluster of four genes, Cas9, Cas1, Cas2, and Csn1, as well as two non-coding RNA elements, tracrRNA, and a characteristic array of repetitive sequences (direct repeats) interspersed with short fragments of non-repetitive sequences (spacers, approximately 30 bp each). In this system, a targeted double-strand break (DSB) in DNA is formed in four sequential steps. First, two non-coding RNAs, the pre-crRNA array and tracrRNA, are transcribed from the CRISPR locus. Second, tracrRNA hybridizes to the direct repeats in the pre-crRNA, which is then processed into mature crRNAs containing individual spacer sequences. Third, the mature crRNA:tracrRNA complex directs Cas to a target DNA consisting of a protospacer and an appropriate PAM by forming a heteroduplex between the spacer region of the crRNA and the protospacer DNA. Finally, Cas mediates cleavage of the target DNA upstream of the PAM to form a DSB within the protospacer. A pre-crRNA array consisting of a single spacer flanked by two direct repeats (DRs) is also encompassed by the term "paired tracr sequences." In certain embodiments, the presence of Cas may be constant, or its presence may be induced, or its presence may be conditionally dependent, or it may be introduced or delivered. Optimization of Cas may be used to enhance function or to develop new functions, and chimeric Cas proteins may be produced. Cas may also be used as a universal DNA binding protein.
Как правило, в контексте эндогенной системы CRISPR образование комплекса CRISPR (содержащего направляющую последовательность, гибридизированую с целевой последовательностью и находящуюся в комплексе с одним или несколькими белками Cas) приводит к расщеплению одной или обеих нитей в (к примеру, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар оснований) целевой последовательности или рядом с ней. Не вдаваясь в теорию, полагают, что tracr-последовательность, которая может содержать всю или часть tracr-последовательности дикого типа или состоять из нее (например, приблизительно или более чем приблизительно 20, 26, 32, 45, 48, 54, 63, 67, 85 или более нуклеотидов tracr-последовательности дикого типа), может также формировать часть комплекса CRISPR, как, например, путем гибридизации по меньшей мере части tracr-последовательности со всей или частью парной tracr-последовательности, которая функционально связана с направляющей последовательностью.Typically, in the context of an endogenous CRISPR system, formation of a CRISPR complex (containing a guide sequence hybridized to a target sequence and complexed with one or more Cas proteins) results in cleavage of one or both strands at or near (e.g., within 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 or more base pairs) the target sequence. Without wishing to be bound by theory, it is believed that a tracr sequence, which may comprise or consist of all or a portion of a wild-type tracr sequence (e.g., about or more than about 20, 26, 32, 45, 48, 54, 63, 67, 85 or more nucleotides of a wild-type tracr sequence), may also form part of a CRISPR complex, such as by hybridizing at least a portion of the tracr sequence to all or a portion of a mate tracr sequence that is operably linked to a guide sequence.
В настоящем изобретении термин "Cas" может означать "Cas9" или фермент CRISPR. В контексте настоящего изобретения Cas9, или Cas, или фермент CRISPR является мутированным или модифицированным, "в результате чего фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом" (или подобные выражения); и при чтении настоящего описания подразумевается, что термины "Cas9", или "Cas", или "фермент CRISPR и т.д. включают мутированный или модифицированный Cas9, или Cas, или фермент CRISPR в соответствии с настоящим изобретением, т. e."в результате этого фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом" (или подобные выражения).In the present invention, the term "Cas" may mean "Cas9" or a CRISPR enzyme. In the context of the present invention, Cas9 or Cas or a CRISPR enzyme is mutated or modified "whereby the enzyme in the CRISPR complex has a reduced ability to modify one or more off-target loci compared to an unmodified enzyme" (or similar expressions); and when reading the present description, the terms "Cas9" or "Cas" or "CRISPR enzyme, etc." are intended to include mutated or modified Cas9 or Cas or a CRISPR enzyme according to the present invention, i.e. "whereby the enzyme in the CRISPR complex has a reduced ability to modify one or more off-target loci compared to an unmodified enzyme" (or similar expressions).
Оптимизация кодонов и использование кодонов для экспрессии белка CasCodon optimization and codon usage for Cas protein expression
Молекула нуклеиновой кислоты, кодирующая Cas, преимущественно является кодон-оптимизированной для Cas. В данном случае примером кодон-оптимизированной последовательности является последовательность, оптимизированная для экспрессии у эукариота, например, у людей (т. e. является оптимизированной для экспрессии у людей), или у другого эукариота, животного или млекопитающего, обсуждаемых в данном документе; см., например, кодон-оптимизированная последовательность SaCas9 для человека в WO 2014/093622 (PCT/US2013/074667). Хотя это является предпочтительным, следует иметь в виду, что возможны другие примеры и что известна оптимизация кодонов для вида-хозяина, отличного от человека, или оптимизация кодонов для конкретных органов. В некоторых вариантах осуществления кодирующая фермент последовательность, кодирующая Cas, является кодон-оптимизированной для экспрессии в определенных клетках, как, например, эукариотических клетках. Эукариотические клетки могут быть клетками определенного организма или полученными из него, как, например, клетками млекопитающего, в том числе без ограничения человека, или отличного от человека эукариота, или животного, или млекопитающего, обсуждаемых в данном документе, например, мыши, крысы, кролика, собаки, крупного рогатого скота или отличного от человека млекопитающего или примата. В некоторых вариантах осуществления могут исключаться способы модифицирования генетической идентичности зародышевой линии человека и/или способы модификации генетической идентичности животных, которые, вероятно, могут причинить им страдания без какой-либо значительной медицинской пользы для человека или животного, а также животные, являющиеся результатом таких способов. В целом, оптимизация кодонов означает способ модифицирования последовательности нуклеиновой кислоты для повышения уровня экспрессии в представляющих интерес клетках-хозяевах путем замещения по меньшей мере одного кодона (например, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более кодонов) нативной последовательности на кодоны, которые чаще или наиболее часто используют в генах такой клетки-хозяина, при этом с сохранением нативной аминокислотной последовательности. Разные виды проявляют определенное "предпочтение" в отношении конкретных кодонов определенной аминокислоты. "Предпочтение" кодонов (различия в частоте использования кодонов между организмами) зачастую соотносится с эффективностью трансляции матричной РНК (mRNA), которая, в свою очередь, как полагают, зависит, среди прочего, от свойств кодонов, которые транслируются, и доступности конкретных молекул транспортной РНК (tRNA). Преобладание выбранных тРНК в клетке, как правило, указывает на кодоны, используемые наиболее часто при синтезе пептидов. Соответственно, гены можно приспособить для оптимальной экспрессии генов в данном организме за счет оптимизации кодонов. Таблицы частоты использования кодонов общедоступны, например, в "Базе данных частот использования кодонов", доступной в интернете по адресу www.kazusa.orjp/codon/, и эти таблицы можно адаптировать различными способами. См., Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000). Также доступны компьютерные алгоритмы для оптимизации кодонов определенной последовательности для экспрессии в определенной клетке-хозяине, как, например, Gene Forge (Aptagen; Джакобус, Пенсильвания). В некоторых вариантах осуществления один или несколько кодонов (например, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 или более или все кодоны) в последовательности, кодирующей Cas, соответствуют наиболее часто используемому кодону для определенной аминокислоты.A nucleic acid molecule encoding Cas is preferably codon-optimized for Cas. In this case, an example of a codon-optimized sequence is a sequence optimized for expression in a eukaryote, such as humans (i.e., is optimized for expression in humans), or in another eukaryote, animal, or mammal discussed herein; see, for example, the codon-optimized human SaCas9 sequence in WO 2014/093622 (PCT/US2013/074667). Although this is preferred, it should be understood that other examples are possible and that codon optimization for a host species other than humans or codon optimization for specific organs is known. In some embodiments, the Cas encoding enzyme sequence is codon-optimized for expression in certain cells, such as eukaryotic cells. Eukaryotic cells may be cells of or derived from a particular organism, such as cells of a mammal, including but not limited to a human or non-human eukaryote, or an animal or mammal discussed herein, such as a mouse, rat, rabbit, dog, cattle, or non-human mammal or primate. In some embodiments, methods of modifying the genetic identity of the germline of a human and/or methods of modifying the genetic identity of animals that are likely to cause them suffering without any significant medical benefit to the human or animal, as well as animals resulting from such methods, may be excluded. In general, codon optimization refers to a method of modifying a nucleic acid sequence to enhance expression levels in host cells of interest by replacing at least one codon (e.g., about or more than about 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 or more codons) of the native sequence with codons that are more frequently or most frequently used in the genes of such host cell, while maintaining the native amino acid sequence. Different species exhibit a certain "preference" for particular codons for a particular amino acid. Codon "preference" (differences in codon usage between organisms) is often correlated with the efficiency of translation of messenger RNA (mRNA), which in turn is believed to depend on, among other things, the properties of the codons being translated and the availability of particular transfer RNA (tRNA) molecules. The prevalence of selected tRNAs in a cell generally indicates the codons used most frequently in peptide synthesis. Accordingly, genes can be tailored for optimal gene expression in a given organism by codon optimization. Codon usage tables are publicly available, such as in the Codon Usage Database, available on the Internet at www.kazusa.orjp/codon/, and these tables can be adapted in a variety of ways. See, Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000). Computer algorithms for optimizing the codons of a given sequence for expression in a particular host cell are also available, such as Gene Forge (Aptagen; Jacobus, PA). In some embodiments, one or more codons (e.g., 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 or more, or all codons) in the Cas encoding sequence correspond to the most frequently used codon for a particular amino acid.
В определенных вариантах осуществления способы, описываемые в данном документе, могут включать обеспечение трансгенной по Cas клетки, в которой одна или несколько нуклеиновых кислот, кодирующих одну или несколько направляющих РНК, обеспечивают или вводят функционально связанными в клетку с регуляторным элементом, содержащим промотор одного или нескольких представляющих интерес генов. Используемый в данном документе термин "трансгенная по Cas клетка" обозначает клетку, такую как эукариотическая клетка, в геном которой был интегрирован ген Cas. Природа, тип или происхождение клетки конкретно не ограничиваются в соответствии с настоящим изобретением. Также способ, посредством которого трансген Cas вводят в клетку, может отличаться и может представлять собой любой способ, известный из уровня техники. В определенных вариантах осуществления трансгенную по Cas клетку получают путем введения трансгена Cas в выделенную клетку. В определенных других вариантах осуществления трансгенную по Cas клетку получают путем выделения клеток из трансгенного по Cas организма. В качестве примера и без ограничения, трансгенная по Cas клетка, упоминаемая в данном документе, может быть получена из трансгенного по Cas эукариота, такого как эукариота с нокином по Cas. Ссылка делается на WO 2014/093622 (PCT/US13/74667), который включен в данный документ посредством ссылки. Способы из публикаций заявок на патенты США №№ 20120017290 и 20110265198, закрепленных за Sangamo BioSciences, Inc., относящиеся к нацеливанию на локус Rosa, можно модифицировать для использования системы CRISPR-Cas по настоящему изобретению. Способы из публикации заявки на патент США № 20130236946, закрепленной за Cellectis, относящиеся к нацеливанию на локус Rosa, можно также модифицировать для использования системы CRISPR-Cas по настоящему изобретению. В качестве дополнительного примера ссылка делается на Platt et. al. (Cell; 159(2):440-455 (2014)), описывающую мышь с нокином по Cas9, которая включена в данный документ посредством ссылки. Трансген Cas может дополнительно содержать кассету Lox-Stop-polyA-Lox (LSL), за счет чего обеспечивается возможность индуцирования экспрессии Cas с помощью Cre-рекомбиназы. Альтернативно трансгенная по Cas клетка может быть получена путем введения трансгена Cas в выделенную клетку. Системы доставки для трансгенов хорошо известны из уровня техники. В качестве примера, трансген Cas может быть доставлен, например, в эукариотическую клетку посредством доставки с помощью вектора (например, AAV, аденовируса, лентивируса), и/или частицы, и/или наночастицы, как также описывается в других разделах данного документа.In certain embodiments, the methods described herein may comprise providing a Cas transgenic cell, wherein one or more nucleic acids encoding one or more guide RNAs are provided or introduced operably linked into the cell to a regulatory element comprising a promoter of one or more genes of interest. As used herein, the term "Cas transgenic cell" refers to a cell, such as a eukaryotic cell, into whose genome a Cas gene has been integrated. The nature, type, or origin of the cell is not particularly limited according to the present invention. Also, the method by which the Cas transgene is introduced into the cell may vary and may be any method known in the art. In certain embodiments, the Cas transgenic cell is produced by introducing the Cas transgene into an isolated cell. In certain other embodiments, the Cas transgenic cell is produced by isolating cells from a Cas transgenic organism. By way of example and without limitation, a Cas transgenic cell referred to herein can be derived from a Cas transgenic eukaryote, such as a Cas knockin eukaryote. Reference is made to WO 2014/093622 (PCT/US13/74667), which is incorporated herein by reference. The methods of U.S. Patent Application Publication Nos. 20120017290 and 20110265198 assigned to Sangamo BioSciences, Inc. relating to targeting the Rosa locus can be modified to use the CRISPR-Cas system of the present invention. The methods of U.S. Patent Application Publication No. 20130236946 assigned to Cellectis relating to targeting the Rosa locus can also be modified to use the CRISPR-Cas system of the present invention. As a further example, reference is made to Platt et. al. (Cell; 159(2):440-455 (2014)), describing a Cas9 knockin mouse, which is incorporated herein by reference. The Cas transgene may further comprise a Lox-Stop-polyA-Lox (LSL) cassette, thereby allowing for induction of Cas expression by Cre recombinase. Alternatively, a Cas transgenic cell can be produced by introducing a Cas transgene into an isolated cell. Delivery systems for transgenes are well known in the art. As an example, the Cas transgene can be delivered, for example, to a eukaryotic cell via vector (e.g., AAV, adenovirus, lentivirus) and/or particle and/or nanoparticle delivery, as also described elsewhere herein.
Специалисту в данной области будет понятно, что клетка, такая как трансгенная по Cas клетка, упоминаемая в данном документе, может содержать дополнительные изменения в геноме помимо наличия интегрированного гена Cas или мутаций, возникающих за счет специфического в отношении последовательности действия Cas при образовании комплекса с РНК, способной направлять Cas в целевой локус, таких как, например, одна или несколько онкогенных мутаций, как в качестве примера и без ограничения описано у Platt et al. (2014), Chen et al. (2014) или Kumar et al. (2009).It will be appreciated by those skilled in the art that a cell, such as a Cas transgenic cell as referred to herein, may contain additional alterations in the genome in addition to the presence of an integrated Cas gene or mutations arising from the sequence-specific action of Cas when complexed with RNA capable of directing Cas to a target locus, such as, for example, one or more oncogenic mutations, as described by way of example and without limitation in Platt et al. (2014), Chen et al. (2014), or Kumar et al. (2009).
Белок Cas с одной или несколькими NLSCas protein with one or more NLS
В некоторых вариантах осуществления последовательность Cas слита с одной или несколькими последовательностями ядерной локализации (NLS), как, например, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или больше NLS. В некоторых вариантах осуществления Cas содержит приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или больше NLS на амино-конце или рядом с ним, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или больше NLS на карбокси-конце или рядом с ним или их комбинацию (например, ни одной либо по меньшей мере одну или несколько NLS на амино-конце и ни одной либо одну или несколько NLS на карбокси-конце). В тех случаях, когда присутствуют более одной NLS, каждая может быть выбрана независимо от других, так что одна NLS может присутствовать в более чем одной копии и/или в комбинации с одной или несколькими другими NLS, присутствующими в одной или нескольких копиях. В предпочтительном варианте осуществления настоящего изобретения Cas содержит не более 6 NLS. В некоторых вариантах осуществления считается, что NLS находится рядом с N- или C-концом в тех случаях, когда наиболее близкая аминокислота NLS находится в пределах приблизительно 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 или более аминокислот вдоль полипетидной цепи от N- или C-конца. Неограничивающие примеры NLS включают последовательность NLS, происходящую из NLS из большого Т-антигена вируса SV40 с аминокислотной последовательностью PKKKRKV(SEQ ID NO: Х); NLS из нуклеоплазмина (например, двусоставная NLS из нуклеоплазмина с последовательностью KRPAATKKAGQAKKKK) (SEQ ID NO: Х); NLS из c-myc с аминокислотной последовательностью PAAKRVKLD (SEQ ID NO: Х) или RQRRNELKRSP (SEQ ID NO: Х); NLS из hRNPA1 M9 с последовательностью NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: X); последовательности RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (SEQ ID NO: Х) домена IBB из импортина-альфа; последовательностей VSRKRPRP (SEQ ID NO: X) и PPKKARED (SEQ ID NO: X) белка T миомы; последовательности POPKKKPL (SEQ ID NO: X) человеческого p53; последовательности SALIKKKKKMAP (SEQ ID NO: X) c-abl IV мыши; последовательностей DRLRR (SEQ ID NO: X) и PKQKKRK (SEQ ID NO: Х) из NS1 вируса гриппа; последовательности RKLKKKIKKL (SEQ ID NO: Х) из дельта-антигена вируса гепатита; последовательности REKKKFLKRR (SEQ ID NO: Х) из белка Mx1 мыши; последовательность KRKGDEVDGVDEVAKKKSKK (SEQ ID NO: Х) из поли(АДФ-рибоза)-полимеразы человека и последовательности RKCLQAGMNLEARKTKK (SEQ ID NO: Х) рецепторов стероидных гормонов глюкокортикоидов (человека). В целом, одна или несколько NLS являются достаточно эффективными, чтобы управлять накоплением Cas в обнаруживаемом количестве в ядре эукариотической клетки. В целом, степень проявления активности ядерной локализации может быть результатом следующего: числа NLS в Cas, конкретных используемых(конкретной используемой) NLS или комбинации этих факторов. Обнаружение накопления в ядре можно выполнять с помощью любой подходящей методики. Например, обнаруживаемый маркер может быть слит с Cas, так что расположение в клетке может быть визуализировано, как, например, в комбинации со средствами для обнаружения расположения в ядре (например, окрашивающим средством, специфичным к ядру, таким как DAPI). Ядра клеток также можно выделять из клеток, причем их содержимое затем можно анализировать с помощью любого подходящего способа для обнаружения белка, как, например, иммуногистохимического анализа, вестерн-блоттинга или анализа активности фермента. Накопление в ядре также можно определить опосредованно, как, например, с помощью анализа эффекта образования комплекса CRISPR (например, анализа в отношении расщепления ДНК или мутации в целевой последовательности или анализа активности экспрессии генов, измененной посредством образования комплекса CRISPR и/или активности Cas) по сравнению с контролем, который не подвергали воздействию Cas или комплекса или подвергали воздействию Cas, у которого отсутствуют одна или несколько NLS. В некоторых вариантах осуществления NLS не добавляют или не сливают с белком Cas.In some embodiments, the Cas sequence is fused to one or more nuclear localization sequences (NLS), such as about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more NLSs. In some embodiments, the Cas comprises about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more NLSs at or near the amino terminus, about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more NLSs at or near the carboxy terminus, or a combination thereof (e.g., none or at least one or more NLSs at the amino terminus and none or one or more NLSs at the carboxy terminus). In cases where more than one NLS is present, each may be selected independently of the others, such that one NLS may be present in more than one copy and/or in combination with one or more other NLSs present in one or more copies. In a preferred embodiment of the present invention, the Cas comprises no more than 6 NLSs. In some embodiments, an NLS is considered to be near the N- or C-terminus when the closest amino acid to the NLS is within about 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 or more amino acids along the polypeptide chain from the N- or C-terminus. Non-limiting examples of NLSs include an NLS sequence derived from an NLS from the large T antigen of the SV40 virus with the amino acid sequence PKKKRKV (SEQ ID NO: X); NLS from nucleoplasmin (e.g., the two-part NLS from nucleoplasmin with the sequence KRPAATKKAGQAKKKK) (SEQ ID NO: X); NLS from c-myc with the amino acid sequence PAAKRVKLD (SEQ ID NO: X) or RQRRNELKRSP (SEQ ID NO: X); NLS from hRNPA1 M9 with the sequence NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (SEQ ID NO: X); the sequences RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (SEQ ID NO: X) of the IBB domain of importin alpha; the sequences VSRKRPRP (SEQ ID NO: X) and PPKKARED (SEQ ID NO: X) of the myoma T protein; the sequences POPKKKPL (SEQ ID NO: X) of human p53; the SALIKKKKKMAP (SEQ ID NO: X) sequences of mouse c-abl IV; the DRLRR (SEQ ID NO: X) and PKQKKRK (SEQ ID NO: X) sequences from influenza virus NS1; the RKLKKKIKKL (SEQ ID NO: X) sequences from the hepatitis virus delta antigen; the REKKKFLKRR (SEQ ID NO: X) sequences from the mouse Mx1 protein; the KRKGDEVDGVDEVAKKKSKK (SEQ ID NO: X) sequence from human poly(ADP-ribose) polymerase; and the RKCLQAGMNLEARKTKK (SEQ ID NO: X) sequences from the steroid hormone receptors (human) glucocorticoids. In general, one or more NLSs are sufficiently efficient to direct the accumulation of Cas in detectable amounts in the nucleus of a eukaryotic cell. In general, the degree of nuclear localization activity may be a result of the following: the number of NLSs in the Cas, the specific NLS(s) used, or a combination of these factors. Detection of nuclear accumulation may be accomplished by any suitable technique. For example, a detectable marker may be fused to the Cas so that cellular localization may be visualized, such as in combination with a means for detecting nuclear localization (e.g., a nuclear-specific stain such as DAPI). Cell nuclei may also be isolated from the cells, and their contents may then be analyzed by any suitable method for protein detection, such as immunohistochemistry, Western blotting, or enzyme activity assay. Nuclear accumulation can also be determined indirectly, such as by analyzing the effect of CRISPR complex formation (e.g., analyzing DNA cleavage or mutation in a target sequence, or analyzing gene expression activity altered by CRISPR complex formation and/or Cas activity) compared to a control that is not exposed to Cas or the complex or exposed to Cas that lacks one or more NLSs. In some embodiments, no NLSs are added or fused to the Cas protein.
Доставка системы CRISPRDelivery of the CRISPR system
Благодаря использованию данного раскрытия и сведений из уровня техники, систему CRISPR-Cas, особенно новые системы CRISPR, описанные в данном документе, или ее компоненты, или ее молекулы нуклеиновой кислоты (в том числе, например, матрицу для HDR), или молекулы нуклеиновой кислоты, кодирующие или представляющие собой ее компоненты, можно доставлять с помощью системы доставки, описываемой в данном документе как в целом, так и в подробностях.By utilizing this disclosure and the prior art, a CRISPR-Cas system, particularly the novel CRISPR systems described herein, or components thereof, or nucleic acid molecules thereof (including, for example, an HDR template), or nucleic acid molecules encoding or comprising components thereof, can be delivered using a delivery system described herein, both generally and in detail.
Общая информация касательно векторовGeneral information about vectors
В целом и на протяжении данного описания термин "вектор" обозначает молекулу нуклеиновой кислоты, способную переносить другую нуклеиновую кислоту, с которой она была связана. Векторы включают без ограничения молекулы нуклеиновой кислоты, которые являются однонитевыми, двухнитевыми или частично двухнитевыми; молекулы нуклеиновой кислоты, которые содержат один или несколько свободных концов, не содержат свободных концов (например, кольцевые); молекулы нуклеиновой кислоты, которые содержат ДНК, РНК или и ту, и другую; и другие разновидности полинуклеотидов, известные из уровня техники. Одним типом вектора является "плазмида", которая означает кольцевую петлю двухнитевой ДНК, в которую можно встраивать дополнительные сегменты ДНК, как, например, с помощью стандартных методик молекулярного клонирования. Другим типом вектора является вирусный вектор, где полученные из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (например, ретровирусы, ретровирусы с дефектной системой репликации, аденовирусы, аденовирусы с дефектной системой репликации и аденоассоциированные вирусы). Вирусные векторы также включают полинуклеотиды, переносимые вирусом для трансфекции в клетку-хозяина. Определенные векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы с бактериальной точкой начала репликации и эписомные векторы для млекопитающих). Другие векторы (например, векторы для млекопитающих, отличные от эписомных) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и, таким образом, реплицируются вместе с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы в данном документе обозначены как "векторы экспрессии". Векторы для экспрессии в эукариотической клетке и обеспечивающие таковую в ней могут обозначаться в данном документе как "векторы экспрессии у эукариот". Общепринятые пригодные для методик рекомбинантной ДНК векторы экспрессии часто находятся в форме плазмид.In general and throughout this specification, the term "vector" refers to a nucleic acid molecule capable of transporting another nucleic acid to which it has been linked. Vectors include, but are not limited to, nucleic acid molecules that are single-stranded, double-stranded, or partially double-stranded; nucleic acid molecules that contain one or more free ends, no free ends (e.g., circular); nucleic acid molecules that contain DNA, RNA, or both; and other varieties of polynucleotides known in the art. One type of vector is a "plasmid," which refers to a circular loop of double-stranded DNA into which additional segments of DNA can be inserted, such as by standard molecular cloning techniques. Another type of vector is a viral vector, wherein virally derived DNA or RNA sequences are present in the vector for packaging into the virus (e.g., retroviruses, replication-defective retroviruses, adenoviruses, replication-defective adenoviruses, and adeno-associated viruses). Viral vectors also include polynucleotides carried by the virus for transfection into a host cell. Certain vectors are capable of autonomous replication within the host cell into which they are introduced (e.g., bacterial vectors with a bacterial origin of replication and mammalian episomal vectors). Other vectors (e.g., mammalian vectors other than episomal vectors) integrate into the host cell genome upon introduction into the host cell and are thereby replicated along with the host genome. Furthermore, certain vectors are capable of directing the expression of genes to which they are functionally linked. Such vectors are referred to herein as "expression vectors." Vectors for and providing expression in a eukaryotic cell may be referred to herein as "eukaryotic expression vectors". Commonly used expression vectors suitable for recombinant DNA techniques are often in the form of plasmids.
Рекомбинантные векторы экспрессии могут содержать нуклеиновую кислоту по настоящему изобретению в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается применять для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии предполагается, что выражение "функционально связанный" обозначает то, что представляющая интерес нуклеотидная последовательность связана с регуляторным(регуляторными) элементом(элементами), так что обеспечивается возможность экспрессии нуклеотидной последовательности (например, в системе транскрипции/трансляции in vitro или в клетке-хозяине при введении вектора в клетку-хозяина).Recombinant expression vectors may comprise a nucleic acid of the present invention in a form suitable for expression of the nucleic acid in a host cell, which means that the recombinant expression vectors comprise one or more regulatory elements, which may be selected taking into account the host cells that are intended to be used for expression, which are operably linked to the nucleic acid sequence that is intended to be expressed. In the context of a recombinant expression vector, the term "operably linked" is intended to mean that the nucleotide sequence of interest is linked to the regulatory element(s) such that expression of the nucleotide sequence is allowed (e.g. in an in vitro transcription/translation system or in a host cell upon introduction of the vector into the host cell).
Предполагается, что термин "регуляторный элемент" подразумевает промоторы, энхансеры, сайты внутренней посадки рибосомы (IRES) и другие элементы контроля экспрессии (например, сигналы терминации транскрипции, такие как сигналы полиаденилирования и поли-U-последовательности). Такие регуляторные элементы описаны, например, в Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Регуляторные элементы включают такие элементы, которые управляют конститутивной экспрессией нуклеотидной последовательности во многих типах клеток-хозяев, и такие элементы, которые управляют экспрессией нуклеотидной последовательности только в определенных клетках-хозяевах (например, тканеспецифичные регуляторные последовательности). Тканеспецифичный промотор может управлять экспрессией преимущественно в представляющей интерес целевой ткани, такой как мышца, нейрон, кость, кожа, кровь, конкретных органах (например, печени, поджелудочной железе) или определенных типах клеток (например, лимфоцитах). Регуляторные элементы также могут управлять экспрессией зависимым от времени образом, как, например, зависимым от клеточного цикла или зависимым от стадии развития образом, который также может быть или может не быть тканеспецифичным или специфичным к типу клеток. В некоторых вариантах осуществления вектор содержит один или несколько промоторов pol III (например, 1, 2, 3, 4, 5 или более промоторов pol III), один или несколько промоторов pol II (например, 1, 2, 3, 4, 5 или более промоторов pol II), один или несколько промоторов pol I (например, 1, 2, 3, 4, 5 или более промоторов pol I) или их комбинации. Примеры промоторов pol III включают без ограничения промоторы U6 и H1. Примеры промоторов pol II включают без ограничения ретровирусный промотор LTR вируса саркомы Рауса (RSV) (необязательно с энхансером RSV), промотор цитомегаловируса (CMV) (необязательно с энхансером CMV) [см., например, Boshart et al, Cell, 41:521-530 (1985)], промотор SV40, промотор гена дигидрофолатредуктазы, промотор гена β-актина, промотор гена глицерофосфаткиназы (PGK) и промотор EF1α. Также термином "регуляторный элемент" охватываются энхансерные элементы, такие как энхансеры WPRE; CMV; сегмент R-U5' в LTR из HTLV-I (Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988); энхансер SV40; а также интронная последовательность между экзонами 2 и 3 гена β-глобина кролика (Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981). Специалистам в данной области техники будет понятно, что конфигурация вектора экспрессии может зависеть от таких факторов, как выбор клетки-хозяина, подлежащей трансформации, требуемый уровень экспрессии и т.п. Вектор можно вводить в клетки-хозяева с получением, таким образом, транскриптов, белков или пептидов, в том числе слитых белков или пептидов, кодируемых нуклеиновыми кислотами, которые описаны в данном документе (например, транскриптов коротких палиндромных повторов, регулярно расположенных группами (CRISPR), белков, ферментов, их мутантных форм, их слитых белков и т.п.).The term "regulatory element" is intended to include promoters, enhancers, internal ribosome entry sites (IRES), and other expression control elements (e.g., transcription termination signals such as polyadenylation signals and poly-U sequences). Such regulatory elements are described, for example, in Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Regulatory elements include those that direct constitutive expression of a nucleotide sequence in many types of host cells and those that direct expression of a nucleotide sequence only in certain host cells (e.g., tissue-specific regulatory sequences). A tissue-specific promoter may direct expression preferentially in a target tissue of interest, such as muscle, neuron, bone, skin, blood, specific organs (e.g., liver, pancreas), or specific cell types (e.g., lymphocytes). Regulatory elements may also direct expression in a time-dependent manner, such as in a cell cycle-dependent or developmental stage-dependent manner, which may or may not also be tissue-specific or cell type-specific. In some embodiments, the vector comprises one or more pol III promoters (e.g., 1, 2, 3, 4, 5 or more pol III promoters), one or more pol II promoters (e.g., 1, 2, 3, 4, 5 or more pol II promoters), one or more pol I promoters (e.g., 1, 2, 3, 4, 5 or more pol I promoters), or combinations thereof. Examples of pol III promoters include, but are not limited to, the U6 and H1 promoters. Examples of pol II promoters include, but are not limited to, the retroviral Rous sarcoma virus (RSV) LTR promoter (optionally with the RSV enhancer), the cytomegalovirus (CMV) promoter (optionally with the CMV enhancer) [see, e.g., Boshart et al, Cell, 41:521-530 (1985)], the SV40 promoter, the dihydrofolate reductase gene promoter, the β-actin gene promoter, the glycerophosphate kinase (PGK) gene promoter, and the EF1α promoter. Also encompassed by the term "regulatory element" are enhancer elements such as the WPRE; CMV; the R-U5' segment of the LTR of HTLV-I (Mol. Cell. Biol., Vol. 8(1), pp. 466-472, 1988); the SV40 enhancer; and the intronic sequence between exons 2 and 3 of the rabbit β-globin gene (Proc. Natl. Acad. Sci. USA., Vol. 78(3), pp. 1527-31, 1981). Those skilled in the art will appreciate that the configuration of the expression vector may depend on factors such as the choice of host cell to be transformed, the desired expression level, etc. The vector can be introduced into host cells to thereby produce transcripts, proteins or peptides, including fusion proteins or peptides, encoded by nucleic acids described herein (e.g., clustered regularly interspaced short palindromic repeats (CRISPR) transcripts, proteins, enzymes, mutant forms thereof, fusion proteins thereof, etc.).
Преимущественные векторы включают лентивирусы и аденоассоциированные вирусы, и типы таких векторов также могут быть выбраны для нацеливания на определенные типы клеток.Preferred vectors include lentiviruses and adeno-associated viruses, and types of such vectors can also be selected to target specific cell types.
В некоторых вариантах осуществления один или несколько векторов, управляющих экспрессией одного или нескольких элементов системы нацеливания на нуклеиновую кислоту, вводят в клетку-хозяина, так что экспрессия элементов системы нацеливания на нуклеиновую кислоту управляет образованием комплекса нацеливания на нуклеиновую кислоту на одном или нескольких целевых сайтах. Например, каждый из эффекторного фермента для нацеливания на нуклеиновую кислоту, и направляющей РНК для нацеливания на нуклеиновую кислоту могут быть функционально связаны с отдельными регуляторными элементами в отдельных векторах. РНК системы нацеливания на нуклеиновую кислоту могут быть доставлены в трансгенное по эффекторному белку для нацеливания на нуклеиновую кислоту животное или млекопитающее, например, животное или млекопитающее, которое постоянно, или при индукции, или в определенных условиях экспрессирует эффекторный белок для нацеливания на нуклеиновую кислоту; или животное или млекопитающее, которое по другим причинам экспрессирует эффекторный белок для нацеливания на нуклеиновую кислоту или имеет клетки, содержащие эффекторный белок для нацеливания на нуклеиновую кислоту, как, например, посредством предварительного введения им вектора или векторов, кодирующих и экспрессирующих in vivo эффекторный белок для нацеливания на нуклеиновую кислоту. Альтернативно два или более элементов, экспрессируемых с одних и тех же или различных регуляторных элементов, можно объединять в одном векторе, при этом один или несколько дополнительных векторов обеспечивают любые компоненты системы нацеливания на нуклеиновую кислоту, не включенные в первый вектор. Элементы системы нацеливания на нуклеиновую кислоту, которые объединены в одном векторе, могут быть размещены в любой подходящей ориентации, как, например, один элемент, расположенный с 5'-конца ("выше") относительно второго элемента или 3'-конца ("ниже") относительно второго элемента. Кодирующая последовательность одного элемента может быть расположена на одной и той же или противоположной нити по отношению к кодирующей последовательности второго элемента и ориентирована в одном и том же или противоположном направлении. В некоторых вариантах осуществления один промотор управляет экспрессией транскрипта, кодирующего эффекторный белок для нацеливания на нуклеиновую кислоту и направляющую РНК для нацеливания на нуклеиновую кислоту, встроенных в одну или несколько интронных последовательностей (например, каждая в отдельном интроне, две или более по меньшей мере в одном интроне или все в одном интроне). В некоторых вариантах осуществления эффекторный белок для нацеливания на нуклеиновую кислоту и направляющая РНК для нацеливания на нуклеиновую кислоту могут быть функционально связаны с одним и тем же промотором и экспрессироваться с него. Средства доставки, векторы, частицы, наночастицы, составы и их компоненты для экспрессии одного или нескольких элементов системы нацеливания на нуклеиновую кислоту являются такими, как используемые в вышеизложенных документах, таких как WO 2014/093622 (PCT/US2013/074667). В некоторых вариантах осуществления вектор содержит один или несколько сайтов встраивания, как, например, последовательность узнавания рестрикционной эндонуклеазой (также называемая "сайтом клонирования"). В некоторых вариантах осуществления один или несколько сайтов встраивания (например, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или больше сайтов встраивания) находятся выше и/или ниже одного или нескольких элементов последовательности одного или нескольких векторов. В некоторых вариантах осуществления вектор содержит сайт встраивания выше парной tracr-последовательности и необязательно ниже регуляторного элемента, функционально связанного с парной tracr-последовательностью, так что после встраивания направляющей последовательности в сайт встраивания и при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса нацеливания на нуклеиновую кислоту с целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления вектор содержит два или более сайтов встраивания, чтобы обеспечить возможность встраивания направляющей последовательности в каждый сайт. При таком размещении две или более направляющих последовательностей могут содержать две или более копии одиночной направляющей последовательности, две или более различные направляющие последовательности или их комбинации. В тех случаях, когда применяются множественные отличающиеся направляющие последовательности, можно использовать одну экспрессионную конструкцию, чтобы нацеливать активности нацеливания на нуклеиновую кислоту на множественные отличающиеся соответствующие целевые последовательности в клетке. Например, один вектор может содержать приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 или больше направляющих последовательностей. В некоторых вариантах осуществления векторы, содержащие приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или больше таких направляющих последовательностей, могут быть получены и необязательно доставлены в клетку. В некоторых вариантах осуществления вектор содержит регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, которая кодирует эффекторный белок для нацеливания на нуклеиновую кислоту. Эффекторный белок для нацеливания на нуклеиновую кислоту либо направляющую РНК или направляющие РНК для нацеливания на нуклеиновую кислоту можно доставлять по отдельности; и преимущественно по меньшей мере одно из них доставляют посредством комплекса на основе частиц или наночастиц. мРНК эффекторного белка для нацеливания на нуклеиновую кислоту может быть доставлена до направляющей РНК для нацеливания на нуклеиновую кислоту, чтобы предоставить время для экспрессии эффекторного белка для нацеливания на нуклеиновую кислоту. мРНК эффекторного белка для нацеливания на нуклеиновую кислоту может быть введена за 1-12 часов (предпочтительно за приблизительно 2-6 часов) до введения направляющей РНК для нацеливания на нуклеиновую кислоту. Альтернативно мРНК эффекторного белка для нацеливания на нуклеиновую кислоту и направляющая РНК для нацеливания на нуклеиновую кислоту могут быть введены вместе. Преимущественно вторую бустерную дозу направляющей РНК можно вводить через 1-12 часов (предпочтительно через около 2-6 часов) после первого введения мРНК эффекторного белка для нацеливания на нуклеиновую кислоту + направляющей РНК. Введение дополнительных доз мРНК эффекторного белка для нацеливания на нуклеиновую кислоту и/или направляющей РНК может быть пригодным для достижения наиболее эффективных уровней модификации генома.In some embodiments, one or more vectors that direct the expression of one or more elements of a nucleic acid targeting system are introduced into a host cell such that expression of the elements of the nucleic acid targeting system directs the formation of a nucleic acid targeting complex at one or more target sites. For example, each of the nucleic acid targeting effector enzyme and the nucleic acid targeting guide RNA can be operably linked to separate regulatory elements in separate vectors. The nucleic acid targeting RNAs can be delivered to an animal or mammal transgenic for a nucleic acid targeting effector protein, such as an animal or mammal that continuously, or induced, or under certain conditions expresses the nucleic acid targeting effector protein; or an animal or mammal that otherwise expresses a nucleic acid targeting effector protein or has cells containing a nucleic acid targeting effector protein, such as by previously introducing therein a vector or vectors encoding and expressing in vivo a nucleic acid targeting effector protein. Alternatively, two or more elements expressed from the same or different regulatory elements may be combined in a single vector, with one or more additional vectors providing any components of the nucleic acid targeting system not included in the first vector. The elements of the nucleic acid targeting system that are combined in a single vector may be arranged in any suitable orientation, such as one element located 5'-end ("upstream") of the second element or 3'-end ("downstream") of the second element. The coding sequence of one element may be located on the same or opposite strand relative to the coding sequence of the second element and oriented in the same or opposite direction. In some embodiments, one promoter drives the expression of a transcript encoding a nucleic acid targeting effector protein and a nucleic acid targeting guide RNA embedded in one or more intron sequences (e.g., each in a separate intron, two or more in at least one intron, or all in a single intron). In some embodiments, the nucleic acid targeting effector protein and the nucleic acid targeting guide RNA may be operably linked to and expressed from the same promoter. Delivery vehicles, vectors, particles, nanoparticles, formulations and components thereof for expressing one or more elements of a nucleic acid targeting system are as used in the foregoing documents, such as WO 2014/093622 (PCT/US2013/074667). In some embodiments, the vector comprises one or more insertion sites, such as a restriction endonuclease recognition sequence (also referred to as a "cloning site"). In some embodiments, the one or more insertion sites (e.g., about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more insertion sites) are upstream and/or downstream of one or more sequence elements of one or more vectors. In some embodiments, the vector comprises an insertion site upstream of the tracr mate sequence and optionally downstream of a regulatory element operably linked to the tracr mate sequence, such that upon insertion of the guide sequence into the insertion site and upon expression, the guide sequence directs sequence-specific binding of the nucleic acid targeting complex to a target sequence in a eukaryotic cell. In some embodiments, the vector comprises two or more insertion sites to allow insertion of a guide sequence into each site. In such an arrangement, the two or more guide sequences may comprise two or more copies of a single guide sequence, two or more different guide sequences, or combinations thereof. In cases where multiple distinct guide sequences are used, a single expression construct may be used to direct nucleic acid targeting activities to multiple distinct corresponding target sequences in a cell. For example, one vector can contain about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 or more targeting sequences. In some embodiments, vectors containing about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more such targeting sequences can be produced and optionally delivered to a cell. In some embodiments, the vector comprises a regulatory element operably linked to an enzyme-coding sequence that encodes an effector protein for targeting a nucleic acid. The effector protein for targeting a nucleic acid or the guide RNA or guide RNAs for targeting a nucleic acid can be delivered separately; and advantageously, at least one of them is delivered via a particle-based or nanoparticle-based complex. The nucleic acid targeting effector protein mRNA may be delivered prior to the nucleic acid targeting guide RNA to allow time for the nucleic acid targeting effector protein to be expressed. The nucleic acid targeting effector protein mRNA may be administered 1-12 hours (preferably about 2-6 hours) prior to administration of the nucleic acid targeting guide RNA. Alternatively, the nucleic acid targeting effector protein mRNA and the nucleic acid targeting guide RNA may be administered together. Advantageously, the second booster dose of guide RNA may be administered 1-12 hours (preferably about 2-6 hours) after the first administration of nucleic acid targeting effector protein mRNA + guide RNA. Administration of additional doses of effector protein mRNA for targeting nucleic acid and/or guide RNA may be useful to achieve the most efficient levels of genome modification.
Общая информация касательно векторной доставкиGeneral information regarding vector delivery
Определенные аспекты настоящего изобретения относятся к векторам, например, для доставки или введения в клетку Cas и/или РНК, способной направлять Cas в целевой локус (т. e. направляющей РНК), а также для наращивания количества этих компонентов (например, в прокариотических клетках). Как используется в данном документе, "вектор" представляет собой инструмент, который позволяет или облегчает перенос объекта из одной среды в другую. Он представляет собой репликон, такой как плазмида, фаг или космида, в который может быть встроен другой сегмент ДНК для осуществления таким образом репликации встроенного сегмента. Как правило, вектор способен к репликации, если ассоциирован с соответствующими элементами контроля. В целом, термин "вектор" относится к молекуле нуклеиновой кислоты, способной переносить другую нуклеиновую кислоту, с которой она связана. Векторы включают без ограничения молекулы нуклеиновой кислоты, которые являются однонитевыми, двухнитевыми или частично двухнитевыми; молекулы нуклеиновой кислоты, которые содержат один или несколько свободных концов, не содержат свободных концов (например, кольцевые); молекулы нуклеиновой кислоты, которые содержат ДНК, РНК или и ту, и другую; и другие разновидности полинуклеотидов, известные из уровня техники. Одним типом вектора является "плазмида", которая означает кольцевую петлю двухнитевой ДНК, в которую можно встраивать дополнительные сегменты ДНК, как, например, с помощью стандартных методик молекулярного клонирования. Другим типом вектора является вирусный вектор, где полученные из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (например, ретровирусы, ретровирусы с дефектной системой репликации, аденовирусы, аденовирусы с дефектной системой репликации и аденоассоциированные вирусы (AAV)). Вирусные векторы также включают полинуклеотиды, переносимые вирусом для трансфекции в клетку-хозяина. Определенные векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы с бактериальной точкой начала репликации и эписомные векторы для млекопитающих). Другие векторы (например, векторы для млекопитающих, отличные от эписомных) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и, таким образом, реплицируются вместе с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы в данном документе обозначены как "векторы экспрессии". Общепринятые пригодные для методик рекомбинантной ДНК векторы экспрессии часто находятся в форме плазмид.Certain aspects of the present invention relate to vectors, for example, for the delivery or introduction into a cell of Cas and/or RNA capable of directing Cas to a target locus (i.e., guide RNA), as well as for increasing the amount of these components (e.g., in prokaryotic cells). As used herein, a "vector" is a vehicle that enables or facilitates the transfer of an entity from one environment to another. It is a replicon, such as a plasmid, phage, or cosmid, into which another segment of DNA can be inserted to thereby effect replication of the inserted segment. Typically, a vector is capable of replication if associated with appropriate control elements. In general, the term "vector" refers to a nucleic acid molecule capable of transferring another nucleic acid to which it has been linked. Vectors include, but are not limited to, nucleic acid molecules that are single-stranded, double-stranded, or partially double-stranded; nucleic acid molecules that contain one or more free ends, do not contain free ends (e.g., circular); nucleic acid molecules that contain DNA, RNA, or both; and other varieties of polynucleotides known in the art. One type of vector is a "plasmid," which refers to a circular loop of double-stranded DNA into which additional DNA segments can be inserted, such as by standard molecular cloning techniques. Another type of vector is a viral vector, where virally derived DNA or RNA sequences are present in the vector for packaging into the virus (e.g., retroviruses, replication-defective retroviruses, adenoviruses, replication-defective adenoviruses, and adeno-associated viruses (AAV)). Viral vectors also include polynucleotides carried by the virus for transfection into a host cell. Certain vectors are capable of autonomous replication within the host cell into which they are introduced (e.g., bacterial vectors with a bacterial origin of replication and episomal vectors for mammals). Other vectors (e.g., non-episomal mammalian vectors) integrate into the host cell genome upon introduction into the host cell and are thus replicated along with the host genome. Furthermore, certain vectors are capable of directing the expression of genes to which they are functionally linked. Such vectors are referred to herein as "expression vectors." Common expression vectors suitable for recombinant DNA techniques are often in the form of plasmids.
Рекомбинантные векторы экспрессии могут содержать нуклеиновую кислоту по настоящему изобретению в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается применять для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии предполагается, что выражение "функционально связанный" обозначает то, что представляющая интерес нуклеотидная последовательность связана с регуляторным(регуляторными) элементом(элементами), так что обеспечивается возможность экспрессии нуклеотидной последовательности (например, в системе транскрипции/трансляции in vitro или в клетке-хозяине при введении вектора в клетку-хозяина). Что касается способов рекомбинации и клонирования, следует упомянуть заявку на патент США № 10/815730, опубликованную 2 сентября 2004 г. как US 2004-0171156 A1, содержание которой включено в данный документ посредством ссылки в полном объеме.Recombinant expression vectors may comprise a nucleic acid of the present invention in a form suitable for expression of the nucleic acid in a host cell, which means that the recombinant expression vectors comprise one or more regulatory elements, which may be selected taking into account the host cells that are intended to be used for expression, which are operably linked to the nucleic acid sequence that is intended to be expressed. In the context of a recombinant expression vector, the term "operably linked" is intended to mean that the nucleotide sequence of interest is linked to the regulatory element(s) such that expression of the nucleotide sequence is allowed (e.g. in an in vitro transcription/translation system or in a host cell upon introduction of the vector into the host cell). With respect to recombination and cloning methods, reference should be made to U.S. Patent Application No. 10/815,730, published September 2, 2004 as US 2004-0171156 A1, the contents of which are incorporated herein by reference in their entirety.
Вектор(векторы) могут включать в себя регуляторный(регуляторные) элемент(элементы), например, промотор(промоторы). Вектор(векторы) могут содержать кодирующие Cas последовательности и/или одну, но, возможно, также могут содержать по меньшей мере 3, или 8, или 16, или 32, или 48, или 50 кодирующих направляющие РНК (например, sgRNA) последовательности, как, например, 1-2, 1-3, 1-4 1-5, 3-6, 3-7, 3-8, 3-9, 3-10, 3-8, 3-16, 3-30, 3-32, 3-48, 3-50 РНК (например, sgRNA). В одном векторе может быть промотор для каждой РНК (например, sgRNA), преимущественно, если присутствует до приблизительно 16 РНК (например, sgRNA); а если в одном векторе содержится более чем 16 РНК (например, sgRNA), то один промотор или несколько промоторов могут управлять экспрессией более чем одной РНК (например, sgRNA), например, если присутствует 32 РНК (например, sgRNA), то каждый промотор может управлять экспрессией двух РНК (например, sgRNA), и если присутствует 48 РНК (например, sgRNA), то каждый промотор может управлять экспрессией трех РНК (например, sgRNA). Путем простых арифметических приемов и общепринятых протоколов клонирования, а также идей настоящего раскрытия специалист в данной области сможет легко осуществить настоящее изобретение на практике, что касается РНК (например, sgRNA) для подходящего иллюстративного вектора, такого как AAV, и подходящего промотора, такого как промотор U6, например, U6-sgRNA. Например, предел упаковки AAV составляет ~4,7 т. п. о. Длина одного U6-sgRNA (плюс сайты рестрикции для клонирования) составляет 361 п. о. Следовательно, специалист в данной области сможет легко разместить приблизительно 12-16, например 13, кассет U6-sgRNA в одном векторе. Он может быть собран с помощью любого подходящего способа, как, например, стратегия Golden Gate, применяемая для сборки TALE (http://www.genome-engineering.org/taleffectors/). Специалист в данной области также может применять стратегию, основанную на использовании тандемных направляющих, для повышения числа U6-sgRNA в примерно 1,5 раза, например, для повышения числа U6-sgRNA от 12 до 16, например, от 13 до примерно 18-24, например, приблизительно 19. Следовательно, специалист в данной области сможет легко получить примерно 18-24, например приблизительно 19, промоторов-РНК, например U6-sgRNA, в одном векторе, например в векторе на основе AAV. Дополнительным способом повышения числа промоторов и РНК, например, sgRNA, в векторе является применение одного промотора (например, U6) для экспрессии массива РНК, например, sgRNA, разделенных расщепляемыми последовательностями. Еще одним дополнительным способом повышения числа промоторов-РНК, например, sgRNA, в векторе является экспрессия массива промоторов-РНК, например, sgRNA, разделенных расщепляемыми последовательностями в интроне кодирующей последовательности или гена; и в данном случае преимущественным является применение промотора полимеразы II, который может обладать повышенной экспрессией и способностью к транскрипции длинной РНК специфическим в отношении ткани образом. (См., например, http://nar.oxfordjournals.org/content/34/7/e53.short, http://www.nature.com/mt/journal/v16/n9/abs/mt2008144a.html). В преимущественном варианте осуществления AAV может упаковывать U6 в тандеме с sgRNA, нацеливающейся на приблизительно 50 генов включительно. Соответственно, исходя из сведений из уровня техники и идей настоящего раскрытия специалист в данной области сможет легко получить и применять вектор(векторы), например, один вектор, экспрессирующий несколько РНК, или направляющих, или sgRNA, находящихся под контролем одного или нескольких промоторов либо функционально эффективно или функционально связанных с ними, особенно это касается числа РНК, или направляющих, или sgRNA, обсуждаемых в данном документе, без каких-либо неоправданных экспериментов.The vector(s) may comprise a regulatory element(s), such as a promoter(s). The vector(s) may comprise Cas coding sequences and/or one, but may also comprise at least 3, or 8, or 16, or 32, or 48, or 50 guide RNA (e.g. sgRNA) coding sequences, such as 1-2, 1-3, 1-4, 1-5, 3-6, 3-7, 3-8, 3-9, 3-10, 3-8, 3-16, 3-30, 3-32, 3-48, 3-50 RNAs (e.g. sgRNA). There may be a promoter for each RNA (e.g. sgRNA) in one vector, advantageously if up to about 16 RNAs (e.g. sgRNA) are present; and if there are more than 16 RNAs (e.g., sgRNAs) in a single vector, then one or more promoters can drive the expression of more than one RNA (e.g., sgRNA), for example, if there are 32 RNAs (e.g., sgRNAs), then each promoter can drive the expression of two RNAs (e.g., sgRNAs), and if there are 48 RNAs (e.g., sgRNAs), then each promoter can drive the expression of three RNAs (e.g., sgRNAs). By simple arithmetic and conventional cloning protocols, as well as the teachings of the present disclosure, one skilled in the art will be able to readily practice the present invention with respect to RNAs (e.g., sgRNAs) for a suitable exemplary vector, such as AAV, and a suitable promoter, such as the U6 promoter, e.g., U6-sgRNA. For example, the packaging limit of AAV is ~4.7 kb. The length of one U6-sgRNA (plus restriction sites for cloning) is 361 bp. Therefore, one skilled in the art can easily accommodate about 12-16, such as 13, U6-sgRNA cassettes in a single vector. It can be assembled using any suitable method, such as the Golden Gate strategy used for TALE assembly (http://www.genome-engineering.org/taleffectors/). One skilled in the art can also use a tandem guide strategy to increase the number of U6-sgRNA by about 1.5-fold, such as to increase the number of U6-sgRNA from 12 to 16, such as from 13 to about 18-24, such as about 19. Therefore, one skilled in the art can easily obtain about 18-24, such as about 19, promoter RNAs, such as U6-sgRNA, in a single vector, such as an AAV-based vector. An additional way to increase the number of promoters and RNAs, e.g., sgRNAs, in a vector is to use a single promoter (e.g., U6) to express an array of RNAs, e.g., sgRNAs, separated by cleavable sequences. Yet another additional way to increase the number of promoters-RNAs, e.g., sgRNAs, in a vector is to express an array of promoters-RNAs, e.g., sgRNAs, separated by cleavable sequences within an intron of a coding sequence or gene; in this case, it is advantageous to use a polymerase II promoter, which may have increased expression and the ability to transcribe long RNA in a tissue-specific manner. (See, e.g., http://nar.oxfordjournals.org/content/34/7/e53.short, http://www.nature.com/mt/journal/v16/n9/abs/mt2008144a.html). In an advantageous embodiment, the AAV can package U6 in tandem with an sgRNA targeting up to and including approximately 50 genes. Accordingly, based on the knowledge of the prior art and the teachings of the present disclosure, one skilled in the art can readily prepare and use vector(s), such as a single vector, expressing multiple RNAs or guides or sgRNAs under the control of one or more promoters, or functionally effective or operably linked to them, particularly with respect to the number of RNAs or guides or sgRNAs discussed herein, without undue experimentation.
Кодирующие направляющие РНК, например, sgRNA, последовательности и/или кодирующие Cas последовательности могут быть функционально или функционально эффективно связанными с регуляторным(регуляторными) элементом(элементами), и, следовательно, регуляторный(регуляторные) элемент(элементы) управляет(управляют) экспрессией. Промотор(промоторы) может(могут) быть конститутивным(конститутивными) промотором(промоторами), и/или активируемым(активируемыми) при определенных условиях промотором(промоторами), и/или индуцируемым(индуцируемыми) промотором(промоторами), и/или тканеспецифичным(тканеспецифичными) промотором(промоторами). Промотор может быть выбран из группы, состоящей из РНК-полимераз, pol I, pol II, pol III, T7, U6, H1, ретровирусного промотора LTR вируса саркомы Рауса (RSV), промотора цитомегаловируса (CMV), промотора SV40, промотора дигидрофолатредуктазы, промотора β-актина, промотора глицерофосфаткиназы (PGK) и промотора EF1α. Предпочтительным промотором является промотор U6.The coding guide RNAs, e.g. sgRNAs, sequences and/or Cas coding sequences may be functionally or functionally effectively linked to a regulatory element(s), and hence the regulatory element(s) controls expression. The promoter(s) may be a constitutive promoter(s) and/or a conditionally activated promoter(s) and/or an inducible promoter(s) and/or a tissue-specific promoter(s). The promoter may be selected from the group consisting of RNA polymerases, pol I, pol II, pol III, T7, U6, H1, the retroviral LTR promoter of Rous sarcoma virus (RSV), the cytomegalovirus (CMV) promoter, the SV40 promoter, the dihydrofolate reductase promoter, the β-actin promoter, the glycerophosphate kinase (PGK) promoter, and the EF1α promoter. A preferred promoter is the U6 promoter.
Векторная доставкаVector delivery
Векторная доставка, например, доставка с помощью плазмиды, вируса. Фермент CRISPR, например Cas9, и/или любую из РНК по настоящему изобретению, например направляющую РНК, можно доставлять с помощью любого подходящего вектора, например плазмиды или вирусных векторов, таких как аденоассоциированный вирус (AAV), лентивирус, аденовирус или другие типы вирусных векторов, или их комбинации. Cas9 и одна или несколько направляющих РНК могут быть упакованы в одном или нескольких векторах, например, плазмиде или вирусных векторах. В некоторых вариантах осуществления вектор, например, плазмиду или вирусный вектор, доставляют в представляющую интерес ткань посредством, например, внутримышечной инъекции, тогда как в других случаях доставка осуществляется посредством внутривенного, трансдермального, интраназального, перорального, трансмукозального или других способов доставки. Такая доставка может осуществляться в виде однократной дозы или многократных доз. Специалисту в данной области понятно, что фактическая доза, подлежащая доставке согласно данному документу, может в значительной степени варьировать в зависимости от ряда факторов, таких как выбор вектора, целевые клетка, организм или ткань, общее состояние субъекта, подлежащего лечению, степень требуемой трансформации/модификации, путь введения, способ введения, тип требуемой трансформации/модификации и т.п.Vector delivery, e.g., plasmid, viral delivery. The CRISPR enzyme, e.g., Cas9, and/or any of the RNAs of the present invention, e.g., guide RNA, can be delivered using any suitable vector, e.g., plasmid or viral vectors such as adeno-associated virus (AAV), lentivirus, adenovirus or other types of viral vectors, or combinations thereof. Cas9 and one or more guide RNAs can be packaged in one or more vectors, e.g., plasmid or viral vectors. In some embodiments, the vector, e.g., plasmid or viral vector, is delivered to the tissue of interest by, e.g., intramuscular injection, while in other cases, delivery is via intravenous, transdermal, intranasal, oral, transmucosal or other delivery methods. Such delivery can be in the form of a single dose or multiple doses. One skilled in the art will appreciate that the actual dose to be delivered herein may vary significantly depending on a number of factors such as the choice of vector, the target cell, organism or tissue, the general condition of the subject being treated, the degree of transformation/modification required, the route of administration, the route of administration, the type of transformation/modification required, etc.
Такая доза может дополнительно содержать, например, носитель (воду, солевой раствор, этанол, глицерин, лактозу, сахарозу, фосфат кальция, желатин, декстран, агар, пектин, арахисовое масло, кунжутное масло и т.д.), разбавитель, фармацевтически приемлемый носитель (например, фосфатно-солевой буфер), фармацевтически приемлемый наполнитель и/или другие соединения, известные из уровня техники. Доза может дополнительно содержать одну или несколько фармацевтически приемлемых солей, таких как, например, соль неорганической кислоты, такая как гидрохлорид, гидробромид, фосфат, сульфат и т.д.; и соли органических кислот, такие как ацетаты, пропионаты, малонаты, бензоаты и т.д. Дополнительно в ней также могут присутствовать вспомогательные вещества, такие как смачивающие или эмульгирующие средства, буферные вещества, поддерживающие pH, гели или гелеобразующие материалы, ароматизаторы, красители, микросферы, полимеры, суспендирующие средства и т.д. Кроме того, также могут присутствовать один или несколько других традиционных фармацевтических ингредиентов, таких как консерванты, увлажнители, суспендирующие средства, поверхностно-активные вещества, антиоксиданты, средства против слеживания, заполнители, хелатообразователи, средства для нанесения покрытий, химические стабилизаторы и т.д., особенно если лекарственная форма представляет собой форму, подлежащую восстановлению. Подходящие иллюстративные ингредиенты включают микрокристаллическую целлюлозу, натрий-карбоксиметилцеллюлозу, полисорбат 80, фенилэтиловый спирт, хлорбутанол, сорбат калия, сорбиновую кислоту, диоксид серы, пропилгаллат, парабены, этилванилин, глицерин, фенол, парахлорфенол, желатин, альбумин и их комбинацию. Подробное обсуждение фармацевтически приемлемых наполнителей доступно в REMINGTON'S PHARMACEUTICAL SCIENCES (Mack Pub. Co., N.J. 1991), включенном в данный документ посредством ссылки.Such a dose may further comprise, for example, a carrier (water, saline, ethanol, glycerol, lactose, sucrose, calcium phosphate, gelatin, dextran, agar, pectin, peanut oil, sesame oil, etc.), a diluent, a pharmaceutically acceptable carrier (e.g., phosphate buffered saline), a pharmaceutically acceptable excipient, and/or other compounds known in the art. The dose may further comprise one or more pharmaceutically acceptable salts, such as, for example, a salt of an inorganic acid, such as hydrochloride, hydrobromide, phosphate, sulfate, etc.; and salts of organic acids, such as acetates, propionates, malonates, benzoates, etc. Additionally, it may also contain auxiliary substances such as wetting or emulsifying agents, pH buffering agents, gels or gelling materials, flavorings, coloring agents, microspheres, polymers, suspending agents, etc. In addition, one or more other conventional pharmaceutical ingredients such as preservatives, humectants, suspending agents, surfactants, antioxidants, anti-caking agents, fillers, chelating agents, coating agents, chemical stabilizers, etc. may also be present, especially if the dosage form is a form to be reconstituted. Suitable illustrative ingredients include microcrystalline cellulose, sodium carboxymethylcellulose, polysorbate 80, phenylethyl alcohol, chlorobutanol, potassium sorbate, sorbic acid, sulfur dioxide, propyl gallate, parabens, ethyl vanillin, glycerin, phenol, parachlorophenol, gelatin, albumin, and combinations thereof. A detailed discussion of pharmaceutically acceptable excipients is available in REMINGTON'S PHARMACEUTICAL SCIENCES (Mack Pub. Co., N.J. 1991), incorporated herein by reference.
В одном варианте осуществления согласно данному документу доставку осуществляют посредством аденовируса, который может находиться в однократной бустерной дозе, содержащей по меньшей мере 1 x 105 частиц (также называемых единицами частиц, pu) аденовирусного вектора. В одном варианте осуществления согласно данному документу доза предпочтительно составляет по меньшей мере приблизительно 1 x 106 частиц (например, приблизительно 1 x 106 - 1 x 1012 частиц), более предпочтительно по меньшей мере приблизительно 1 x 107 частиц, более предпочтительно по меньшей мере приблизительно 1 x 108 частиц (например, приблизительно 1 x 108 - 1 x 1011 частиц или приблизительно 1 x 108 - 1 x 1012 частиц) и наиболее предпочтительно по меньшей мере приблизительно 1 x 100 частиц (например, приблизительно 1 x 109 - 1 x 1010 частиц или приблизительно 1 x 109 - 1 x 1012 частиц) или даже по меньшей мере приблизительно 1 x 1010 частиц (например, приблизительно 1 x 1010 - 1 x 1012 частиц) аденовирусного вектора. Альтернативно доза содержит не более чем приблизительно 1 x 1014 частиц, предпочтительно не более чем приблизительно 1 x 1013 частиц, еще более предпочтительно не более чем приблизительно 1 x 1012 частиц, еще более предпочтительно не более чем приблизительно 1 x 1011 частиц и наиболее предпочтительно не более чем приблизительно 1 x 1010 частиц (например, не более чем приблизительно 1 x 109 частиц). Таким образом, доза может включать в себя однократную дозу аденовирусного вектора, например, с приблизительно 1 x 106 единиц частиц (pu), приблизительно 2 x 106 pu, приблизительно 4 x 106 pu, приблизительно 1 x 107 pu, приблизительно 2 x 107 pu, приблизительно 4 x 107 pu, приблизительно 1 x 108 pu, приблизительно 2 x 108 pu, приблизительно 4 x 108 pu, приблизительно 1 x 109 pu, приблизительно 2 x 109 pu, приблизительно 4 x 109 pu, приблизительно 1 x 1010 pu, приблизительно 2 x 1010 pu, приблизительно 4 x 1010 pu, приблизительно 1 x 1011 pu, приблизительно 2 x 1011 pu, приблизительно 4 x 1011 pu, приблизительно 1 x 1012 pu, приблизительно 2 x 1012 pu или приблизительно 4 x 1012 pu аденовирусного вектора. См., например, аденовирусные векторы в патенте США № 8454972 B2 Nabel, et. al., выданном 4 июня 2013 г.; включенном в данный документ посредством ссылки, и дозы в столбце 29, строках 36-58 данного патента. В одном варианте осуществления согласно данному документу аденовирус доставляется посредством многократных доз.In one embodiment according to this document, delivery is carried out via adenovirus, which can be in a single booster dose containing at least 1 x 10 5 particles (also referred to as particle units, pu) of adenoviral vector. In one embodiment according to this document, the dose is preferably at least about 1 x 10 6 particles (e.g., about 1 x 10 6 - 1 x 10 12 particles), more preferably at least about 1 x 10 7 particles, more preferably at least about 1 x 10 8 particles (e.g., about 1 x 10 8 - 1 x 10 11 particles or about 1 x 10 8 - 1 x 10 12 particles) and most preferably at least about 1 x 10 0 particles (e.g., about 1 x 10 9 - 1 x 10 10 particles or about 1 x 10 9 - 1 x 10 12 particles) or even at least about 1 x 10 10 particles (e.g., about 1 x 10 10 - 1 x 10 12 particles) of adenoviral vector. Alternatively, the dose contains no more than about 1 x 10 14 particles, preferably no more than about 1 x 10 13 particles, even more preferably no more than about 1 x 10 12 particles, even more preferably no more than about 1 x 10 11 particles, and most preferably no more than about 1 x 10 10 particles (e.g., no more than about 1 x 10 9 particles). Thus, the dose may comprise a single dose of adenoviral vector, for example, with about 1 x 10 6 particle units (pu), about 2 x 10 6 pu, about 4 x 10 6 pu, about 1 x 10 7 pu, about 2 x 10 7 pu, about 4 x 10 7 pu, about 1 x 10 8 pu, about 2 x 10 8 pu, about 4 x 10 8 pu, about 1 x 10 9 pu, about 2 x 10 9 pu, about 4 x 10 9 pu, about 1 x 10 10 pu, about 2 x 10 10 pu, about 4 x 10 10 pu, about 1 x 10 11 pu, about 2 x 10 11 pu, about 4 x 10 11 pu, about 1 x 10 12 pu, about 2 x 10 12 pu, or about 4 x 10 12 pu of an adenovirus vector. See, for example, the adenovirus vectors in U.S. Patent No. 8,454,972 B2 to Nabel, et al., issued June 4, 2013; incorporated herein by reference, and the doses at column 29, lines 36-58 of that patent. In one embodiment according to this document, the adenovirus is delivered via multiple doses.
В одном варианте осуществления согласно данному документу доставку осуществляют посредством AAV. Полагают, что терапевтически эффективная доза для in vivo доставки AAV человеку находится в диапазоне от приблизительно 20 до приблизительно 50 мл физиологического раствора, содержащего от приблизительно 1 x 1010 до приблизительно 1 x 1010 функциональных частиц AAV/мл раствора. Дозу можно скорректировать для уравновешивания терапевтической пользы и любых побочных эффектов. В одном варианте осуществления согласно данному документу доза AAV, как правило, находится в диапазоне концентраций от приблизительно 1 x 105 до 1 x 1050 геномов AAV, от приблизительно 1 x 108 до 1 x 1020 геномов AAV, от приблизительно 1 x 1010 до приблизительно 1 x 1016 геномов или от приблизительно 1 x 1011 до приблизительно 1 x 1016 геномов AAV. Доза для человека может составлять приблизительно 1 x 1013 геномов AAV. Такие концентрации можно доставлять в растворе носителя объемом от приблизительно 0,001 мл до приблизительно 100 мл, от приблизительно 0,05 до приблизительно 50 мл или от приблизительно 10 до приблизительно 25 мл. Другие эффективные дозы может без труда установить средний специалист в данной области посредством стандартных испытаний с построением кривых зависимости "доза-эффект". См., например, патент США № 8404658 B2 Hajjar, et al., выданный 26 марта 2013 г., в столбце 27, строках 45-60.In one embodiment according to the present document, delivery is carried out via AAV. It is believed that a therapeutically effective dose for in vivo delivery of AAV to a human is in the range of about 20 to about 50 ml of saline solution containing about 1 x 10 10 to about 1 x 10 10 functional AAV particles/ml of solution. The dose can be adjusted to balance the therapeutic benefit and any side effects. In one embodiment according to the present document, the dose of AAV is typically in the concentration range of about 1 x 10 5 to 1 x 10 50 AAV genomes, about 1 x 10 8 to 1 x 10 20 AAV genomes, about 1 x 10 10 to about 1 x 10 16 genomes, or about 1 x 10 11 to about 1 x 10 16 AAV genomes. A human dose may be about 1 x 10 13 AAV genomes. Such concentrations may be delivered in a carrier solution of about 0.001 ml to about 100 ml, about 0.05 ml to about 50 ml, or about 10 ml to about 25 ml. Other effective doses may be readily determined by one of ordinary skill in the art through routine dose-response testing. See, for example, U.S. Patent No. 8,404,658 B2 to Hajjar, et al., issued March 26, 2013, at column 27, lines 45-60.
Общие принципы упаковки и использования промоторовGeneral principles of packaging and use of promoters
Существуют следующие способы упаковки молекул нуклеиновой кислоты, кодирующих Cas9, например ДНК, в векторы, например вирусные векторы, для опосредования модификации генома in vivo.The following methods exist for packaging Cas9-encoding nucleic acid molecules, such as DNA, into vectors, such as viral vectors, to mediate genome modification in vivo.
Для обеспечения опосредованного NHEJ нокаута гена необходимо следующее.To achieve NHEJ-mediated gene knockout, the following is required.
Один вирусный векторOne viral vector
Вектор, содержащий две или более кассет экспрессии:A vector containing two or more expression cassettes:
промотор-молекула нуклеиновой кислоты, кодирующая Cas9-терминатор;promoter - a nucleic acid molecule encoding the Cas9 terminator;
промотор-gRNA1-терминатор;promoter-gRNA1-terminator;
промотор-gRNA2-терминатор;promoter-gRNA2-terminator;
промотор-gRNA(N)-терминатор (до предельного размера вектора).promoter-gRNA(N)-terminator (up to the maximum vector size).
Два вирусных вектораTwo viral vectors
Вектор 1, содержащий одну кассету экспрессии для управления экспрессией Cas9:Vector 1 containing one expression cassette to drive Cas9 expression:
промотор-молекула нуклеиновой кислоты, кодирующая Cas9-терминатор;promoter - a nucleic acid molecule encoding the Cas9 terminator;
вектор 2, содержащий одну или несколько кассет экспрессии для управления экспрессией одной или нескольких направляющих РНК:vector 2 containing one or more expression cassettes for directing the expression of one or more guide RNAs:
промотор-gRNA1-терминатор;promoter-gRNA1-terminator;
промотор-gRNA(N)-терминатор (до предельного размера вектора).promoter-gRNA(N)-terminator (up to the maximum vector size).
Для опосредования репарации с участием гомологичной рекомбинации.To mediate repair involving homologous recombination.
В дополнение к подходам с одним и двумя вирусными векторами, описанными выше, можно использовать дополнительный вектор для доставки матрицы для репарации с участием гомологичной рекомбинации.In addition to the single and dual viral vector approaches described above, an additional vector can be used to deliver a template for repair involving homologous recombination.
Промотор, используемый для управления экспрессией молекулы нуклеиновой кислоты, кодирующей Cas9, может включать следующее.The promoter used to drive expression of the nucleic acid molecule encoding Cas9 may include the following.
ITR AAV может служить в качестве промотора: это является преимущественным для устранения необходимости в дополнительном промоторном элементе (который может занимать пространство в векторе). Освободившееся дополнительное пространство можно задействовать для управления экспрессией дополнительных элементов (gRNA и т.д.). Также активность ITR является относительно более слабой, поэтому ее можно использовать для снижения потенциальной токсичности, обусловленной сверхэкспрессией Cas9.The AAV ITR can serve as a promoter: this is advantageous in that it eliminates the need for an additional promoter element (which may take up space in the vector). The freed up extra space can be used to drive the expression of additional elements (gRNA, etc.). Also, the ITR activity is relatively weaker, so it can be used to reduce the potential toxicity caused by Cas9 overexpression.
Для повсеместной экспрессии можно использовать следующие промоторы: CMV, CAG, CBh, PGK, SV40, генов тяжелой или легкой цепей ферритина и т.д.For ubiquitous expression, the following promoters can be used: CMV, CAG, CBh, PGK, SV40, ferritin heavy or light chain genes, etc.
Для экспрессии в головном мозге или в другом отделе ЦНС можно использовать следующие промоторы: гена синапсина I для всех нейронов, гена CaMKII-альфа для возбуждающих нейронов, GAD67, или GAD65, или VGAT для GABA-эргических нейронов и т.д.For expression in the brain or other part of the CNS, the following promoters can be used: the synapsin I gene for all neurons, the CaMKII-alpha gene for excitatory neurons, GAD67 or GAD65 or VGAT for GABAergic neurons, etc.
Для экспрессии в печени можно использовать промотор гена альбумина.For expression in the liver, the albumin gene promoter can be used.
Для экспрессии в легких можно использовать SP-B.SP-B can be used for expression in the lungs.
Для эндотелиальных клеток можно использовать ICAM.For endothelial cells, ICAM can be used.
Для кроветворных клеток можно использовать промотор гена IFN-бета или CD45.For hematopoietic cells, the IFN-beta or CD45 gene promoter can be used.
Для остеобластов можно использовать OG-2.For osteoblasts, OG-2 can be used.
Промотор, используемый для управления направляющей РНК, может включать в себя следующее:The promoter used to drive the guide RNA may include the following:
промоторы для Pol III, такие как U6 или H1.promoters for Pol III, such as U6 or H1.
Использование промотора для Pol II и интронных кассет для экспрессии gRNA.Use of a Pol II promoter and intronic cassettes for gRNA expression.
Кристаллизация и структура CRISPR-Cas9Crystallization and structure of CRISPR-Cas9
Кристаллизация CRISPR-Cas9 и определение характеристики кристаллической структуры. Кристаллы могут быть получены с помощью методик, используемых в кристаллографии белков, в том числе способами групповой обработки, жидкого моста, диализа, диффузии из паровой фазы и "висячей капли". Как правило, кристаллы выращивают путем растворения практически чистой CRISPR-Cas9 и молекулы нуклеиновой кислоты, с которой она связывается, в водном буфере, содержащем осаждающее вещество при концентрации чуть ниже необходимой для осаждения. Воду удаляют путем контролируемого выпаривания для обеспечения условий осаждения, которые поддерживают до прекращения роста кристаллов. См., Nishimasu et al.Crystallization of CRISPR-Cas9 and characterization of the crystal structure. Crystals can be prepared using techniques used in protein crystallography, including batch processing, liquid bridge, dialysis, vapor diffusion, and hanging drop methods. Typically, crystals are grown by dissolving nearly pure CRISPR-Cas9 and the nucleic acid molecule to which it binds in an aqueous buffer containing a precipitant at a concentration just below that required for precipitation. Water is removed by controlled evaporation to provide precipitation conditions, which are maintained until crystal growth ceases. See, Nishimasu et al.
Пути применения кристаллов, координат кристаллической структуры и атомной структуры. Кристаллы и, в частности, полученные на основании них координаты атомной структуры, имеют широкий спектр применений. Кристаллы и координаты структуры особенно пригодны для идентификации соединений (молекул нуклеиновой кислоты), которые связываются с CRISPR-Cas9, и CRISPR-Cas9, которые могут связываться с конкретными соединениями (молекулами нуклеиновой кислоты). Таким образом, координаты структуры, описанные в данном документе, можно использовать в качестве моделей фазирования при определении кристаллических структур дополнительных синтетических или подвергнутых мутации CRISPR-Cas9, Cas9, никаз, доменов связывания. Обеспечение кристаллической структуры CRISPR-Cas9, находящейся в комплексе с молекулой нуклеиновой кислоты, может обеспечить специалисту понимание сути CRISPR-Cas9. Такое понимание обеспечивает возможность разработки модифицированных CRISPR-Cas9, как, например, путем прикрепления к ним функциональной группы, такой как репрессор или активатор. Хотя к N- или C-концу CRISPR-Cas9 можно прикрепить функциональную группу, такую как репрессор или активатор, кристаллическая структура демонстрирует, что N-конец, по видимому, загорожен или скрыт, тогда как C-конец более доступен для функциональной группы, такой как репрессор или активатор. Более того, кристаллическая структура демонстрирует, что существует гибкая петля между остатками CRISPR-Cas9 (S. pyogenes), соответствующими примерно 534-676, которая подходит для прикрепления функциональной группы, такой как активатор или репрессор. Прикрепление может быть выполнено посредством линкера, например, гибкого глицин-серинового (GlyGlyGlySer) или (GGGS)3 или жесткого альфа-спирального линкера, такого как (Ala(GluAlaAlaAlaLys)Ala). Кроме гибкой петли также имеется нуклеазный или H3-участок, H2-участок и спиральный участок. Под "спиралью" или "спиральным" подразумевают спираль, как известно из уровня техники, в том числе без ограничения альфа-спираль. Кроме того, термин "спираль" или "спиральный" также может использоваться для обозначения C-концевого спирального элемента с N-концевым поворотом.Applications of Crystals, Crystal Structure Coordinates, and Atomic Structure. Crystals, and in particular the atomic structure coordinates derived therefrom, have a wide range of applications. Crystals and structure coordinates are particularly useful for identifying compounds (nucleic acid molecules) that bind to CRISPR-Cas9 and CRISPR-Cas9 that can bind to specific compounds (nucleic acid molecules). Thus, the structure coordinates described herein can be used as phasing models in determining crystal structures of additional synthetic or mutated CRISPR-Cas9, Cas9, nickase, binding domains. Providing a crystal structure of CRISPR-Cas9 complexed with a nucleic acid molecule can provide one skilled in the art with insight into CRISPR-Cas9. Such insight enables the development of modified CRISPR-Cas9, such as by attaching a functional group such as a repressor or activator. Although a functional group such as a repressor or activator can be attached to the N- or C-terminus of CRISPR-Cas9, the crystal structure shows that the N-terminus appears to be obstructed or buried, while the C-terminus is more accessible to a functional group such as a repressor or activator. Furthermore, the crystal structure shows that there is a flexible loop between residues corresponding to approximately 534-676 of CRISPR-Cas9 (S. pyogenes), which is suitable for the attachment of a functional group such as an activator or repressor. The attachment can be accomplished through a linker such as a flexible glycine-serine (GlyGlyGlySer) or (GGGS)3 or a rigid alpha-helical linker such as (Ala(GluAlaAlaAlaLys)Ala). In addition to the flexible loop, there is also a nuclease or H3 region, an H2 region, and a helical region. By "helix" or "helical" is meant a helix as known in the art, including but not limited to an alpha helix. In addition, the term "helix" or "helical" may also be used to refer to a C-terminal helical element with an N-terminal turn.
Обеспечение кристаллической структуры CRISPR-Cas9, находящейся в комплексе с молекулой нуклеиновой кислоты, обеспечивает новый подход для поиска новых лекарственных средств или соединений, идентификации и разработки соединений, которые могут связываться с CRISPR-Cas9, и, таким образом, в настоящем изобретении предусматриваются инструменты, пригодные для диагностики, лечения или предупреждения состояний или заболеваний у многоклеточных организмов, например, водорослей, растений, позвоночных, рыб, амфибий, рептилий, птиц, млекопитающих; например, домашних растений, животных (например, продуктивных животных, таких как свинья, жвачное животное, курица; животного-компаньона, такого как представители кошачьих, собачьих, грызунов (кролик, песчанка, хомячок); лабораторных животных, таких как мышь, крыса) и людей. Соответственно, в настоящем изобретении предусмотрен способ рациональной разработки комплексов CRISPR-Cas9, основанный на использовании компьютера. Такая рациональная разработка может предусматривать обеспечение структуры комплекса CRISPR-Cas9, определяемой с помощью некоторых или всех (например, по меньшей мере 2 или больше, например, по меньшей мере 5, преимущественно по меньшей мере 10, более преимущественно по меньшей мере 50 и еще более преимущественно по меньшей мере 100 атомов структуры) координат из таблицы кристаллических структур и/или представленных на фигуре(фигурах), касающихся кристаллической структуры; см. Nishimasu et al.; обеспечение структуры требуемой молекулы нуклеиновой кислоты, в отношении которой требуется комплекс CRISPR-Cas9; и подгонку структуры комплекса CRISPR-Cas9, определяемой с помощью некоторых или всех координат, к требуемой молекуле нуклеиновой кислоты, включенной в указанную подгонку, с получением предполагаемой(предполагаемых) модификации(модификаций) комплекса CRISPR-Cas9, определяемого с помощью некоторых или всех координат, для того, чтобы указанная требуемая молекула нуклеиновой кислоты связывалась с комплексом(комплексами) CRISPR-Cas9, включающим(включающими) требуемую молекулу нуклеиновой кислоты. В способе или подгонке согласно способу можно использовать координаты представляющих интерес атомов комплекса CRISPR-Cas9, определяемого с помощью некоторых или всех координат, которые соответствуют близлежащей по отношению к активному сайту или участку связывания области (например, по меньшей мере 2 или больше, например, по меньшей мере 5, преимущественно по меньшей мере 10, более преимущественно по меньшей мере 50 и еще более преимущественно по меньшей мере 100 атомов структуры), для моделирования близлежащей по отношению к активному сайту или участку связывания области. Эти координаты можно использовать для определения пространства, в отношении которого затем проводят скрининг "in silico" в отношении требуемой или кандидатной молекулы нуклеиновой кислоты. Таким образом, в настоящем изобретении предусмотрен способ рациональной разработки комплексов CRISPR-Cas9, основанный на использовании компьютера. Данный способ может предусматривать обеспечение координат по меньшей мере двух атомов из таблицы кристаллических структур ("выбранные координаты"); см. Nishimasu et al.; обеспечение структуры кандидатной или требуемой молекулы нуклеиновой кислоты и подгонку структуры кандидата к выбранным координатам. Таким образом специалист также может подогнать функциональную группу и кандидатную или требуемую молекулу нуклеиновой кислоты. Например, обеспечение структуры комплекса CRISPR-Cas9, определяемой с помощью некоторых или всех (например, по меньшей мере 2 или больше, например, по меньшей мере 5, преимущественно по меньшей мере 10, более преимущественно по меньшей мере 50 и еще более преимущественно по меньшей мере 100 атомов структуры) координат; обеспечение структуры требуемой молекулы нуклеиновой кислоты, в отношении которой требуется комплекс CRISPR-Cas9; подгонка структуры комплекса CRISPR-Cas9, определяемой с помощью некоторых или всех координат из таблицы кристаллических структур и/или представленных на фигурах, касающихся кристаллической структуры; см. Nishimasu et al.; к требуемой молекуле нуклеиновой кислоты, включенной в указанную подгонку, с получением предполагаемой модификации(модификаций) определяемого комплекса CRISPR-Cas9 для того, чтобы указанная требуемая молекула нуклеиновой кислоты связывалась с комплексом(комплексами) CRISPR-Cas9, включающим (включающими) требуемую молекулу нуклеиновой кислоты; выбор предполагаемого совпадения комплекса(комплексов) CRISPR-Cas9-требуемая молекула нуклеиновой кислоты, подгонка такого предполагаемого совпадения комплекса(комплексов) CRISPR-Cas9-требуемая молекула нуклеиновой кислоты к функциональной группе (например, активатору, репрессору), например, что касается местоположений для размещения функциональной группы (например, положений в пределах гибкой петли) и/или предполагаемых модификаций предполагаемого совпадения комплекса(комплексов) CRISPR-Cas9-требуемая молекула нуклеиновой кислоты для получения местоположений для размещения функциональной группы.Providing a crystal structure of CRISPR-Cas9 complexed with a nucleic acid molecule provides a new approach for finding new drugs or compounds, identifying and developing compounds that can bind to CRISPR-Cas9, and thus the present invention provides tools useful for diagnosing, treating or preventing conditions or diseases in multicellular organisms, such as algae, plants, vertebrates, fish, amphibians, reptiles, birds, mammals; such as domestic plants, animals (e.g., food animals such as pig, ruminant, chicken; companion animal such as feline, canine, rodent (rabbit, gerbil, hamster); laboratory animals such as mouse, rat) and humans. Accordingly, the present invention provides a method for rationally designing CRISPR-Cas9 complexes based on the use of a computer. Such rational design may include providing a structure of a CRISPR-Cas9 complex defined by some or all (e.g., at least 2 or more, such as at least 5, preferably at least 10, more preferably at least 50, and even more preferably at least 100 atoms of the structure) of the coordinates from a table of crystal structures and/or shown in a figure(s) relating to the crystal structure; see Nishimasu et al.; providing a structure of a desired nucleic acid molecule for which a CRISPR-Cas9 complex is desired; and adjusting the structure of the CRISPR-Cas9 complex defined by some or all of the coordinates to a desired nucleic acid molecule included in said adjustment to obtain a putative modification(s) of the CRISPR-Cas9 complex defined by some or all of the coordinates so that said desired nucleic acid molecule binds to the CRISPR-Cas9 complex(es) comprising the desired nucleic acid molecule. The method or a fit according to the method may use coordinates of atoms of interest of a CRISPR-Cas9 complex defined by some or all of the coordinates that correspond to a region proximate to the active site or binding site (e.g., at least 2 or more, such as at least 5, preferably at least 10, more preferably at least 50, and even more preferably at least 100 atoms of the structure) to model the region proximate to the active site or binding site. These coordinates may be used to define a space that is then screened in silico for a desired or candidate nucleic acid molecule. Thus, the present invention provides a computer-based method for rationally designing CRISPR-Cas9 complexes. The method may comprise providing coordinates of at least two atoms from a table of crystal structures ("selected coordinates"); see Nishimasu et al.; providing a structure of a candidate or desired nucleic acid molecule and fitting the structure of the candidate to the selected coordinates. In this way, the skilled person can also fit a functional group and a candidate or desired nucleic acid molecule. For example, providing a structure of a CRISPR-Cas9 complex defined by some or all (e.g. at least 2 or more, such as at least 5, preferably at least 10, more preferably at least 50 and even more preferably at least 100 atoms of the structure) coordinates; providing a structure of a desired nucleic acid molecule for which a CRISPR-Cas9 complex is required; fitting the structure of the CRISPR-Cas9 complex defined by some or all coordinates from a table of crystal structures and/or shown in figures relating to the crystal structure; see Nishimasu et al.; to a desired nucleic acid molecule included in said match, to obtain putative modification(s) of a detectable CRISPR-Cas9 complex so that said desired nucleic acid molecule binds to a CRISPR-Cas9 complex(es) comprising the desired nucleic acid molecule; selecting a putative match of the CRISPR-Cas9 complex(es)-desired nucleic acid molecule, matching such putative match of the CRISPR-Cas9 complex(es)-desired nucleic acid molecule to a functional group (e.g., an activator, a repressor), such as with respect to locations for accommodating the functional group (e.g., positions within a flexible loop) and/or putative modifications of the putative match of the CRISPR-Cas9 complex(es)-desired nucleic acid molecule to obtain locations for accommodating the functional group.
Однако по информации о кристаллической структуре SpCas9 (см. Nishimasu et al.) нельзя спрогнозировать уменьшение нецелевых эффектов, достигаемых за счет мутаций согласно настоящему изобретению; или то, что конкретные мутации могут приводить к уменьшению нецелевых эффектов, раскрытых в данном документе. Но благодаря настоящему изобретению, обеспечиваемому информацию о мутациях, которые обеспечивают снижение нецелевых эффектов или с помощью которых оно достигается, специалист в данной области сможет легко применить идеи в соответствии с данным документом в сочетании с информацией о кристаллической структуре SpCas9 и информацией о последовательностях Cas9 для проведения анализов последовательностей и структур Cas9 с целью определения аналогичных аминокислот, которые можно подвергать мутации или модификации аналогичным образом, чтобы получить дополнительные мутированные или модифицированные Cas9, в которых мутация или модификация приводят к уменьшению нецелевых эффектов.However, the crystal structure information of SpCas9 (see Nishimasu et al.) does not predict the reduction in off-target effects achieved by the mutations of the present invention; or that particular mutations may result in the reduction in off-target effects disclosed herein. However, by providing information on mutations that provide or by which the reduction in off-target effects is achieved, one skilled in the art will be able to readily apply the teachings of this document in combination with the crystal structure information of SpCas9 and the sequence information of Cas9 to perform sequence and structure analyses of Cas9 to determine similar amino acids that can be mutated or modified in a similar manner to produce additional mutated or modified Cas9s in which the mutation or modification results in the reduction in off-target effects.
Таким образом, настоящее изобретение вместе с информацией о кристалле SpCas9 может быть осуществлено на практике с использованием координат, соответствующих близлежащей по отношению к мутации(мутациям) или модификации(модификациям), раскрытой(раскрытых) в данном документе, области или активному сайту или участку связывания, расположенных в непосредственной близости к такой мутации(мутациям) или модификации(модификациям); и, следовательно, в способах определения дополнительных мутаций или модификаций в SpCas9 или аналогичных мутаций или модификаций в ортологах Cas9 можно использовать аспект, например, сравнительный аспект представляющего интерес субдомена(субдоменов) комплекса CRISPR-Cas9. Способы определения дополнительных мутаций или модификаций SpCas9 или аналогичных мутаций или модификаций в ортологах Cas9 можно осуществлять на практике с использованием координат домена или субдомена. Способы необязательно могут предусматривать синтез кандидатной или требуемой молекулы нуклеиновой кислоты и/или систем CRISPR-Cas9 согласно результатам "in silico" и тестирование "практических" или фактических мутаций или модификаций в отношении связывания, и/или активности, и/или снижения нецелевых эффектов. Системы CRISPR-Cas9, включающие в себя мутации или модификации, необязательно могут включать в себя функциональную группу. Такие способы могут предусматривать изучение клетки или организма, содержащего клетку, на предмет требуемой реакции, например, уменьшения проявления симптомов, или состояния, или заболевания, преимущественно включающей в себя снижение нецелевых эффектов. Получение структуры кандидатной молекулы нуклеиновой кислоты может предусматривать выбор соединения путем компьютерного скрининга базы данных, содержащей данные о молекулах нуклеиновой кислоты, например, такие данные, которые имеют отношение к состояниям или заболеваниям. 3-D идентификатор в отношении связывания кандидатной молекулы нуклеиновой кислоты может быть получен из геометрических и функциональных ограничений, происходящих из структуры и химической природы комплекса CRISPR-Cas9 или его доменов или участков в кристаллической структуре с учетом мутаций или модификаций, раскрытых в данном документе. В действительности, идентификатор может представлять собой тип фактической(фактических) модификации(модификаций) кристаллической структуры комплекса CRISPR-Cas9 согласно данному документу для обеспечения связывания CRISPR-Cas9 с кандидатной или требуемой молекулой нуклеиновой кислоты. В данном документе затем могут быть выполнены "практические" стадии с использованием идентификатора и молекул нуклеиновой кислоты, которые предположительно обладают хорошим связыванием.Thus, the present invention together with the SpCas9 crystal information can be practiced using coordinates corresponding to a region adjacent to the mutation(s) or modification(s) disclosed herein, or an active site or binding site located in close proximity to such mutation(s) or modification(s); and therefore, methods for determining additional mutations or modifications in SpCas9 or similar mutations or modifications in Cas9 orthologs can use an aspect, such as a comparative aspect, of the subdomain(s) of interest of the CRISPR-Cas9 complex. Methods for determining additional mutations or modifications in SpCas9 or similar mutations or modifications in Cas9 orthologs can be practiced using the domain or subdomain coordinates. The methods may optionally comprise synthesizing a candidate or desired nucleic acid molecule and/or CRISPR-Cas9 systems according to the "in silico" results and testing "practical" or actual mutations or modifications for binding and/or activity and/or reduction of off-target effects. CRISPR-Cas9 systems comprising mutations or modifications may optionally comprise a functional group. Such methods may comprise examining a cell or an organism comprising a cell for a desired response, such as reducing the manifestation of symptoms or a condition or disease, preferably comprising reducing off-target effects. Obtaining the structure of a candidate nucleic acid molecule may comprise selecting a compound by computer screening a database containing data on nucleic acid molecules, such as data that are relevant to conditions or diseases. The 3-D identifier with respect to binding of the candidate nucleic acid molecule may be derived from geometric and functional constraints derived from the structure and chemical nature of the CRISPR-Cas9 complex or its domains or regions in the crystal structure, taking into account the mutations or modifications disclosed herein. In fact, the identifier may be the type of actual modification(s) of the crystal structure of the CRISPR-Cas9 complex according to this document to ensure binding of CRISPR-Cas9 to the candidate or desired nucleic acid molecule. Herein, the "practical" steps may then be performed using the identifier and nucleic acid molecules that are suspected of having good binding.
"Подгонка" может означать определение взаимодействий между по меньшей мере одним атомом кандидата и по меньшей мере одним атомом комплекса CRISPR-Cas9 с помощью автоматизированных или полуавтоматизированных средств и вычисление степени стабильности таких взаимодействий. Взаимодействия могут включать притяжение, отталкивание, обусловленное зарядом, стерическими аспектами и т.п. "Субдомен" может означать по меньшей мере один, например, один, два, три или четыре, полный(полных) элемент(элементов) вторичной структуры. Конкретные участки или домены CRISPR-Cas9 включают таковые, идентифицированные в таблице кристаллических структур и на фигурах, соответствующих им; см. Nishimasu et al."Fitting" may mean determining interactions between at least one atom of the candidate and at least one atom of the CRISPR-Cas9 complex by automated or semi-automated means and calculating the stability of such interactions. The interactions may include attraction, repulsion, charge-based, steric aspects, etc. "Subdomain" may mean at least one, such as one, two, three, or four, complete secondary structure element(s). Particular regions or domains of CRISPR-Cas9 include those identified in the table of crystal structures and the figures corresponding thereto; see Nishimasu et al.
В любом случае трехмерная структура комплекса CRISPR-Cas9 (например Cas9 S. pyogenes; см. Nishimasu et al.) обеспечивает в контексте настоящего изобретения дополнительный инструмент для идентификации дополнительных мутаций в ортологах Cas9 в виде положений для мутаций/модификаций, идентифицированных в данном документе, которые могут быть применены к ортологам Cas9 на основании сравнения последовательности и структурного положения с использованием кристаллической структуры комплекса CRISPR-SpCas9. Кристаллическая структура также может быть основой для разработки новых и специфичных Cas9, например, таких, которые имеют мутацию(мутации) или модификацию(модификации) согласно данному документу, и включают в себя, или имеют в качестве партнера по слиянию, или имеют связанные с ними любую одну или несколько различных функциональных групп, например, репрессор транскрипции, активатор транскрипции, нуклеазный домен, ДНК-метилтрансферазу, протеинацетилтрансферазу, протеиндеацетилазу, протеинметилтрансферазу, протеиндезаминазу, протеинкиназу и протеинфосфатазу; а в некоторых аспектах функциональных домен представляет собой эпигенетический регулятор; см., например, Zhang et al., патент США № 8507272, и снова упоминается, что этот и все документы, цитируемые в данном документе, и все цитируемые в настоящей заявке документы тем самым включены в данный документ посредством ссылки, путем модификации Cas9 с помощью новых никаз. Исходя из настоящего раскрытия и зная трехмерную структуру кристалла CRISPR-Cas9 (Cas9 S. pyogenes) можно использовать компьютерные моделирующие программы для разработки или идентификации разных молекул, которые, как ожидается, будут взаимодействовать с возможными или подтвержденными сайтами, такими как сайты связывания или другие структурные или функциональные особенности системы CRISPR-Cas9 (например, Cas9 S. pyogenes). Соединение, которое потенциально связывает ("связующее"), можно исследовать посредством применения компьютерного моделирования с использованием программы докинга. Программы докинга являются известными; например, GRAM, DOCK или AUTODOCK (см. Walters et al. Drug Discovery Today, vol. 3, no. 4 (1998), 160-178, и Dunbrack et al. Folding and Design 2 (1997), 27-42). Эта процедура может включать компьютерную подгонку потенциальных связующих с целью выяснения того, насколько хорошо форма и химическая структура потенциального связующего будут способствовать связыванию с системой CRISPR-Cas9 (например, Cas9 S. pyogenes). С помощью компьютера можно вручную выполнить проверку активного сайта или сайта связывания системы CRISPR-Cas9 (например, Cas9 S. pyogenes). Программы, как, например, GRID (P. Goodford, J. Med. Chem, 1985, 28, 849-57), представляющая собой программу, которая определяет вероятные сайты взаимодействия между молекулами с различными функциональными группами, также можно использовать для анализа активного сайта или сайта связывания для прогнозирования частичных структур связывающих соединений. Компьютерные программы можно использовать для оценки притяжения, отталкивания или стерического несоответствия двух партнеров по связыванию, например, системы CRISPR-Cas9 (например, Cas9 S. pyogenes) и кандидатной молекулы нуклеиновой кислоты или молекулы нуклеиновой кислоты и кандидатной системы CRISPR-Cas9 (например, Cas9 S. pyogenes); и при этом кристаллическая структура CRISPR-Cas9 (Cas9 S. pyogenes) облегчает такие способы. Как правило, чем плотнее подгонка, тем меньше стерических несоответствий, и чем больше силы притяжения, тем сильнее потенциал связующего, поскольку эти свойства согласуются с более четкой константой связывания. Более того, чем больше специфичность при разработке кандидатной системы CRISPR-Cas9 (например, Cas9 S. pyogenes), тем более вероятно, что она не будет взаимодействовать вдобавок с нецелевыми молекулами. В настоящем изобретении также разрешаются "практические" способы. Например, в одном аспекте настоящего изобретения предусмотрен способ определения структуры связующего (например, целевой молекулы нуклеиновой кислоты) кандидатной системы CRISPR-Cas9 (например, Cas9 S. pyogenes), связанной с кандидатной системой CRISPR-Cas9 (например, Cas9 S. pyogenes), при этом указанный способ включает (a) получение первого кристалла кандидатной системы CRISPR-Cas9 (Cas9 S. pyogenes) в соответствии с настоящим изобретением или второго кристалла кандидатной системы CRISPR-Cas9 (например, Cas9 S. pyogenes), (b) приведение в контакт первого кристалла или второго кристалла с указанным связующим в условиях, приводящих к образованию комплекса; и (c) определение структуры указанного кандидата (например, системы CRISPR-Cas9 (например, Cas9 S. pyogenes) или комплекса системы CRISPR-Cas9 (Cas9 S. pyogenes)). Второй кристалл, по сути, может иметь те же координаты, обсуждаемые в данном документе, однако из-за незначительных изменений в системе CRISPR-Cas9 (например, Cas9 в такой системе представляет собой, например, Cas9 S. pyogenes, в отличии от Cas9 S. pyogenes), где "например, Cas9 S. pyogenes" указывает на то, что Cas9 представляет собой Cas9 и может происходить из S. pyogenes или его ортолога или может быть получен из них), кристалл может образовываться в другой пространственной группе симметрии. Настоящее изобретение дополнительно предусматривает вместо или в дополнение к способам "in silico" другие "практические" способы, включающие высокопроизводительный скрининг связующего (например, целевой молекулы нуклеиновой кислоты) и кандидатной системы CRISPR-Cas9 (например, Cas9 S. pyogenes), или кандидатного связующего (например, целевой молекулы нуклеиновой кислоты) и системы CRISPR-Cas9 (например, Cas9 S. pyogenes), или кандидатного связующего (например, целевой молекулы нуклеиновой кислоты) и кандидатной системы CRISPR-Cas9 (например, Cas9 S. pyogenes) (вышеупомянутой(вышеупомянутых) системы(систем) CRISPR-Cas9 с одной или несколькими функциональными группами или без них), для отбора соединений с активностью связывания. Такие пары связующего и системы CRISPR-Cas9, которые демонстрируют активность связывания, могут быть выбраны и дополнительно подвергнуты кристаллизации с кристаллом CRISPR-Cas9, имеющим структуру согласно настоящему документу, например, путем совместной кристаллизации или смачивания, для рентгеноструктурного анализа. После разработки, идентификации или выбора возможных пар связующего и системы CRISPR-Cas9 путем определения тех, которые имеют благоприятные подходящие свойства, например, прогнозируемое сильное притяжение, основанное на данных кристаллической структуры пар связующего и CRISPR-Cas9 согласно данному документу, эти возможные пары затем можно подвергать скринингу в отношении активности с помощью "практических" способов. Следовательно, в одном аспекте настоящее изобретение может предусматривать получение или синтез возможных пар и приведение в контакт связующего (например, целевой молекулы нуклеиновой кислоты) и кандидатной системы CRISPR-Cas9 (например, Cas9 S. pyogenes), или кандидатного связующего (например, целевой молекулы нуклеиновой кислоты) и системы CRISPR-Cas9 (например, Cas9 S. pyogenes), или кандидатного связующего (например, целевой молекулы нуклеиновой кислоты) и кандидатной системы CRISPR-Cas9 (например, Cas9 S. pyogenes) (вышеупомянутой(вышеупомянутых системы(систем) CRISPR-Cas9 с одной или несколькими функциональными группами или без них) для определения способности к связыванию. На последней стадии приведение в контакт выполняют преимущественно в условиях, позволяющих определить функцию. Вместо или в дополнение к выполнению такого анализа настоящее изобретение может предусматривать получение или синтез комплекса(комплексов) в результате указанного приведения в контакт и осуществление анализа комплекса(комплексов), например, с помощью рентгеновской дифракции, или ЯМР, или других способов, для определения способности к связыванию или взаимодействию. Затем можно получить подробную информацию о структуре, что касается связывания, и с учетом этой информации можно произвести корректировку структуры или функций кандидатной системы CRISPR-Cas9 или ее компонентов. При необходимости эти стадии можно повторять и проводить повторно. Альтернативно или в дополнение потенциальные системы CRISPR-Cas9 из вышеупомянутых способов или используемые в них могут находиться с молекулами нуклеиновой кислоты in vivo, в том числе без ограничения за счет введения в организм (в том числе отличного от человека животного и человека) для выяснения или подтверждения функции, в том числе того, дают ли они в результате требуемый исход (например, уменьшение проявления симптомов, лечение).In any case, the three-dimensional structure of the CRISPR-Cas9 complex (e.g. S. pyogenes Cas9; see Nishimasu et al.) provides in the context of the present invention an additional tool for identifying additional mutations in Cas9 orthologs in the form of positions for the mutations/modifications identified herein that can be applied to Cas9 orthologs based on sequence and structural position comparison using the crystal structure of the CRISPR-SpCas9 complex. The crystal structure can also be the basis for the design of new and specific Cas9, such as those having the mutation(s) or modification(s) according to this document, and comprising, or having as a fusion partner, or having associated therewith, any one or more of a variety of functional groups, such as a transcriptional repressor, a transcriptional activator, a nuclease domain, a DNA methyltransferase, a protein acetyltransferase, a protein deacetylase, a protein methyltransferase, a protein deaminase, a protein kinase, and a protein phosphatase; and in some aspects, the functional domain is an epigenetic regulator; see, for example, Zhang et al., U.S. Patent No. 8,507,272, and again this and all documents cited therein and all documents cited in the present application are hereby incorporated by reference, by modifying Cas9 with the novel nickases. Based on the present disclosure and knowing the three-dimensional crystal structure of CRISPR-Cas9 (S. pyogenes Cas9), computer modeling programs can be used to design or identify various molecules that are expected to interact with candidate or confirmed sites, such as binding sites or other structural or functional features of the CRISPR-Cas9 system (e.g., S. pyogenes Cas9). A compound that potentially binds (a "binder") can be examined by applying computer modeling using a docking program. Docking programs are known; for example, GRAM, DOCK, or AUTODOCK (see Walters et al. Drug Discovery Today, vol. 3, no. 4 (1998), 160-178, and Dunbrack et al. Folding and Design 2 (1997), 27-42). This procedure may involve computer fitting of potential binders to determine how well the shape and chemical structure of the potential binder will facilitate binding to the CRISPR-Cas9 system (e.g., S. pyogenes Cas9). The active site or binding site of the CRISPR-Cas9 system (e.g., S. pyogenes Cas9) can be manually inspected by computer. Programs such as GRID (P. Goodford, J. Med. Chem, 1985, 28, 849-57), which is a program that identifies likely interaction sites between molecules with different functional groups, can also be used to analyze the active site or binding site to predict partial structures of binders. Computer programs can be used to evaluate the attraction, repulsion, or steric hindrance of two binding partners, such as a CRISPR-Cas9 system (e.g., S. pyogenes Cas9) and a candidate nucleic acid molecule, or a nucleic acid molecule and a candidate CRISPR-Cas9 system (e.g., S. pyogenes Cas9); and the crystal structure of CRISPR-Cas9 (S. pyogenes Cas9) facilitates such methods. In general, the tighter the fit, the less steric hindrance, and the greater the attractive forces, the stronger the binding potential, since these properties are consistent with a sharper binding constant. Moreover, the more specificity in the design of a candidate CRISPR-Cas9 system (e.g., S. pyogenes Cas9), the more likely it will not interact with additionally non-target molecules. The present invention also allows "practical" methods. For example, in one aspect of the present invention, there is provided a method for determining the structure of a binder (e.g., a target nucleic acid molecule) of a candidate CRISPR-Cas9 system (e.g., S. pyogenes Cas9) associated with a candidate CRISPR-Cas9 system (e.g., S. pyogenes Cas9), wherein said method comprises (a) providing a first crystal of a candidate CRISPR-Cas9 system (e.g., S. pyogenes Cas9) according to the present invention or a second crystal of a candidate CRISPR-Cas9 system (e.g., S. pyogenes Cas9), (b) contacting the first crystal or the second crystal with said binder under conditions resulting in the formation of a complex; and (c) determining the structure of said candidate (e.g., a CRISPR-Cas9 system (e.g., S. pyogenes Cas9) or a complex of the CRISPR-Cas9 system (e.g., S. pyogenes Cas9)). The second crystal may have essentially the same coordinates discussed in this paper, but due to minor changes in the CRISPR-Cas9 system (e.g., the Cas9 in such a system is, e.g., S. pyogenes Cas9, as opposed to S. pyogenes Cas9), where "e.g., S. pyogenes Cas9" indicates that the Cas9 is Cas9 and may be from or derived from S. pyogenes or an ortholog thereof), the crystal may form in a different symmetry space group. The present invention further provides, instead of or in addition to the "in silico" methods, other "practical" methods comprising high-throughput screening of a binder (e.g., a target nucleic acid molecule) and a candidate CRISPR-Cas9 system (e.g., S. pyogenes Cas9), or a candidate binder (e.g., a target nucleic acid molecule) and a CRISPR-Cas9 system (e.g., S. pyogenes Cas9), or a candidate binder (e.g., a target nucleic acid molecule) and a candidate CRISPR-Cas9 system (e.g., S. pyogenes Cas9) (the aforementioned CRISPR-Cas9 system(s) with or without one or more functional groups), to select compounds with binding activity. Such pairs of the binder and the CRISPR-Cas9 system that exhibit binding activity can be selected and further crystallized with a CRISPR-Cas9 crystal having the structure according to the present document, for example, by co-crystallization or wetting, for X-ray analysis. After the design, identification or selection of candidate pairs of the binder and the CRISPR-Cas9 system by determining those that have favorable suitable properties, for example, a predicted strong attraction based on the crystal structure data of the binder and CRISPR-Cas9 pairs according to the present document, these candidate pairs can then be screened for activity using "practical" methods. Accordingly, in one aspect, the present invention may comprise preparing or synthesizing candidate pairs and contacting a binder (e.g., a target nucleic acid molecule) and a candidate CRISPR-Cas9 system (e.g., S. pyogenes Cas9), or a candidate binder (e.g., a target nucleic acid molecule) and a CRISPR-Cas9 system (e.g., S. pyogenes Cas9), or a candidate binder (e.g., a target nucleic acid molecule) and a candidate CRISPR-Cas9 system (e.g., S. pyogenes Cas9) (the aforementioned(s) CRISPR-Cas9 system(s) with or without one or more functional groups) to determine the binding ability. In the latter step, the contacting is preferably performed under conditions that allow the function to be determined. Instead of or in addition to performing such an analysis, the present invention may comprise preparing or synthesizing a complex(es) as a result of said contacting and analyzing the complex(es), for example, by X-ray diffraction, or NMR, or other methods to determine binding or interaction properties. Detailed structural information regarding binding can then be obtained, and the structure or function of the candidate CRISPR-Cas9 system or its components can be adjusted based on this information. These steps can be repeated and re-performed as necessary. Alternatively or in addition, candidate CRISPR-Cas9 systems from or used in the above methods can be exposed to nucleic acid molecules in vivo, including without limitation by administration to an organism (including a non-human animal and a human) to determine or confirm function, including whether they result in a desired outcome (e.g., symptom amelioration, treatment).
Настоящее изобретение дополнительно относится к способу определения трехмерных структур систем или комплекса(комплексов) CRISPR-Cas с неизвестной структурой с использованием координат структуры из документов, обсуждаемых в данном документе, особенно, если они скорректированы в отношении модификации(модификаций) или мутации(мутаций), обсуждаемых в данном документе. Например, если для системы или комплекса CRISPR-Cas неизвестной кристаллической структуры получены данные рентгеноструктурного анализа или ЯМР-спектроскопии, то структуру комплекса CRISPR-Cas9 можно использовать для интерпретации этих данных с получением вероятной структуры для неизвестной системы или комплекса с помощью таких методик, как фазовое моделирование в случае рентгеноструктурного анализа. Таким образом, способ может включать выравнивание графического представления системы или комплекса CRISPR-Cas с неизвестной кристаллической структурой с аналогичным графическим представлением системы или комплекса CRISPR-Cas9 с кристаллической структурой согласно документам, цитируемых в данном документе (преимущественно скорректированной в отношении модификации(модификаций) или мутации(мутаций) согласно данному документу), с обеспечением совпадения гомологичных или аналогичных участков (например, гомологичных или аналогичных последовательностей); моделирование структуры совпавших гомологичных или аналогичных участков (например, последовательностей) системы или комплекса CRISPR-Cas с неизвестной кристаллической структурой; и определение конформации (например, принимая во внимание то, что благоприятные взаимодействия должны формироваться так, чтобы формировалась низкоэнергетическая конформация) неизвестной кристаллической структуры, которая практически сохраняет структуру указанных совпавших гомологичных участков. "Гомологичными участками" описываются, например, что касается аминокислот, аминокислотные остатки в двух последовательностях, которые являются идентичными или имеют подобные, например, алифатические, ароматические, полярные, отрицательно заряженные или положительно заряженные химические группы боковых цепей. Гомологичные участки, что касается молекул нуклеиновой кислоты, могут характеризоваться по меньшей мере 85%, или 86%, или 87%, или 88%, или 89%, или 90%, или 91%, или 92%, или 93%, или 94%, или 95%, или 96%, или 97%, или 98%, или 99% гомологией или идентичностью. Идентичные и подобные участки иногда описываются специалистами в данной области как "инвариантные" и "консервативные" соответственно. Преимущественно первую и третью стадии выполняют с помощью компьютерного моделирования. Моделирование гомологии является методикой, которая хорошо известна специалистам в данной области (см., например, Greer, Science vol. 228 (1985) 1055, и Blundell et al. Eur J Biochem vol 172 (1988), 513). Компьютерное представление консервативных участков кристаллической структуры CRISPR-Cas9 согласно данному документу и таковых в системе CRISPR-Cas с неизвестной кристаллической структурой помогает прогнозировать и определять кристаллическую структуру системы CRISPR-Cas с неизвестной кристаллической структурой. Кроме того, аспекты настоящего изобретения, в которых используется кристаллическая структура CRISPR-Cas9 in silico, можно в равной степени применять к новой(новым) мутации(мутациям) или модификации(модификациям) согласно данному документу и кристаллической структуре CRISPR-Cas. Таким образом может быть получена библиотека кристаллических структур CRISPR-Cas. Таким образом, в настоящем изобретении предусмотрена рациональная разработка системы CRISPR-Cas. Например, после определения конформации или кристаллической структуры системы или комплекса CRISPR-Cas с помощью способов, описанных в данном документе (в том числе с учетом информации из уровня техники на основании документов, цитируемых в данном документе), такую конформацию можно использовать в способах, основанных на использовании компьютера, согласно данному документу для определения конформации или кристаллической структуры других систем или комплексов CRISPR-Cas, чья кристаллическая структура еще неизвестна. Данные всех этих кристаллических структур могут находиться в базе данных, и способы согласно данному документу могут быть более надежными, если сравнения согласно данному документу проводятся между кристаллической структурой или ее частями из данного документа и одной или несколькими кристаллическими структурами из библиотеки. В настоящем изобретении дополнительно предусмотрены системы, такие как компьютерные системы, предназначенные для получения структур и/или выполнения рациональной разработки системы или комплекса CRISPR-Cas. Система может содержать данные атомных координат или может быть получена из них, например, путем моделирования, при этом указанные данные определяют трехмерную структуру системы или комплекса CRISPR-Cas или по меньшей мере одного их домена или субдомена или их данные по структурному фактору, при этом указанные данные по структурному фактору получают из данных по атомным координатам. Настоящее изобретение также относится к машиночитаемым носителям с данными по атомным координатам, при этом указанные данные определяют трехмерную структуру системы или комплекса CRISPR-Cas или по меньшей мере одного их домена или субдомена или данные по их структурному фактору. "Машиночитаемые носители" относятся к любым носителям, которые могут быть считаны и доступ к которым может быть получен непосредственно с помощью компьютера, и включают без ограничения магнитное запоминающее устройство; оптическое запоминающее устройство; электрическое запоминающее устройство; облачное хранилище данных и гибриды этих категорий. Путем обеспечения таких машиночитаемых носителей к данным по атомных координатам может быть получен доступ обычным способом для моделирования или других способов "in silico". Настоящее изобретение дополнительно охватывает способы ведения коммерческой деятельности путем предоставления доступа к таким машиночитаемым носителям, например, на основании подписки, через Интернет или глобальную коммуникационную компьютерную сеть; или компьютерная система может быть доступна пользователю на основании подписки. "Компьютерная система" относится к аппаратным средствам, программным средствам и средствам хранения данных, применяемым для анализа данных по атомным координатам по настоящему изобретению. Минимальные аппаратные средства компьютерных систем по настоящему изобретению могут содержать центральный процессор (CPU), устройства ввода, устройства вывода и средства хранения данных. Для визуализации данных по структуре желательно обеспечить дисплей или монитор. Настоящее изобретение дополнительно охватывает способы передачи информации, представленной в данном документе или полученной любым способом или его стадией, описанными в данном документе, например, посредством телекоммуникаций, телефона, массовых коммуникаций, средств массовой информации, презентаций, Интернета, электронной почты и т.д. Кристаллические структуры по настоящему изобретению можно анализировать для получения карты(карт) распределения плотности электронов Фурье систем или комплексов CRISPR-Cas. Карты распределения плотности электронов Фурье могут быть рассчитаны на основании картин рентгеновской дифракции. Затем эти карты можно использовать для определения аспектов связывания или других взаимодействий. Карты распределения плотности электронов могут быть рассчитаны с использованием известных программ, таких как в компьютерном пакете CCP4 (Collaborative Computing Project, No. 4. The CCP4 Suite: Programs for Protein Crystallography, Acta Crystallographica, D50, 1994, 760-763). Для визуализации карт и построения моделей можно использовать такие программы, как "QUANTA" (1994, San Diego, Calif.: Molecular Simulations, Jones et al., Acta Crystallography A47 (1991), 110-119).The present invention further relates to a method for determining three-dimensional structures of CRISPR-Cas systems or complex(es) of unknown structure using the structure coordinates from the documents discussed herein, especially when corrected for the modification(s) or mutation(s) discussed herein. For example, if X-ray crystallographic or NMR spectroscopy data are obtained for a CRISPR-Cas system or complex of unknown crystal structure, the structure of the CRISPR-Cas9 complex can be used to interpret these data to obtain a probable structure for the unknown system or complex using techniques such as phase modeling in the case of X-ray crystallographic analysis. Thus, the method may include aligning a graphical representation of a CRISPR-Cas system or complex with an unknown crystal structure with a similar graphical representation of a CRISPR-Cas9 system or complex with a crystal structure according to the documents cited herein (preferably adjusted for modification(s) or mutation(s) according to this document), ensuring that homologous or similar regions (e.g., homologous or similar sequences) match; modeling the structure of the matched homologous or similar regions (e.g., sequences) of the CRISPR-Cas system or complex with an unknown crystal structure; and determining a conformation (e.g., taking into account that favorable interactions should form such that a low-energy conformation is formed) of the unknown crystal structure that substantially preserves the structure of the matched homologous regions. "Homologous regions" describe, for example, with respect to amino acids, amino acid residues in two sequences that are identical or have similar, e.g., aliphatic, aromatic, polar, negatively charged or positively charged chemical side chain groups. Homologous regions, with respect to nucleic acid molecules, may be characterized by at least 85%, or 86%, or 87%, or 88%, or 89%, or 90%, or 91%, or 92%, or 93%, or 94%, or 95%, or 96%, or 97%, or 98%, or 99% homology or identity. Identical and similar regions are sometimes described by those skilled in the art as "invariant" and "conserved," respectively. Advantageously, the first and third steps are performed using computer modeling. Homology modeling is a technique that is well known to those skilled in the art (see, for example, Greer, Science vol. 228 (1985) 1055, and Blundell et al. Eur J Biochem vol 172 (1988), 513). A computer representation of the conserved regions of the CRISPR-Cas9 crystal structure according to this document and those of a CRISPR-Cas system with an unknown crystal structure helps to predict and determine the crystal structure of a CRISPR-Cas system with an unknown crystal structure. Furthermore, aspects of the present invention that utilize the in silico crystal structure of CRISPR-Cas9 can be equally applied to the new mutation(s) or modification(s) according to this document and the CRISPR-Cas crystal structure. In this manner, a library of CRISPR-Cas crystal structures can be obtained. Thus, the present invention provides for rational design of a CRISPR-Cas system. For example, once a conformation or crystal structure of a CRISPR-Cas system or complex has been determined using the methods described herein (including taking into account prior art information based on documents cited herein), such conformation can be used in the computer-based methods of this document to determine the conformation or crystal structure of other CRISPR-Cas systems or complexes whose crystal structure is not yet known. All of these crystal structure data may be in a database, and the methods of this document may be more reliable if the comparisons of this document are made between a crystal structure or portions thereof from this document and one or more crystal structures from a library. The present invention further provides systems, such as computer systems, for obtaining structures and/or performing rational design of a CRISPR-Cas system or complex. The system may comprise or be obtained from atomic coordinate data, such as by modeling, wherein said data define a three-dimensional structure of the CRISPR-Cas system or complex or at least one domain or subdomain thereof, or their structure factor data, wherein said structure factor data is obtained from the atomic coordinate data. The present invention also relates to machine-readable media with atomic coordinate data, wherein said data define a three-dimensional structure of the CRISPR-Cas system or complex or at least one domain or subdomain thereof, or their structure factor data. "Machine-readable media" refers to any media that can be read and accessed directly by a computer, and includes, but is not limited to, magnetic storage; optical storage; electrical storage; cloud storage, and hybrids of these categories. By providing such machine-readable media, the atomic coordinate data can be accessed in a conventional manner for modeling or other "in silico" methods. The present invention further encompasses methods of conducting business by providing access to such computer-readable media, for example, on a subscription basis, via the Internet or a global communications computer network; or the computer system may be available to a user on a subscription basis. "Computer system" refers to hardware, software, and data storage used to analyze the atomic coordinate data of the present invention. Minimum hardware of the computer systems of the present invention may include a central processing unit (CPU), input devices, output devices, and data storage means. A display or monitor may be provided for visualizing the structure data. The present invention further encompasses methods of communicating the information presented herein or obtained by any method or step thereof described herein, for example, via telecommunications, telephone, mass communications, media, presentations, the Internet, e-mail, etc. The crystal structures of the present invention can be analyzed to obtain a Fourier electron density distribution map(s) of the CRISPR-Cas systems or complexes. Fourier electron density maps can be calculated from X-ray diffraction patterns. These maps can then be used to determine aspects of binding or other interactions. Electron density maps can be calculated using well-known programs such as those in the CCP4 computer package (Collaborative Computing Project, No. 4. The CCP4 Suite: Programs for Protein Crystallography, Acta Crystallographica, D50, 1994, 760-763). Programs such as "QUANTA" (1994, San Diego, Calif.: Molecular Simulations, Jones et al., Acta Crystallography A47 (1991), 110-119) can be used to visualize the maps and build models.
Приведенная в данном документе кристаллическая структура обеспечивает данные атомных координат для CRISPR-Cas9 (S. pyogenes) и перечни каждого атома с уникальным номером; химический элемент и его положение для каждого аминокислотного остатка (определяемого по картам распределения плотности электронов и сравнениям последовательностей антител), аминокислотный остаток, в котором расположен данный элемент, идентификатор цепи, номер остатка, координаты (например, X, Y, Z), которые определяют атомное положение относительно кристаллографических осей (в ангстремах) для соответствующего атома, заполнение атомом соответствующего положения, "B", параметр изотопного замещения (в ангстремах2), который отражает движение атома вокруг его атомного центра, и атомный номер.The crystal structure provided herein provides atomic coordinate data for CRISPR-Cas9 (S. pyogenes) and lists each atom with a unique number; the chemical element and its position for each amino acid residue (determined from electron density maps and antibody sequence comparisons), the amino acid residue at which the element is located, a chain identifier, a residue number, coordinates (e.g., X, Y, Z) that define the atomic position relative to the crystallographic axes (in angstroms) for the corresponding atom, the atomic occupancy of the corresponding position, "B", an isotopic substitution parameter (in angstroms 2 ) that reflects the motion of the atom about its atomic center, and an atomic number.
В конкретных вариантах осуществления настоящего изобретения конформационные изменения кристаллических структур системы CRISPR-Cas9 или компонентов CRISPR-Cas9 обеспечивают важную и необходимую информацию о гибкости или подвижности белковых структурных участков относительно нуклеотидных (РНК или ДНК) структурных участков, которые могут быть важны для функции системы CRISPR-Cas. Информацию о структуре, представленную для Cas9 (например, Cas9 S. pyogenes: Crystal structure of cas9 in complex with guide RNA and target DNA. Nishimasu, H., Ran, FA., Hsu, PD., Konermann, S., Shehata, SI., Dohmae, N., Ishitani, R., Zhang, F., Nureki, O. Cell Feb 27. (2014). 156(5):935-49; или Cas9 Sa: Crystal Structure of Staphylococcus aureus Cas9, Nishimasu et al., Cell 162, 1113-1126 (Aug. 27, 2015)) в качестве фермента CRISPR в настоящей заявке, можно использовать для дополнительного конструирования и оптимизации системы CRISPR-Cas, и ее также можно экстраполировать на детальное исследование структурно-функциональных связей в системах с другим ферментом CRISPR. Один аспект настоящего изобретения относится к кристаллической структуре Cas9 S. pyogenes в комплексе с sgRNA и ее целевой ДНК при разрешающей способности в 2,4 Å. В структуре была выявлена двудольная компоновка, состоящая из доли распознавания мишени и нуклеазной доли, обеспечивающих размещение дуплекса sgRNA:ДНК в положительно заряженной бороздке на границе их соприкосновения. Доля распознавания является существенной для связывания sgRNA и ДНК, а нуклеазная доля содержит нуклеазные домены HNH и RuvC, расположенные надлежащим образом для расщепления комплементарной и некомплементарной нитей целевой ДНК соответственно. Эта структура с высоким разрешением и функциональные анализы, представленные в данном документе, объясняют молекулярный механизм направляемого РНК нацеливания на ДНК с помощью Cas9 и обеспечивают исчерпывающую информацию для получения оптимизированных систем CRISPR-Cas и их компонентов.In particular embodiments of the present invention, conformational changes in the crystal structures of the CRISPR-Cas9 system or CRISPR-Cas9 components provide important and relevant information about the flexibility or mobility of protein structural regions relative to nucleotide (RNA or DNA) structural regions that may be important for the function of the CRISPR-Cas system. The structural information provided for Cas9 (e.g., Cas9 S. pyogenes: Crystal structure of cas9 in complex with guide RNA and target DNA. Nishimasu, H., Ran, FA., Hsu, PD., Konermann, S., Shehata, SI., Dohmae, N., Ishitani, R., Zhang, F., Nureki, O. Cell Feb 27. (2014). 156(5):935-49; or Cas9 Sa: Crystal Structure of Staphylococcus aureus Cas9, Nishimasu et al., Cell 162, 1113-1126 (Aug. 27, 2015)) as a CRISPR enzyme in the present application can be used for further design and optimization of the CRISPR-Cas system, and can also be extrapolated to detailed structure-function studies in systems with another CRISPR enzyme. One aspect of the present invention relates to a crystal structure of S. pyogenes Cas9 in complex with sgRNA and its target DNA at a resolution of 2.4 Å. The structure reveals a bilobed arrangement consisting of a target recognition lobe and a nuclease lobe that ensure the placement of the sgRNA:DNA duplex in the positively charged groove at their interface. The recognition lobe is essential for the binding of sgRNA and DNA, and the nuclease lobe contains the HNH and RuvC nuclease domains properly positioned to cleave the complementary and non-complementary strands of the target DNA, respectively. This high-resolution structure and the functional analyses presented herein elucidate the molecular mechanism of RNA-guided DNA targeting by Cas9 and provide comprehensive information for the design of optimized CRISPR-Cas systems and their components.
В конкретных вариантах осуществления настоящего изобретения кристаллическая структура обеспечивает необходимую стадию, направленную на понимание молекулярного механизма направляемого РНК нацеливания на ДНК с помощью Cas9. Структурные и функциональные анализы согласно данному документу обеспечивают пригодную основу для рациональной разработки технологий модуляции генома на основе Cas9 и могут служить руководством относительно опосредованного Cas9 распознавания последовательностей PAM на целевой ДНК или допустимости несовпадения между дуплексом sgRNA:ДНК. Аспекты настоящего изобретения также относятся к мутантам, полученным в результате усечения, например, мутант Cas9 S. pyogenes, полученный в результате усечения, может облегчать упаковку Cas9 в ограниченные по размеру вирусные векторы для in vivo и терапевтических применений. Аналогично, конструирование взаимодействующего с PAM (PI) домена может обеспечить программирование специфичности в отношении PAM, улучшить точность распознавания целевого сайта и повысить универсальность платформы конструирования генома Cas9. Кроме того, конструирование взаимодействующего с PAM (PI) домена может обеспечить программирование специфичности в отношении PAM, улучшить точность распознавания целевого сайта и повысить универсальность платформы конструирования генома Cas, например, Cas9. Белки Cas, такие как белки Cas9, можно конструировать с изменением их специфичности в отношении PAM, например, как описывается у Kleinstiver BP et al. Engineered CRISPR-Cas9 nucleases with altered PAM specificities. Nature. 2015 Jul 23;523(7561):481-5. doi: 10.1038/nature14592.In certain embodiments of the present invention, the crystal structure provides a necessary step towards understanding the molecular mechanism of RNA-guided DNA targeting by Cas9. The structural and functional analyses herein provide a useful basis for the rational design of Cas9-based genome modulation technologies and can provide guidance on Cas9-mediated recognition of PAM sequences on target DNA or mismatch tolerance between an sgRNA:DNA duplex. Aspects of the present invention also relate to truncation mutants, for example, a truncation mutant of S. pyogenes Cas9 can facilitate packaging of Cas9 into limited-size viral vectors for in vivo and therapeutic applications. Similarly, engineering of a PAM interacting (PI) domain can provide programming of PAM specificity, improve target site recognition accuracy, and increase the versatility of the Cas9 genome engineering platform. Furthermore, engineering of the PAM interacting (PI) domain may enable programming of PAM specificity, improve target site recognition accuracy, and increase the versatility of the Cas genome engineering platform, such as Cas9. Cas proteins, such as Cas9 proteins, can be engineered to alter their PAM specificity, such as described by Kleinstiver BP et al. Engineered CRISPR-Cas9 nucleases with altered PAM specificities. Nature. 2015 Jul 23;523(7561):481-5. doi: 10.1038/nature14592.
Настоящее изобретение охватывает оптимизированные функциональные ферментные системы CRISPR-Cas. В частности, фермент CRISPR содержит одну или несколько мутаций, которые превращают его в ДНК-связывающий белок, к которому могут быть рекрутированы, или добавлены, или вставлены, или прикреплены функциональные домены, проявляющие представляющую интерес функцию. В определенных вариантах осуществления фермент CRISPR содержит одну или несколько мутаций, которые включают без ограничения D10A, E762A, H840A, N854A, N863A или D986A (на основании нумерации аминокислотных положений Cas9 S. pyogenes), и/или одна или несколько мутаций находятся в домене RuvC1 или HNH фермента CRISPR или представляют собой другую мутацию, обсуждаемую в данном документе. В некоторых вариантах осуществления фермент CRISPR имеет одну или несколько мутаций в каталитическом домене, где при транскрипции парная tracr-последовательность гибридизируется с tracr-последовательностью, а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, и где фермент дополнительно содержит функциональный домен.The present invention encompasses optimized functional CRISPR-Cas enzyme systems. In particular, the CRISPR enzyme comprises one or more mutations that convert it into a DNA-binding protein to which functional domains exhibiting a function of interest can be recruited or added or inserted or attached. In certain embodiments, the CRISPR enzyme comprises one or more mutations that include, but are not limited to, D10A, E762A, H840A, N854A, N863A, or D986A (based on the amino acid position numbering of S. pyogenes Cas9), and/or the one or more mutations are in the RuvC1 or HNH domain of the CRISPR enzyme or are another mutation discussed herein. In some embodiments, the CRISPR enzyme has one or more mutations in the catalytic domain, wherein upon transcription, the tracr mate sequence hybridizes to the tracr sequence and the guide sequence directs sequence-specific binding of the CRISPR complex to the target sequence, and wherein the enzyme further comprises a functional domain.
Информация о структуре, представленная в данном документе, позволяет детально изучить взаимодействие sgRNA (или химерной РНК) с целевой ДНК и ферментом CRISPR (например, Cas9), предоставляя возможность конструирования или изменения структуры sgRNA для оптимизации функциональности всей системы CRISPR-Cas. Например, петли в sgRNA могут быть увеличены без перекрывания с белком Cas9 путем вставки отличающейся(отличающихся) петли(петель) РНК или отличающейся(отличающихся) последовательности(последовательностей), которая(которые) могут рекрутировать адаптерные белки, которые могут связываться с отличающейся(отличающимися) петлей(петлями) РНК или отличающейся(отличающимися) последовательностью (последовательностями).The structural information presented in this paper allows detailed study of the interaction of sgRNA (or chimeric RNA) with target DNA and CRISPR enzyme (e.g., Cas9), providing the ability to design or alter the structure of sgRNA to optimize the functionality of the overall CRISPR-Cas system. For example, loops in sgRNA can be enlarged without overlapping with the Cas9 protein by inserting different RNA loop(s) or different sequence(s) that can recruit adaptor proteins that can bind to the different RNA loop(s) or different sequence(s).
Функциональные варианты ферментов в соответствии с настоящим изобретениемFunctional variants of enzymes according to the present invention
В вариантах осуществления упоминаемый в данном документе белок Cas9 также охватывает функциональный вариант. "Функциональный вариант" белка, как используется в данном документе, обозначает вариант такого белка, который сохраняет, по меньшей мере частично, активность этого белка. Функциональные варианты могут включать мутантов (которые могут представлять собой мутанты, полученные в результате вставки, делеции или замещения), в том числе полиморфов и т.п. Также функциональные варианты включают продукты слияния такого белка с другими, обычно не родственными, нуклеиновой кислотой, белком, полипептидом или пептидом. Функциональные варианты могут встречаться в природе или могут быть получены человеком. Преимущественные варианты осуществления могут предусматривать сконструированный или не встречающийся в природе нацеливающийся на РНК эффектoрный белок II типа, например, Cas9 или его ортолог или гомолог.In embodiments, the Cas9 protein referred to herein also encompasses a functional variant. A "functional variant" of a protein, as used herein, means a variant of such a protein that retains, at least in part, the activity of the protein. Functional variants may include mutants (which may be insertion, deletion, or substitution mutants), including polymorphs, and the like. Functional variants also include fusion products of such a protein with another, typically unrelated, nucleic acid, protein, polypeptide, or peptide. Functional variants may be naturally occurring or may be produced by man. Advantageous embodiments may involve an engineered or non-naturally occurring type II RNA-targeting effector protein, such as Cas9 or an ortholog or homolog thereof.
Общая информация касательно мутации белков в соответствии с настоящим изобретениемGeneral information regarding protein mutation according to the present invention
Настоящее изобретение охватывает комплекс CRISPR-Cas, содержащий фермент CRISPR и направляющую РНК (sgRNA), где фермент CRISPR содержит по меньшей мере одну мутацию, вследствие которой фермент CRISPR характеризуется не более чем 5% нуклеазной активности фермента CRISPR, не имеющего по меньшей мере одной мутации и необязательно по меньшей мере одной или нескольких последовательностей ядерной локализации; направляющая РНК (sgRNA) содержит направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке; и где фермент CRISPR ассоциирован с двумя или более функциональными доменами; или по меньшей мере одна петля sgRNA модифицирована путем вставки отличающейся(отличающихся) последовательности(последовательностей) РНК, которая(которые) связывается(связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциирован с двумя или более функциональными доменами; или фермент CRISPR ассоциирован с одним или несколькими функциональными доменами, и по меньшей мере одна петля sgRNA модифицирована путем вставки отличающейся(отличающихся) последовательности(последовательностей) РНК, которая(которые) связывается(связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциирован с одним или несколькими функциональными доменами.The present invention encompasses a CRISPR-Cas complex comprising a CRISPR enzyme and a guide RNA (sgRNA), wherein the CRISPR enzyme comprises at least one mutation such that the CRISPR enzyme has no more than 5% of the nuclease activity of a CRISPR enzyme lacking the at least one mutation and optionally at least one or more nuclear localization sequences; the guide RNA (sgRNA) comprises a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell; and wherein the CRISPR enzyme is associated with two or more functional domains; or at least one loop of the sgRNA is modified by insertion of different RNA sequence(s) that binds to one or more adaptor proteins, and wherein the adaptor protein is associated with two or more functional domains; or the CRISPR enzyme is associated with one or more functional domains, and at least one loop of the sgRNA is modified by insertion of a different RNA sequence(s) that binds to one or more adaptor proteins, and wherein the adaptor protein is associated with one or more functional domains.
Функциональные домены и адаптерные белки, аптамерыFunctional domains and adaptor proteins, aptamers
Адаптерные белки могут включать без ограничения комбинации ортогональный связывающий РНК белок/аптамер, которые встречаются во множестве белков оболочки бактериофагов. Перечень таких белков оболочки включает без ограничения Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, фCb5, фCb8r, фCb12r, фCb23r, 7s и PRR1. Такие адаптерные белки или ортогональные связывающие РНК белки могут дополнительно ректурировать эффекторные белки или продукты слияния, которые содержат один или несколько функциональных доменов. В некоторых вариантах осуществления функциональный домен может быть выбран из группы, состоящей из домена транспозазы, домена интегразы, домена рекомбиназы, домена резольвазы, домена инвертазы, домена протеазы, домена ДНК-метилтрансферазы, домена ДНК-гидроксилметилазы, домена ДНК-деметилазы, дезаминазы, домена гистонацетилазы, домена гистондеацетилазы, нуклеазного домена, репрессорного домена, активаторного домена, доменов сигнала ядерной локализации, домена белка, регулирующего транскрипцию (или рекрутирующего транскрипционный комплекс), домена, ассоциированного с активностью клеточного поглощения, домена связывания нуклеиновой кислоты, домена презентации антитела, модифицирующих гистоны ферментов, рекрутера модифицирующих гистоны ферментов; ингибитора модифицирующих гистоны ферментов, гистонметилтрансферазы, гистондеметилазы, гистонкиназы, гистонфосфатазы, гистонрибозилазы, гистондерибозилазы, гистонубиквитиназы, гистондеубиквитиназы, гистонбиотиназы и протеазы гистонового хвоста.Adaptor proteins may include, but are not limited to, orthogonal RNA binding protein/aptamer combinations that are found in a variety of bacteriophage coat proteins. Such coat proteins include, but are not limited to, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, φCb5, φCb8r, φCb12r, φCb23r, 7s, and PRR1. Such adaptor proteins or orthogonal RNA binding proteins may further recruit effector proteins or fusion products that contain one or more functional domains. In some embodiments, the functional domain may be selected from the group consisting of a transposase domain, an integrase domain, a recombinase domain, a resolvase domain, an invertase domain, a protease domain, a DNA methyltransferase domain, a DNA hydroxylmethylase domain, a DNA demethylase domain, a deaminase, a histone acetylase domain, a histone deacetylase domain, a nuclease domain, a repressor domain, an activator domain, nuclear localization signal domains, a transcription regulatory protein (or transcription complex recruitment) domain, a cellular uptake activity associated domain, a nucleic acid binding domain, an antibody presentation domain, a histone modifying enzyme, a histone modifying enzyme recruiter; inhibitor of histone modifying enzymes, histone methyltransferase, histone demethylase, histone kinase, histone phosphatase, histone ribosylase, histone deribosylase, histone ubiquitinase, histone deubiquitinase, histone biotinase and histone tail protease.
В некоторых предпочтительных вариантах осуществления функциональный домен представляет собой домен активации транскрипции, предпочтительно VP64. В некоторых вариантах осуществления функциональный домен представляет собой домен репрессии транскрипции, предпочтительно KRAB. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой SID или конкатемеры SID (например, SID4X). В некоторых вариантах осуществления функциональный домен представляет собой домен эпигенетического модифицирования, так что обеспечивается фермент эпигенетического модифицирования. В некоторых вариантах осуществления функциональный домен представляет собой домен активации, который может представлять собой домен активации P65. В некоторых вариантах осуществления функциональных домен представляет собой дезаминазу, такую как цитидиндезаминазу. Цитидиндезаминаза может быть направлена на целевую нуклеиновую кислоту, туда, где она управляет превращением цитидина в уридин, что приводит в результате к заменам C на T (G на A в комплементарной нити). В таком варианте осуществления нуклеотидные замены могут быть осуществлены без расщепления ДНК.In some preferred embodiments, the functional domain is a transcriptional activation domain, preferably VP64. In some embodiments, the functional domain is a transcriptional repression domain, preferably KRAB. In some embodiments, the transcriptional repression domain is SID or concatemers of SID (e.g., SID4X). In some embodiments, the functional domain is an epigenetic modification domain, such that an epigenetic modification enzyme is provided. In some embodiments, the functional domain is an activation domain, which can be a P65 activation domain. In some embodiments, the functional domain is a deaminase, such as a cytidine deaminase. The cytidine deaminase can be directed to a target nucleic acid where it directs the conversion of cytidine to uridine, resulting in C to T (G to A in the complementary strand) substitutions. In such an embodiment, the nucleotide substitutions can be made without cleavage of the DNA.
В одном аспекте для идентификации активности в отношении образования вставок/делеций/нуклеазной активности используют анализ с использованием нуклеазы Surveyor. В целом, анализ с использованием нуклеазы Surveyor включает экстракцию геномной ДНК, ПЦР-амплификацию участка генома, фланкирующего целевой сайт CRISPR, очистку продуктов, повторную гибридизацию для обеспечения образования гетеродуплексов. После повторной гибридизации продукты обрабатывают нуклеазой SURVEYOR и энхансером S SURVEYOR (Transgenomics) согласно протоколу, рекомендованному производителем. Анализ можно проводить с использованием полиакриламидных гелей в соответствии с известными способами. Количественный анализ может основываться на значениях относительной интенсивности окрашивания полос.In one aspect, a Surveyor nuclease assay is used to identify insertion/deletion/nuclease activity. In general, the Surveyor nuclease assay comprises extracting genomic DNA, PCR amplifying a region of the genome flanking a CRISPR target site, purifying the products, re-hybridizing to ensure formation of heteroduplexes. After re-hybridization, the products are treated with SURVEYOR nuclease and SURVEYOR S enhancer (Transgenomics) according to the manufacturer's recommended protocol. The assay can be performed using polyacrylamide gels according to known methods. Quantitative analysis can be based on relative band intensity values.
***Индуцируемый фермент и разделяемый фермент ("Split-Cas9")***Inducible enzyme and split enzyme ("Split-Cas9")
В одном аспекте настоящего изобретения предусмотрена не встречающаяся в природе или сконструированная система CRISPR-Cas на основе индуцируемого Cas9, содержащая:In one aspect of the present invention, there is provided a non-naturally occurring or engineered CRISPR-Cas system based on inducible Cas9, comprising:
первую слитую конструкцию на основе Cas9, к которой прикреплена первая половинка индуцируемого димера, иthe first Cas9-based fusion construct to which the first half of the inducible dimer is attached, and
вторую слитую конструкцию на основе Cas9, к которой прикреплена вторая половинка индуцируемого димера,a second Cas9-based fusion construct to which the second half of the inducible dimer is attached,
где первая слитая конструкция на основе Cas9 функционально связана с одним или несколькими сигналами ядерной локализации,wherein the first Cas9-based fusion construct is operably linked to one or more nuclear localization signals,
где вторая слитая конструкция на основе Cas9 функционально связана с одним или несколькими сигналами ядерного экспорта,wherein the second Cas9-based fusion construct is operably linked to one or more nuclear export signals,
где приведение в контакт с источником энергии, являющимся индуктором, обеспечивает сведение первой и второй половинок индуцируемого димера вместе,where contact with an energy source, which is an inductor, ensures that the first and second halves of the induced dimer are brought together,
где сведение первой и второй половинок индуцируемого димера вместе позволяет первой и второй слитым конструкциям на основе Cas9 образовать функциональную систему CRISPR-Cas на основе Cas9,where bringing the first and second halves of the inducible dimer together allows the first and second Cas9-based fusion constructs to form a functional Cas9-based CRISPR-Cas system,
где система CRISPR-Cas на основе Cas9 содержит направляющую РНК (gRNA), содержащую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, иwherein the Cas9-based CRISPR-Cas system comprises a guide RNA (gRNA) comprising a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell, and
где функциональная система CRISPR-Cas на основе Cas9 связывается с целевой последовательностью и необязательно редактирует локус генома для изменения экспрессии генов.where a functional Cas9-based CRISPR-Cas system binds to a target sequence and optionally edits a genomic locus to alter gene expression.
В одном аспекте настоящего изобретения в системе CRISPR-Cas на основе индуцируемого Cas9 индуцируемый димер представляет собой, или содержит, или состоит, по сути, из, или состоит из индуцируемого гетеродимера. В одном аспекте в системе CRISPR-Cas на основе индуцируемого Cas9 первая половинка, или первая часть, или первый фрагмент индуцируемого гетеродимера представляет собой, или содержит, или состоит из, или состоит, по сути, из FKBP, необязательно FKBP12. В одном аспекте настоящего изобретения в системе CRISPR-Cas на основе индуцируемого Cas9 вторая половинка, или вторая часть, или второй фрагмент индуцируемого гетеродимера представляет собой, или содержит, или состоит из, или состоит, по сути, из FRB. В одном аспекте настоящего изобретения в системе CRISPR-Cas на основе индуцируемого Cas9 порядок расположения в первой слитой конструкции на основе Cas9 представляет собой, или содержит, или состоит из, или состоит, по сути, из N'-концевой части Cas9-FRB-NES. В одном аспекте настоящего изобретения в системе CRISPR-Cas на основе индуцируемого Cas9 порядок расположения в первой слитой конструкции на основе Cas9 представляет собой, или содержит, или состоит из, или состоит, по сути, из NES-N'-концевая часть Cas9-FRB-NES. В одном аспекте настоящего изобретения в системе CRISPR-Cas на основе индуцируемого Cas9 порядок расположения во второй слитой конструкции на основе Cas9 представляет собой, или содержит, или состоит, по сути, из, или состоит из C'-концевой части Cas9-FKBP-NLS. В одном аспекте настоящего изобретения предусмотрена система CRISPR-Cas на основе индуцируемого Cas9, в которой порядок расположения во второй слитой конструкции на основе Cas9 представляет собой, или содержит, или состоит из, или состоит, по сути, из NLS-C'-концевая часть Cas9-FKBP-NLS. В одном аспекте в системе CRISPR-Cas на основе индуцируемого Cas9 может присутствовать линкер, который отделяет часть Cas9 от половинки, или части, или фрагмента индуцируемого димера. В одном аспекте в системе CRISPR-Cas на основе индуцируемого Cas9 источник энергии, являющийся индуктором, представляет собой, или содержит, или состоит, по сути, из, или состоит из рапамицина. В одном аспекте в системе CRISPR-Cas на основе индуцируемого Cas9 индуцируемый димер представляет собой индуцируемый гомодимер. В одном аспекте в системе CRISPR-Cas на основе индуцируемого Cas9 - Cas9 представляет собой FnCas9. В одном аспекте в системе CRISPR-Cas на основе индуцируемого Cas9 один или несколько функциональных доменов ассоциированы с одной или обеими частями Cas9, например, функциональные домены необязательно включают активатор транскрипции, транскрипционный элемент или нуклеазу, такую как нуклеаза Fok1. В одном аспекте системы CRISPR-Cas на основе индуцируемого Cas9 функциональная система CRISPR-Cas на основе Cas9 связывается с целевой последовательностью, и при этом фермент представляет собой нефункциональный Cas9, который необязательно характеризуется нуклеазной активностью, сниженной по меньшей мере на 97% или 100% (или характеризуется не более чем 3% и преимущественно 0% нуклеазной активностью) по сравнению с Cas9, не имеющим по меньшей мере одной мутации. Настоящее изобретение дополнительно охватывает полинуклеотид, кодирующий систему CRISPR-Cas на основе индуцируемого Cas9, обсуждаемую в данном документе, и он предусмотрен в одном аспекте настоящего изобретения.In one aspect of the present invention, in the inducible Cas9-based CRISPR-Cas system, the inducible dimer is, or comprises, or consists essentially of, or consists of, an inducible heterodimer. In one aspect, in the inducible Cas9-based CRISPR-Cas system, the first half, or first portion, or first fragment of the inducible heterodimer is, or comprises, or consists of, or consists essentially of FKBP, optionally FKBP12. In one aspect of the present invention, in the inducible Cas9-based CRISPR-Cas system, the second half, or second portion, or second fragment of the inducible heterodimer is, or comprises, or consists of, or consists essentially of FRB. In one aspect of the present invention, in an inducible Cas9-based CRISPR-Cas system, the arrangement in the first Cas9-based fusion construct is, or comprises, or consists of, or consists essentially of, the N'-terminal portion of Cas9-FRB-NES. In one aspect of the present invention, in an inducible Cas9-based CRISPR-Cas system, the arrangement in the first Cas9-based fusion construct is, or comprises, or consists of, or consists essentially of, NES-N'-terminal portion of Cas9-FRB-NES. In one aspect of the present invention, in an inducible Cas9-based CRISPR-Cas system, the arrangement in the second Cas9-based fusion construct is, or comprises, or consists essentially of, or consists of, the C'-terminal portion of Cas9-FKBP-NLS. In one aspect, the present invention provides an inducible Cas9-based CRISPR-Cas system, wherein the arrangement in the second Cas9-based fusion construct is, or comprises, or consists of, or consists essentially of NLS-C'-terminal portion of Cas9-FKBP-NLS. In one aspect, in the inducible Cas9-based CRISPR-Cas system, a linker may be present that separates the Cas9 portion from the half or portion or fragment of the inducible dimer. In one aspect, in the inducible Cas9-based CRISPR-Cas system, the energy source that is an inducer is, or comprises, or consists essentially of, or consists of rapamycin. In one aspect, in the inducible Cas9-based CRISPR-Cas system, the inducible dimer is an inducible homodimer. In one aspect, in an inducible Cas9-based CRISPR-Cas system, the Cas9 is FnCas9. In one aspect, in an inducible Cas9-based CRISPR-Cas system, one or more functional domains are associated with one or both portions of the Cas9, for example, the functional domains optionally include a transcriptional activator, a transcriptional element, or a nuclease, such as a Fok1 nuclease. In one aspect of an inducible Cas9-based CRISPR-Cas system, a functional Cas9-based CRISPR-Cas system binds to a target sequence, and wherein the enzyme is a non-functional Cas9, which optionally has a nuclease activity that is reduced by at least 97% or 100% (or has no more than 3% and substantially 0% nuclease activity) compared to a Cas9 that does not have at least one mutation. The present invention further encompasses a polynucleotide encoding the inducible Cas9-based CRISPR-Cas system discussed herein, and it is provided in one aspect of the present invention.
В одном аспекте настоящего изобретения предусмотрен вектор для доставки первой слитой конструкции на основе Cas9, к которой прикреплена первая половинка, или часть, или фрагмент индуцируемого димера, и которая функционально связана с одним или несколькими сигналами ядерной локализации, в соответствии с обсуждаемым в данном документе. В одном аспекте настоящего изобретения предусмотрен вектор для доставки второй слитой конструкции на основе Cas9, к которой прикреплена вторая половинка, или часть, или фрагмент индуцируемого димера, и которая функционально связана с одним или несколькими сигналами ядерного экспорта.In one aspect of the present invention, there is provided a vector for delivering a first Cas9-based fusion construct to which a first half or portion or fragment of an inducible dimer is attached and which is operably linked to one or more nuclear localization signals, as discussed herein. In one aspect of the present invention, there is provided a vector for delivering a second Cas9-based fusion construct to which a second half or portion or fragment of an inducible dimer is attached and which is operably linked to one or more nuclear export signals.
В одном аспекте настоящего изобретения предусмотрен вектор для доставки как первой слитой конструкции на основе Cas9, к которой прикреплена первая половинка, или часть, или фрагмент индуцируемого димера, и которая функционально связана с одним или несколькими сигналами ядерной локализации, обсуждаемыми в данном документе; так и второй слитой конструкции на основе Cas9, к которой прикреплена вторая половинка, или часть, или фрагмент индуцируемого димера, и которая функционально связана с одним или несколькими сигналами ядерного экспорта, обсуждаемыми в данном документе.In one aspect of the present invention, there is provided a vector for delivering both a first Cas9-based fusion construct to which a first half, or portion, or fragment of an inducible dimer is attached and which is operably linked to one or more nuclear localization signals discussed herein; and a second Cas9-based fusion construct to which a second half, or portion, or fragment of an inducible dimer is attached and which is operably linked to one or more nuclear export signals discussed herein.
В одном аспекте вектор может представлять отдельную плазмиду или кассету экспрессии.In one aspect, the vector may be a single plasmid or expression cassette.
В одном аспекте настоящего изобретения предусмотрены эукариотическая клетка-хозяин или линия клеток, трансформированные с помощью любого из векторов, обсуждаемых в данном документе, или экспрессирующие систему CRISPR-Cas на основе индуцируемого Cas9, обсуждаемую в данном документе.In one aspect, the present invention provides a eukaryotic host cell or cell line transformed with any of the vectors discussed herein or expressing the inducible Cas9-based CRISPR-Cas system discussed herein.
В одном аспекте настоящего изобретения предусмотрен трансгенный организм, трансформированный с помощью любого из векторов, обсуждаемых в данном документе, или экспрессирующий систему CRISPR-Cas на основе индуцируемого Cas9, обсуждаемую в данном документе, или его потомство. В одном аспекте настоящего изобретения предусмотрен модельный организм, который конститутивно экспрессирует систему CRISPR-Cas на основе индуцируемого Cas9, обсуждаемую в данном документе.In one aspect, the present invention provides a transgenic organism transformed with any of the vectors discussed herein or expressing the inducible Cas9-based CRISPR-Cas system discussed herein or a progeny thereof. In one aspect, the present invention provides a model organism that constitutively expresses the inducible Cas9-based CRISPR-Cas system discussed herein.
В одном аспекте настоящего изобретения предусмотрена не встречающаяся в природе или сконструированная система CRISPR-Cas на основе индуцируемого Cas9, содержащая:In one aspect of the present invention, there is provided a non-naturally occurring or engineered CRISPR-Cas system based on inducible Cas9, comprising:
первую слитую конструкцию на основе Cas9, к которой прикреплена первая половинка индуцируемого гетеродимера, иthe first Cas9-based fusion construct to which the first half of the inducible heterodimer is attached, and
вторую слитую конструкцию на основе Cas9, к которой прикреплена вторая половинка индуцируемого гетеродимера,a second Cas9-based fusion construct to which the second half of the inducible heterodimer is attached,
где первая слитая конструкция на основе Cas9 функционально связана с одним или несколькими сигналами ядерной локализации,wherein the first Cas9-based fusion construct is operably linked to one or more nuclear localization signals,
где вторая слитая конструкция на основе Cas9 функционально связана с сигналом ядерного экспорта,where the second Cas9-based fusion construct is functionally linked to a nuclear export signal,
где приведение в контакт с источником энергии, являющимся индуктором, обеспечивает сведение первой и второй половинок индуцируемого гетеродимера вместе,where contact with an energy source, which is an inductor, ensures that the first and second halves of the induced heterodimer are brought together,
где сведение первой и второй половинок индуцируемого гетеродимера вместе позволяет первой и второй слитым конструкциям на основе Cas9 образовать функциональную систему CRISPR-Cas на основе Cas9,where bringing the first and second halves of the inducible heterodimer together allows the first and second Cas9-based fusion constructs to form a functional Cas9-based CRISPR-Cas system,
где система CRISPR-Cas на основе Cas9 содержит направляющую РНК (gRNA), содержащую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, иwherein the Cas9-based CRISPR-Cas system comprises a guide RNA (gRNA) comprising a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell, and
где функциональная система CRISPR-Cas на основе Cas9 редактирует локус генома для изменения экспрессии генов.where a functional Cas9-based CRISPR-Cas system edits a genomic locus to alter gene expression.
В одном аспекте настоящего изобретения предусмотрен способ лечения субъекта, нуждающегося в этом, включающий индуцирование редактирования генов путем трансформации субъекта с помощью полинуклеотида, обсуждаемого в данном документе, или любого из векторов, обсуждаемых в данном документе, и введение субъекту источника энергии, являющегося индуктором. Настоящее изобретение охватывает пути применения такого полинуклеотида или вектора в изготовлении лекарственного препарата, например, такого лекарственного препарата, предназначенного для лечения субъекта или для такого способа лечения субъекта. Настоящее изобретение охватывает полинуклеотид, обсуждаемый в данном документе, или любой из векторов, обсуждаемых в данном документе, для применения в способе лечения субъекта, нуждающегося в этом, предусматривающем индуцирование редактирования генов, где способ дополнительно включает введение субъекту источника энергии, являющегося индуктором. В одном аспекте в способе также обеспечивается матрица для репарации, например, доставляемая вектором, содержащим указанную матрицу для репарации.In one aspect, the present invention provides a method of treating a subject in need thereof, comprising inducing gene editing by transforming the subject with a polynucleotide as discussed herein or any of the vectors as discussed herein, and administering to the subject an energy source that is an inducer. The present invention encompasses ways of using such a polynucleotide or vector in the manufacture of a medicament, e.g., such a medicament, for treating a subject or for such a method of treating a subject. The present invention encompasses a polynucleotide as discussed herein or any of the vectors as discussed herein for use in a method of treating a subject in need thereof, comprising inducing gene editing, wherein the method further comprises administering to the subject an energy source that is an inducer. In one aspect, the method also provides a repair template, e.g., delivered by a vector containing said repair template.
В настоящем изобретении также предусмотрен способ лечения субъекта, нуждающегося в этом, включающий индуцирование активации или репрессии транскрипции путем трансформации субъекта с помощью полинуклеотида, обсуждаемого в данном документе, или любого из векторов, обсуждаемых в данном документе, где указанные полинуклеотид или вектор кодируют или содержат каталитически неактивный Cas9 и один или несколько ассоциированных c ним функциональных доменов, обсуждаемых в данном документе; при этом способ дополнительно включает введение субъекту источника энергии, являющегося индуктором. В настоящем изобретении также предусмотрены полинуклеотид, обсуждаемый в данном документе, или любой из векторов, обсуждаемых в данном документе, для применения в способе лечения субъекта, нуждающегося в этом, включающем индуцирование активации или репрессии транскрипции, где способ дополнительно включает введение субъекту источника энергии, являющегося индуктором.The present invention also provides a method of treating a subject in need thereof, comprising inducing transcriptional activation or repression by transforming the subject with a polynucleotide discussed herein or any of the vectors discussed herein, wherein said polynucleotide or vector encodes or comprises a catalytically inactive Cas9 and one or more associated functional domains discussed herein; wherein the method further comprises administering to the subject an energy source that is an inducer. The present invention also provides a polynucleotide discussed herein or any of the vectors discussed herein for use in a method of treating a subject in need thereof, comprising inducing transcriptional activation or repression, wherein the method further comprises administering to the subject an energy source that is an inducer.
Соответственно, настоящее изобретение охватывает, помимо прочего, гомодимеры, а также гетеродимеры, нефункциональный Cas9 или Cas9, характеризующийся фактически отсутствием нуклеазной активности, например, из-за мутации, системы или комплексы, в которых присутствуют одна или несколько NLS и/или одна или несколько NES; функциональный(функциональные) домен(домены), связанный(связанные) со split-Cas9; способы, в том числе способы лечения, и пути применения.Accordingly, the present invention encompasses, inter alia, homodimers as well as heterodimers, non-functional Cas9 or Cas9 characterized by a substantial absence of nuclease activity, for example due to mutation, systems or complexes in which one or more NLS and/or one or more NES are present; functional domain(s) associated with split-Cas9; methods, including methods of treatment, and routes of use.
Следует понимать, что когда в данном документе ссылаются на Cas9, белок Cas9 или фермент Cas9, то под ними подразумевают split-Cas9 согласно настоящему изобретению. В одном аспекте настоящего изобретения предусмотрен способ изменения или модифицирования экспрессии продукта гена. Указанный способ может предусматривать введение в клетку, содержащую и экспрессирующую молекулу ДНК, кодирующую продукт гена, сконструированной, не встречающейся в природе системы CRISPR-Cas на основе Cas9, содержащей белок Cas9 и направляющую РНК, которая нацеливается на молекулу ДНК, в результате чего направляющая РНК нацеливается на молекулу ДНК, кодирующую продукт гена, а белок Cas9 расщепляет молекулу ДНК, кодирующую продукт гена, в результате чего изменяется экспрессия продукта гена; и где белок Cas9 и направляющая РНК не встречаются в природе вместе. Настоящее изобретение охватывает направляющую РНК, предусматривающую направляющую последовательность, связанную с последовательностью прямого повтора (DR). Настоящее изобретение дополнительно охватывает белок Cas9, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающего, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной.It should be understood that when Cas9, Cas9 protein or Cas9 enzyme are referred to herein, split-Cas9 according to the present invention is meant. In one aspect, the present invention provides a method of altering or modifying the expression of a gene product. The method may comprise introducing into a cell containing and expressing a DNA molecule encoding a gene product, an engineered, non-naturally occurring Cas9-based CRISPR-Cas system comprising a Cas9 protein and a guide RNA that targets the DNA molecule, whereby the guide RNA targets the DNA molecule encoding the gene product, and the Cas9 protein cleaves the DNA molecule encoding the gene product, whereby the expression of the gene product is altered; and wherein the Cas9 protein and the guide RNA do not occur together in nature. The present invention encompasses a guide RNA that provides a guide sequence associated with a direct repeat (DR) sequence. The present invention further encompasses a Cas9 protein that is codon-optimized for expression in a eukaryotic cell. In a preferred embodiment, the eukaryotic cell is a mammalian cell, and in a more preferred embodiment, the mammalian cell is a human cell. In a further embodiment of the present invention, expression of the gene product is reduced.
В одном аспекте настоящего изобретения предусмотрена сконструированная, не встречающаяся в природе система CRISPR-Cas на основе Cas9, содержащая белок Cas9 и направляющую РНК, которая нацеливается на молекулу ДНК, кодирующую продукт гена в клетке, в результате чего направляющая РНК нацеливается на молекулу ДНК, кодирующую продукт гена, а белок Cas9 расщепляет молекулу ДНК, кодирующую продукт гена, в результате чего изменяется экспрессия продукта гена; и где белок Cas9 и направляющая РНК не встречаются в природе вместе; при этом предусматривается split-Cas9 согласно настоящему изобретению. Настоящее изобретение охватывает направляющую РНК, предусматривающую направляющую последовательность, связанную с последовательностью DR. Настоящее изобретение дополнительно охватывает белок Cas9, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающего, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной.In one aspect of the present invention, there is provided an engineered, non-naturally occurring Cas9-based CRISPR-Cas system comprising a Cas9 protein and a guide RNA that targets a DNA molecule encoding a gene product in a cell, whereby the guide RNA targets the DNA molecule encoding the gene product, and the Cas9 protein cleaves the DNA molecule encoding the gene product, whereby expression of the gene product is altered; and wherein the Cas9 protein and the guide RNA do not occur together in nature; wherein there is provided a split-Cas9 according to the present invention. The present invention encompasses a guide RNA that comprises a guide sequence associated with a DR sequence. The present invention further encompasses a Cas9 protein that is codon-optimized for expression in a eukaryotic cell. In a preferred embodiment, the eukaryotic cell is a mammalian cell, and in a more preferred embodiment, the mammalian cell is a human cell. In a further embodiment of the present invention, expression of the gene product is reduced.
В другом аспекте настоящего изобретения предусмотрена сконструированная, не встречающаяся в природе векторная система, содержащая один или несколько векторов, содержащих первый регуляторный элемент, функционально связанный с направляющей РНК системы CRISPR-Cas на основе Cas9, которая нацеливается на молекулу ДНК, кодирующую продукт гена, и второй регуляторный элемент, функционально связанный с белком Cas9; при этом предусматривается split-Cas9 согласно настоящему изобретению. Компоненты (a) и (b) могут быть расположены в одном и том же или разных векторах системы. Направляющая РНК нацеливается на молекулу ДНК, кодирующую продукт гена в клетке, а белок Cas9 расщепляет молекулу ДНК, кодирующую продукт гена, в результате чего изменяется экспрессия продукта гена; и где белок Cas9 и направляющая РНК не встречаются в природе вместе. Настоящее изобретение охватывает направляющую РНК, предусматривающую направляющую последовательность, связанную с последовательностью DR. Настоящее изобретение дополнительно охватывает белок Cas9, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающего, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной.In another aspect, the present invention provides an engineered, non-naturally occurring vector system comprising one or more vectors comprising a first regulatory element operably linked to a guide RNA of a Cas9-based CRISPR-Cas system that targets a DNA molecule encoding a gene product, and a second regulatory element operably linked to a Cas9 protein; wherein split-Cas9 according to the present invention is provided. Components (a) and (b) can be located in the same or different vectors of the system. The guide RNA targets a DNA molecule encoding a gene product in a cell, and the Cas9 protein cleaves the DNA molecule encoding the gene product, resulting in altered expression of the gene product; and wherein the Cas9 protein and the guide RNA do not occur together in nature. The present invention encompasses a guide RNA that provides a guide sequence associated with a DR sequence. The present invention further encompasses a Cas9 protein that is codon-optimized for expression in a eukaryotic cell. In a preferred embodiment, the eukaryotic cell is a mammalian cell, and in a more preferred embodiment, the mammalian cell is a human cell. In a further embodiment of the present invention, expression of the gene product is reduced.
В одном аспекте настоящего изобретения предусмотрена векторная система, содержащая один или несколько векторов. В некоторых вариантах осуществления система содержит: (a) первый регуляторный элемент, функционально связанный с последовательностью DR и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей ниже последовательности DR, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR-Cas на основе Cas9 с целевой последовательностью в эукариотической клетке, где комплекс CRISPR-Cas на основе Cas9 содержит Cas9 в комплексе с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) последовательностью DR; и (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, которая кодирует указанный фермент Cas9, содержащий последовательность ядерной локализации; где компоненты (a) и (b) находятся в одном и том же или разных векторах системы; при этом предусматривается split-Cas9 согласно настоящему изобретению. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR-Cas на основе Cas9 со своей целевой последовательностью в эукариотической клетке.In one aspect of the present invention, a vector system is provided, comprising one or more vectors. In some embodiments, the system comprises: (a) a first regulatory element operably linked to a DR sequence and one or more insertion sites for inserting one or more guide sequences downstream of the DR sequence, wherein, when expressed, the guide sequence directs sequence-specific binding of a Cas9-based CRISPR-Cas complex to a target sequence in a eukaryotic cell, wherein the Cas9-based CRISPR-Cas complex comprises Cas9 in complex with (1) a guide sequence that hybridizes to the target sequence and (2) a DR sequence; and (b) a second regulatory element operably linked to an enzyme-coding sequence that encodes said Cas9 enzyme comprising a nuclear localization sequence; wherein components (a) and (b) are in the same or different vectors of the system; wherein split-Cas9 according to the present invention is provided. In some embodiments, component (a) further comprises two or more guide sequences operably linked to the first regulatory element, wherein, when expressed, each of the two or more guide sequences directs sequence-specific binding of a Cas9-based CRISPR-Cas complex to its target sequence in a eukaryotic cell.
В некоторых вариантах осуществления комплекс CRISPR-Cas на основе Cas9 содержит одну или несколько последовательностей ядерной локализации, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного комплекса CRISPR-Cas на основе Cas9 в обнаруживаемом количестве в ядре эукариотической клетки. Не вдаваясь в теорию, полагают, что последовательность ядерной локализации не является необходимой для активности комплекса CRISPR-Cas на основе Cas9 у эукариот, но включение таких последовательностей повышает активность системы, особенно в отношении нацеливания на молекулы нуклеиновой кислоты в ядре.In some embodiments, the Cas9-based CRISPR-Cas complex comprises one or more nuclear localization sequences that are sufficiently efficient to direct the accumulation of said Cas9-based CRISPR-Cas complex in a detectable amount in the nucleus of a eukaryotic cell. Without being bound by theory, it is believed that the nuclear localization sequence is not necessary for the activity of the Cas9-based CRISPR-Cas complex in eukaryotes, but the inclusion of such sequences enhances the activity of the system, especially with respect to targeting nucleic acid molecules in the nucleus.
В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 видов бактерий, выбранных из группы, состоящей из Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens и Porphyromonas macacae, и может включать мутированный Cas9, происходящий из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления Cas9 является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления Cas9 управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В предпочтительном варианте осуществления нитевой разрыв представляет собой ступенчатый разрыв, образующий "липкий" 5'-конец. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления минимальная длина прямого повтора составляет 16 нуклеотидов, и он содержит одну "петлю-на-стебле". В дополнительных вариантах осуществления длина прямого повтора составляет более 16 нуклеотидов, предпочтительно более 17 нуклеотидов, и он содержит более одной "петли-на-стебле" или оптимизированных вторичных структур.In some embodiments, the Cas9 enzyme is a Cas9 of a bacterial species selected from the group consisting of Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens, and Porphyromonas macacae, and may include a mutated Cas9 derived from these organisms. The enzyme may be a homolog or ortholog of Cas9. In some embodiments, Cas9 is codon optimized for expression in a eukaryotic cell. In some embodiments, Cas9 directs a single or double strand cleavage at a specific position in a target sequence. In a preferred embodiment, the strand break is a staggered break that forms a 5' sticky end. In some embodiments, the first regulatory element is a polymerase III promoter. In some embodiments, the second regulatory element is a polymerase II promoter. In some embodiments, the minimum length of the direct repeat is 16 nucleotides and comprises one stem loop. In further embodiments, the length of the direct repeat is greater than 16 nucleotides, preferably greater than 17 nucleotides, and comprises more than one stem loop or optimized secondary structures.
В одном аспекте настоящего изобретения предусмотрена эукариотическая клетка-хозяин, содержащая (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей ниже последовательности DR, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR-Cas на основе Cas9 с целевой последовательностью в эукариотической клетке, где комплекс CRISPR-Cas на основе Cas9 содержит Cas9 в комплексе с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) последовательностью DR; и/или (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, которая кодирует указанный фермент Cas9, содержащий последовательность ядерной локализации. В некоторых вариантах осуществления клетка-хозяин содержит компоненты (a) и (b); при этом предусматривается split-Cas9 согласно настоящему изобретению. В некоторых вариантах осуществления компонент (a), компонент (b) или компоненты (a) и (b) стабильно интегрированы в геном эукариотической клетки-хозяина. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR-Cas на основе Cas9 со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления Cas9 является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления Cas9 управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В предпочтительном варианте осуществления нитевой разрыв представляет собой ступенчатый разрыв, образующий "липкий" 5'-конец. В некоторых вариантах осуществления Cas9 не обладает активностью расщепления нитей ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления минимальная длина прямого повтора составляет 16 нуклеотидов, и он содержит одну "петлю-на-стебле". В дополнительных вариантах осуществления длина прямого повтора составляет более 16 нуклеотидов, предпочтительно более 17 нуклеотидов, и он содержит более одной "петли-на-стебле" или оптимизированных вторичных структур. В одном аспекте настоящего изобретения предусмотрен эукариотический организм, отличный от человека; предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина в соответствии с любым из описанных вариантов осуществления. В других аспектах настоящего изобретения предусмотрен эукариотический организм, предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина в соответствии с любым из описанных вариантов осуществления. В некоторых вариантах осуществления этих аспектов организм может представлять собой животное; например, млекопитающее. Также организм может представлять собой членистоногое, такое как насекомое. Организм также может представлять собой растение. Кроме того, организм может представлять собой гриб.In one aspect of the present invention, there is provided a eukaryotic host cell comprising (a) a first regulatory element operably linked to a direct repeat sequence and one or more insertion sites for insertion of one or more guide sequences downstream of a DR sequence, wherein, when expressed, the guide sequence directs sequence-specific binding of a Cas9-based CRISPR-Cas complex to a target sequence in a eukaryotic cell, wherein the Cas9-based CRISPR-Cas complex comprises Cas9 in complex with (1) a guide sequence that hybridizes to the target sequence and (2) a DR sequence; and/or (b) a second regulatory element operably linked to an enzyme-coding sequence that encodes said Cas9 enzyme comprising a nuclear localization sequence. In some embodiments, the host cell comprises components (a) and (b); wherein a split-Cas9 according to the present invention is provided. In some embodiments, component (a), component (b), or components (a) and (b) are stably integrated into the genome of a eukaryotic host cell. In some embodiments, component (a) further comprises two or more guide sequences operably linked to a first regulatory element, wherein when expressed, each of the two or more guide sequences directs sequence-specific binding of a Cas9-based CRISPR-Cas complex to its target sequence in a eukaryotic cell. In some embodiments, Cas9 is codon-optimized for expression in a eukaryotic cell. In some embodiments, Cas9 directs a single or double strand cleavage at a specific position of a target sequence. In a preferred embodiment, the strand break is a staggered break that forms a 5' sticky end. In some embodiments, Cas9 lacks DNA strand cleavage activity. In some embodiments, the first regulatory element is a polymerase III promoter. In some embodiments, the direct repeat has a minimum length of 16 nucleotides and comprises one stem-loop. In further embodiments, the direct repeat has a length of more than 16 nucleotides, preferably more than 17 nucleotides, and comprises more than one stem-loop or optimized secondary structures. In one aspect, the present invention provides a eukaryotic organism other than a human; preferably a multicellular eukaryotic organism comprising a eukaryotic host cell according to any of the described embodiments. In other aspects, the present invention provides a eukaryotic organism, preferably a multicellular eukaryotic organism comprising a eukaryotic host cell according to any of the described embodiments. In some embodiments of these aspects, the organism may be an animal; for example, a mammal. The organism may also be an arthropod, such as an insect. The organism may also be a plant. In addition, the organism may be a fungus.
В одном аспекте настоящего изобретения предусмотрен набор, содержащий один или несколько компонентов, описанных в данном документе. В некоторых вариантах осуществления набор содержит векторную систему и инструкции по применению набора. В некоторых вариантах осуществления векторная система содержит (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей ниже последовательности DR, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR-Cas на основе Cas9 с целевой последовательностью в эукариотической клетке, где комплекс CRISPR-Cas на основе Cas9 содержит Cas9 в комплексе с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью, и (2) последовательностью DR; и/или (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, которая кодирует указанный фермент Cas9, содержащий последовательность ядерной локализации, и преимущественно он предусматривает split-Cas9 согласно настоящему изобретению. В некоторых вариантах осуществления набор содержит компоненты (a) и (b), находящиеся в одном и том же или разных векторах системы. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR-Cas на основе Cas9 со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления Cas9 содержит одну или несколько последовательностей ядерной локализации, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного Cas9 в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент Cas9 представляет собой Cas9 видов бактерий, выбранных из группы, состоящей из Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens и Porphyromonas macacae, и может включать мутированный Cas9, происходящий из этих организмов. Фермент может быть гомологом или ортологом Cas9. В некоторых вариантах осуществления Cas9 является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления Cas9 управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В предпочтительном варианте осуществления нитевой разрыв представляет собой ступенчатый разрыв, образующий "липкий" 5'-конец. В некоторых вариантах осуществления фермент CRISPR не обладает активностью расщепления нитей ДНК. В некоторых вариантах осуществления минимальная длина прямого повтора составляет 16 нуклеотидов, и он содержит одну "петлю-на-стебле". В дополнительных вариантах осуществления длина прямого повтора составляет более 16 нуклеотидов, предпочтительно более 17 нуклеотидов, и он содержит более одной "петли-на-стебле" или оптимизированных вторичных структур.In one aspect of the present invention, a kit is provided comprising one or more components described herein. In some embodiments, the kit comprises a vector system and instructions for using the kit. In some embodiments, the vector system comprises (a) a first regulatory element operably linked to a direct repeat sequence and one or more insertion sites for inserting one or more guide sequences downstream of a DR sequence, wherein when expressed, the guide sequence directs sequence-specific binding of a Cas9-based CRISPR-Cas complex to a target sequence in a eukaryotic cell, wherein the Cas9-based CRISPR-Cas complex comprises Cas9 in complex with (1) a guide sequence that hybridizes to the target sequence and (2) a DR sequence; and/or (b) a second regulatory element operably linked to an enzyme-coding sequence that encodes said Cas9 enzyme comprising a nuclear localization sequence, and advantageously it provides for split-Cas9 according to the present invention. In some embodiments, the kit comprises components (a) and (b) located in the same or different vectors of the system. In some embodiments, component (a) further comprises two or more guide sequences operably linked to the first regulatory element, wherein when expressed, each of the two or more guide sequences directs sequence-specific binding of the Cas9-based CRISPR-Cas complex to its target sequence in a eukaryotic cell. In some embodiments, the Cas9 comprises one or more nuclear localization sequences that are sufficiently efficient to direct the accumulation of said Cas9 in a detectable amount in the nucleus of a eukaryotic cell. In some embodiments, the Cas9 enzyme is a Cas9 of a bacterial species selected from the group consisting of Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens, and Porphyromonas macacae, and may include mutated Cas9 from these organisms. The enzyme may be a homolog or ortholog of Cas9. In some embodiments, Cas9 is codon optimized for expression in a eukaryotic cell. In some embodiments, Cas9 directs the cleavage of one or two strands at a specific position in a target sequence. In a preferred embodiment, the strand break is a staggered break that forms a 5' sticky end. In some embodiments, the CRISPR enzyme does not have DNA strand cleavage activity. In some embodiments, the direct repeat has a minimum length of 16 nucleotides and comprises one stem loop. In further embodiments, the direct repeat is greater than 16 nucleotides, preferably greater than 17 nucleotides, and comprises more than one stem loop or optimized secondary structures.
В одном аспекте настоящего изобретения предусмотрен способ модифицирования целевого полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR-Cas на основе Cas9 с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида, за счет чего обеспечивается модифицирование целевого полинуклеотида, где комплекс CRISPR-Cas на основе Cas9 содержит Cas9 в комплексе с направляющей последовательностью, гибридизированной с целевой последовательностью в пределах указанного целевого полинуклеотида, где указанная направляющая последовательность связана с последовательностью прямого повтора. В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении целевой последовательности с помощью указанного Cas9; при этом предусматривается split-Cas9 согласно настоящему изобретению. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида с помощью гомологичной рекомбинации с экзогенной полинуклеотидной матрицей, где указанная репарация приводит к возникновению мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в указанном целевом полинуклеотиде. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот в белке, экспрессируемом с гена, содержащего целевую последовательность. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанную эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из Cas9 и направляющей последовательности, связанной с последовательностью DR. В некоторых вариантах осуществления указанные векторы доставляются в эукариотическую клетку в субъекте. В некоторых вариантах осуществления указанное модифицирование происходит в указанной эукариотической клетке в культуре клеток. В некоторых вариантах осуществления способ дополнительно включает выделение указанной эукариотической клетки из организма субъекта перед проведением указанного модифицирования. В некоторых вариантах осуществления способ дополнительно включает возвращение указанной эукариотической клетки и/или клеток, происходящих из нее, указанному субъекту.In one aspect of the present invention, there is provided a method for modifying a target polynucleotide in a eukaryotic cell. In some embodiments, the method comprises allowing a Cas9-based CRISPR-Cas complex to bind to a target polynucleotide to effect cleavage of said target polynucleotide, thereby effecting modification of the target polynucleotide, wherein the Cas9-based CRISPR-Cas complex comprises Cas9 in a complex with a guide sequence hybridized to a target sequence within said target polynucleotide, wherein said guide sequence is linked to a direct repeat sequence. In some embodiments, said cleavage comprises cleaving one or two strands at a certain position of the target sequence using said Cas9; wherein a split-Cas9 according to the present invention is provided. In some embodiments, said cleavage results in reduced transcription of the target gene. In some embodiments, the method further comprises repairing said cleaved target polynucleotide by homologous recombination with an exogenous polynucleotide template, wherein said repair results in a mutation involving an insertion, deletion or substitution of one or more nucleotides in said target polynucleotide. In some embodiments, said mutation results in a change in one or more amino acids in a protein expressed from a gene comprising the target sequence. In some embodiments, the method further comprises delivering one or more vectors to said eukaryotic cell, wherein the one or more vectors drive expression of one or more of Cas9 and a guide sequence associated with a DR sequence. In some embodiments, said vectors are delivered to a eukaryotic cell in a subject. In some embodiments, said modification occurs in said eukaryotic cell in cell culture. In some embodiments, the method further comprises isolating said eukaryotic cell from the subject prior to said modification. In some embodiments, the method further comprises returning said eukaryotic cell and/or cells derived therefrom to said subject.
В одном аспекте настоящего изобретения предусмотрен способ модифицирования экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR-Cas на основе Cas9 с полинуклеотидом, так что указанное связывание приводит к повышенной или сниженной экспрессии указанного полинуклеотида; где комплекс CRISPR-Cas на основе Cas9 содержит Cas9 в комплексе с направляющей последовательностью, гибридизирующейся с целевой последовательностью в пределах указанного полинуклеотида, где указанная направляющая последовательность связана с последовательностью прямого повтора; при этом предусматривается split-Cas9 согласно настоящему изобретению. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанные эукариотические клетки, где один или несколько векторов управляют экспрессией одного или нескольких из Cas9 и направляющей последовательности, связанной с последовательностью DR.In one aspect of the present invention, there is provided a method of modifying the expression of a polynucleotide in a eukaryotic cell. In some embodiments, the method comprises causing a Cas9-based CRISPR-Cas complex to bind to a polynucleotide, such that said binding results in increased or decreased expression of said polynucleotide; wherein the Cas9-based CRISPR-Cas complex comprises Cas9 in a complex with a guide sequence that hybridizes to a target sequence within said polynucleotide, wherein said guide sequence is linked to a direct repeat sequence; wherein a split-Cas9 according to the present invention is provided. In some embodiments, the method further comprises delivering one or more vectors to said eukaryotic cells, wherein the one or more vectors direct the expression of one or more of Cas9 and a guide sequence linked to a DR sequence.
В одном аспекте настоящего изобретения предусмотрен способ получения модельной эукариотической клетки, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) введение одного или нескольких векторов в эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из Cas9 и направляющей последовательности, связанной с последовательностью прямого повтора; и (b) обеспечение связывания комплекса CRISPR-Cas на основе Cas9 с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в пределах указанного гена, ответственного за развитие заболевания, где комплекс CRISPR-Cas на основе Cas9 содержит Cas9 в комплексе с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью в пределах целевого полинуклеотида, и (2) последовательностью DR, с получением тем самым модельной эукариотической клетки, содержащей мутированный ген, ответственный за развитие заболевания; при этом предусматривается split-Cas9 согласно настоящему изобретению. В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении целевой последовательности с помощью указанного Cas9. В предпочтительном варианте осуществления нитевой разрыв представляет собой ступенчатый разрыв, образующий "липкий" 5'-конец. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида с помощью гомологичной рекомбинации с экзогенной полинуклеотидной матрицей, где указанная репарация приводит к возникновению мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в указанном целевом полинуклеотиде. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот при экспрессии белка с гена, содержащего целевую последовательность.In one aspect, the present invention provides a method for producing a model eukaryotic cell comprising a mutated disease-causative gene. In some embodiments, the disease-causative gene is any gene associated with an increased risk of having or developing a disease. In some embodiments, the method comprises (a) introducing one or more vectors into a eukaryotic cell, wherein the one or more vectors direct expression of one or more of Cas9 and a guide sequence associated with a direct repeat sequence; and (b) allowing a Cas9-based CRISPR-Cas complex to bind to a target polynucleotide to effect cleavage of the target polynucleotide within said disease-causative gene, wherein the Cas9-based CRISPR-Cas complex comprises Cas9 in complex with (1) a guide sequence that hybridizes to a target sequence within the target polynucleotide, and (2) a DR sequence, thereby producing a model eukaryotic cell comprising a mutated disease-causative gene; wherein a split-Cas9 according to the present invention is provided. In some embodiments, said cleavage comprises cleaving one or two strands at a certain position of the target sequence using said Cas9. In a preferred embodiment, the strand break is a staggered break forming a 5' sticky end. In some embodiments, said cleavage results in reduced transcription of the target gene. In some embodiments, the method further comprises repairing said cleaved target polynucleotide by homologous recombination with an exogenous polynucleotide template, wherein said repair results in a mutation involving an insertion, deletion or substitution of one or more nucleotides in said target polynucleotide. In some embodiments, said mutation results in a change in one or more amino acids in the expression of a protein from a gene comprising the target sequence.
В одном аспекте настоящего изобретения предусмотрен способ разработки биологически активного средства, которое модулирует событие передачи сигнала в клетке, ассоциированное с геном, ответственным за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) приведение тестируемого соединения в контакт с модельной клеткой по любому из описанных вариантов осуществления; и (b) обнаружение изменения считываемого показания, что указывает на снижение или возрастание события передачи сигнала в клетке, ассоциированного с указанной мутацией в указанном гене, ответственном за развитие заболевания, с получением тем самым указанного биологически активного средства, которое модулирует указанное событие передачи сигнала в клетке, ассоциированное с указанным геном, ответственным за развитие заболевания.In one aspect of the present invention, there is provided a method for developing a biologically active agent that modulates a cellular signaling event associated with a disease-promoting gene. In some embodiments, the disease-promoting gene is any gene associated with an increased risk of having or developing a disease. In some embodiments, the method comprises (a) contacting a test compound with a model cell according to any of the described embodiments; and (b) detecting a change in a readout that indicates a decrease or increase in a cellular signaling event associated with said mutation in said disease-promoting gene, thereby obtaining said biologically active agent that modulates said cellular signaling event associated with said disease-promoting gene.
В одном аспекте настоящего изобретения предусмотрен рекомбинантный полинуклеотид, содержащий направляющую последовательность ниже последовательности прямого повтора, где направляющая последовательность при экспрессии управляет специфичным к последовательности связыванием комплекса CRISPR-Cas на основе Cas9 с соответствующей целевой последовательностью, присутствующей в эукариотической клетке. В некоторых вариантах осуществления целевой последовательностью является вирусная последовательность, присутствующая в эукариотической клетке. В некоторых вариантах осуществления целевая последовательность представляет собой протоонкоген или онкоген.In one aspect of the present invention, there is provided a recombinant polynucleotide comprising a guide sequence downstream of a direct repeat sequence, wherein the guide sequence, when expressed, directs sequence-specific binding of a Cas9-based CRISPR-Cas complex to a corresponding target sequence present in a eukaryotic cell. In some embodiments, the target sequence is a viral sequence present in a eukaryotic cell. In some embodiments, the target sequence is a proto-oncogene or an oncogene.
В одном аспекте настоящего изобретения предусмотрен способ отбора клетки или нескольких клеток путем введения одной или нескольких мутаций в ген в одной или нескольких клетках, при этом способ предусматривает введение одного или нескольких векторов в клетку(клетки), где один или несколько векторов управляют экспрессией одного или нескольких из Cas9, направляющей последовательности, связанной с последовательностью прямого повтора, и матрицы редактирования; где матрица редактирования содержит одну или несколько мутаций, которые обеспечивают прекращение расщепления под действием Cas9; обеспечение гомологичной рекомбинации матрицы редактирования с целевым полинуклеотидом в клетке(клетках), подлежащей(подлежащих) отбору; обеспечение связывания комплекса CRISPR-Cas на основе Cas9 с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в пределах указанного гена, где комплекс CRISPR-Cas на основе Cas9 содержит Cas9 в комплексе с (1) направляющей последовательностью, которая гибридизируется с целевой последовательностью в пределах целевого полинуклеотида, и (2) последовательностью прямого повтора, где связывание комплекса CRISPR-Cas на основе Cas9 с целевым полинуклеотидом индуцирует гибель клетки, тем самым обеспечивая возможность отбора одной или нескольких клеток, в которые были введены одна или несколько мутаций; при этом предусматривается split-Cas9 согласно настоящему изобретению. В другом предпочтительном варианте настоящего изобретения клетка, подлежащая отбору, может представлять собой эукариотическую клетку. Аспекты настоящего изобретения предусматривают отбор специфических клеток без необходимости наличия маркера отбора или двухстадийного способа, который может включать систему негативного отбора.In one aspect of the present invention, there is provided a method of selecting a cell or more cells by introducing one or more mutations into a gene in one or more cells, the method comprising introducing one or more vectors into the cell(s), wherein the one or more vectors direct the expression of one or more of Cas9, a guide sequence associated with a direct repeat sequence, and an editing template; wherein the editing template comprises one or more mutations that provide for the termination of cleavage by Cas9; providing for homologous recombination of the editing template with a target polynucleotide in the cell(s) to be selected; allowing a Cas9-based CRISPR-Cas complex to bind to a target polynucleotide to effect cleavage of the target polynucleotide within said gene, wherein the Cas9-based CRISPR-Cas complex comprises Cas9 in a complex with (1) a guide sequence that hybridizes to a target sequence within the target polynucleotide, and (2) a direct repeat sequence, wherein the binding of the Cas9-based CRISPR-Cas complex to the target polynucleotide induces cell death, thereby allowing selection of one or more cells into which one or more mutations have been introduced; wherein split-Cas9 according to the present invention is provided. In another preferred embodiment of the present invention, the cell to be selected may be a eukaryotic cell. Aspects of the present invention provide for the selection of specific cells without the need for a selection marker or a two-step method that may include a negative selection system.
В данном документе встречается фраза "при этом предусматривается split-Cas9 согласно настоящему изобретению" или подобное выражение; и они указывают на то, что Cas9 в представленных в данном документе вариантах осуществления может представлять собой split-Cas9, обсуждаемый в данном документе.Throughout this document, the phrase "wherein split-Cas9 according to the present invention is provided" or similar expression appears; and these indicate that the Cas9 in the embodiments provided herein may be the split-Cas9 discussed herein.
В одном аспекте настоящее изобретение относится к не встречающейся в природе или сконструированной системе CRISPR-Cas на основе индуцируемого Cas9, содержащей первую слитую конструкцию на основе Cas9, к которой прикреплена первая половинка индуцируемого гетеродимера, и вторую слитую конструкцию на основе Cas9, к которой прикреплена вторая половинка индуцируемого гетеродимера, где первая слитая конструкция на основе Cas9 функционально связана с одним или несколькими сигналами ядерной локализации, где вторая слитая конструкция на основе Cas9 функционально связана с сигналом ядерного экспорта, где приведение в контакт с источником энергии, являющимся индуктором, обеспечивает сведение первой и второй половинок индуцируемого гетеродимера вместе, где сведение первой и второй половинок индуцируемого гетеродимера вместе позволяет первой и второй слитым конструкциям на основе Cas9 образовать функциональную систему CRISPR-Cas на основе Cas9, где система CRISPR-Cas на основе Cas9 содержит направляющую РНК (gRNA), содержащую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, и где функциональная система CRISPR-Cas на основе Cas9 редактирует локус генома для изменения экспрессии генов. В одном варианте осуществления настоящего изобретения первая половинка индуцируемого гетеродимера представляет собой FKBP12, а вторая половинка индуцируемого гетеродимера представляет собой FRB. В другом варианте осуществления настоящего изобретения источником энергии, являющимся индуктором, является рапамицин.In one aspect, the present invention relates to a non-naturally occurring or engineered inducible Cas9-based CRISPR-Cas system comprising a first Cas9-based fusion construct to which a first half of an inducible heterodimer is attached and a second Cas9-based fusion construct to which a second half of the inducible heterodimer is attached, wherein the first Cas9-based fusion construct is operably linked to one or more nuclear localization signals, wherein the second Cas9-based fusion construct is operably linked to a nuclear export signal, wherein contact with an energy source that is an inducer causes the first and second halves of the inducible heterodimer to be brought together, wherein bringing the first and second halves of the inducible heterodimer together allows the first and second Cas9-based fusion constructs to form a functional Cas9-based CRISPR-Cas system, wherein the Cas9-based CRISPR-Cas system comprises a guide RNA (gRNA) comprising a guide sequence, capable of hybridizing to a target sequence at a genomic locus of interest in a cell, and wherein the functional Cas9-based CRISPR-Cas system edits the genomic locus to alter gene expression. In one embodiment of the present invention, the first half of the inducible heterodimer is FKBP12, and the second half of the inducible heterodimer is FRB. In another embodiment of the present invention, the energy source that is an inducer is rapamycin.
Источником энергии, являющимся индуктором, можно считать просто индуктор или димеризующее средство. Термин "источник энергии, являющийся индуктором" используется по всему данному документу для согласованности. Источник энергии, являющийся индуктором, (или индуктор) действует с восстановлением Cas9. В некоторых вариантах осуществления источник энергии, являющийся индуктором, обеспечивает сведение двух частей Cas9 вместе за счет действия двух половинок индуцируемого димера. Две половинки индуцируемого димера, следовательно, сводятся вместе в присутствии источника энергии, являющегося индуктором. Без источника энергии, являющегося индуктором, две половинки димера не будут образовывать димер (димеризоваться).An inducing energy source may be considered simply an inducer or a dimerizing agent. The term "inducing energy source" is used throughout this document for consistency. An inducing energy source (or inducer) functions with the reduction of Cas9. In some embodiments, an inducing energy source causes the two halves of Cas9 to be brought together by the action of the two halves of an inducible dimer. The two halves of the inducible dimer are therefore brought together in the presence of an inducing energy source. Without an inducing energy source, the two halves of the dimer will not form a dimer (dimerize).
Таким образом, две половинки индуцируемого димера взаимодействуют с источником энергии, являющимся индуктором, с димеризацией в димер. В свою очередь, это обеспечивает восстановление Cas9 путем сведения первой и второй частей Cas9 вместе.Thus, the two halves of the inducible dimer interact with the energy source, which is the inducer, to dimerize into a dimer. In turn, this ensures the restoration of Cas9 by bringing the first and second parts of Cas9 together.
Каждая из слитых конструкций на основе фермента CRISPR содержит одну часть split-Cas9. Они сливаются, предпочтительно посредством линкера, такого как линкер GlySer, описанный в данном документе, с одной из двух половин димера. Две половинки димера могут быть, по сути, двумя одинаковыми мономерами, которые вместе образуют гомодимер, или они могут быть разными мономерами, которые вместе образуют гетеродимер. Таким образом, два мономера можно рассматривать как одну половинку полного димера.Each of the CRISPR enzyme fusion constructs contains one split-Cas9 portion. They are fused, preferably via a linker, such as the GlySer linker described herein, to one of the two halves of the dimer. The two halves of the dimer may be essentially two identical monomers that together form a homodimer, or they may be different monomers that together form a heterodimer. Thus, the two monomers can be considered one half of a complete dimer.
Cas9 является составным в том смысле, что две части фермента Cas9, по сути, содержат функциональный Cas9. Такой Cas9 может функционировать как фермент, редактирующий геном (при образовании комплекса с целевой ДНК и направляющей), такой как никаза или нуклеаза (расщепляющая обе нити ДНК), или он может быть нефункциональным Cas9, который в сущности представляет собой ДНК-связывающий белок с очень небольшой каталитической активностью или с отсутствием таковой, как правило, из-за мутации(мутаций) в его каталитических доменах.Cas9 is composite in the sense that the two parts of the Cas9 enzyme essentially comprise a functional Cas9. Such a Cas9 may function as a genome-editing enzyme (when complexed with target DNA and a guide) such as a nickase or nuclease (cleaving both strands of DNA), or it may be a non-functional Cas9, which is essentially a DNA-binding protein with little or no catalytic activity, typically due to mutation(s) in its catalytic domains.
Две части split-Cas9 можно рассматривать как N'-концевую часть и C'-концевую часть split-Cas9. Слияние, как правило, происходит в точке разделения Cas9. Другими словами, С'-конец N'-концевой части split-Cas9 сливается с одной из половинок димера, тогда как N'-конец C'-концевой части сливается с другой половинкой димера.The two parts of split-Cas9 can be thought of as the N'-terminal part and the C'-terminal part of split-Cas9. Fusion typically occurs at the point of splitting of Cas9. In other words, the C'-terminus of the N'-terminal part of split-Cas9 is fused to one half of the dimer, while the N'-terminus of the C'-terminal part is fused to the other half of the dimer.
Cas9 не подлежит разделению в том смысле, что заново образуется разрыв. Точку разделения, как правило, разрабатывают in silico и клонируют в конструкции. Вместе две части split-Cas9, N'-концевая и C'-концевая части, образуют полный Cas9, содержащий предпочтительно по меньшей мере 70% или больше аминокислот дикого типа (или нуклеотидов, кодирующих их), предпочтительно по меньшей мере 80% или больше, предпочтительно по меньшей мере 90% или больше, предпочтительно по меньшей мере 95% или больше, и наиболее предпочтительно по меньшей мере 99% или больше аминокислот дикого типа (или нуклеотидов, кодирующих их). Может быть возможным некоторое урезание, и при этом предусматриваются мутанты. Нефункциональные домены могут быть полностью удалены. Важно то, что две части могут быть сведены вместе, и что требуемая функция Cas9 возобновляется или восстанавливается.Cas9 is not splittable in the sense that the gap is re-created. The split point is typically designed in silico and cloned into the construct. Together, the two parts of split-Cas9, the N'-terminal and C'-terminal parts, form a complete Cas9, containing preferably at least 70% or more of the wild-type amino acids (or nucleotides encoding them), preferably at least 80% or more, preferably at least 90% or more, preferably at least 95% or more, and most preferably at least 99% or more of the wild-type amino acids (or nucleotides encoding them). Some trimming may be possible, and mutants are envisaged. Non-functional domains can be completely deleted. What is important is that the two parts can be brought together and that the desired Cas9 function is restored or reestablished.
Димер может быть гомодимером или гетеродимером.A dimer can be a homodimer or a heterodimer.
Один или несколько, предпочтительно два, NLS можно использовать в функциональном связывании с первой конструкцией на основе Cas9. Один или несколько, предпочтительно два, NES можно использовать в функциональном связывании с первой конструкцией на основе Cas9. NLS и/или NES предпочтительно фланкируют слияние split-Cas9-димера (т. e., половины димера), т. e. один NLS может быть расположен на N'-конце первой конструкции на основе Cas9, и один NLS может быть на C'-конце первой конструкции на основе Cas9. Аналогично, один NES может быть расположен на N'-конце второй конструкции на основе Cas9, и один NES может быть на C'-конце второй конструкции на основе Cas9. Если ссылаются на N'- или C'-концы, следует понимать, что они соответствуют 5'- и 3'-концам в соответствующей нуклеотидной последовательности.One or more, preferably two, NLSs can be used in operative linkage to the first Cas9-based construct. One or more, preferably two, NESs can be used in operative linkage to the first Cas9-based construct. The NLSs and/or NESs preferably flank the split-Cas9-dimer (i.e., half-dimer) fusion, i.e., one NLS can be located at the N'-terminus of the first Cas9-based construct, and one NLS can be at the C'-terminus of the first Cas9-based construct. Similarly, one NES can be located at the N'-terminus of the second Cas9-based construct, and one NES can be at the C'-terminus of the second Cas9-based construct. When referring to the N'- or C'-termini, it is understood that they correspond to the 5'- and 3'-termini in the corresponding nucleotide sequence.
Предпочтительный порядок расположения заключается в том, что первая конструкция на основе Cas9 устроена так: 5'-NLS-(N'-концевая часть Cas9)-линкер-(первая половина димера)-NLS-3'. Предпочтительный порядок расположения заключается в том, что вторая конструкция на основе Cas9 устроена так: 5'-NES-(вторая половина димера)-линкер-(C'-концевая часть Cas9)-NES-3'. Подходящий промотор предпочтительно находится выше каждой из этих конструкций. Две конструкции можно доставлять отдельно или вместе.A preferred arrangement is that the first Cas9-based construct is 5'-NLS-(N'-terminal portion of Cas9)-linker-(first half of the dimer)-NLS-3'. A preferred arrangement is that the second Cas9-based construct is 5'-NES-(second half of the dimer)-linker-(C'-terminal portion of Cas9)-NES-3'. A suitable promoter is preferably located upstream of each of these constructs. The two constructs can be delivered separately or together.
В некоторых вариантах осуществления один или все из NES для функционального связывания со второй конструкцией на основе Cas9 могут быть заменены на NLS. Однако это, как правило, может быть не предпочтительным, и в других вариантах осуществления сигнал локализации для функционального связывания со второй конструкцией Cas9 представляет собой один или несколько NES.In some embodiments, one or all of the NESs for functionally linking to the second Cas9-based construct may be replaced with an NLS. However, this may not generally be preferred, and in other embodiments, the localization signal for functionally linking to the second Cas9 construct is one or more NESs.
Также следует понимать, что NES может быть функционально связан с N'-концевым фрагментом split-Cas9, и что NLS может быть функционально связан с C'-концевым фрагментом split-Cas9. Однако порядок расположения, при котором NLS функционально связан с N'-концевым фрагментом split-Cas9, а NES функционально связан с С'-концевым фрагментом split-Cas9, может быть предпочтительным.It should also be understood that the NES may be operably linked to the N'-terminal fragment of split-Cas9, and that the NLS may be operably linked to the C'-terminal fragment of split-Cas9. However, an arrangement in which the NLS is operably linked to the N'-terminal fragment of split-Cas9 and the NES is operably linked to the C'-terminal fragment of split-Cas9 may be preferred.
NES функционирует с тем, чтобы локализовать вторую слитую конструкцию на основе Cas9 вне ядра, по меньшей мере до тех пор, пока не будет обеспечен источник энергии, являющийся индуктором (например, по меньшей мере до тех пор, пока не будет обеспечен источник энергии для выполнения индуктором своей функции). Присутствие индуктора стимулирует димеризацию двух продуктов слияния на основе Cas9 в цитоплазме и делает термодинамически выгодным перемещение в ядро димеризованных первого и второго продуктов слияния на основе Cas9. Без ограничения теорией, заявители полагают, что NES обеспечивает изоляцию второго продукта слияния на основе Cas9 в цитоплазме (т. e. вне ядра). NLS в первом продукте слияния на основе Cas9 обеспечивает его локализацию в ядре. В обоих случаях, заявители используют NES или NLS для сдвига равновесия (равновесия ядерного транспорта) в требуемом направлении. Димеризация, как правило, происходит вне ядра (очень небольшая часть может происходить в ядре), и NLS в димеризованном комплексе сдвигают равновесие ядерного транспорта к ядерной локализации, так что димеризованный и, следовательно, восстановленный Cas9 проникает в ядро.The NES functions to localize the second Cas9-based fusion construct outside the nucleus, at least until an energy source that is an inducer is provided (e.g., at least until an energy source for the inducer to perform its function is provided). The presence of the inducer stimulates dimerization of the two Cas9-based fusion products in the cytoplasm and makes it thermodynamically favorable for the dimerized first and second Cas9-based fusion products to be translocated into the nucleus. Without being limited by theory, applicants believe that the NES ensures the sequestration of the second Cas9-based fusion product in the cytoplasm (i.e., outside the nucleus). The NLS in the first Cas9-based fusion product ensures its localization to the nucleus. In both cases, applicants use the NES or the NLS to shift the equilibrium (the nuclear transport equilibrium) in the desired direction. Dimerization typically occurs outside the nucleus (a very small fraction may occur in the nucleus), and the NLSs in the dimerized complex shift the nuclear transport equilibrium toward nuclear localization such that dimerized and hence reconstituted Cas9 enters the nucleus.
Фактически, заявители способны восстанавливать функцию split-Cas9. Для доказательства концепции применяли транзиентную трансфекцию, и димеризация происходила в фоновом режиме в присутствии источника энергии, являющегося индуктором,. Никакой активности не наблюдали в случае отдельных фрагментов Cas9. Затем обеспечивали стабильную экспрессию посредством доставки лентивируса для проявления этого, и было показано, что подход со split-Cas9 может быть применимым.In fact, the applicants are able to restore the function of split-Cas9. As a proof of concept, transient transfection was used and dimerization occurred in the background in the presence of an energy source, which is an inducer. No activity was observed with individual Cas9 fragments. Stable expression was then achieved by lentiviral delivery to demonstrate this, and it was shown that the split-Cas9 approach could be feasible.
Такой подход со split-Cas9 согласно настоящему изобретению является полезным, поскольку он обеспечивает возможность индуцирования активности Cas9, обеспечивая таким образом временный контроль. Более того, для снижения активности самособранных комплексов в окружении можно использовать разные последовательности локализации (т. e. NES и NLS как предпочтительные). Тканеспецифичные промоторы, например, один для каждой из первой и второй слитых конструкций на основе Cas9, также можно использовать для специфического в отношении ткани нацеливания, с обеспечением таким образом пространственного контроля. Два разных тканеспецифичных промотора можно использовать, чтобы обеспечить при необходимости более высокую степень контроля. Этот же подход можно использовать по отношению к специфичным в отношении стадии промоторов, или может быть смесь специфичных в отношении стадии промоторов и тканеспецифичных промоторов, при этом одна из первой и второй слитых конструкций на основе Cas9 находится под контролем (т.e. функционально связана или содержит) тканеспецифичного промотора, тогда как другая из первой и второй слитых конструкций на основе Cas9 находится под контролем (т.e. функционально связана или содержит) специфичного в отношении стадии промотора.This split-Cas9 approach according to the present invention is advantageous because it allows for the induction of Cas9 activity, thus providing temporal control. Moreover, different localization sequences (i.e. NES and NLS as preferred) can be used to reduce the activity of the self-assembled complexes in the environment. Tissue-specific promoters, for example one for each of the first and second Cas9-based fusion constructs, can also be used for tissue-specific targeting, thus providing spatial control. Two different tissue-specific promoters can be used to provide a higher degree of control if necessary. The same approach can be used with stage-specific promoters, or there can be a mixture of stage-specific promoters and tissue-specific promoters, wherein one of the first and second Cas9-based fusion constructs is under the control of (i.e., is operably linked to or contains) a tissue-specific promoter, while the other of the first and second Cas9-based fusion constructs is under the control of (i.e., is operably linked to or contains) a stage-specific promoter.
Система CRISPR-Cas на основе индуцируемого Cas9 содержит одну или несколько последовательностей ядерной локализации (NLS), описанных в данном документе, например, функционально связанные с первой слитой конструкцией на основе Cas9. Эти последовательности ядерной локализации в идеальном случае характеризуются достаточной эффективностью, чтобы управлять накоплением указанной первой слитой конструкции на основе Cas9 в обнаруживаемом количестве в ядре эукариотической клетки. Не вдаваясь в теорию, полагают, что последовательность ядерной локализации не является необходимой для активности комплекса CRISPR-Cas на основе Cas9 у эукариот, но включение таких последовательностей повышает активность системы, особенно в отношении нацеливания на молекулы нуклеиновой кислоты в ядре, и содействует функционированию системы из 2 частей согласно настоящему изобретению.The inducible Cas9-based CRISPR-Cas system comprises one or more nuclear localization sequences (NLS) described herein, for example, operably linked to a first Cas9-based fusion construct. These nuclear localization sequences are ideally characterized by sufficient efficiency to direct the accumulation of said first Cas9-based fusion construct in a detectable amount in the nucleus of a eukaryotic cell. Without being bound by theory, it is believed that the nuclear localization sequence is not necessary for the activity of the Cas9-based CRISPR-Cas complex in eukaryotes, but the inclusion of such sequences enhances the activity of the system, especially with respect to targeting nucleic acid molecules in the nucleus, and facilitates the function of the two-part system of the present invention.
Подобным образом, вторая слитая конструкция на основе Cas9 функционально связана с последовательностью ядерного экспорта (NES). На самом деле, она может быть связана с одной или несколькими последовательностями ядерного экспорта. Другими словами, число последовательностей экспорта, используемых со второй слитой конструкцией на основе Cas9, предпочтительно составляет 1, или 2, или 3. Как правило, 2 являются предпочтительными, но 1 достаточна, и поэтому является предпочтительной в некоторых вариантах осуществления. Подходящие примеры NLS и NES известны из уровня техники. Например, предпочтительным сигналом ядерного экспорта (NES) является человеческий белок тирозинкиназа 2. Предпочтительные сигналы будут видоспецифичными.Similarly, the second Cas9-based fusion construct is operably linked to a nuclear export sequence (NES). In fact, it can be linked to one or more nuclear export sequences. In other words, the number of export sequences used with the second Cas9-based fusion construct is preferably 1, or 2, or 3. Typically, 2 are preferred, but 1 is sufficient and is therefore preferred in some embodiments. Suitable examples of NLSs and NESs are known in the art. For example, a preferred nuclear export signal (NES) is human protein tyrosine kinase 2. Preferred signals will be species-specific.
Если используется система FRB и FKBP, то FKBP предпочтительно фланкируется последовательностями ядерной локализации (NLS). Если используется система FRB и FKBP, то предпочтительный порядок расположения представляет собой N'-концевой Cas9-FRB-NES: C'-концевой Cas9-FKBP-NLS. Таким образом, первая слитая конструкция на основе Cas9 будет содержать C'-концевую часть Cas9, а вторая слитая конструкция Cas9 будет содержать N'-концевую часть Cas9.If the FRB and FKBP system is used, the FKBP is preferably flanked by nuclear localization sequences (NLS). If the FRB and FKBP system is used, the preferred arrangement is N'-terminal Cas9-FRB-NES: C'-terminal Cas9-FKBP-NLS. Thus, the first Cas9 fusion will contain the C'-terminal portion of Cas9, and the second Cas9 fusion will contain the N'-terminal portion of Cas9.
Другой полезный аспект настоящего изобретения заключается в том, что она может быть быстро активизироваться, т.е. имеет быструю реакцию. Без ограничения теорией полагают, что активность Cas9 может быть индуцирована посредством димеризации имеющихся (уже присутствующих) слитых конструкций (за счет приведения в контакт с источником энергии, являющимся индуктором) быстрее, чем посредством экспрессии (в особенности трансляции) новых слитых конструкций. Таким образом, первая и вторая слитые конструкции на основе Cas9 могут экспрессироваться в целевой клетке заблаговременно, т.е. до того, как потребуется активность Cas9. Затем активность Cas9 может временно контролироваться, а потом быстро устанавливаться путем добавления источника энергии, являющегося индуктором, который в идеале действует быстрее (с димеризацией гетеродимера и обеспечением тем самым активности Cas9), чем посредством экспрессии (в том числе индукции транскрипции) Cas9, доставленного, например, вектором.Another advantageous aspect of the present invention is that it can be rapidly activated, i.e. has a rapid response. Without being limited by theory, it is believed that Cas9 activity can be induced by dimerization of existing (already present) fusion constructs (by bringing into contact with an energy source, which is an inducer) faster than by expression (especially translation) of new fusion constructs. Thus, the first and second Cas9-based fusion constructs can be expressed in the target cell in advance, i.e. before Cas9 activity is required. Cas9 activity can then be temporarily controlled and then quickly established by adding an energy source, which is an inducer, which ideally acts faster (by dimerizing the heterodimer and thereby providing Cas9 activity) than by expression (including inducing transcription) of Cas9 delivered, for example, by a vector.
Термины "Cas9" или "фермент Cas9" и "фермент CRISPR" используются в данном документе взаимозаменяемо, если не является очевидным иное.The terms "Cas9" or "Cas9 enzyme" and "CRISPR enzyme" are used interchangeably in this document unless otherwise apparent.
Заявители продемонстрировали, что Cas9 может быть разделен на два компонента, которые при сведении вновь вместе восстанавливают функциональную нуклеазу. С использованием чувствительных к рапамицину доменов димеризации заявители получили химически индуцируемый Cas9 для временного контроля опосредованного Cas9 редактирования генома и модулирования транскрипции. Другими словами, заявители продемонстрировали, что Cas9 может быть химически индуцируемым, будучи разделенным на два фрагмента, и что чувствительные к рапамицину домены димеризации можно использовать для контролируемой повторной сборки Cas9. Заявители показали, что повторно собранный Cas9 может использоваться для опосредования редактирования генома (посредством нуклеазной/никазной активности), а также для модулирования транскрипции (в качестве ДНК-связывающего домена, так называемого "нефункционального Cas9").Applicants have demonstrated that Cas9 can be separated into two components that, when brought back together, reconstitute a functional nuclease. Using rapamycin-sensitive dimerization domains, Applicants have generated chemically inducible Cas9 to transiently control Cas9-mediated genome editing and modulate transcription. In other words, Applicants have demonstrated that Cas9 can be chemically inducible when separated into two fragments and that rapamycin-sensitive dimerization domains can be used to controllably reassemble Cas9. Applicants have shown that reassembled Cas9 can be used to mediate genome editing (via nuclease/nickase activity) and to modulate transcription (as a DNA-binding domain, the so-called "non-functional Cas9").
Таким образом, использование чувствительных к рапамицину доменов димеризации является предпочтительным. Повторная сборка Cas9 является предпочтительной. Повторная сборка может определяться путем восстановления активности связывания. Если Cas9 представляет собой никазу или индуцирует двухнитевой разрыв, то проводят подходящее процентное сравнение с диким типом, как описывается в данном документе.Thus, the use of rapamycin-sensitive dimerization domains is preferred. Reassembly of Cas9 is preferred. Reassembly can be determined by reconstitution of binding activity. If Cas9 is a nickase or induces a double-strand break, then a suitable percentage comparison with wild type is performed as described herein.
Обработка рапамицином может продолжаться 12 дней. Доза может составлять 200 нM. Такая временная и/или молярная дозировка является примером соответствующей дозы для линий клеток эмбриональной почки человека 293FT (HEK293FT), и ее также можно использовать для других линий клеток. Эта схема может быть экстраполирована для терапевтического применения in vivo, например, в мг/кг. Однако в данном случае также предусматривается, что стандартную дозировку также используют для введения рапамицина субъекту. Под "стандартной дозировкой" подразумевают дозировку при обычном терапевтическом применении рапамицина или первичном показании (т. e. дозу, используемую при введении рапамицина для предупреждения отторжения органа).The rapamycin treatment may be for 12 days. The dose may be 200 nM. This time and/or molar dosage is an example of an appropriate dose for human embryonic kidney 293FT (HEK293FT) cell lines and may also be used for other cell lines. This schedule may be extrapolated for in vivo therapeutic use, such as mg/kg. However, it is also envisaged here that the standard dosage is also used to administer rapamycin to a subject. By "standard dosage" is meant the dosage for rapamycin's usual therapeutic use or primary indication (i.e., the dose used when rapamycin is administered to prevent organ rejection).
Следует отметить, что предпочтительным порядком расположения частей Cas9-FRB/FKBP является отдельный, и они являются неактивными до тех пор, пока индуцируемая рапамицином димеризация FRB и FKBP не приведет к повторной сборке функциональной полноразмерной нуклеазы Cas9. Таким образом, предпочтительно, чтобы первая слитая конструкция на основе Cas9, к которой прикреплена первая половина индуцируемого гетеродимера, доставлялась отдельно и/или локализовалась отдельно от второй слитой конструкции на основе Cas9, к которой присоединена первая половина индуцируемого гетеродимера.It should be noted that the preferred order of the Cas9-FRB/FKBP moieties is separate and they are inactive until rapamycin-induced dimerization of FRB and FKBP results in reassembly of a functional full-length Cas9 nuclease. Thus, it is preferred that the first Cas9-based fusion construct to which the first half of the inducible heterodimer is attached is delivered separately and/or localized separately from the second Cas9-based fusion construct to which the first half of the inducible heterodimer is attached.
Для обеспечения изоляции фрагмента Cas9(N)-FRB в цитоплазме, где существует меньшая вероятность димеризации с фрагментом Cas9(C)-FKBP, локализуемым в ядре, предпочтительно использовать в Cas9(N)-FRB одну последовательность ядерного экспорта (NES) из человеческой протеинтирозинкиназы 2 (Cas9(N)-FRB-NES). В присутствии рапамицина Cas9(N)-FRB-NES димеризуется с Cas9(C)-FKBP-2xNLS с восстановлением полного белка Cas9, что сдвигает равновесие ядерного транспорта в направлении ядерного импорта и обеспечивает возможность нацеливания на ДНК.To ensure the isolation of the Cas9(N)-FRB fragment in the cytoplasm, where there is a lower probability of dimerization with the nuclear-localized Cas9(C)-FKBP fragment, it is preferable to use one nuclear export sequence (NES) from human protein tyrosine kinase 2 (Cas9(N)-FRB-NES) in Cas9(N)-FRB. In the presence of rapamycin, Cas9(N)-FRB-NES dimerizes with Cas9(C)-FKBP-2xNLS to reconstitute the complete Cas9 protein, which shifts the nuclear transport equilibrium toward nuclear import and enables DNA targeting.
Высокая дозировка Cas9 может увеличить частоту образования вставок-делеций в нецелевых (OT) последовательностях, которые характеризуются несколькими несовпадающими основаниями с направляющей нитью. Такие последовательности являются особенно восприимчивыми, если несовпадающие основания являются непоследовательными и/или находятся за пределами затравочного участка направляющей. Соответственно, временный контроль активности Cas9 может использоваться для снижения дозировки в экспериментах с длительной экспрессией, и, следовательно, приводить к сниженному образованию нецелевых вставок/делеций по сравнению с конститутивно активным Cas9.High Cas9 dosage can increase the frequency of insertion-deletion formation in off-target (OT) sequences, which are characterized by multiple mismatched bases to the guide strand. Such sequences are particularly susceptible if the mismatched bases are non-sequential and/or are outside the seed region of the guide. Accordingly, transient control of Cas9 activity can be used to reduce dosage in long-term expression experiments, and hence result in reduced formation of off-target insertions/deletions compared to constitutively active Cas9.
Доставка с помощью вирусов является предпочтительной. В частности, предусматривается вектор доставки на основе лентивируса или AAV. Заявители получили конструкцию split-Cas9 на основе лентивируса, подобную плазмиде lentiCRISPR. Составные части должны быть достаточно маленькими, чтобы соответствовать ограничению по размеру AAV, составляющему ~4,7 т. п. о.Viral delivery is preferred. In particular, a lentivirus or AAV-based delivery vector is envisaged. Applicants have obtained a lentivirus-based split-Cas9 construct similar to the lentiCRISPR plasmid. The components must be small enough to meet the AAV size limit of ~4.7 kb.
Заявители продемонстрировали, что стабильную низкокопийную экспрессию split-Cas9 можно использовать для индуцирования существенных вставок/делеций в целевом локусе без значительной мутации в нецелевых сайтах. Заявители клонировали фрагменты Cas9 (2 части на основе split 5, описанного в данном документе).Applicants have demonstrated that stable low copy number expression of split-Cas9 can be used to induce large insertions/deletions at a target locus without significant mutation at off-target sites. Applicants have cloned Cas9 fragments (2 parts based on split 5 described herein).
Также можно использовать нефункциональный Cas9, содержащий домен трансактивации VP64, например, добавленный к Cas9(C)-FKBP-2xNLS (неактивный Cas9(C)-FKBP-2xNLS-VP64). Эти фрагменты восстанавливают каталитически неактивный продукт слияния Cas9-VP64 (нефункциональный Cas9-VP64). Активация транскрипции индуцируется с помощью VP64 в присутствии рапамицина с индуцированием димеризации продукта слияния Cas9(C)-FKBP и продукта слияния Cas9(N)-FRB. Другими словами, заявители тестировали индуцируемость разделяемого нефункционального Cas9-VP64 и показали, что активация транскрипции индуцируется нефункциональным split-Cas9-VP64 в присутствии рапамицина. Таким образом, индуцируемый Cas9 согласно настоящему изобретению может быть ассоциирован с одним или несколькими функциональными доменами, такими как активатор или репрессор транскрипции или нуклеаза (такая как Fok1). Функциональный домен может быть связан или слит с одной частью split-Cas9.It is also possible to use non-functional Cas9 containing the VP64 transactivation domain, for example, added to Cas9(C)-FKBP-2xNLS (inactive Cas9(C)-FKBP-2xNLS-VP64). These fragments reconstitute a catalytically inactive Cas9-VP64 fusion product (non-functional Cas9-VP64). Transcriptional activation is induced by VP64 in the presence of rapamycin, inducing dimerization of the Cas9(C)-FKBP fusion product and the Cas9(N)-FRB fusion product. In other words, applicants tested the inducibility of split non-functional Cas9-VP64 and showed that transcriptional activation is induced by non-functional split-Cas9-VP64 in the presence of rapamycin. Thus, the inducible Cas9 of the present invention may be associated with one or more functional domains, such as a transcriptional activator or repressor or a nuclease (such as Fok1). The functional domain may be linked or fused to one part of split-Cas9.
Предпочтительный порядок расположения заключается в том, что первая конструкция на основе Cas9 устроена так: 5'-первый сигнал локализации-(N'-концевая часть Cas9)-линкер-(первая половинка димера)-первый сигнал локализации-3', и вторая конструкция на основе Cas9 устроена так: 5'-второй сигнал локализации-(вторая половинка димера)-линкер-(C'-концевая часть Cas9)-второй сигнал локализации-функциональный домен-3'. В данном случае функциональный домен помещен на 3'-конце второй конструкции на основе Cas9. Альтернативно, функциональный домен может быть помещен на 5'-конце первой конструкции на основе Cas9. Один или несколько функциональных доменов можно использовать на 3'-конце, или 5'-конце, или на обоих концах. Подходящий промотор предпочтительно находится выше каждой из этих конструкций. Две конструкции можно доставлять отдельно или вместе. Сигналами локализации могут быть NLS или NES, при условии, что они не перемешиваются в каждой конструкции.A preferred arrangement is that the first Cas9-based construct is arranged as follows: 5'-first localization signal-(N'-terminal portion of Cas9)-linker-(first half of the dimer)-first localization signal-3', and the second Cas9-based construct is arranged as follows: 5'-second localization signal-(second half of the dimer)-linker-(C'-terminal portion of Cas9)-second localization signal-functional domain-3'. In this case, the functional domain is placed at the 3'-end of the second Cas9-based construct. Alternatively, the functional domain can be placed at the 5'-end of the first Cas9-based construct. One or more functional domains can be used at the 3'-end, or the 5'-end, or at both ends. A suitable promoter is preferably located upstream of each of these constructs. The two constructs can be delivered separately or together. Localization signals can be NLS or NES, provided that they are not mixed in each design.
В одном аспекте настоящего изобретения предусмотрена система CRISPR-Cas на основе индуцируемого Cas9, где Cas9 характеризуется нуклеазной активностью, сниженной по меньшей мере на 97% или 100% по сравнению с ферментом Cas9, не имеющим по меньшей мере одной мутации.In one aspect of the present invention, a CRISPR-Cas system based on inducible Cas9 is provided, wherein the Cas9 has a nuclease activity reduced by at least 97% or 100% compared to a Cas9 enzyme lacking at least one mutation.
Соответственно, также предпочтительно, чтобы Cas9 представлял собой нефункциональный Cas9. В идеальном случае, разделение всегда должно быть таким, чтобы каталитический(каталитические) домен(домены) не подвергался(не подвергались) воздействию. Значение нефункционального Cas9 состоит в том, что происходит связывание с ДНК, но не происходит расщепление или не проявляется никазная активность.Accordingly, it is also preferred that the Cas9 be a non-functional Cas9. Ideally, the partitioning should always be such that the catalytic domain(s) are not affected. The meaning of a non-functional Cas9 is that DNA binding occurs, but no cleavage or nicase activity occurs.
В одном аспекте настоящего изобретения предусмотрена система CRISPR-Cas на основе индуцируемого Cas9, обсуждаемая в данном документе, где один или несколько функциональных доменов ассоциированы с Cas9. Такой функциональных домен может быть ассоциирован (т. e. связан или слит) с одной или обеими частями split-Cas9. Он может быть ассоциирован с каждой из двух частей split-Cas9. Следовательно, они могут быть представлены, как правило, в виде части первой и/или второй слитых конструкций на основе Cas9, в виде продуктов слияния в пределах этой конструкции. Функциональные домены, как правило, сливаются посредством линкера, такого как линкер GlySer, обсуждаемый в данном документе. Один или несколько функциональных доменов могут представлять собой домен активации или домен репрессии транскрипции. Хотя они могут представлять собой разные домены, предпочтительно, чтобы все функциональные домены являлись либо активаторами, либо репрессорами, и чтобы не использовалась смесь двух.In one aspect, the present invention provides an inducible Cas9-based CRISPR-Cas system discussed herein, wherein one or more functional domains are associated with Cas9. Such a functional domain may be associated (i.e., linked or fused) with one or both parts of a split-Cas9. It may be associated with each of the two parts of a split-Cas9. Thus, they may typically be present as part of a first and/or second Cas9-based fusion construct, as fusion products within that construct. The functional domains are typically fused via a linker, such as the GlySer linker discussed herein. The one or more functional domains may be an activation domain or a transcriptional repression domain. Although they may be different domains, it is preferred that all functional domains are either activators or repressors, and that a mixture of the two is not used.
Домен активации транскрипции может включать VP64, p65, MyoD1, HSF1, RTA или SET7/9.The transcriptional activation domain may include VP64, p65, MyoD1, HSF1, RTA, or SET7/9.
В одном аспекте настоящего изобретения предусмотрена система CRISPR-Cas на основе индуцируемого Cas9, обсуждаемая в данном документе, где один или несколько функциональных доменов, ассоциированных с Cas9, представляют собой домен репрессии транскрипции.In one aspect of the present invention, there is provided a CRISPR-Cas system based on inducible Cas9 as discussed herein, wherein one or more functional domains associated with Cas9 are a transcriptional repression domain.
В одном аспекте настоящего изобретения предусмотрена система CRISPR-Cas на основе индуцируемого Cas9, обсуждаемая в данном документе, где домен репрессии транскрипции представляет собой домен KRAB.In one aspect of the present invention, there is provided a CRISPR-Cas system based on inducible Cas9 as discussed herein, wherein the transcriptional repression domain is a KRAB domain.
В одном аспекте настоящего изобретения предусмотрена система CRISPR-Cas на основе индуцируемого Cas9, обсуждаемая в данном документе, где домен репрессии транскрипции представляет собой домен NuE, домен NcoR, домен SID или домен SID4X.In one aspect of the present invention, there is provided a CRISPR-Cas system based on inducible Cas9 as discussed herein, wherein the transcriptional repression domain is a NuE domain, an NcoR domain, a SID domain, or a SID4X domain.
В одном аспекте настоящего изобретения предусмотрена система CRISPR-Cas на основе индуцируемого Cas9, обсуждаемая в данном документе, где один или несколько функциональных доменов, ассоциированных с адаптерным белком, характеризуются одной или несколькими видами активности, предусматривающими метилазную активность, деметилазную активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность расщепления РНК, активность расщепления ДНК, активность интеграции ДНК или активность связывания нуклеиновой кислоты.In one aspect of the present invention, there is provided an inducible Cas9-based CRISPR-Cas system as discussed herein, wherein one or more functional domains associated with the adaptor protein are characterized by one or more activities comprising methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, RNA cleavage activity, DNA cleavage activity, DNA integration activity, or nucleic acid binding activity.
Домены, модифицирующие гистоны, также являются предпочтительными в некоторых вариантах осуществления. Иллюстративные домены, модифицирующие гистоны, обсуждаются ниже. Домены транспозазы, домены механизма HR (гомологичной рекомбинации), домены рекомбиназы и/или домены интегразы также являются предпочтительными в качестве функциональных доменов по настоящему изобретению. В некоторых вариантах осуществления активность интеграции ДНК имеют домены механизма HR, домены интегразы, домены рекомбиназы и/или домены транспозазы.Histone modifying domains are also preferred in some embodiments. Exemplary histone modifying domains are discussed below. Transposase domains, HR (homologous recombination) machinery domains, recombinase domains, and/or integrase domains are also preferred as functional domains of the present invention. In some embodiments, HR machinery domains, integrase domains, recombinase domains, and/or transposase domains have DNA integration activity.
В одном аспекте настоящего изобретения предусмотрена система CRISPR-Cas на основе индуцируемой Cas9, обсуждаемая в данном документе, где активность расщепления ДНК обеспечивается нуклеазой.In one aspect of the present invention, there is provided a CRISPR-Cas system based on the inducible Cas9 discussed herein, wherein the DNA cleavage activity is provided by a nuclease.
В одном аспекте настоящего изобретения предусматривается система CRISPR-Cas на основе индуцируемой Cas9, обсуждаемая в данном документе, где нуклеаза предусматривает нуклеазу Fok1.In one aspect of the present invention, there is provided a Cas9-based CRISPR-Cas system as discussed herein, wherein the nuclease comprises a Fok1 nuclease.
Применение таких функциональных доменов, которые являются предпочтительными для системы на основе split-Cas9 согласно настоящему изобретению, также подробно обсуждается в Konermann et al. ("Genome-scale transcriptional activation with an engineered CRISPR-Cas9 complex", опубликованной в Nature 11 декабря 2014 г.).The use of such functional domains, which are preferred for the split-Cas9-based system of the present invention, is also discussed in detail in Konermann et al. (“Genome-scale transcriptional activation with an engineered CRISPR-Cas9 complex,” published in Nature on December 11, 2014).
Система согласно настоящему изобретению может применяться с любой направляющей.The system according to the present invention can be used with any guide.
В определенных вариантах осуществления могут применяться модифицированные направляющие. Особенно предпочтительными являются направляющие в соответствии с идеями вышеупомянутой статьи Konermann, опубликованной в Nature 11 декабря 2014 г. Эти направляющие модифицированы тем, что добавлены связывающиеся с белком части РНК (такие как аптамеры). Такая(такие) часть(части) может(могут) замещать часть направляющей. Соответствующие домены связывающего РНК белка могут использоваться для последующего распознавания РНК и рекрутирования функциональных доменов, таких как описываемые в данном документе, к направляющей. Они прежде всего предназначены для применения с нефункциональным Cas9, что приводит к активации или репрессии транскрипции или расщеплению ДНК посредством нуклеаз, таких как Fok1. Применение таких направляющих в комбинации с нефункциональным Cas9 является эффективным, и оно особенно эффективно, если сам Cas9 также ассоциирован со своим собственным функциональным доменом, обсуждаемым в данном документе. Если нефункциональный Cas9 (с ассоциированным своим собственным функциональным доменом или без него) индуцируется с восстановлением в соответствии с настоящим изобретением, т.e. представляет собой split-Cas9, то инструмент является особенно пригодным.In certain embodiments, modified guides may be used. Particularly preferred are guides according to the teachings of the above-mentioned article by Konermann, published in Nature on December 11, 2014. These guides are modified by adding protein-binding moieties of RNA (such as aptamers). Such moiety(s) may replace a portion of the guide. The corresponding domains of the RNA binding protein may be used for subsequent recognition of the RNA and recruitment of functional domains, such as those described herein, to the guide. They are especially intended for use with non-functional Cas9, which results in activation or repression of transcription or cleavage of DNA by nucleases such as Fok1. The use of such guides in combination with non-functional Cas9 is effective, and is particularly effective if Cas9 itself is also associated with its own functional domain, as discussed herein. If non-functional Cas9 (with or without its own associated functional domain) is induced with reconstitution according to the present invention, i.e. is a split-Cas9, then the tool is particularly suitable.
Направляющая РНК (gRNA), также предпочтительная для применения в соответствии с настоящим изобретением, может содержать направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, где gRNA модифицирована путем вставки отличающейся(отличающихся) последовательности(последовательностей) РНК, которая(которые) связывается(связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциирован с одним или несколькими функциональными доменами. Cas9 может содержать по меньшей мере одну мутацию, вследствие которой фермент Cas9 характеризуется не более чем 5% нуклеазной активности фермента Cas9, не имеющего по меньшей мере одной мутации; и/или по меньшей мере одну или несколько последовательностей ядерной локализации. Также предусмотрена не встречающаяся в природе или сконструированная композиция, содержащая одну или несколько направляющих РНК (gRNA), содержащих направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, фермент Cas9, содержащий по меньшей мере одну или несколько последовательностей ядерной локализации, где фермент Cas9 содержит по меньшей мере одну мутацию, вследствие которой фермент Cas9 характеризуется не более чем 5% нуклеазной активности фермента Cas9, не имеющего по меньшей мере одной мутации, где по меньшей мере одна gRNA модифицирована путем вставки отличающейся(отличающихся) последовательности(последовательностей) РНК, которая(которые) связывается (связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциирован с одним или несколькими функциональными доменами.A guide RNA (gRNA) also preferred for use in accordance with the present invention may comprise a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell, wherein the gRNA is modified by inserting a different RNA sequence(s) that binds to one or more adaptor proteins, and wherein the adaptor protein is associated with one or more functional domains. Cas9 may comprise at least one mutation such that the Cas9 enzyme has no more than 5% of the nuclease activity of a Cas9 enzyme lacking the at least one mutation; and/or at least one or more nuclear localization sequences. Also provided is a non-naturally occurring or engineered composition comprising one or more guide RNAs (gRNA) comprising a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell, a Cas9 enzyme comprising at least one or more nuclear localization sequences, wherein the Cas9 enzyme comprises at least one mutation such that the Cas9 enzyme has no more than 5% of the nuclease activity of a Cas9 enzyme lacking the at least one mutation, wherein the at least one gRNA is modified by insertion of a different RNA sequence(s) that binds to one or more adaptor proteins, and wherein the adaptor protein is associated with one or more functional domains.
gRNA предпочтительно модифицирована путем вставки отличающейся(отличающихся) последовательности(последовательностей) РНК, которая (которые) связывается(связываются) с одним или несколькими адаптерными белками. Вставка отличающейся(отличающихся) последовательности(последовательностей) РНК, которая(которые) связывается(связываются) с одним или несколькими адаптерными белками, предпочтительно представляет собой аптамерную последовательность или две или более аптамерные последовательности, специфичные в отношении одного и того же адаптерного белка или разных адаптерных белков. Адаптерный белок предпочтительно предусматривает MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, фCb5, фCb8r, фCb12r, фCb23r, 7s, PRR1. Могут быть пригодны линии клеток, стабильно экспрессирующие, помимо прочего, нефункциональный split-Cas9.The gRNA is preferably modified by inserting a different RNA sequence(s) that binds to one or more adaptor proteins. The insertion of a different RNA sequence(s) that binds to one or more adaptor proteins is preferably an aptamer sequence or two or more aptamer sequences specific for the same adaptor protein or different adaptor proteins. The adapter protein preferably comprises MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, fCb5, fCb8r, fCb12r, fCb23r, 7s, PRR1. Cell lines stably expressing, inter alia, non-functional split-Cas9 may be suitable.
Заявители продемонстрировали, что Cas9 может быть разделен на два отличающихся фрагмента, которые при сведении вновь вместе с помощью химической индукции восстанавливают функциональную полноразмерную нуклеазу Cas9. Структура split-Cas9 будет пригодной для ряда применений. Например, split-Cas9 может обеспечивать возможность осуществления генетических стратегий, направленных на ограничение активности Cas9 в популяциях клеток, находящихся на границе раздела, путем помещения каждого фрагмента под контроль разных тканеспецифичных промоторов. Кроме того, также можно использовать разные химически индуцируемые домены димеризации, такие как APA и гиббереллин.Applicants have demonstrated that Cas9 can be split into two distinct fragments that, when brought back together by chemical induction, reconstitute a functional full-length Cas9 nuclease. The split-Cas9 structure will be suitable for a number of applications. For example, split-Cas9 may enable genetic strategies to restrict Cas9 activity to cell populations at an interface by placing each fragment under the control of different tissue-specific promoters. In addition, different chemically inducible dimerization domains, such as APA and gibberellin, may also be used.
Источником энергии, являющимся индуктором, предпочтительно является химическая индукция.The energy source, which is an inductor, is preferably chemical induction.
Положением или местоположением разделения является точка, в которой первая часть фермента Cas9 отделяется от второй части. В некоторых вариантах осуществления первая часть будет содержать или кодировать от 1 до X аминокислоты, тогда как вторая часть будет содержать или кодировать от X+1 аминокислоты до конца. В данном примере нумерация является непрерывной, но это не всегда может быть необходимо, поскольку аминокислоты (или нуклеотиды, кодирующие их) могут быть урезаны с конца любого из разделенных концов при условии, что сохраняются достаточная активность связывания ДНК и, при необходимости, активность никазы или расщепления ДНК, например, по меньшей мере 40%, 50%, 60%, 70%, 80%, 90% или 95% активности по сравнению с Cas9 дикого типа.The split position or location is the point at which the first portion of the Cas9 enzyme is separated from the second portion. In some embodiments, the first portion will comprise or encode from 1 to X amino acids, while the second portion will comprise or encode from X+1 amino acids to the end. In this example, the numbering is continuous, but this may not always be necessary since amino acids (or nucleotides encoding them) can be trimmed from the end of either of the split ends, as long as sufficient DNA binding activity and, if necessary, nickase or DNA cleavage activity are retained, such as at least 40%, 50%, 60%, 70%, 80%, 90% or 95% of the activity of wild-type Cas9.
Иллюстративная нумерация, представленная в данном документе, может приводится относительно белка дикого типа, предпочтительно FnCas9 дикого типа. Однако предусматривается, что могут использоваться мутанты Cas9 дикого типа, такие как белка FnCas9. Нумерация также может не полностью соответствовать нумерации FnCas9, поскольку, например, могут использоваться некоторые N'- или C'-концевые усечения или делеции, но это можно устранить с помощью стандартных инструментов выравнивания последовательностей. Ортологи также предпочтительны как инструмент выравнивания последовательностей.The illustrative numbering provided herein may be relative to a wild-type protein, preferably wild-type FnCas9. However, it is envisaged that mutants of wild-type Cas9, such as the FnCas9 protein, may be used. The numbering may also not exactly match the numbering of FnCas9, since, for example, some N'- or C'-terminal truncations or deletions may be used, but this can be resolved using standard sequence alignment tools. Orthologs are also preferred as a sequence alignment tool.
Таким образом, положение разделения может быть выбрано средним специалистом в данной области, например, на основании данных о кристаллической структуре и/или компьютерных результатов прогнозирования структуры.Thus, the splitting position can be selected by a person of ordinary skill in the art, for example, based on crystal structure data and/or computer-aided structure prediction results.
Например, с помощью компьютерного анализа первичной структуры нуклеаз Cas9 выявили три отличающихся участка (фиг. 1). Первый, C-концевой RuvC-подобный домен, который является единственным охарактеризованным функциональным доменом. Второй, N-концевой альфа-спиральный участок, и третий, участок со смешанной альфа- и бета-структурой, расположенный между RuvC-подобным доменом и альфа-спиральным участком. Несколько небольших отрезков из неструктурированных участков прогнозируются в первичной структуре Cas9. Неструктурированные участки, которые доступны для растворителя и не являются консервативными среди разных ортологов Cas9, могут представлять собой предпочтительные стороны для разделений (фиг. 2 и фиг. 3).For example, computational analysis of the primary structure of Cas9 nucleases revealed three distinct regions (Fig. 1). The first is the C-terminal RuvC-like domain, which is the only functional domain characterized. The second is the N-terminal alpha-helical region, and the third is a region of mixed alpha and beta structure located between the RuvC-like domain and the alpha-helical region. Several short stretches of unstructured regions are predicted in the primary structure of Cas9. Unstructured regions that are solvent accessible and not conserved among different Cas9 orthologs may represent preferred sides for separation (Fig. 2 and Fig. 3).
В нижеприведенной таблице представлены неограничивающие потенциальные участки разделения в As и LbCas9. Сайт разделения в пределах такого участка может быть подходящим. The table below shows non-restrictive potential cleavage sites in As and LbCas9. A cleavage site within such a region may be suitable.
Для мутантов Fn, As и Lb Cas9 должно быть совершенно очевидно, что соответствующее положение для потенциального сайта разделения, например, основывается на выравнивании последовательностей. Для отличных от Fn, As и Lb ферментов можно использовать кристаллическую структуру ортолога, если существует относительно высокая степень гомологии между ортологом и предполагаемым Cas9, или можно использовать компьютерное прогнозирование.For Fn, As and Lb Cas9 mutants, it should be obvious that the appropriate position for the potential splitting site is, for example, based on sequence alignment. For enzymes other than Fn, As and Lb, the crystal structure of the ortholog can be used if there is a relatively high degree of homology between the ortholog and the putative Cas9, or computational prediction can be used.
В идеальном случае положение разделения должно быть расположено в пределах участка или петли. Предпочтительно, положение разделения находится там, где прерывание аминокислотной последовательности не приводит к частичному или полному разрушению структурного элемента (например, альфа-спиралей или бета-листов). Неструктурированные участки (участки, которые не обнаруживаются в кристаллической структуре, поскольку эти участки недостаточно структурированы, чтобы "застывать" в кристалле) часто являются предпочтительными вариантами. Заявители могут, например, проводить разделения в неструктурированных участках, которые доступны на поверхности Cas9.Ideally, the split position should be located within a region or loop. Preferably, the split position is where interruption of the amino acid sequence does not result in partial or complete disruption of a structural element (e.g., alpha helices or beta sheets). Unstructured regions (regions that are not found in the crystal structure because these regions are not sufficiently structured to "freeze" in the crystal) are often preferred options. Applicants may, for example, perform splits in unstructured regions that are accessible on the surface of Cas9.
Заявители могут придерживаться следующей процедуры, которая представлена в качестве предпочтительного примера и в качестве руководства. Поскольку неструктурированные участки не обнаруживаются в кристаллической структуре, заявители рассматривают окружающую аминокислотную последовательность в кристалле с первичной аминокислотной последовательностью Cas9. Каждый неструктурированный участок может состоять, например, из приблизительно 3-10 аминокислот, которые не обнаруживаются в кристалле. Следовательно, заявители выполняют разделение между этими аминокислотами. Для включения большего количества потенциальных сторон разделения заявители включают разделения, расположенные в петлях вне Cas9, с использованием тех же критериев, что и с неструктурированными участками.Applicants may follow the following procedure, which is provided as a preferred example and as a guide. Since the unstructured regions are not found in the crystal structure, applicants consider the surrounding amino acid sequence in the crystal with the primary amino acid sequence of Cas9. Each unstructured region may consist of, for example, approximately 3-10 amino acids that are not found in the crystal. Applicants therefore perform a split between these amino acids. To include a larger number of potential split ends, applicants include splits located in loops outside of Cas9 using the same criteria as with the unstructured regions.
В некоторых вариантах осуществления положение разделения находится во внешней петле Cas9. В других предпочтительных вариантах осуществления положение разделения находится в неструктурированном участке Cas9. Неструктурированный участок, как правило, представляет собой очень гибкую внешнюю петлю, структуру которой сложно определить по рентгенограмме кристалла.In some embodiments, the splitting position is in an external loop of Cas9. In other preferred embodiments, the splitting position is in an unstructured region of Cas9. The unstructured region is typically a very flexible external loop whose structure is difficult to determine from an X-ray crystal pattern.
После идентификации положения разделения можно разрабатывать подходящие конструкции.Once the split position has been identified, suitable designs can be developed.
Как правило, NES располагается на N'-конце первой части разделяемой аминокислоты (или на 5'-конце нуклеотида, кодирующего ее). В таком случае, NLS располагается на С'-конце второй части разделяемой аминокислоты (или на 3'-конце нуклеотида, кодирующего ее). Таким образом, первая слитая конструкция на основе Cas9 может быть функционально связана с одним или несколькими сигналами ядерного экспорта, а вторая слитая конструкция на основе Cas9 может быть функционально связана с сигналом ядерной локализации.Typically, the NES is located at the N'-terminus of the first part of the amino acid to be separated (or at the 5'-end of the nucleotide encoding it). In this case, the NLS is located at the C'-terminus of the second part of the amino acid to be separated (or at the 3'-end of the nucleotide encoding it). Thus, the first Cas9-based fusion construct can be operably linked to one or more nuclear export signals, and the second Cas9-based fusion construct can be operably linked to a nuclear localization signal.
Разумеется, может предусматриваться обратный порядок расположения, при котором NLS располагается на N'-конце первой части разделяемой аминокислоты (или на 5'-конце нуклеотида, кодирующего ее). В таком случае, NES располагается на С'-конце второй части разделяемой аминокислоты (или на 3'-конце нуклеотида, кодирующего ее). Таким образом, первая слитая конструкция на основе Cas9 может быть функционально связана с одним или несколькими сигналами ядерной локализации, а вторая слитая конструкция на основе Cas9 может быть функционально связана с сигналом ядерного экспорта.Of course, the reverse order of arrangement can be envisaged, in which the NLS is located at the N'-terminus of the first part of the amino acid to be separated (or at the 5'-end of the nucleotide encoding it). In such a case, the NES is located at the C'-terminus of the second part of the amino acid to be separated (or at the 3'-end of the nucleotide encoding it). Thus, the first Cas9-based fusion construct can be operably linked to one or more nuclear localization signals, and the second Cas9-based fusion construct can be operably linked to a nuclear export signal.
Разделения, которые обеспечивают то, что две части (либо боковая сторона разделения) имеют примерно одинаковую длину, могут быть полезны для целей упаковки. Например, считается, что легче поддерживать стехиометрию между обеими частями, когда транскрипты имеют примерно одинаковый размер.Splits that ensure that the two parts (or the side of the split) are approximately the same length may be useful for packaging purposes. For example, it is thought to be easier to maintain stoichiometry between the two parts when the transcripts are approximately the same size.
В некоторых примерах N- и C-концевые части кодон-оптимизированного Cas9 человека, такого как FnCas9, сливают с доменами димеризации FRB и FKBP соответственно. Такой порядок расположения может быть предпочтительным. Они могут быть перенаправлены (т.е. N'-конец с FKBP и C'-конец с FRB).In some examples, the N- and C-terminal portions of a codon-optimized human Cas9, such as FnCas9, are fused to the dimerization domains of FRB and FKBP, respectively. This arrangement may be preferred. They may be redirected (i.e., N'-terminus to FKBP and C'-terminus to FRB).
Линкеры, как, например, (GGGGS)3, предпочтительно используют в данном документе для отделения фрагмента Cas9 от домена димеризации. (GGGGS)3 является предпочтительным, поскольку он является относительно длинным линкером (15 аминокислот). Глициновые остатки являются наиболее гибкими, а сериновые остатки повышают вероятность того, что линкер будет находится на внешней стороне белка. (GGGGS)6, (GGGGS)9 или (GGGGS)12 предпочтительно можно использовать в качестве альтернатив. Другими предпочтительными альтернативами являются (GGGGS)1, (GGGGS)2, (GGGGS)4, (GGGGS)5, (GGGGS)7, (GGGGS)8, (GGGGS)10 или (GGGGS)11.Linkers such as (GGGGS) 3 are preferably used herein to separate the Cas9 fragment from the dimerization domain. (GGGGS) 3 is preferred because it is a relatively long linker (15 amino acids). Glycine residues are the most flexible, and serine residues increase the likelihood that the linker will be on the outside of the protein. (GGGGS) 6 , (GGGGS) 9 or (GGGGS) 12 can preferably be used as alternatives. Other preferred alternatives are (GGGGS) 1 , (GGGGS) 2 , (GGGGS) 4 , (GGGGS) 5 , (GGGGS) 7 , (GGGGS) 8 , (GGGGS) 10 or (GGGGS) 11 .
Например, (GGGGS)3 может быть включен между N'-концевым фрагментом Cas9 и FRB. Например, (GGGGS)3 может быть включен между FKB и C'-концевым фрагментом Cas9.For example, (GGGGS) 3 can be inserted between the N'-terminal fragment of Cas9 and FRB. For example, (GGGGS) 3 can be inserted between FKB and the C'-terminal fragment of Cas9.
Доступны альтернативные линкеры, но считается, что очень гибкие линкеры лучше обеспечивают максимальную возможность объединения двух 2 частей Cas9 и, таким образом, восстановления активности Cas9. Одной альтернативой является то, что NLS нуклеоплазмина можно использовать в качестве линкера.Alternative linkers are available, but highly flexible linkers are thought to be better at maximizing the ability to join the two parts of Cas9 and thus restore Cas9 activity. One alternative is that the NLS of nucleoplasmin can be used as a linker.
Линкер также можно использовать между Cas9 и любым функциональным доменом. Опять-таки, в данном случае можно использовать линкер (GGGGS)3 (или его варианты с 6, 9 или 12 повторами) или можно использовать NLS нуклеоплазмина в качестве линкера между Cas9 и функциональным доменом.A linker can also be used between Cas9 and any functional domain. Again, in this case, the (GGGGS) 3 linker (or its 6, 9 or 12 repeat variants) can be used, or the nucleoplasmin NLS can be used as a linker between Cas9 and the functional domain.
Предусматриваются альтернативы системы FRB/FKBP. Например, система ABA и гиббереллина.Alternatives to the FRB/FKBP system are envisaged. For example, the ABA and gibberellin system.
Соответственно, предпочтительными примерами семейства FKBP являются любые из следующих индуцируемых систем: FKBP, который димеризуется с кальциневрином А (CNA) в присутствии FK506; FKBP, который димеризуется с CyP-Fas в присутствии FKCsA; FKBP, который димеризуется с FRB в присутствии рапамицина; GyrB, который димеризуется с GryB в присутствии кумермицина; GAI, который димеризуется с GID1 в присутствии гиббереллина; или Snap-tag, который димеризуется с HaloTag в присутствии HaXS.Accordingly, preferred examples of the FKBP family are any of the following inducible systems: FKBP, which dimerizes with calcineurin A (CNA) in the presence of FK506; FKBP, which dimerizes with CyP-Fas in the presence of FKCsA; FKBP, which dimerizes with FRB in the presence of rapamycin; GyrB, which dimerizes with GryB in the presence of coumermycin; GAI, which dimerizes with GID1 in the presence of gibberellin; or Snap-tag, which dimerizes with HaloTag in the presence of HaXS.
Альтернативы в самом семействе FKBP также являются предпочтительными. Например, FKBP, который гомодимеризуется (т.е. один FKBP димеризуется с другим FKBP) в присутствии FK1012. Таким образом, также предусмотрена система CRISPR-Cas на основе не встречающегося в природе или сконструированного индуцируемого Cas9, содержащая:Alternatives within the FKBP family itself are also preferred. For example, an FKBP that homodimerizes (i.e. one FKBP dimerizes with another FKBP) in the presence of FK1012. Thus, a CRISPR-Cas system based on non-naturally occurring or engineered inducible Cas9 is also envisaged, comprising:
первую слитую конструкцию на основе Cas9, к которой прикреплена первая половинка индуцируемого гомодимера, иthe first Cas9-based fusion construct to which the first half of the inducible homodimer is attached, and
вторую слитую конструкцию на основе Cas9, к которой прикреплена вторая половинка индуцируемого гомодимера,a second Cas9-based fusion construct to which the second half of the inducible homodimer is attached,
где первая слитая конструкция на основе Cas9 функционально связана с одним или несколькими сигналами ядерной локализации,wherein the first Cas9-based fusion construct is operably linked to one or more nuclear localization signals,
где вторая слитая конструкция на основе Cas9 функционально связана с (необязательно одним или несколькими) сигналом(сигналами) ядерного экспорта,wherein the second Cas9-based fusion construct is operably linked to (optionally one or more) nuclear export signal(s),
где приведение в контакт с источником энергии, являющимся индуктором, обеспечивает сведение первой и второй половинок индуцируемого гомодимера вместе,where contact with an energy source, which is an inductor, brings the first and second halves of the induced homodimer together,
где сведение первой и второй половинок индуцируемого гомодимера вместе позволяет первой и второй слитым конструкциям на основе Cas9 образовать функциональную систему CRISPR-Cas на основе Cas9,where bringing the first and second halves of the inducible homodimer together allows the first and second Cas9-based fusion constructs to form a functional Cas9-based CRISPR-Cas system,
где система CRISPR-Cas на основе Cas9 содержит направляющую РНК (gRNA), содержащую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, иwherein the Cas9-based CRISPR-Cas system comprises a guide RNA (gRNA) comprising a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell, and
где функциональная система CRISPR-Cas на основе Cas9 связывается с целевой последовательностью и необязательно редактирует локус генома для изменения экспрессии генов.where a functional Cas9-based CRISPR-Cas system binds to a target sequence and optionally edits a genomic locus to alter gene expression.
В одном варианте осуществления гомодимер предпочтительно представляет собой FKBP, а источник энергии, являющийся индуктором, предпочтительно представляет собой FK1012. В другом варианте осуществления гомодимер предпочтительно представляет собой GryB, а источник энергии, являющийся индуктором, предпочтительно представляет собой кумермицин. В другом варианте осуществления гомодимер предпочтительно представляет собой ABA, а источник энергии, являющийся индуктором, предпочтительно представляет собой гиббереллин.In one embodiment, the homodimer is preferably FKBP and the energy source that is an inducer is preferably FK1012. In another embodiment, the homodimer is preferably GryB and the energy source that is an inducer is preferably coumermycin. In another embodiment, the homodimer is preferably ABA and the energy source that is an inducer is preferably gibberellin.
В других вариантах осуществления димер является гетеродимером. Предпочтительными примерами гетеродимеров являются любые из следующих индуцируемых систем: FKBP, который димеризуется с кальциневрином А (CNA) в присутствии FK506; FKBP, который димеризуется с CyP-Fas в присутствии FKCsA; FKBP, который димеризуется с FRB в присутствии рапамицина в присутствии кумермицина; GAI, который димеризуется с GID1 в присутствии гиббереллина; или Snap-tag, который димеризуется с HaloTag в присутствии HaXS.In other embodiments, the dimer is a heterodimer. Preferred examples of heterodimers are any of the following inducible systems: FKBP, which dimerizes with calcineurin A (CNA) in the presence of FK506; FKBP, which dimerizes with CyP-Fas in the presence of FKCsA; FKBP, which dimerizes with FRB in the presence of rapamycin in the presence of coumermycin; GAI, which dimerizes with GID1 in the presence of gibberellin; or Snap-tag, which dimerizes with HaloTag in the presence of HaXS.
Заявители использовали FKBP/FRB, поскольку он хорошо охарактеризован, и оба домена являются достаточно маленькими (<100 аминокислот) для содействия упаковке. Более того, рапамицин использовался долгое время и его побочные эффекты хорошо известны. Крупные домены димеризации (>300 aa) также должны работать, но для обеспечения восстановления Cas9 могут потребоваться более длинные линкеры.The applicants used FKBP/FRB because it is well characterized and both domains are small enough (<100 amino acids) to facilitate packaging. Furthermore, rapamycin has been used for a long time and its side effects are well known. Large dimerization domains (>300 aa) should also work, but longer linkers may be required to ensure Cas9 reconstitution.
У Paulmurugan и Gambhir (Cancer Res, August 15, 2005 65; 7413) обсуждаются базовые сведения о системе FRB/FKBP/рапамицин. Другим полезным документом является статья Crabtree et al. (Chemistry & Biology 13, 99-107, Jan 2006).Paulmurugan and Gambhir (Cancer Res, August 15, 2005 65; 7413) discuss the basics of the FRB/FKBP/rapamycin system. Another useful reference is the paper by Crabtree et al. (Chemistry & Biology 13, 99-107, Jan 2006).
В данном примере конструируют один вектор, кассету экспрессии (плазмиду). gRNA находится под контролем промотора U6. Используют два разных разделения Cas9. Конструкция split-Cas9 основывается на первой слитой конструкции на основе Cas9, фланкированной NLS, с FKBP, слитым с C'-концевой частью split-Cas9 посредством линкера GlySer; и второй слитой конструкции на основе Cas9, фланкированной NES, с FRB, слитым с N'-концевой частью split-Cas9 посредством линкера GlySer. Для отделения первой и второй слитых конструкций на основе Cas9 используют P2A, обеспечивающий разделение при транскрипции. Split-Cas9 демонстрирует образование вставок/делеций, подобное таковому у дикого типа, в присутствии рапамицина, но значительно более низкое образование вставок/делеций, чем у дикого типа, в отсутствии рапамицина.In this example, a single vector, an expression cassette (plasmid), is constructed. The gRNA is under the control of the U6 promoter. Two different split-Cas9 constructs are used. The split-Cas9 construct is based on a first NLS-flanked Cas9 fusion with FKBP fused to the C'-terminal portion of split-Cas9 via a GlySer linker; and a second NES-flanked Cas9 fusion with FRB fused to the N'-terminal portion of split-Cas9 via a GlySer linker. P2A is used to separate the first and second Cas9 fusions, allowing for transcriptional separation. Split-Cas9 exhibits insertion/deletion formation similar to wild-type in the presence of rapamycin, but significantly lower insertion/deletion formation than wild-type in the absence of rapamycin.
Соответственно, предусматривается один вектор. Вектор содержит:Accordingly, one vector is provided. The vector contains:
первую слитую конструкцию на основе Cas9, к которой прикреплена первая половинка индуцируемого димера, иthe first Cas9-based fusion construct to which the first half of the inducible dimer is attached, and
вторую слитую конструкцию на основе Cas9, к которой прикреплена вторая половинка индуцируемого димера,a second Cas9-based fusion construct to which the second half of the inducible dimer is attached,
где первая слитая конструкция на основе Cas9 функционально связана с одним или несколькими сигналами ядерной локализации,wherein the first Cas9-based fusion construct is operably linked to one or more nuclear localization signals,
где вторая слитая конструкция на основе Cas9 функционально связана с одним или несколькими сигналами ядерного экспорта,wherein the second Cas9-based fusion construct is operably linked to one or more nuclear export signals,
где приведение в контакт с источником энергии, являющимся индуктором, обеспечивает сведение первой и второй половинок индуцируемого гетеродимера вместе,where bringing into contact with an energy source, which is an inductor, ensures that the first and second halves of the induced heterodimer are brought together,
где сведение первой и второй половинок индуцируемого гетеродимера вместе позволяет первой и второй слитым конструкциям на основе Cas9 образовать функциональную систему CRISPR-Cas на основе Cas9,where bringing the first and second halves of the inducible heterodimer together allows the first and second Cas9-based fusion constructs to form a functional Cas9-based CRISPR-Cas system,
где система CRISPR-Cas на основе Cas9 содержит направляющую РНК (gRNA), содержащую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, иwherein the Cas9-based CRISPR-Cas system comprises a guide RNA (gRNA) comprising a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell, and
где функциональная система CRISPR-Cas на основе Cas9 связывается с целевой последовательностью и необязательно редактирует локус генома для изменения экспрессии генов. Эти элементы предпочтительно представлены в одной конструкции, например, в кассете экспрессии.wherein a functional Cas9-based CRISPR-Cas system binds to a target sequence and optionally edits a genomic locus to alter gene expression. These elements are preferably present in a single construct, such as an expression cassette.
Первая слитая конструкция на основе Cas9 предпочтительно фланкирована по меньшей мере одним сигналом ядерной локализации на каждом конце. Вторая слитая конструкция на основе Cas9 предпочтительно фланкирована по меньшей мере одним сигналом ядерного экспорта на каждом конце.The first Cas9-based fusion construct is preferably flanked by at least one nuclear localization signal at each end. The second Cas9-based fusion construct is preferably flanked by at least one nuclear export signal at each end.
Также предусмотрен способ лечения субъекта, нуждающегося в этом, включающий индуцирование редактирования генов путем трансформации субъекта с помощью полинуклеотида, кодирующего систему, или любого из векторов согласно настоящему изобретению и введение субъекту источника энергии, являющегося индуктором. Также может предусматриваться подходящая матрица для репарации, например, доставляемая вектором, содержащим указанную матрицу для репарации.A method for treating a subject in need thereof is also provided, comprising inducing gene editing by transforming the subject using a polynucleotide encoding the system or any of the vectors according to the present invention and administering to the subject an energy source which is an inducer. A suitable repair matrix may also be provided, for example delivered by a vector containing said repair matrix.
Также предусмотрен способ лечения субъекта, нуждающегося в этом, включающий индуцирование активации или репрессии транскрипции путем трансформации субъекта с помощью полинуклеотида, кодирующего систему согласно настоящему изобретению, или любого из векторов согласно настоящему изобретению, где указанные полинуклеотид или вектор кодируют или содержат каталитически неактивный Cas9 и один или несколько ассоциированных с ним функциональных доменов; при этом способ дополнительно включает введение субъекту источника энергии, являющегося индуктором.Also provided is a method for treating a subject in need thereof, comprising inducing transcriptional activation or repression by transforming the subject with a polynucleotide encoding the system according to the present invention or any of the vectors according to the present invention, wherein said polynucleotide or vector encodes or contains catalytically inactive Cas9 and one or more functional domains associated therewith; wherein the method further comprises administering to the subject an energy source that is an inducer.
Также предусмотрены композиции, содержащие систему согласно настоящему изобретению, для применения в указанном способе лечения. Также предусмотрено применение системы согласно настоящему изобретению в изготовлении лекарственного препарата для таких способов лечения.Compositions comprising the system according to the present invention for use in said method of treatment are also provided. Use of the system according to the present invention in the manufacture of a medicinal product for such methods of treatment is also provided.
Примеры состояний, которые можно лечить с помощью системы согласно настоящему изобретению, описаны в данном документе или в документах, цитируемых в данном документе.Examples of conditions that can be treated with the system of the present invention are described herein or in documents cited herein.
Один вектор может содержать средство, разделяющее транскрипты, например, P2A. P2A разделяет транскрипт надвое с отделением первой и второй слитых конструкций на основе Cas9. Разделение происходит из-за "рибосомного пропуска". По сути, рибосома пропускает аминокислоту в ходе трансляции, что разрывает цепь белка и дает в результате два отдельных полипептида/белка. Один вектор также пригоден для применений, при которых низкая фоновая активность не имеет значения, но при этом желательна высокая индуцируемая активность.A single vector can contain a transcript splitter such as P2A. P2A splits the transcript in two, separating the first and second Cas9-based fusion constructs. The splitting occurs due to "ribosome skipping." Essentially, the ribosome skips an amino acid during translation, which breaks the protein chain and results in two separate polypeptides/proteins. A single vector is also suitable for applications where low background activity is unimportant, but high inducible activity is desired.
Одним примером может быть получение клональных линий эмбриональных стволовых клеток. Обычной процедурой является транзиентная трансфекция плазмидами, кодирующими Cas9 wt или никазы Cas9. Эти плазмиды обеспечивают продуцирувание молекул Cas9, которые остаются активными в течение нескольких дней и характеризуются более высокой вероятностью нецелевой активности. Использование одного вектора экспрессии для split-Cas9 позволяет ограничить "высокую" активность Cas9 в более короткий промежуток времени (например, одна доза индуктора, такого как рапамицин). Без непрерывных (ежесуточных) обработок индуктором (например, рапамицином) активность отдельных векторов экспрессии split-Cas9 является низкой и обеспечивает пониженную вероятность возникновения нежелательных нецелевых эффектов.One example is the generation of clonal embryonic stem cell lines. A common procedure is transient transfection with plasmids encoding wt Cas9 or Cas9 nickase. These plasmids produce Cas9 molecules that remain active for several days and have a higher probability of off-target activity. Using a single expression vector for split-Cas9 allows for the "high" Cas9 activity to be confined to a shorter period of time (e.g., a single dose of an inducer such as rapamycin). Without continuous (daily) treatments with an inducer (e.g., rapamycin), the activity of individual split-Cas9 expression vectors is low and provides a reduced probability of unwanted off-target effects.
Пик активности индуцированного Cas9 полезен в некоторых вариантах осуществления и может быть наиболее легко вызван с использованием одного вектора доставки, но это также возможно с помощью двойной векторной системы (каждый вектор доставляет одну половинку split-Cas9). Пик может представлять высокую активность и длиться в течение короткого срока, как правило, продолжительности действия индуктора.A peak of induced Cas9 activity is useful in some embodiments and can be most easily induced using a single delivery vector, but is also possible with a dual vector system (each vector delivering one half of the split-Cas9). The peak can represent high activity and last for a short period of time, typically the duration of the inducer.
Соответственно, предусмотрен способ получения клональных линий эмбриональных стволовых клеток, включающий трансфекцию одной или нескольких эмбриональных стволовых клеток с помощью полинуклеотида, кодирующего систему согласно настоящему изобретению, или одного из векторов согласно настоящему изобретению для экспрессии split-Cas9 согласно настоящему изобретению и введение в одну или несколько стволовых клеток источника энергии, являющегося индуктором, согласно настоящему изобретению или приведение их в контакт с ним для индуцирования восстановления Cas9. Может предусматриваться матрица для репарации.Accordingly, a method for producing clonal lines of embryonic stem cells is provided, comprising transfecting one or more embryonic stem cells with a polynucleotide encoding the system according to the present invention or one of the vectors according to the present invention for expressing split-Cas9 according to the present invention and introducing into one or more stem cells an energy source, which is an inducer, according to the present invention or bringing them into contact with it to induce Cas9 repair. A repair matrix may be provided.
Как и во всех способах, описанных в данном документе, следует понимать, что будут необходимы подходящие gRNA или направляющие.As with all methods described in this document, it should be understood that suitable gRNAs or guides will be required.
Если функциональные домены и подобные "ассоциированы" с одной или другой частью фермента, то они, как правило, являются продуктами слияния. Термин "связанный с" используется в данном документе в отношении того, как одна молекула "связывается" по отношению к другой, например, между частями Cas9 и функциональным доменом. В случае таких белок-белковых взаимодействий эту ассоциацию можно рассматривать с точки зрения распознавания как распознавание антителом эпитопа. Альтернативно один белок может быть ассоциирован с другим белком посредством слияния обоих, например, одна субъединица является слитой с другой субъединицей. Слияние обычно происходит путем добавления одной аминокислотной последовательности к другой, например, посредством сплайсинга нуклеотидных последовательностей, которые кодируют каждый белок или субъединицу. Альтернативно, по сути, это можно рассматривать как связывание двух молекул или прямую связь, например, белок слияния. В любом случае слитый белок может включать линкер между двумя представляющими интерес субъединицами (т.е. между ферментом и функциональным доменом или между адаптерным белком и функциональным доменом). Таким образом, в некоторых вариантах осуществления часть Cas9 ассоциирована с функциональным доменом за счет связывания с ним. В других вариантах осуществления Cas9 ассоциирован с функциональным доменом ввиду того, что двое слиты вместе необязательно посредством промежуточного линкера. Примеры линкеров включают линкеры GlySer, обсуждаемые в данном документе.When functional domains and the like are "associated" with one or another part of an enzyme, they are typically fusion products. The term "associated with" is used herein to refer to one molecule "binding" to another, such as between parts of Cas9 and a functional domain. In the case of such protein-protein interactions, this association can be thought of in terms of recognition, such as an antibody recognizing an epitope. Alternatively, one protein can be associated with another protein by a fusion of the two, such as one subunit being fused to another subunit. Fusion typically occurs by the addition of one amino acid sequence to another, such as by splicing the nucleotide sequences that encode each protein or subunit. Alternatively, it can be thought of as essentially a linkage of two molecules, or a direct linkage, such as a fusion protein. In any case, the fusion protein may include a linker between the two subunits of interest (i.e., between the enzyme and the functional domain, or between the adaptor protein and the functional domain). Thus, in some embodiments, the Cas9 portion is associated with the functional domain by binding thereto. In other embodiments, the Cas9 is associated with the functional domain by the two being fused together, optionally through an intervening linker. Examples of linkers include the GlySer linkers discussed herein.
Другие примеры индукторов включают свет и гормоны. Что касается света, индуцируемые димеры могут быть гетеродимерами и включать первую индуцируемую светом половинку димера и вторую (и комплиментарную) индуцируемую светом половинку димера. Предпочтительным примером первой и второй индуцируемых светом половинок димера является система CIB1 и CRY2. Домен CIB1 является гетеродимерным партнером по связыванию чувствительного к свету криптохрома 2 (CRY2).Other examples of inducers include light and hormones. For light, inducible dimers can be heterodimers and include a first light-inducible half-dimer and a second (and complementary) light-inducible half-dimer. A preferred example of a first and second light-inducible half-dimer is the CIB1 and CRY2 system. The CIB1 domain is the heterodimeric binding partner of light-sensitive cryptochrome 2 (CRY2).
В другом примере чувствительная к синему свету система димеризации Magnet (pMag и nMag) может быть слита с двумя частями белка split-Cas9. В ответ на стимуляцию светом pMag и nMag димеризуются и происходит повторная сборка Cas9. Например, такая система описывается вместе с Cas9 у Nihongaki et al. (Nat. Biotechnol. 33, 755-790, 2015).In another example, the blue-light-sensitive Magnet dimerization system (pMag and nMag) can be fused to the two parts of the split-Cas9 protein. In response to light stimulation, pMag and nMag dimerize and Cas9 reassembles. For example, such a system is described together with Cas9 by Nihongaki et al. (Nat. Biotechnol. 33, 755–790, 2015).
В настоящем изобретении подразумевается то, что источником энергии, являющимся индуктором, может быть тепло, ультразвук, электромагнитная энергия или химическое вещество. В предпочтительном варианте осуществления настоящего изобретения источником энергии, являющимся индуктором, может быть антибиотик, малая молекула, гормон, производное гормона, стероид или производное стероида. В более предпочтительном варианте осуществления источником энергии, являющимся индуктором, может быть абсцизовая кислота (ABA), доксициклин (DOX), кумат, рапамицин, 4-гидрокситамоксифен (4OHT), эстроген или экдизон. В настоящем изобретении предусматривается то, что по меньшей мере один "переключатель" может быть выбран из группы, состоящей из индуцируемых на основе антибиотиков систем, индуцируемых на основе электромагнитной энергии систем, индуцируемых на основе малых молекул систем, индуцируемых на основе ядерных рецепторов систем и индуцируемых на основе гормонов систем. В более предпочтительном варианте осуществления по меньшей мере один переключатель может быть выбран из группы, состоящей из индуцируемых тетрациклином (Tet)/DOX систем, индуцируемых светом систем, индуцируемых ABA систем, систем на основе куматного репрессора/оператора, индуцируемых 4OHT/эстрогеном систем, индуцируемых на основе экдизона систем и индуцируемых FKBP12/FRAP (комплекс FKBP12-рапамицин) систем. Такие индукторы также обсуждаются в данном документе и в заявке PCT/US2013/051418, включенной в данный документ посредством ссылки.The present invention contemplates that the energy source, which is an inducer, can be heat, ultrasound, electromagnetic energy or a chemical substance. In a preferred embodiment of the present invention, the energy source, which is an inducer, can be an antibiotic, a small molecule, a hormone, a hormone derivative, a steroid or a steroid derivative. In a more preferred embodiment, the energy source, which is an inducer, can be abscisic acid (ABA), doxycycline (DOX), cumate, rapamycin, 4-hydroxytamoxifen (4OHT), estrogen or ecdysone. The present invention contemplates that at least one "switch" can be selected from the group consisting of antibiotic-based inducible systems, electromagnetic energy-based inducible systems, small molecule-based inducible systems, nuclear receptor-based inducible systems and hormone-based inducible systems. In a more preferred embodiment, the at least one switch may be selected from the group consisting of tetracycline (Tet)/DOX inducible systems, light inducible systems, ABA inducible systems, cumate repressor/operator based systems, 4OHT/estrogen inducible systems, ecdysone based inducible systems, and FKBP12/FRAP (FKBP12-rapamycin complex) inducible systems. Such inducers are also discussed herein and in PCT/US2013/051418, incorporated herein by reference.
В целом, любое применение, которое может касаться Cas9, будь то wt, никаза или нефункциональный Cas9 (с ассоциированными функциональными доменами или без них), может быть осуществлено с использованием подхода split-Cas9 согласно настоящему изобретению. Преимуществом остается индуцируемый характер активности Cas9.In general, any application that may involve Cas9, whether wt, nickase or non-functional Cas9 (with or without associated functional domains), can be implemented using the split-Cas9 approach of the present invention. The inducible nature of Cas9 activity remains an advantage.
В качестве дополнительного примера могут быть получены продукты слияния split-Cas9 с флуоресцентными белками, такими как GFP. Это позволит визуализировать локусы генома (см. "Dynamic Imaging of Genomic Loci in Living Human Cells by an Optimized CRISPR/Cas System" Chen B. et al. Cell 2013), но индуцируемым образом. Таким образом, в некоторых вариантах осуществления одна или несколько частей Cas9 могут быть ассоциированы (и, в частности, слиты с) флуоресцентным белком, например, GFP.As a further example, split-Cas9 fusion products with fluorescent proteins such as GFP can be produced. This will allow for visualization of genomic loci (see "Dynamic Imaging of Genomic Loci in Living Human Cells by an Optimized CRISPR/Cas System" Chen B. et al. Cell 2013), but in an inducible manner. Thus, in some embodiments, one or more portions of Cas9 can be associated with (and in particular fused to) a fluorescent protein, such as GFP.
Дополнительные эксперименты касаются того, существует ли разница в нецелевом разрезании среди Cas9 дикого типа (wt) и split-Cas9 при аналогичном уровне нецелевого разрезания. Для этого заявители использовали транзиентную трансфекцию плазмидами Cas9 wt и split-Cas9 и осуществляли сбор в разные моменты времени. Заявители определяли нецелевую активацию после выявления ряда образцов, в которых целевое разрезание составляло +/- 5%. Заявители получали линии клеток со стабильной экспрессией Cas9 wt или split-Cas9 без направляющих (с использованием лентивируса). После отбора с помощью антибиотика направляющие доставляли с помощью отдельного лентивируса и осуществляли сбор в разные моменты времени для измерения целевого/нецелевого разрезания.Additional experiments examined whether there is a difference in off-target cleavage between wild-type (wt) and split-Cas9 at similar levels of off-target cleavage. To do this, we transiently transfected wt and split-Cas9 Cas9 plasmids and harvested at different time points. We determined off-target activation after identifying a subset of samples in which on-target cleavage was +/- 5%. We generated cell lines stably expressing wt or split-Cas9 Cas9 without guides (using lentivirus). Following antibiotic selection, guides were delivered using a separate lentivirus and harvested at different time points to measure on-target/off-target cleavage.
Заявители ввели дестабилизирующую последовательность (PEST, см. "Use of mRNA- and protein-destabilizing elements to develop a highly responsive reporter system" Voon DC et al. Nucleic Acids Research 2005) во фрагмент FRB(N)Cas9-NES для облегчения более быстрого разрушения и, следовательно, для снижения стабильности комплекса нефункциональный split-Cas9-VP64.Applicants introduced a destabilizing sequence (PEST, see "Use of mRNA- and protein-destabilizing elements to develop a highly responsive reporter system" Voon DC et al. Nucleic Acids Research 2005) into the FRB(N)Cas9-NES fragment to facilitate faster degradation and hence reduce the stability of the non-functional split-Cas9-VP64 complex.
Такие дестабилизирующие последовательности, описываемые в других разделах данного описания, (в том числе PEST) могут быть предпочтительными для применения с системами split-Cas9.Such destabilizing sequences, described elsewhere in this document (including PEST), may be preferred for use with split-Cas9 systems.
Получали линии клеток, стабильно экспрессирующие нефункциональный split-Cas9-VP64 и MS2-p65-HSF1 + направляющая. Скрининг на предмет устойчивости к PLX может продемонстрировать, что необратимая регулируемая во времени активация транскрипции может быть пригодна в скринингах лекарственных средств. Этот подход может быть преимущественным, если нефункциональный split-Cas9-VP64 является необратимым.Cell lines stably expressing non-functional split-Cas9-VP64 and MS2-p65-HSF1 + guide were generated. Screening for PLX resistance may demonstrate that irreversible, time-regulated transcriptional activation may be useful in drug screening. This approach may be advantageous if non-functional split-Cas9-VP64 is irreversible.
В одном аспекте настоящего изобретения предусмотрена не встречающейся в природе или сконструированная система CRISPR-Cas на основе Cas9, которая может содержать по меньшей мере один "переключатель", при этом активность указанной системы CRISPR-Cas на основе Cas9 контролируется в отношении "переключателя" путем приведения в контакт по меньшей мере с одним источником энергии, являющимся индуктором. В одном варианте осуществления настоящего изобретения контроль в отношении по меньшей мере одного "переключателя" или активности указанной системы CRISPR-Cas на основе Cas9 может быть активирован, усилен, прекращен или подавлен. Приведение в контакт по меньшей мере с одним источником энергии, являющимся индуктором, может приводить в результате к первому эффекту и второму эффекту. Первый эффект может представлять собой одно или несколько из ядерного импорта, ядерного экспорта, рекрутирования вторичного компонента (такого как эффекторная молекула), конформационного изменения (белка, ДНК или РНК), расщепления, высвобождения молекулы-карго (такой как защищенная молекула или кофактор), ассоциации или диссоциации. Второй эффект может представлять собой одно или несколько из активации, усиления, прекращения или подавления контроля в отношении по меньшей мере одного "переключателя" или активности указанной системы CRISPR-Cas на основе Cas9. В одном варианте осуществления первый эффект и второй эффект могут проявляться в виде каскада.In one aspect of the present invention, there is provided a non-naturally occurring or engineered Cas9-based CRISPR-Cas system, which can comprise at least one "switch", wherein the activity of said Cas9-based CRISPR-Cas system is controlled with respect to the "switch" by contacting with at least one energy source that is an inducer. In one embodiment of the present invention, the control with respect to the at least one "switch" or the activity of said Cas9-based CRISPR-Cas system can be activated, enhanced, terminated or suppressed. Contacting with at least one energy source that is an inducer can result in a first effect and a second effect. The first effect may be one or more of nuclear import, nuclear export, recruitment of a secondary component (such as an effector molecule), a conformational change (of a protein, DNA, or RNA), cleavage, release of a cargo molecule (such as a protected molecule or cofactor), association, or dissociation. The second effect may be one or more of activation, enhancement, termination, or suppression of control over at least one "switch" or activity of said Cas9-based CRISPR-Cas system. In one embodiment, the first effect and the second effect may occur as a cascade.
В другом аспекте настоящего изобретения система CRISPR-Cas на основе Cas9 может дополнительно содержать по меньшей мере один или несколько из сигнала ядерной локализации (NLS), сигнала ядерного экспорта (NES), функционального домена, гибкого линкера, мутации, делеции, изменения или усечения. Одно или несколько из NLS, NES или функционального домена могут быть активированными в зависимости от условий или инактивированными. В другом варианте осуществления мутацией может быть одна или несколько из мутации в гомологичном участке фактора транскрипции, мутации в ДНК-связывающем домене (как, например, подвергнутые мутации основные остатки в структуре основная спираль-петля-спираль), мутации в эндогенном NLS или мутации в эндогенном NES. В настоящем изобретении подразумевается то, что источником энергии, являющимся индуктором, может быть тепло, ультразвук, электромагнитная энергия или химическое вещество. В предпочтительном варианте осуществления настоящего изобретения источником энергии, являющимся индуктором, может быть антибиотик, малая молекула, гормон, производное гормона, стероид или производное стероида. В более предпочтительном варианте осуществления источником энергии, являющимся индуктором, может быть абсцизовая кислота (ABA), доксициклин (DOX), кумат, рапамицин, 4-гидрокситамоксифен (4OHT), эстроген или экдизон. В настоящем изобретении предусматривается то, что по меньшей мере один "переключатель" может быть выбран из группы, состоящей из индуцируемых на основе антибиотиков систем, индуцируемых на основе электромагнитной энергии систем, индуцируемых на основе малых молекул систем, индуцируемых на основе ядерных рецепторов систем и индуцируемых на основе гормонов систем. В более предпочтительном варианте осуществления по меньшей мере один переключатель может быть выбран из группы, состоящей из индуцируемых тетрациклином (Tet)/DOX систем, индуцируемых светом систем, индуцируемых ABA систем, систем на основе куматного репрессора/оператора, индуцируемых 4OHT/эстрогеном систем, индуцируемых на основе экдизона систем и индуцируемых FKBP12/FRAP (комплекс FKBP12-рапамицин) систем.In another aspect of the present invention, the Cas9-based CRISPR-Cas system may further comprise at least one or more of a nuclear localization signal (NLS), a nuclear export signal (NES), a functional domain, a flexible linker, a mutation, a deletion, an alteration, or a truncation. One or more of the NLS, NES, or functional domain may be conditionally activated or inactivated. In another embodiment, the mutation may be one or more of a mutation in a homologous region of a transcription factor, a mutation in a DNA-binding domain (such as mutated basic residues in a basic helix-loop-helix structure), a mutation in an endogenous NLS, or a mutation in an endogenous NES. The present invention contemplates that the energy source that is an inducer may be heat, ultrasound, electromagnetic energy, or a chemical substance. In a preferred embodiment of the present invention, the energy source that is an inducer may be an antibiotic, a small molecule, a hormone, a hormone derivative, a steroid, or a steroid derivative. In a more preferred embodiment, the energy source that is an inducer may be abscisic acid (ABA), doxycycline (DOX), cumate, rapamycin, 4-hydroxytamoxifen (4OHT), estrogen, or ecdysone. The present invention contemplates that at least one "switch" may be selected from the group consisting of antibiotic-based inducible systems, electromagnetic energy-based inducible systems, small molecule-based inducible systems, nuclear receptor-based inducible systems, and hormone-based inducible systems. In a more preferred embodiment, at least one switch may be selected from the group consisting of tetracycline (Tet)/DOX inducible systems, light inducible systems, ABA inducible systems, cumate repressor/operator based systems, 4OHT/estrogen inducible systems, ecdysone based inducible systems, and FKBP12/FRAP (FKBP12-rapamycin complex) inducible systems.
Аспекты контроля, подробно описываемые в данной заявке, относятся по меньшей мере к одному или нескольким "переключателям". Термин "переключатель", используемый в данном документе, обозначает систему или набор компонентов, которые действуют согласовано с обеспечением изменения, охватывающего все аспекты биологической функции, такие как активация, подавление, усиление или прекращение этой функции. В одном аспекте термин "переключатель" охватывает "генетические переключатели", которые содержат основные компоненты в виде белков, регулирующих гены, и специфические последовательности ДНК, которые эти белки распознают. В одном аспекте "переключатели" относятся к индуцируемым и репрессируемым системам, используемым в генной регуляции. В целом, индуцируемая система может быть неактивна до тех пор, пока не будет присутствовать определенная молекула (называемая индуктором), которая обеспечивает экспрессию гена. Считается, что молекула "индуцирует экспрессию". Способ, с помощью которого это осуществляется, зависит от механизмов контроля, а также от различий в типе клетки. Репрессируемая система является активной пока не присутствует определенная молекула (называемая корепрессором), которая подавляет экспрессию гена. Считается, что молекула "репрессирует экспрессию". Способ, с помощью которого это осуществляется, зависит от механизмов контроля, а также от различий в типе клетки. Термин "индуцируемый", используемый в данном документе, может охватывать все аспекты "переключателя" независимо от задействованного молекулярного механизма. Соответственно, "переключатель", как подразумевается в настоящем изобретении, может включать без ограничения индуцируемые на основе антибиотиков системы, индуцируемые на основе электромагнитной энергии системы, индуцируемые на основе малых молекул системы, индуцируемые на основе ядерных рецепторов системы и индуцируемые на основе гормонов системы. В предпочтительных вариантах осуществления "переключателем" может быть индуцируемая тетрациклином (Tet)/DOX система, индуцируемые светом системы, индуцируемая абсцизовой кислотой система, система на основе куматного репрессора/оператора, индуцируемая 4OHT/эстрогеном система, индуцируемые на основе экдизона системы и индуцируемая FKBP12/FRAP (комплексом FKBP12-рапамицин) система.The aspects of control detailed in this application relate to at least one or more "switches". The term "switch" as used herein refers to a system or set of components that act in concert to effect a change that encompasses all aspects of a biological function, such as activation, repression, enhancement, or termination of that function. In one aspect, the term "switch" encompasses "genetic switches" that comprise essential components in the form of gene regulatory proteins and specific DNA sequences that these proteins recognize. In one aspect, "switches" refer to inducible and repressible systems used in gene regulation. In general, an inducible system may be inactive until a specific molecule (called an inducer) is present that causes the gene to be expressed. The molecule is said to "induce expression". The manner in which this is accomplished depends on the control mechanisms as well as differences in cell type. A repressible system is active until a specific molecule (called a corepressor) is present that suppresses gene expression. The molecule is said to "repress expression." The manner in which this is accomplished depends on the control mechanisms as well as differences in cell type. The term "inducible" as used herein may encompass all aspects of a "switch" regardless of the molecular mechanism involved. Accordingly, a "switch" as contemplated in the present invention may include, but is not limited to, antibiotic-based inducible systems, electromagnetic energy-based inducible systems, small molecule-based inducible systems, nuclear receptor-based inducible systems, and hormone-based inducible systems. In preferred embodiments, the "switch" may be a tetracycline (Tet)/DOX-inducible system, light-inducible systems, abscisic acid-inducible system, cumate repressor/operator-based system, 4OHT/estrogen-inducible system, ecdysone-based inducible systems, and FKBP12/FRAP (FKBP12-rapamycin complex)-inducible system.
Система CRISPR-Cas на основе Cas9 согласно настоящему изобретению может быть разработана для модулирования или изменения экспрессии отдельных эндогенных генов точным в пространственном и временном отношении способом. Система CRISPR-Cas на основе Cas9 может быть разработана так, чтобы связываться с промоторной последовательностью представляющего интерес гена для изменения экспрессии гена. Cas9 может быть разделен надвое, при этом одна половинка сливается с одной половинкой гетеродимера криптохрома (криптохрома-2 или CIB1), тогда как оставшаяся часть криптохрома сливается с другой половинкой Cas9. В некоторых аспектах транскрипционный эффекторный домен также может быть включен в систему CRISPR-Cas на основе Cas9. Эффекторные домены могут быть либо активаторами, такими как VP16, VP64 или p65, либо репрессорами, такими как KRAB, EnR или SID. В нестимулированном состоянии одна половинка белка Cas9-криптохром-2 локализуется в промоторном участке представляющего интерес гена, но не связывается с CIB1-эффекторным белком. При стимуляции светом синего спектра криптохром-2 активируется, подвергается конформационному изменению и открывает свой домен связывания. CIB1, в свою очередь, связывается с криптохромом-2, что приводит в результате к локализации второй половинки Cas9 в промоторном участке представляющего интерес гена и инициированию редактирования генома, которое может приводить к сверхэкспрессии или сайленсингу гена. Аспекты LITE дополнительно описываются в Liu, H et al., Science, 2008, и Kennedy M et al., Nature Methods 2010, содержание которых включено в данный документ посредством ссылки во всей своей полноте.The Cas9-based CRISPR-Cas system of the present invention can be designed to modulate or alter the expression of individual endogenous genes in a spatially and temporally precise manner. The Cas9-based CRISPR-Cas system can be designed to bind to a promoter sequence of a gene of interest to alter gene expression. Cas9 can be split in two, with one half fused to one half of a cryptochrome heterodimer (cryptochrome-2 or CIB1), while the remaining cryptochrome is fused to the other half of Cas9. In some aspects, a transcriptional effector domain can also be included in the Cas9-based CRISPR-Cas system. Effector domains can be either activators, such as VP16, VP64, or p65, or repressors, such as KRAB, EnR, or SID. In the unstimulated state, one half of the Cas9-cryptochrome-2 protein localizes to the promoter region of the gene of interest but does not bind to the CIB1 effector protein. Upon stimulation with blue light, cryptochrome-2 is activated, undergoes a conformational change, and exposes its binding domain. CIB1, in turn, binds to cryptochrome-2, resulting in the localization of the other half of Cas9 to the promoter region of the gene of interest and initiation of genome editing that can lead to gene overexpression or silencing. Aspects of LITE are further described in Liu, H et al., Science, 2008, and Kennedy M et al., Nature Methods 2010, the contents of which are incorporated herein by reference in their entireties.
Активаторные и репрессорные домены, которые могут дополнительно модулировать функцию, могут быть выбраны на основании видов, эффективности, механизма, продолжительности, размера или любого ряда других параметров. Предпочтительные эффекторные домены включают без ограничения домен транспозазы, домен интегразы, домен рекомбиназы, домен резолвазы, домен инвертазы, домен протеазы, домен ДНК-метилтрансферазы, домен ДНК-деметилазы, домен гистонацетилазы, домен гистондеацетилазы, нуклеазный домен, репрессорный домен, активаторный домен, домены сигнала ядерной локализации, домен рекрутирования транскрипционного белка, домен, ассоциированный с активностью клеточного поглощения, домен связывания нуклеиновой кислоты или домен презентации антитела.Activator and repressor domains that can further modulate function can be selected based on species, potency, mechanism, duration, size, or any number of other parameters. Preferred effector domains include, but are not limited to, a transposase domain, an integrase domain, a recombinase domain, a resolvase domain, an invertase domain, a protease domain, a DNA methyltransferase domain, a DNA demethylase domain, a histone acetylase domain, a histone deacetylase domain, a nuclease domain, a repressor domain, an activator domain, nuclear localization signal domains, a transcriptional protein recruitment domain, a cellular uptake activity associated domain, a nucleic acid binding domain, or an antibody presentation domain.
Существует несколько разных способов получения индуцируемых систем: 1. система на основе ABI-PYL, индуцируемая абсцизовой кислотой (ABA) (см., например, веб-сайт stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2), 2. система на основе FKBP-FRB, индуцируемая рапамицином (или родственными химическими соединениями на основе рапамицина) (см., например, веб-сайт nature.com/nmeth/journal/v2/n6/full/nmeth763.html), 3. система на основе GID1-GAI, индуцируемая гиббереллином (GA) (см., например, веб-сайт nature.com/nchembio/journal/v8/n5/full/nchembio.922.html).There are several different ways to generate inducible systems: 1. the ABI-PYL-based system inducible by abscisic acid (ABA) (see, for example, stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2), 2. the FKBP-FRB-based system inducible by rapamycin (or rapamycin-related chemicals) (see, for example, nature.com/nmeth/journal/v2/n6/full/nmeth763.html), 3. the GID1-GAI-based system inducible by gibberellin (GA) (see, for example, nature.com/nchembio/journal/v8/n5/full/nchembio.922.html).
Другая система, предусматриваемая настоящим изобретением, представляет собой химически индуцируемую систему, основанную на изменении субклеточной локализации. Заявители также предусматривают индуцируемую систему CRISPR-Cas на основе Cas9, сконструированную для нацеливания на представляющий интерес локус генома, при этом фермент Cas9 разделен на две слитых конструкции, которые дополнительно связаны с разными частями чувствительного к химическим веществам или энергии белка. Такой чувствительный к химическим веществам или энергии белок будет приводить к изменению субклеточной локализации одной из половинок фермента Cas9 (т.е. транспорту одной из половинок фермента Cas9 из цитоплазмы в ядро клеток) при связывании химического вещества или при переносе энергии на чувствительный к химическим веществам или энергии белок. Такой транспорт слитых конструкций из одних субклеточных компартментов или органелл, в которых его активность ограничивается из-за отсутствия субстрата для восстановленной системы CRISPR-Cas на основе Cas9, в другие, в которых субстрат присутствует, позволит компонентам объединяться и восстанавливать функциональную активность, а затем вступать в контакт с требуемым для них субстратом (т.е. геномной ДНК в ядре клетки млекопитающих) и приводить в результате к активации или репрессии экспрессии целевого гена.Another system contemplated by the present invention is a chemically inducible system based on a change in subcellular localization. Applicants also provide an inducible Cas9-based CRISPR-Cas system designed to target a genomic locus of interest, wherein the Cas9 enzyme is divided into two fusion constructs that are further linked to different parts of a chemically or energy-sensitive protein. Such a chemically or energy-sensitive protein will lead to a change in the subcellular localization of one of the halves of the Cas9 enzyme (i.e., the transport of one of the halves of the Cas9 enzyme from the cytoplasm to the nucleus of cells) upon binding a chemical or upon transfer of energy to the chemically or energy-sensitive protein. Such transport of the fusion constructs from one subcellular compartment or organelle in which its activity is limited due to the absence of a substrate for the reconstituted Cas9-based CRISPR-Cas system to another in which the substrate is present will allow the components to combine and restore functional activity, and then come into contact with their required substrate (i.e., genomic DNA in the mammalian cell nucleus) and result in the activation or repression of target gene expression.
Предусматриваются другие индуцируемые системы, такие как без ограничения регуляция тяжелыми металлами [Mayo KE et al., Cell 1982, 29:99-108; Searle PF et al., Mol Cell Biol 1985, 5:1480-1489, и Brinster RL et al., Nature (London) 1982, 296:39-42], стероидными гормонами [Hynes NE et al., Proc Natl Acad Sci USA 1981, 78:2038-2042; Klock G et al., Nature (London) 1987, 329:734-736, и Lee F et al., Nature (London) 1981, 294:228-232.], тепловым шоком [Nouer L: Heat Shock Response. Boca Raton, FL: CRC; 1991], и были разработаны другие реагенты [Mullick A, Massie B: Transcription, translation and the control of gene expression. В Encyclopedia of Cell Technology, под ред.: Speir RE. Wiley; 2000:1140-1164, и Fussenegger M, Biotechnol Prog 2001, 17:1-51]. Однако в случае таких индуцируемых промоторов млекопитающих существуют ограничения, такие как "утечка" при "выключенном" состоянии и плейотропные эффекты индукторов (теплового шока, тяжелых металлов, глюкокортикоидов и т.д.). Было предложено применение гормонов насекомых (экдизона), с надеждой снизить противодействие клеточными процессам в клетках млекопитающих [No D et al., Proc Natl Acad Sci USA 1996, 93:3346-3351]. В другой превосходной системе в качестве индуктора применяется рапамицин [Rivera VM et al., Nat Med 1996, 2:1028-1032], но роль рапамицина в качестве иммуносупрессора была главным ограничением его применения in vivo и, поэтому было необходимо найти биологически инертное соединение [Saez E et al., Proc Natl Acad Sci USA 2000, 97:14512-14517] для контроля экспрессии гена.Other inducible systems have been proposed, such as unlimited regulation by heavy metals [Mayo KE et al., Cell 1982, 29:99-108; Searle PF et al., Mol Cell Biol 1985, 5:1480-1489, and Brinster RL et al., Nature (London) 1982, 296:39-42], steroid hormones [Hynes NE et al., Proc Natl Acad Sci USA 1981, 78:2038-2042; Klock G et al., Nature (London) 1987, 329:734-736, and Lee F et al., Nature (London) 1981, 294:228-232], and heat shock [Nouer L: Heat Shock Response. Boca Raton, FL: CRC; 1991], and other reagents have been developed [Mullick A, Massie B: Transcription, translation and the control of gene expression. In Encyclopedia of Cell Technology, eds: Speir RE. Wiley; 2000:1140-1164, and Fussenegger M, Biotechnol Prog 2001, 17:1-51]. However, limitations exist with such mammalian inducible promoters, such as "leakage" in the "off" state and pleiotropic effects of inducers (heat shock, heavy metals, glucocorticoids, etc.). The use of insect hormones (ecdysone) has been proposed in the hope of reducing the antagonism of cellular processes in mammalian cells [No D et al., Proc Natl Acad Sci USA 1996, 93:3346-3351]. Another excellent system uses rapamycin as an inducer [Rivera VM et al., Nat Med 1996, 2:1028-1032], but rapamycin's role as an immunosuppressant was a major limitation of its use in vivo and it was therefore necessary to find a biologically inert compound [Saez E et al., Proc Natl Acad Sci USA 2000, 97:14512-14517] to control gene expression.
См. также приведенный ниже раздел о индуцируемых системах.See also the section below on induced systems.
Дестабилизированный фермент: ферменты в соответствии с настоящим изобретением, имеющие или ассоциированные с доменами дестабилизацииDestabilized enzyme: enzymes according to the present invention having or associated with destabilization domains
В одном аспекте настоящего изобретения предусмотрен не встречающийся в природе или сконструированный фермент CRISPR, предпочтительно фермент CRISPR 2 класса, предпочтительно фермент CRISPR V или VI типа, описанный в данном документе, такой как предпочтительно без ограничения Cas9, описываемый в других разделах данного документа, ассоциированный по меньшей мере с одним доменом дестабилизации (DD); и, для краткости, такой не встречающийся в природе или сконструированный фермент CRISPR, ассоциированный по меньшей мере с одним доменом дестабилизации (DD), называют в данном документе "ферментом DD-CRISPR". Следует понимать, что любой из ферментов CRISPR в соответствии с настоящим изобретением, описываемый в других разделах настоящего документа, может применяться в виде имеющего дестабилизирующие домены, описываемые в данном документе ниже, или ассоциированного с ними. Любые из способов, продуктов, композиций и вариантов применения, описываемых в других разделах данного документа, одинаково применимы с ферментами CRISPR, ассоциированными с дестабилизирующими доменами, как подробно описывается ниже.In one aspect, the present invention provides a non-naturally occurring or engineered CRISPR enzyme, preferably a class 2 CRISPR enzyme, preferably a type V or VI CRISPR enzyme, as described herein, such as preferably but not limited to Cas9 as described elsewhere herein, associated with at least one destabilization domain (DD); and, for brevity, such a non-naturally occurring or engineered CRISPR enzyme associated with at least one destabilization domain (DD) is referred to herein as a "DD-CRISPR enzyme". It is understood that any of the CRISPR enzymes of the present invention as described elsewhere herein may be used as having or associated with the destabilizing domains described herein below. Any of the methods, products, compositions, and uses described elsewhere herein are equally applicable to CRISPR enzymes associated with destabilizing domains, as described in detail below.
С целью дополнительного руководства приводятся следующие конкретные аспекты и варианты осуществления.For further guidance, the following specific aspects and implementation options are provided.
Поскольку аспекты и варианты осуществления, описываемые в данном разделе, включают ферменты DD-CRISPR, DD-Cas, DD-Cas9Cas9, DD-CRISPR-Cas или системы или комплексы DD-CRISPR-Cas9, термины "CRISPR", "Cas", "Cas9, "система CRISPR", "комплекс CRISPR", "CRISPR-Cas", "CRISPR-Cas9" или подобные без приставки "DD", можно рассматривать как имеющие приставку DD, особенно если позволяет контекст, так что настоящее изобретение охватывает варианты осуществления с DD. Таким образом, в одном аспекте настоящего изобретения предусмотрены способы применения одного или нескольких элементов системы CRISPR (которая может рассматриваться как система DD-CRISPR и/или система CRISPR). Комплекс CRISPR по настоящему изобретению обеспечивает эффективные средства модифицирования целевого полинуклеотида. Комплекс CRISPR по настоящему изобретению обладает широкой применимостью, включая модифицирование (например, осуществление делеции, встраивания, транслокации, инактивации, активации) целевого полинуклеотида во множестве типов клеток. Комплекс CRISPR по настоящему изобретению как таковой имеет широкий спектр применений, например, в генной терапии, скрининге лекарственных средств, диагностике и прогнозировании заболеваний.Because the aspects and embodiments described in this section involve DD-CRISPR, DD-Cas, DD-Cas9Cas9, DD-CRISPR-Cas enzymes, or DD-CRISPR-Cas9 systems or complexes, the terms "CRISPR," "Cas," "Cas9, "CRISPR system," "CRISPR complex," "CRISPR-Cas," "CRISPR-Cas9," or the like without the "DD" prefix may be construed as having the DD prefix, particularly where the context permits, so that the present invention encompasses embodiments with DDs. Accordingly, in one aspect, the present invention provides methods of using one or more elements of a CRISPR system (which may be considered a DD-CRISPR system and/or a CRISPR system). The CRISPR complex of the present invention provides an effective means for modifying a target polynucleotide. The CRISPR complex of the present invention has broad utility, including modifying (e.g., causing a deletion, insertion, translocation, inactivation, activation) of a target polynucleotide in a variety of cell types. The CRISPR complex of the present invention as such has a wide range of applications, such as in gene therapy, drug screening, disease diagnosis and prognosis.
В одном аспекте настоящего изобретения предусмотрена сконструированная, не встречающаяся в природе система DD-CRISPR-Cas, содержащая фермент DD-CRISPR, например, такой фермент DD-CRISPR, где фермент CRISPR представляет собой белок Cas (в данном документе называемый "белок DD-Cas", т.е. "DD" перед термином, таким как "комплекс DD-CRISPR-Cas9", означает комплекс CRISPR-Cas9, содержащий белок Cas9, имеющий по меньшей мере один домен дестабилизации, ассоциированный с ним), преимущественно белок DD-Cas, например, белок Cas9, ассоциированный по меньшей мере с одним доменом дестабилизации (в данном документе называемый "белок DD-Cas9"), и направляющую РНК, которая нацеливается на молекулу нуклеиновой кислоты, такую как молекула ДНК, тем самым направляющая РНК нацеливается на молекулу нуклеиновой кислоты, например, молекулу ДНК. Молекула нуклеиновой кислоты, например, молекула ДНК может кодировать продукт гена. В некоторых вариантах осуществления белок DD-Cas может расщеплять молекулу ДНК, кодирующую продукт гена. В некоторых вариантах осуществления экспрессия продукта гена изменена. Белок Cas и направляющая РНК не встречаются в природе вместе. Настоящее изобретение охватывает направляющую РНК, предусматривающую направляющую последовательность, необязательно, если применимо, слитую с последовательностью tracr. Настоящее изобретение дополнительно охватывает кодирование белка Cas, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающего, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. Экспрессия продукта гена может быть снижена. Фермент CRISPR может образовывать часть системы CRISPR-Cas, которая дополнительно содержит направляющую РНК (gRNA), предусматривающую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке В некоторых вариантах осуществления функциональная система CRISPR-Cas связывается с целевой последовательностью. В некоторых вариантах осуществления функциональная система CRISPR-Cas может редактировать целевую последовательность, например, целевая последовательность может предусматривать локус генома, а в некоторых вариантах осуществления может быть предусмотрено изменение экспрессии гена. В некоторых вариантах осуществления функциональная система CRISPR-Cas может содержать дополнительные функциональные домены. В некоторых вариантах осуществления настоящего изобретения предусмотрен способ изменения или модифицирования экспрессии продукта гена. Способ может включать введение в клетку, содержащую целевую нуклеиновую кислоту, например, молекулу ДНК, или содержащую и экспрессирующую целевую нуклеиновую кислоту, например, молекулу ДНК; например, целевая нуклеиновая кислота может кодировать продукт гена или обеспечивать экспрессию продукта гена (например, регуляторную последовательность).In one aspect of the present invention, there is provided an engineered, non-naturally occurring DD-CRISPR-Cas system comprising a DD-CRISPR enzyme, such as a DD-CRISPR enzyme, wherein the CRISPR enzyme is a Cas protein (herein referred to as a "DD-Cas protein", i.e., the "DD" before a term such as a "DD-CRISPR-Cas9 complex" means a CRISPR-Cas9 complex comprising a Cas9 protein having at least one destabilization domain associated therewith), preferably a DD-Cas protein, such as a Cas9 protein, associated with at least one destabilization domain (herein referred to as a "DD-Cas9 protein"), and a guide RNA that targets a nucleic acid molecule, such as a DNA molecule, whereby the guide RNA targets a nucleic acid molecule, such as a DNA molecule. A nucleic acid molecule, such as a DNA molecule, may encode a gene product. In some embodiments, a DD-Cas protein may cleave a DNA molecule encoding a gene product. In some embodiments, expression of the gene product is altered. The Cas protein and the guide RNA do not occur together in nature. The present invention encompasses a guide RNA that provides a guide sequence, optionally, if applicable, fused to a tracr sequence. The present invention further encompasses encoding a Cas protein that is codon-optimized for expression in a eukaryotic cell. In a preferred embodiment, the eukaryotic cell is a mammalian cell, and in a more preferred embodiment, the mammalian cell is a human cell. Expression of the gene product may be reduced. The CRISPR enzyme may form part of a CRISPR-Cas system that further comprises a guide RNA (gRNA) that comprises a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell. In some embodiments, a functional CRISPR-Cas system binds to a target sequence. In some embodiments, a functional CRISPR-Cas system may edit a target sequence, for example, the target sequence may comprise a genomic locus, and in some embodiments, altering gene expression may be provided. In some embodiments, a functional CRISPR-Cas system may comprise additional functional domains. In some embodiments, the present invention provides a method of altering or modifying the expression of a gene product. The method may comprise introducing into a cell comprising or comprising and expressing a target nucleic acid, for example, a DNA molecule; for example, the target nucleic acid may encode a gene product or provide for the expression of a gene product (e.g., a regulatory sequence).
В некоторых вариантах осуществления фермент DD-CRISPR представляет собой DD-Cas9. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой фермент CRISPR подтипа V-A или V-B. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой Cas9. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой As DD-Cas9. В некоторых вариантах осуществления фермент CRISPR представляет собой Lb DD-Cas9. В некоторых вариантах осуществления фермент DD-CRISPR расщепляет обе нити ДНК с образованием двухнитевого разрыва (DSB). В некоторых вариантах осуществления фермент DD-CRISPR представляет собой никазу. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой двойную никазу. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой нефункциональный Cas9, например, Cas9, фактически не проявляющий нуклеазной активности, например, проявляющий не более 5% нуклеазной активности по сравнению с Cas9 дикого типа или с Cas9, не имеющим мутации. Подходящие мутации Cas9 описываются в других разделах данного документа и включают, например, D917A, E1006A, E1028A, D1227A, D1255A, N1257A, D917A, E1006A, E1028A, D1227A, D1255A и N1257A в соответствии с аминокислотными положениями в домене RuvC FnCas9p; или, например, N580A, N584A, T587A, W609A, D610A, K613A, E614A, D616A, K624A, D625A, K627A и Y629A по сравнению с предполагаемым вторым нуклеазным доменом, описываемым в других разделах данного документа.In some embodiments, the DD-CRISPR enzyme is DD-Cas9. In some embodiments, the DD-CRISPR enzyme is a V-A or V-B subtype CRISPR enzyme. In some embodiments, the DD-CRISPR enzyme is Cas9. In some embodiments, the DD-CRISPR enzyme is As DD-Cas9. In some embodiments, the CRISPR enzyme is Lb DD-Cas9. In some embodiments, the DD-CRISPR enzyme cleaves both strands of DNA to form a double-strand break (DSB). In some embodiments, the DD-CRISPR enzyme is a nickase. In some embodiments, the DD-CRISPR enzyme is a dual nickase. In some embodiments, the DD-CRISPR enzyme is a non-functional Cas9, such as a Cas9 that exhibits substantially no nuclease activity, such as exhibiting no more than 5% nuclease activity compared to a wild-type Cas9 or a Cas9 that does not have a mutation. Suitable Cas9 mutations are described elsewhere herein and include, for example, D917A, E1006A, E1028A, D1227A, D1255A, N1257A, D917A, E1006A, E1028A, D1227A, D1255A, and N1257A, corresponding to amino acid positions in the RuvC domain of FnCas9p; or, for example, N580A, N584A, T587A, W609A, D610A, K613A, E614A, D616A, K624A, D625A, K627A, and Y629A, relative to the putative second nuclease domain described elsewhere herein.
В некоторых общих вариантах осуществления фермент DD-CRISPR ассоциирован с одним или несколькими функциональными доменами. В некоторых более конкретных вариантах осуществления фермент DD-CRISPR представляет собой нефункциональный Cas9 и/или ассоциирован с одним или несколькими функциональными доменами. В некоторых вариантах осуществления фермент DD-CRISPR содержит усечение, например, α-спирали или смешанной α/β вторичной структуры. В некоторых вариантах осуществления усечение предусматривает удаление или замещение линкером. В некоторых вариантах осуществления линкер является разветвленным или иным образом обеспечивает привязку DD и/или функционального домена. В некоторых вариантах осуществления фермент CRISPR ассоциирован с DD в форме белка слияния. В некоторых вариантах осуществления фермент CRISPR является слитым с DD. Другими словами, DD может быть ассоциирован с ферментом CRISPR путем слияния с указанным ферментом CRISPR. В некоторых вариантах осуществления фермент можно рассматривать как модифицированный фермент CRISPR, где фермент CRISPR слит по меньшей мере с одним доменом дестабилизации (DD). В некоторых вариантах осуществления DD может быть ассоциирован с ферментом CRISPR посредством соединительного белка, например, с использованием системы, такой как маркерная система, такая как стрептавидин-биотиновая система. Таким образом, предусмотрен продукт слияния фермента CRISPR с соединительным белком, специфическим в отношении высокоаффинного лиганда для такого соединителя, при этом DD связан с указанным высокоаффинным лигандом. Например, стрептавидин может быть соединителем, слитым с ферментом CRISPR, тогда как биотин может быть связан с DD. При совместной локализации стрептавидин будет связываться с биотином, соединяя, таким образом, фермент CRISPR с DD. Для простоты, продукт слияния фермента CRISPR и DD является предпочтительным в некоторых вариантах осуществления. В некоторых вариантах осуществления продукт слияния содержит линкер между DD и ферментом CRISPR. В некоторых вариантах осуществления слияние может происходить по N-концу фермента CRISPR. В некоторых вариантах осуществления по меньшей мере один DD сливается с N-концом фермента CRISPR. В некоторых вариантах осуществления слияние может происходить по С-концу фермента CRISPR. В некоторых вариантах осуществления по меньшей мере один DD сливается с С-концом фермента CRISPR. В некоторых вариантах осуществления один DD может быть слит с N-концом фермента CRISPR, а другой DD слит с C-концом фермента CRISPR. В некоторых вариантах осуществления фермент CRISPR ассоциирован по меньшей мере с двумя DD, и при этом первый DD слит с N-концом фермента CRISPR, а второй DD слит с C-концом фермента CRISPR, при этом первый и второй DD являются одинаковыми или разными. В некоторых вариантах осуществления слияние может происходить по N-концу DD. В некоторых вариантах осуществления слияние может происходить по С-концу DD. В некоторых вариантах осуществления слияние может происходить между С-концом фермента CRISPR и N-концом DD. В некоторых вариантах осуществления слияние может происходить между C-концом DD и N-концом фермента CRISPR. Меньший фон наблюдали с DD, содержащим по меньшей мере одно N-концевое слияние, чем с DD, содержащим по меньшей мере одно C-концевое слияние. Объединение N- и С-концевых слияний характеризовалось наименьшим фоном, но и наиболее низкой общей активностью. Преимущественно DD обеспечивается по меньшей мере одним N-концевым слиянием или по меньшей мере одним N-концевым слиянием плюс по меньшей мере одно C-концевое слияние. И, конечно же, DD может быть обеспечен по меньшей мере одним C-концевым слиянием.In some general embodiments, the DD-CRISPR enzyme is associated with one or more functional domains. In some more specific embodiments, the DD-CRISPR enzyme is a non-functional Cas9 and/or is associated with one or more functional domains. In some embodiments, the DD-CRISPR enzyme comprises a truncation, for example, of an α-helix or a mixed α/β secondary structure. In some embodiments, the truncation involves the removal or replacement of a linker. In some embodiments, the linker is branched or otherwise provides for the attachment of the DD and/or the functional domain. In some embodiments, the CRISPR enzyme is associated with the DD in the form of a fusion protein. In some embodiments, the CRISPR enzyme is fused to the DD. In other words, the DD can be associated with the CRISPR enzyme by fusion to said CRISPR enzyme. In some embodiments, the enzyme can be considered a modified CRISPR enzyme, wherein the CRISPR enzyme is fused to at least one destabilization domain (DD). In some embodiments, the DD may be associated with the CRISPR enzyme via a junction protein, for example, using a system such as a marker system such as the streptavidin-biotin system. Thus, a fusion product of the CRISPR enzyme with a junction protein specific for a high-affinity ligand for such a junction is provided, wherein the DD is linked to said high-affinity ligand. For example, streptavidin may be a junction fused to the CRISPR enzyme, while biotin may be linked to the DD. When co-localized, streptavidin will bind to biotin, thereby linking the CRISPR enzyme to the DD. For simplicity, a fusion product of a CRISPR enzyme and a DD is preferred in some embodiments. In some embodiments, the fusion product comprises a linker between the DD and the CRISPR enzyme. In some embodiments, the fusion may be at the N-terminus of the CRISPR enzyme. In some embodiments, at least one DD is fused to the N-terminus of the CRISPR enzyme. In some embodiments, the fusion may be at the C-terminus of the CRISPR enzyme. In some embodiments, at least one DD is fused to the C-terminus of the CRISPR enzyme. In some embodiments, one DD may be fused to the N-terminus of the CRISPR enzyme and another DD is fused to the C-terminus of the CRISPR enzyme. In some embodiments, the CRISPR enzyme is associated with at least two DDs, and wherein the first DD is fused to the N-terminus of the CRISPR enzyme and the second DD is fused to the C-terminus of the CRISPR enzyme, wherein the first and second DD are the same or different. In some embodiments, the fusion may be at the N-terminus of the DD. In some embodiments, the fusion may be at the C-terminus of the DD. In some embodiments, the fusion may be between the C-terminus of the CRISPR enzyme and the N-terminus of the DD. In some embodiments, the fusion may be between the C-terminus of the DD and the N-terminus of the CRISPR enzyme. Less background was observed with a DD containing at least one N-terminal fusion than with a DD containing at least one C-terminal fusion. The combination of N- and C-terminal fusions had the lowest background, but also the lowest overall activity. Preferably, a DD is provided by at least one N-terminal fusion or at least one N-terminal fusion plus at least one C-terminal fusion. And, of course, a DD may be provided by at least one C-terminal fusion.
В определенных вариантах осуществления дестабилизирующие белок домены, такие как для регуляции индуцированием, могут быть слиты с N-концом и/или C-концом, например, Cas9. Кроме того, дестабилизирующие домены могут быть введены в первичную последовательность, например, Cas9, в доступные для растворителя петли. С помощью компьютерного анализа первичной структуры нуклеаз Cas9 выявили три отличающихся участка. Первый, C-концевой RuvC-подобный домен, который является единственным охарактеризованным функциональным доменом. Второй, N-концевой альфа-спиральный участок, и третий, участок со смешанной альфа- и бета-структурой, расположенный между RuvC-подобным доменом и альфа-спиральным участком. Несколько небольших отрезков из неструктурированных участков прогнозируются в первичной структуре Cas9. Неструктурированные участки, которые доступны для растворителя и не являются консервативными среди разных ортологов Cas9, представляют собой предпочтительные стороны для разделений и вставок небольших белковых последовательностей. Кроме того, эти стороны можно использовать для создания химерных белков между ортологами Cas9.In certain embodiments, protein destabilizing domains, such as for induction regulation, can be fused to the N-terminus and/or C-terminus of, for example, Cas9. Additionally, destabilizing domains can be introduced into the primary sequence of, for example, Cas9, in solvent accessible loops. Computer analysis of the primary structure of Cas9 nucleases revealed three distinct regions. The first, a C-terminal RuvC-like domain, which is the only functional domain characterized. The second, an N-terminal alpha-helical region, and the third, a region with mixed alpha and beta structure located between the RuvC-like domain and the alpha-helical region. Several small stretches of unstructured regions are predicted in the primary structure of Cas9. Unstructured regions that are solvent accessible and are not conserved among different Cas9 orthologs represent preferred sites for separations and insertions of small protein sequences. Furthermore, these sides can be used to create chimeric proteins between Cas9 orthologs.
В некоторых вариантах осуществления DD представляет собой ER50. Соответствующий стабилизирующий лиганд для такого DD в некоторых вариантах осуществления представляет собой 4HT. Таким образом, в некоторых вариантах осуществления один из по меньшей мере одного DD представляет собой ER50, а стабилизирующий лиганд для него представляет собой 4HT или CMP8. В некоторых вариантах осуществления DD представляет собой DHFR50. Соответствующий стабилизирующий лиганд для такого DD в некоторых вариантах осуществления представляет собой TMP. Таким образом, в некоторых вариантах осуществления один из по меньшей мере одного DD представляет собой DHFR50, а стабилизирующий лиганд для него представляет собой TMP. В некоторых вариантах осуществления DD представляет собой ER50. Соответствующий стабилизирующий лиганд для такого DD в некоторых вариантах осуществления представляет собой CMP8. Следовательно, CMP8 может быть стабилизирующим лигандом, являющимся альтернативой 4HT в системе ER50. Хотя возможно, чтобы CMP8 и 4HT могли/должны были применяться конкурентным образом, некоторые типы клеток могут быть более восприимчивыми к одному или другому из этих двух лигандов, и на основании настоящего раскрытия и информации из уровня техники специалист сможет применять CMP8 и/или 4HT.In some embodiments, the DD is ER50. A corresponding stabilizing ligand for such DD is 4HT in some embodiments. Thus, in some embodiments, one of the at least one DD is ER50 and the stabilizing ligand for it is 4HT or CMP8. In some embodiments, the DD is DHFR50. A corresponding stabilizing ligand for such DD is TMP in some embodiments. Thus, in some embodiments, one of the at least one DD is DHFR50 and the stabilizing ligand for it is TMP. In some embodiments, the DD is ER50. A corresponding stabilizing ligand for such DD is CMP8 in some embodiments. Thus, CMP8 can be an alternative stabilizing ligand to 4HT in the ER50 system. While it is possible that CMP8 and 4HT could/should be used competitively, some cell types may be more responsive to one or the other of the two ligands, and based on the present disclosure and prior art information, one skilled in the art will be able to use CMP8 and/or 4HT.
В некоторых вариантах осуществления один или два DD могут быть слиты с N-концом фермента CRISPR, и один или два DD слиты с C-концом фермента CRISPR. В некоторых вариантах осуществления с ферментом CRISPR ассоциированы по меньшей мере два DD, и при этом DD являются одинаковыми DD, т.е. DD являются гомологичными. Таким образом, оба (или два или более) из DD могут быть DD ER50. Это является предпочтительным в некоторых вариантах осуществления. Альтернативно оба (или два или более) из DD могут быть DD DHFR50. Это также является предпочтительным в некоторых вариантах осуществления. В некоторых вариантах осуществления с ферментом CRISPR ассоциированы по меньшей мере два DD, и при этом DD являются разными DD, т.е. DD являются гетерологичными. Таким образом, один из DD может представлять собой ER50, тогда как один или несколько из DD или любых других DD могут представлять собой DHFR50. Наличие двух или более DD, которые являются гетерологичными, может быть предпочтительным, поскольку может обеспечивать больший уровень контроля разрушения. Тандемное слияние более чем одного DD на N- или C-конце может усиливать разрушение; и такое тандемное слияние может представлять собой, например, ER50-ER50-Cas9 или DHFR-DHFR-Cas9. Предусматривается, что высокие уровни разрушения могут наблюдаться в отсутствии обоих стабилизирующих лигандов, промежуточные уровни разрушения могут наблюдаться в отсутствии одного стабилизирующего лиганда и в присутствии другого (или иного) стабилизирующего лиганда, тогда как низкие уровни разрушения могут наблюдаться в присутствии обоих (или двух или более) стабилизирующих лигандов. Контроль также может быть обеспечен наличием N-концевого DD ER50 и C-концевого DD DHFR50.In some embodiments, one or two DDs may be fused to the N-terminus of the CRISPR enzyme, and one or two DDs are fused to the C-terminus of the CRISPR enzyme. In some embodiments, at least two DDs are associated with the CRISPR enzyme, and the DDs are the same DD, i.e., the DDs are homologous. Thus, both (or two or more) of the DDs may be DDs of ER50. This is preferred in some embodiments. Alternatively, both (or two or more) of the DDs may be DDs of DHFR50. This is also preferred in some embodiments. In some embodiments, at least two DDs are associated with the CRISPR enzyme, and the DDs are different DDs, i.e., the DDs are heterologous. Thus, one of the DDs may be ER50, while one or more of the DDs or any other DDs may be DHFR50. The presence of two or more DDs that are heterologous may be advantageous since it may provide a greater level of destruction control. Tandem fusion of more than one DD at the N- or C-terminus may enhance destruction; and such a tandem fusion may be, for example, ER50-ER50-Cas9 or DHFR-DHFR-Cas9. It is envisaged that high levels of destruction may be observed in the absence of both stabilizing ligands, intermediate levels of destruction may be observed in the absence of one stabilizing ligand and in the presence of the other (or different) stabilizing ligand, while low levels of destruction may be observed in the presence of both (or two or more) stabilizing ligands. Control may also be provided by the presence of the N-terminal DD of ER50 and the C-terminal DD of DHFR50.
В некоторых вариантах осуществления продукт слияния фермента CRISPR с DD содержит линкер между DD и ферментом CRISPR. В некоторых вариантах осуществления линкер представляет собой линкер GlySer. В некоторых вариантах осуществления фермент DD-CRISPR дополнительно содержит по меньшей мере один сигнал ядерного экспорта (NES). В некоторых вариантах осуществления фермент DD-CRISPR содержит два или более NES. В некоторых вариантах осуществления фермент DD-CRISPR содержит по меньшей мере один сигнал ядерной локализации (NLS). Он может присутствовать наряду с NES. В некоторых вариантах осуществления фермент CRISPR содержит, или состоит, по сути, из, или состоит из сигнала локализации (ядерного импорта или экспорта), в виде линкера между ферментом CRISPR и DD или его части. Метки HA или Flag также охватываются настоящим изобретением в качестве линкеров. Заявители применяют NLS и/или NES в качестве линкера, а также применяют глицин-сериновые линкеры как короткие GS до (GGGGS)3.In some embodiments, the fusion product of a CRISPR enzyme with a DD comprises a linker between the DD and the CRISPR enzyme. In some embodiments, the linker is a GlySer linker. In some embodiments, the DD-CRISPR enzyme further comprises at least one nuclear export signal (NES). In some embodiments, the DD-CRISPR enzyme comprises two or more NESs. In some embodiments, the DD-CRISPR enzyme comprises at least one nuclear localization signal (NLS). This may be present along with the NES. In some embodiments, the CRISPR enzyme comprises, or consists essentially of, or consists of a localization signal (nuclear import or export), as a linker between the CRISPR enzyme and the DD or a portion thereof. HA or Flag tags are also encompassed by the present invention as linkers. Applicants use NLS and/or NES as a linker, and also use glycine-serine linkers as short GS to (GGGGS) 3 .
В одном аспекте настоящего изобретения предусмотрен полинуклеотид, кодирующий фермент CRISPR и ассоциированный DD. В некоторых вариантах осуществления кодируемый фермент CRISPR и ассоциированный DD функционально связаны с первым регуляторным элементом. В некоторых вариантах осуществления DD также кодируется и функционально связан со вторым регуляторным элементом. Преимущественно DD согласно данному документу "зачищает" стабилизирующий лиганд, и, таким образом, он преимущественно является тем же DD (т.е. тем же типом домена), что и ассоциированный с ферментом, например, обсуждаемым в данном документе (при этом следует учитывать, что термин "зачистка" имеет значение, обсуждаемое в данном документе, а также может обеспечивать осуществление действия, с тем чтобы способствовать активности или завершать ее). С помощью зачистки стабилизирующего лиганда избытком DD, который не ассоциирован с ферментом CRISPR, будет наблюдаться большее разрушение фермента CRISPR. Без ограничения теорией предусматривается, что по мере добавления дополнительного или избыточного неассоциированного DD равновесие будет сдвигаться от образования комплекса со стабилизирующим лигандом или связывания с DD, ассоциированным с ферментом CRISPR, больше в направлении образования комплекса со стабилизирующим лигандом или связывания со свободным DD (т.е. который не ассоциирован с ферментом CRISPR). Таким образом, обеспечение избыточного или дополнительного неассоциированного (или свободного) DD является предпочтительным, если нужно снизить активность фермента CRISPR за счет усиленного разрушения фермента CRISPR. Избыток свободного DD связывается с остаточным лигандом, а также лишает лиганд возможности связываться с продуктом слияния DD-Cas. Поэтому, он ускоряет разрушение DD-Cas и усиливает временный контроль активности Cas. В некоторых вариантах осуществления первый регуляторный элемент представляет собой промотор и необязательно может включать энхансер. В некоторых вариантах осуществления второй регуляторный элемент представляет собой промотор и необязательно может включать энхансер. В некоторых вариантах осуществления первый регуляторный элемент представляет собой ранний промотор. В некоторых вариантах осуществления второй регуляторный элемент представляет собой поздний промотор. В некоторых вариантах осуществления второй регуляторный элемент представляет собой, или содержит, или состоит, по сути, из индуцируемого элемента контроля, необязательно системы tet, или репрессорного элемента контроля, необязательно системы tetr. Индуцируемый промотор может быть подходящим, например, rTTA, для индуцирования tet в присутствии доксициклина.In one aspect, the present invention provides a polynucleotide encoding a CRISPR enzyme and an associated DD. In some embodiments, the encoded CRISPR enzyme and the associated DD are operably linked to a first regulatory element. In some embodiments, the DD is also encoded and operably linked to a second regulatory element. Advantageously, the DD herein "stripping" the stabilizing ligand, and thus is advantageously the same DD (i.e., the same type of domain) as that associated with an enzyme, such as those discussed herein (it should be appreciated that the term "stripping" has the meaning discussed herein and can also provide an effect to promote or terminate activity). By stripping the stabilizing ligand with excess DD that is not associated with the CRISPR enzyme, greater degradation of the CRISPR enzyme will be observed. Without being limited by theory, it is contemplated that as additional or excess unassociated DD is added, the equilibrium will shift away from complexing with the stabilizing ligand or binding to the DD associated with the CRISPR enzyme and more toward complexing with the stabilizing ligand or binding to the free DD (i.e., which is not associated with the CRISPR enzyme). Thus, providing excess or additional unassociated (or free) DD is advantageous if CRISPR enzyme activity is to be reduced by enhancing CRISPR enzyme degradation. Excess free DD binds to the residual ligand and also deprives the ligand of the ability to bind to the DD-Cas fusion product. Therefore, it accelerates DD-Cas degradation and enhances temporal control of Cas activity. In some embodiments, the first regulatory element is a promoter and may optionally include an enhancer. In some embodiments, the second regulatory element is a promoter and may optionally include an enhancer. In some embodiments, the first regulatory element is an early promoter. In some embodiments, the second regulatory element is a late promoter. In some embodiments, the second regulatory element is, or comprises, or consists essentially of, an inducible control element, optionally a tet system, or a repressor control element, optionally a tetr system. The inducible promoter may be suitable, for example, rTTA, for inducing tet in the presence of doxycycline.
Прикрепление или ассоциация могут быть выполнены посредством линкера, например, гибкого глицин-серинового (GlyGlyGlySer) или (GGGS)3, или жесткого альфа-спирального линкера, такого как (Ala(GluAlaAlaAlaLys)Ala). Линкеры, такие как (GGGGS)3, предпочтительно используют в данном документе для отделения белковых или пептидных доменов. (GGGGS)3 является предпочтительным, поскольку он является относительно длинным линкером (15 аминокислот). Глициновые остатки являются наиболее гибкими, а сериновые остатки повышают вероятность того, что линкер будет находится на внешней стороне белка. (GGGGS)6, (GGGGS)9 или (GGGGS)12 предпочтительно можно использовать в качестве альтернатив. Другими предпочтительными альтернативами являются (GGGGS)1, (GGGGS)2, (GGGGS)4, (GGGGS)5, (GGGGS)7, (GGGGS)8, (GGGGS)10 или (GGGGS)11. Доступны альтернативные линкеры, но считается, что очень гибкие линкеры лучше обеспечивают максимальную возможность объединения двух 2 частей Cas и, таким образом, восстановления активности Cas. Одной альтернативой является то, что NLS нуклеоплазмина можно использовать в качестве линкера. Например, линкер также можно использовать между Cas и любым функциональным доменом. Опять-таки, в данном случае можно использовать линкер (GGGGS)3 (или его варианты с 6, 9 или 12 повторами) или можно использовать NLS нуклеоплазмина в качестве линкера между Cas и функциональным доменом.The attachment or association can be accomplished via a linker, such as a flexible glycine-serine (GlyGlyGlySer) or (GGGS) 3 , or a rigid alpha-helical linker such as (Ala(GluAlaAlaAlaLys)Ala). Linkers such as (GGGGS) 3 are preferably used herein to separate protein or peptide domains. (GGGGS) 3 is preferred because it is a relatively long linker (15 amino acids). Glycine residues are the most flexible, and serine residues increase the likelihood that the linker will be on the outside of the protein. (GGGGS) 6 , (GGGGS) 9 or (GGGGS) 12 can preferably be used as alternatives. Other preferred alternatives are (GGGGS) 1 , (GGGGS) 2 , (GGGGS) 4 , (GGGGS) 5 , (GGGGS) 7 , (GGGGS) 8 , (GGGGS) 10 or (GGGGS) 11 . Alternative linkers are available, but highly flexible linkers are thought to better maximize the possibility of combining the two 2 parts of Cas and thus reconstituting Cas activity. One alternative is that the nucleoplasmin NLS can be used as a linker. For example, a linker can also be used between Cas and any functional domain. Again, in this case, the (GGGGS) 3 linker (or its 6-, 9- or 12-repeat variants) can be used, or the nucleoplasmin NLS can be used as a linker between Cas and the functional domain.
В одном аспекте настоящего изобретения предусмотрены средства для доставки комплекса DD-CRISPR-Cas по настоящему изобретению или полинуклеотидов, обсуждаемых в данном документе, например, частица(частицы), доставляющая(доставляющие) компонент(компоненты) комплекса, вектор(векторы), содержащий(содержащие) полинуклеотид(полинуклеотиды), обсуждаемые в данном документе (например, кодирующие фермент CRISPR, DD; обеспечивающий РНК комплекса CRISPR-Cas). В некоторых вариантах осуществления вектором может быть плазмида или вирусный вектор, такой как AAV или лентивирус. Преимущественной может быть транзиентная трансфекция с помощью плазмид, например, клеток HEK, особенно с учетом ограничений по размеру для AAV и того, что, хотя Cas9 вмещается в AAV, в случае дополнительной кодирующей последовательности для ассоциации с DD может быть достигнут верхний предел.In one aspect of the present invention, there are provided means for delivering the DD-CRISPR-Cas complex of the present invention or the polynucleotides discussed herein, such as a particle(s) delivering the component(s) of the complex, a vector(s) comprising the polynucleotide(s) discussed herein (e.g., encoding the CRISPR enzyme, DD; providing the RNA of the CRISPR-Cas complex). In some embodiments, the vector may be a plasmid or a viral vector, such as AAV or lentivirus. Transient transfection with plasmids, such as HEK cells, may be advantageous, especially given the size limitations of AAV and that, although Cas9 fits into AAV, an upper limit may be reached in the case of additional coding sequence for association with DD.
Также предусмотрена модель, которая конститутивно экспрессирует фермент CRISPR и ассоциированный DD. Организм может быть трансгенным и может быть трансфицирован с помощью векторов по настоящему изобретению или может быть потомством организма, трансфицированного таким образом. В дополнительном аспекте настоящего изобретения предусмотрены композиции, содержащие фермент CRISPR и ассоциированный DD, или полинуклеотиды, или векторы, описываемые в данном документе. Также предусмотрены системы CRISPR-Cas, содержащие направляющие РНК.Also provided is a model that constitutively expresses a CRISPR enzyme and an associated DD. The organism may be transgenic and may be transfected with the vectors of the present invention or may be the progeny of an organism so transfected. In a further aspect, the present invention provides compositions comprising a CRISPR enzyme and an associated DD, or polynucleotides or vectors described herein. Also provided are CRISPR-Cas systems comprising guide RNAs.
Также предусмотрен способ лечения субъекта, например, субъекта, нуждающегося в этом, включающий индуцирование редактирования генов путем трансформации субъекта с помощью полинуклеотида, кодирующего систему, или любого из векторов согласно настоящему изобретению и введение субъекту стабилизирующего лиганда. Также может предусматриваться подходящая матрица для репарации, например, доставляемая вектором, содержащим указанную матрицу для репарации. Также предусмотрен способ лечения субъекта, например, субъекта, нуждающегося в этом, включающий индуцирование активации или репрессии транскрипции путем трансформации субъекта с помощью полинуклеотида, кодирующего систему согласно настоящему изобретению, или любого из векторов согласно настоящему изобретению, где указанные полинуклеотид или вектор кодируют или содержат каталитически неактивный фермент CRISPR и один или несколько ассоциированных с ним функциональных доменов; при этом способ дополнительно включает введение субъекту стабилизирующего лиганда. Эти способы также могут включать доставку и/или обеспечение экспрессии избыточного DD у субъекта. В случае осуществления какой-либо обработки ex vivo, например, в культуре клеток, следует понимать, что термин "субъект" можно заменить фразой "клетка или культура клеток".Also provided is a method of treating a subject, for example a subject in need thereof, comprising inducing gene editing by transforming the subject with a polynucleotide encoding the system or any of the vectors of the present invention and administering a stabilizing ligand to the subject. Also provided may be a suitable repair template, for example delivered by a vector comprising said repair template. Also provided is a method of treating a subject, for example a subject in need thereof, comprising inducing transcriptional activation or repression by transforming the subject with a polynucleotide encoding the system of the present invention or any of the vectors of the present invention, wherein said polynucleotide or vector encodes or comprises a catalytically inactive CRISPR enzyme and one or more functional domains associated therewith; wherein the method further comprises administering a stabilizing ligand to the subject. These methods may also comprise delivering and/or providing expression of excess DD in the subject. In the event that any processing is carried out ex vivo, for example in cell culture, it should be understood that the term "subject" may be replaced by the phrase "cell or cell culture".
Также предусмотрены композиции, содержащие систему согласно настоящему изобретению, для применения в указанном способе лечения. Отдельная композиция может содержать стабилизирующий лиганд. Может предусматриваться набор из частей, включающих такие композиции. Также предусмотрено применение системы согласно настоящему изобретению в изготовлении лекарственного препарата для таких способов лечения. В настоящем изобретении также предусмотрено применение системы согласно настоящему изобретению в скрининге, например, скринингах в отношении мутации приобретения функции. Клетки, в которых искусственным путем обеспечивают сверхэкспрессию гена, могут снижать экспрессию гена с течением времени (восстановление равновесия), например, с помощью отрицательных обратных связей. К моменту начала скрининга уровень экспрессии нерегулируемого гена снова может быть снижен. Применение индуцируемого активатора Cas9 позволяет индуцировать транскрипцию непосредственно перед скринингом и тем самым сводит к минимуму вероятность ложноотрицательных соответствий. Соответственно, путем применения настоящего изобретения в скрининге, например, скринингах в отношении мутации приобретения функции, вероятность ложноотрицательных результатов может быть сведена к минимуму.Also provided are compositions comprising the system of the present invention for use in said method of treatment. A single composition may comprise a stabilizing ligand. A kit of parts comprising such compositions may be provided. Also provided is the use of the system of the present invention in the manufacture of a medicament for such methods of treatment. The present invention also provides the use of the system of the present invention in screening, for example, screens for a gain-of-function mutation. Cells in which a gene is artificially overexpressed may decrease gene expression over time (re-equilibration), for example, by negative feedback. By the time the screening begins, the expression level of the unregulated gene may be reduced again. The use of an inducible Cas9 activator allows transcription to be induced immediately before screening, thereby minimizing the likelihood of false negative matches. Accordingly, by using the present invention in screening, for example, screens for a gain-of-function mutation, the likelihood of false negative results can be minimized.
В одном аспекте настоящего изобретения предусмотрена сконструированная, не встречающаяся в природе система CRISPR-Cas, содержащая белок Cas и направляющую РНК, которая нацеливается на молекулу ДНК, кодирующую продукт гена в клетке, в результате чего направляющая РНК нацеливается на молекулу ДНК, кодирующую продукт гена, а белок Cas расщепляет молекулу ДНК, кодирующую продукт гена, в результате чего экспрессия продукта гена изменяется; и где белок Cas и направляющая РНК не встречаются в природе вместе. Настоящее изобретение охватывает направляющую РНК, предусматривающую направляющую последовательность, слитую с tracr-последовательностью. В одном варианте осуществления настоящего изобретения белок Cas представляет собой белок Cas9. Настоящее изобретение дополнительно охватывает кодирование белка Cas, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающего, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной.In one aspect, the present invention provides an engineered, non-naturally occurring CRISPR-Cas system comprising a Cas protein and a guide RNA that targets a DNA molecule encoding a gene product in a cell, whereby the guide RNA targets the DNA molecule encoding the gene product, and the Cas protein cleaves the DNA molecule encoding the gene product, whereby expression of the gene product is altered; and wherein the Cas protein and the guide RNA do not occur together in nature. The present invention encompasses a guide RNA that includes a guide sequence fused to a tracr sequence. In one embodiment, the Cas protein is Cas9. The present invention further encompasses encoding a Cas protein that is codon-optimized for expression in a eukaryotic cell. In a preferred embodiment, the eukaryotic cell is a mammalian cell, and in a more preferred embodiment, the mammalian cell is a human cell. In a further embodiment of the present invention, expression of the gene product is reduced.
Если функциональные домены и подобные "ассоциированы" с одной или другой частью фермента, то они, как правило, являются продуктами слияния. Термин "связанный с" используется в данном документе в отношении того, как одна молекула "связывается" по отношению к другой, например, между частями фермента CRISPR и функциональным доменом. Эти два можно считать привязанными друг к другу. В случае таких белок-белковых взаимодействий эту ассоциацию можно рассматривать с точки зрения распознавания как распознавание антителом эпитопа. Альтернативно один белок может быть ассоциирован с другим белком посредством слияния обоих, например, одна субъединица является слитой с другой субъединицей. Слияние обычно происходит путем добавления одной аминокислотной последовательности к другой, например, посредством сплайсинга нуклеотидных последовательностей, которые кодируют каждый белок или субъединицу. Альтернативно, по сути, это можно рассматривать как связывание двух молекул или прямую связь, например, белок слияния. В любом случае слитый белок может включать линкер между двумя представляющими интерес субъединицами (например, между ферментом и функциональным доменом или между адаптерным белком и функциональным доменом). Таким образом, в некоторых вариантах осуществления часть фермента CRISPR ассоциирована с функциональным доменом за счет связывания с ним. В других вариантах осуществления фермент CRISPR ассоциирован с функциональным доменом ввиду того, что двое слиты вместе необязательно посредством промежуточного линкера. Примеры линкеров включают линкеры GlySer, обсуждаемые в данном документе. Тогда как не связанный ковалентной связью DD может инициировать разрушение ассоциированного Cas (например, Cas9), разрушение протеасомами предусматривает раскручивание цепи белка; и слияние является предпочтительным, поскольку оно может обеспечивать, чтобы DD оставался присоединенным к Cas при разрушении. Однако фермент CRISPR и DD сводятся вместе в присутствии стабилизирующего лиганда, специфического для DD, образуя стабилизационный комплекс. Этот комплекс содержит стабилизирующий лиганд, связанный с DD. Комплекс также содержит DD, ассоциированный с ферментом CRISPR. В отсутствии указанного стабилизирующего лиганда обеспечивается разрушение DD и ассоциированного с ним фермента CRISPR.When functional domains and the like are "associated" with one or another part of an enzyme, they are typically fusion products. The term "associated with" is used herein to refer to how one molecule "binds" to another, such as between parts of a CRISPR enzyme and a functional domain. The two can be thought of as being tethered to each other. In the case of such protein-protein interactions, this association can be thought of in terms of recognition, such as an antibody recognizing an epitope. Alternatively, one protein can be associated with another protein by a fusion of the two, such as one subunit being fused to another subunit. Fusion typically occurs by adding one amino acid sequence to another, such as by splicing the nucleotide sequences that encode each protein or subunit. Alternatively, it can be thought of as essentially a linkage between the two molecules, or a direct linkage, such as a fusion protein. In any case, the fusion protein may include a linker between the two subunits of interest (e.g., between the enzyme and the functional domain, or between the adapter protein and the functional domain). Thus, in some embodiments, a portion of the CRISPR enzyme is associated with the functional domain by binding thereto. In other embodiments, the CRISPR enzyme is associated with the functional domain by the two being fused together, optionally through an intervening linker. Examples of linkers include the GlySer linkers discussed herein. While a non-covalently linked DD can initiate the degradation of an associated Cas (e.g., Cas9), degradation by the proteasome involves unwinding the protein chain; and fusion is preferred because it can ensure that the DD remains attached to the Cas during degradation. However, the CRISPR enzyme and DD are brought together in the presence of a stabilizing ligand specific for the DD, forming a stabilization complex. This complex contains a stabilizing ligand bound to the DD. The complex also contains a DD associated with the CRISPR enzyme. In the absence of this stabilizing ligand, the DD and its associated CRISPR enzyme are destroyed.
Дестабилизирующие домены являются универсальными для придания нестабильности широкому диапазону белков; см., например, Miyazaki, J Am Chem Soc. Mar 7, 2012; 134(9): 3942-3945, включенную в данный документ посредством ссылки. CMP8 или 4-гидрокситамоксифен могут представлять собой дестабилизирующие домены. В более широком смысле, термочувствительный мутант DHFR млекопитающих (DHFRts), дестабилизирующий остаток по правилу N-конца, как оказалось, стабилен при пермиссивной температуре, но нестабилен при 37°C. Добавление метотрексата, высокоаффинного лиганда для DHFR млекопитающих, к клеткам, экспрессирующим DHFRts, частично ингибировало разложение белка. Это было важным доказательством того, что низкомолекулярный лиганд может стабилизировать белок, в ином случае предназначеный для разложения в клетках. Производное рапамицина применяли для стабилизации нестабильного мутанта домена FRB в mTOR (FRB*) и восстановления функция слитой киназы, GSK-3β.6,7. Эта система продемонстрировала, что зависимая от лиганда стабильность является привлекательной стратегией для регуляции функции специфического белка в сложной биологической среде. Система для контроля активности белка может включать DD, становящийся функциональным при возникновении комплементации убиквитина с помощью индуцированной рапамицином димеризации белка, связывающего FK506, и FKBP12. Можно сконструировать мутантов FKBP12 человека или белка ecDHFR, которые будут метаболически нестабильны в отсутствии их высокоаффинных лигандов, Shield-1 или триметоприма (TMP) соответственно. Эти мутанты представляют собой некоторые из возможных дестабилизирующих доменов (DD), применимых при осуществлении настоящего изобретения на практике, и нестабильность DD в виде слияния с ферментом CRISPR обеспечивает разрушение белка CRISPR в виде полного слитого белка под действием протеасомы. Shield-1 и TMP связывают и стабилизируют DD дозозависимым образом. Домен связывания лиганда эстрогенового рецептора (ERLBD, остатки 305-549 в ERS1) также может быть сконструирован как дестабилизирующий домен. Поскольку сигнальный путь эстрогенового рецептора вовлечен в ряд заболеваний, таких как рак молочной железы, этот путь был широко изучен, и были разработаны многочисленные агонисты и антагонисты эстрогенового рецептора. Таким образом, известны совместимые пары ERLBD и лекарственных средств. Существуют лиганды, которые связываются с мутантой формой, а не формой дикой типа ERLBD. Путем применения одного из этих мутантных доменов, кодирующих три мутации (L384M, M421G, G521R)12, возможно регулировать стабильность DD, происходящего из ERLBD, с применением лиганда, который не нарушает эндогенные сети, чувствительные к эстрогену. Дополнительная мутация (Y537S) может быть введена для дополнительной дестабилизации ERLBD и для конфигурации его в качестве потенциального кандидата DD. Такой тетра-мутант является предпочтительной разработкой DD. Мутант ERLBD может быть слит с ферментом CRISPR, и его стабильность можно регулировать или нарушать с применением лиганда, при условии, что фермент CRISPR имеет DD. Другим DD может быть метка размером 12 кДа (107 аминокислот) на основе мутированного белка FKBP, стабилизируемого лигандом Shield1; см., например, Nature Methods 5, (2008). Например, DD может представлять собой модифицированный связывающий FK506 белок 12 (FKBP12), который связывается и обратимо стабилизируется синтетической биологически инертной малой молекулой Shield-1; см., например, Banaszynski LA, Chen LC, Maynard-Smith LA, Ooi AG, Wandless TJ. A rapid, reversible, and tunable method to regulate protein function in living cells using synthetic small molecules. Cell. 2006;126:995-1004; Banaszynski LA, Sellmyer MA, Contag CH, Wandless TJ, Thorne SH. Chemical control of protein stability and function in living mice. Nat Med. 2008;14:1123-1127; Maynard-Smith LA, Chen LC, Banaszynski LA, Ooi AG, Wandless TJ. A directed approach for engineering conditional protein stability using biologically silent small molecules. The Journal of biological chemistry. 2007;282:24866-24872; и Rodriguez, Chem Biol. Mar 23, 2012; 19(3): 391-398, все из которых включены в данный документ посредством ссылки и могут быть использованы при осуществлении настоящего изобретения на практике в выборе DD для ассоциации с ферментом CRISPR для осуществления настоящего изобретения на практике. Как можно видеть, информация из уровня техники включает целый ряд DD, и DD можно ассоциировать с ферментом CRISPR, например, сливать преимущественно с помощью линкера, в результате чего DD можно стабилизировать в присутствии лиганда, а в случае его отсутствия DD может становиться дестабилизированным, в результате чего полностью дестабилизируется фермент CRISPR, или DD может быть стабилизированным в отсутствие лиганда, а когда лиганд присутствует DD может становиться дестабилизированным; при этом DD обеспечивает возможность регуляции и контроля фермента CRISPR и, следовательно, комплекса или системы CRISPR-Cas - условно говоря, включение или выключение, с обеспечением тем самым средства для регуляции или контроля системы, например, в in vivo или in vitro окружении. Например, если представляющий интерес белок экспрессируется в виде продукта слияния с меткой DD, то он дестабилизируется и быстро разлагается в клетке, например, с помощью протеасом. Таким образом, отсутствие стабилизирующего лиганда приводит к разрушению Cas, ассоциированного с DD. Если с представляющим интерес белком сливают новый DD, его нестабильность предается представляющему интерес белку, что приводит к быстрому разрушению всего слитого белка. Пиковая активность Cas иногда выгодна для снижения нецелевых эффектов. Таким образом, короткие всплески высокой активности являются предпочтительными. Настоящее изобретение может обеспечивать такие пики. В некотором смысле система является индуцируемой. В некотором другом смысле система подвергается репрессии в отсутствие стабилизирующего лиганда и вновь активируется в присутствии стабилизирующего лиганда. Не вдаваясь в теорию и не давая каких-либо обещаний, другие преимущества настоящего изобретения могут включать следующие:Destabilizing domains are versatile in conferring instability to a wide range of proteins; see, e.g., Miyazaki, J Am Chem Soc. Mar 7, 2012; 134(9): 3942–3945, incorporated herein by reference. CMP8 or 4-hydroxytamoxifen may represent destabilizing domains. More broadly, a temperature-sensitive mutant of mammalian DHFR (DHFRts) that destabilizes an N-end rule residue was found to be stable at the permissive temperature but unstable at 37°C. Addition of methotrexate, a high-affinity ligand for mammalian DHFR, to cells expressing DHFRts partially inhibited protein degradation. This was important evidence that a small molecule ligand can stabilize a protein otherwise destined for degradation in cells. A rapamycin derivative was used to stabilize an unstable mutant of the FRB domain of mTOR (FRB*) and restore the function of the fusion kinase, GSK-3β.6,7 This system demonstrated that ligand-dependent stability is an attractive strategy for regulating specific protein function in complex biological environments. The system for controlling protein activity could involve a DD that becomes functional upon ubiquitin complementation via rapamycin-induced dimerization of FK506 binding protein and FKBP12. Mutants of human FKBP12 or ecDHFR could be engineered to be metabolically unstable in the absence of their high-affinity ligands, Shield-1 or trimethoprim (TMP), respectively. These mutants represent some of the possible destabilizing domains (DDs) useful in practicing the present invention, and the instability of the DD as a fusion with the CRISPR enzyme ensures that the CRISPR protein as a complete fusion protein is degraded by the proteasome. Shield-1 and TMP bind and stabilize the DD in a dose-dependent manner. The estrogen receptor ligand binding domain (ERLBD, residues 305-549 in ERS1) can also be engineered as a destabilizing domain. Since the estrogen receptor signaling pathway is involved in a number of diseases such as breast cancer, this pathway has been extensively studied and numerous estrogen receptor agonists and antagonists have been developed. Thus, compatible pairs of ERLBD and drugs are known. There are ligands that bind to the mutant form and not to the wild-type form of the ERLBD. By using one of these mutant domains encoding three mutations (L384M, M421G, G521R)12, it is possible to regulate the stability of the ERLBD-derived DD using a ligand that does not disrupt endogenous estrogen-responsive networks. An additional mutation (Y537S) can be introduced to further destabilize the ERLBD and configure it as a potential DD candidate. Such a tetra-mutant is the preferred DD design. The ERLBD mutant can be fused to a CRISPR enzyme and its stability can be regulated or disrupted using a ligand, provided that the CRISPR enzyme has a DD. Another DD could be a 12 kDa (107 amino acids) tag based on the mutated FKBP protein stabilized by the Shield1 ligand; see, e.g., Nature Methods 5, (2008). For example, DD can be a modified FK506 binding protein 12 (FKBP12) that binds to and is reversibly stabilized by the synthetic biologically inert small molecule Shield-1; see, e.g., Banaszynski LA, Chen LC, Maynard-Smith LA, Ooi AG, Wandless TJ. A rapid, reversible, and tunable method to regulate protein function in living cells using synthetic small molecules. Cell. 2006;126:995–1004; Banaszynski LA, Sellmyer MA, Contag CH, Wandless TJ, Thorne SH. Chemical control of protein stability and function in living mice. Nat Med. 2008;14:1123–1127; Maynard-Smith LA, Chen LC, Banaszynski LA, Ooi AG, Wandless TJ. A directed approach for engineering conditional protein stability using biologically silent small molecules. The Journal of biological chemistry. 2007;282:24866-24872; and Rodriguez, Chem Biol. Mar 23, 2012; 19(3):391-398, all of which are incorporated herein by reference and can be used in the practice of the present invention in selecting a DD to associate with a CRISPR enzyme to practice the present invention. As can be seen, the prior art includes a variety of DDs, and the DD can be associated with a CRISPR enzyme, for example, fused preferably via a linker, whereby the DD can be stabilized in the presence of a ligand, and in its absence, the DD can become destabilized, resulting in a completely destabilized CRISPR enzyme, or the DD can be stabilized in the absence of a ligand, and when the ligand is present, the DD can become destabilized; wherein the DD enables the regulation and control of the CRISPR enzyme and hence the CRISPR-Cas complex or system - figuratively speaking, turning it on or off, thereby providing a means for regulating or controlling the system, for example, in an in vivo or in vitro environment. For example, if a protein of interest is expressed as a fusion product with a DD tag, it is destabilized and rapidly degraded in the cell, for example, by the proteasome. Thus, the absence of a stabilizing ligand leads to the destruction of Cas associated with the DD. If a new DD is fused to the protein of interest, its instability is transferred to the protein of interest, which leads to the rapid destruction of the entire fused protein. Spikes of Cas activity are sometimes advantageous in reducing off-target effects. Thus, short bursts of high activity are advantageous. The present invention can provide such peaks. In some sense, the system is inducible. In some other sense, the system is repressed in the absence of a stabilizing ligand and reactivated in the presence of a stabilizing ligand. Without going into theory or making any promises, other advantages of the present invention may include the following:
дозируемость (в отличие от системы, которая "включается" или "выключается", например, можно обеспечивать переменную активность системы или комплекса CRISPR-Cas);dosability (as opposed to a system that is “switched on” or “switched off”, for example, it is possible to provide variable activity of the CRISPR-Cas system or complex);
ортогональность, например, лиганд влияет только на его когнатный DD, так что две или более систем могут функционировать независимо, и/или ферменты CRISPR могут быть от одного или нескольких ортологов;orthogonality, e.g. a ligand only affects its cognate DD, so two or more systems can function independently, and/or CRISPR enzymes can be from one or more orthologs;
транспортируемость, например, может работать в разных типах клеток или линиях клеток;transportability, for example, can work across different cell types or cell lines;
быстрота;rapidity;
временный контроль;temporary control;
способность снижать фоновую или нецелевую токсичность Cas или избыточное накопление Cas путем обеспечения разрушения Cas.the ability to reduce background or non-target Cas toxicity or excess Cas accumulation by promoting Cas destruction.
Хотя DD может находиться на N- и/или C-конце(концах) фермента CRISPR, в том числе DD на одной или нескольких сторонах разделения (как определяется в других разделах данного документа), например, Cas9(N)-линкер-DD-линкер-Cas9(C) также является способом введения DD. В некоторых вариантах осуществления, если используется только одна концевая ассоциация DD с ферментом CRISPR, подлежащим использованию, то предпочтительно использовать ER50 в качестве DD. В некоторых вариантах осуществления, если используются как N-конец, так и C-конец, то предпочтительно использовать ER50 и/или DHFR50. Особенно хорошие результаты наблюдали с N-концевым слиянием, что было удивительным. Наличие как N-концевого, так и C-концевого слияния может быть синергическим. Размер домена дестабилизации варьирует, но, как правило, составляет от примерно 100 до примерно 300 аминокислот. DD предпочтительно представляет собой сконструированный дестабилизирующий белок домен. DD и способы получения DD, например, из высокоаффинного лиганда и его связывающего лиганд домена. Настоящее изобретение можно считать "ортогональным", поскольку только специфический лиганд будет стабилизировать соответствующий ему (когнатный) DD, при этом он не будет влиять на стабильность некогнатных DD. Коммерчески доступной системой DD является система CloneTech, ProteoTuner™; стабилизирующим лигандом является Shield1.Although the DD may be at the N- and/or C-terminus(es) of the CRISPR enzyme, including DDs at one or more sides of a split (as defined elsewhere herein), for example, Cas9(N)-linker-DD-linker-Cas9(C) is also a way to introduce a DD. In some embodiments, if only one terminal association of the DD is used with the CRISPR enzyme to be used, then it is preferable to use ER50 as the DD. In some embodiments, if both the N-terminus and C-terminus are used, then it is preferable to use ER50 and/or DHFR50. Particularly good results were observed with the N-terminal fusion, which was surprising. Having both an N-terminal and a C-terminal fusion can be synergistic. The size of the destabilization domain varies, but is typically from about 100 to about 300 amino acids. The DD is preferably an engineered protein destabilizing domain. DDs and methods for producing DDs, for example, from a high affinity ligand and its ligand binding domain. The present invention can be considered "orthogonal" because only a specific ligand will stabilize its corresponding (cognate) DD, while it will not affect the stability of non-cognate DDs. A commercially available DD system is the CloneTech, ProteoTuner™ system; the stabilizing ligand is Shield1.
В некоторых вариантах осуществления стабилизирующий лиганд представляет собой "малую молекулу". В некоторых вариантах осуществления стабилизирующий лиганд способен проникать в клетку. Он характеризуется высокой аффинностью к соответствующему ему DD. Подходящие пары DD-стабилизирующий лиганд известны из уровня техники. В целом, стабилизирующий лиганд может быть удален с помощью:In some embodiments, the stabilizing ligand is a "small molecule". In some embodiments, the stabilizing ligand is cell-permeable. It has a high affinity for its corresponding DD. Suitable DD-stabilizing ligand pairs are known in the art. In general, the stabilizing ligand can be removed by:
естественной обработки (например, разрушения протеасомами), например, in vivo;natural processing (e.g. degradation by proteasomes), e.g. in vivo;
зачистки, например, ex vivo/в культуре клеток, путемclearing, for example, ex vivo/in cell culture, by
обеспечения предпочтительного партнера по связыванию илиproviding a preferred bonding partner or
обеспечения субстрата XS (DD без Cas).providing XS substrate (DD without Cas).
В другом аспекте настоящего изобретения предусмотрена сконструированная, не встречающаяся в природе векторная система, содержащая один или несколько векторов, содержащих первый регуляторный элемент, функционально связанный с направляющей РНК системы CRISPR-Cas, которая нацеливается на молекулу ДНК, кодирующую продукт гена, и второй регуляторный элемент, функционально связанный с белком DD-Cas. Компоненты (a) и (b) могут быть расположены в одном и том же или разных векторах системы. Направляющая РНК нацеливается на молекулу ДНК, кодирующую продукт гена в клетке, а белок DD-Cas может расщеплять молекулу ДНК, кодирующую продукт гена (он может расщеплять одну или обе нити или фактически не проявлять нуклеазную активность), в результате чего экспрессия продукта гена изменяется; и где белок DD-Cas и направляющая РНК не встречаются в природе вместе. В одном варианте осуществления настоящего изобретения белок DD-Cas представляет собой белок DD-Cas9. Настоящее изобретение дополнительно охватывает кодирование белка DD-Cas, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающего, и в более предпочтительном варианте осуществления клетка млекопитающего является клеткой человека. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной.In another aspect of the present invention, there is provided an engineered, non-naturally occurring vector system comprising one or more vectors comprising a first regulatory element operably linked to a guide RNA of the CRISPR-Cas system that targets a DNA molecule encoding a gene product, and a second regulatory element operably linked to a DD-Cas protein. Components (a) and (b) can be located in the same or different vectors of the system. The guide RNA targets a DNA molecule encoding a gene product in a cell, and the DD-Cas protein can cleave the DNA molecule encoding the gene product (it can cleave one or both strands or exhibit virtually no nuclease activity), resulting in altered expression of the gene product; and wherein the DD-Cas protein and the guide RNA do not occur together in nature. In one embodiment of the present invention, the DD-Cas protein is a DD-Cas9 protein. The present invention further encompasses encoding a DD-Cas protein that is codon-optimized for expression in a eukaryotic cell. In a preferred embodiment, the eukaryotic cell is a mammalian cell, and in a more preferred embodiment, the mammalian cell is a human cell. In a further embodiment, the expression of the gene product is reduced.
В одном аспекте настоящего изобретения предусмотрена векторная система, содержащая один или несколько векторов. В некоторых вариантах осуществления система содержит: (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше или ниже (в зависимости от того, что является подходящим) последовательности прямого повтора, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса DD-CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент DD-CRISPR в комплексе с направляющей последовательностью, которая гибридизируется с целевой последовательностью; и (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, которая кодирует указанный фермент DD-CRISPR, содержащий по меньшей мере одну последовательность ядерной локализации и/или по меньшей мере одну NES; где компоненты (a) и (b) находятся в одном и том же или разных векторах системы. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса DD-CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления комплекс DD-CRISPR содержит одну или несколько последовательностей ядерной локализации и/или одну или несколько NES, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного комплекса CRISPR в обнаруживаемом количестве в ядре эукариотической клетки или за его пределами. Не вдаваясь в теорию полагают, что последовательность ядерной локализации и/или NES не является необходимой для активности комплекса DD-CRISPR у эукариот, но включение таких последовательностей повышает активность системы, особенно в отношении нацеливания на молекулы нуклеиновой кислоты в ядре и/или молекулы за пределами ядра. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой DD-Cas9. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой фермент DD-Cas9. В некоторых вариантах осуществления фермент DD-Cas9 получен из Cas9 Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens или Porphyromonas macacae (например, Cas9 одного из этих организмов, модифицированный так, что он имеет по меньшей мере один DD или имеет способность к ассоциации с ним) и может включать дополнительные мутации или изменения или может представлять собой химерный Cas9. Фермент может быть гомологом или ортологом DD-Cas9. В некоторых вариантах осуществления фермент DD-CRISPR является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент DD-CRISPR управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления фермент DD-CRISPR не обладает активностью расщепления нитей ДНК. В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления длина направляющей последовательности составляет по меньшей мере 16, 17, 18, 19, 20, 25 нуклеотидов, или 16-30, или 16-25, или 16-20 нуклеотидов. В целом и на протяжении данного описания термин "вектор" обозначает молекулу нуклеиновой кислоты, способную переносить другую нуклеиновую кислоту, с которой она была связана. Векторы включают без ограничения молекулы нуклеиновой кислоты, которые являются однонитевыми, двухнитевыми или частично двухнитевыми; молекулы нуклеиновой кислоты, которые содержат один или несколько свободных концов, не содержат свободных концов (например, кольцевые); молекулы нуклеиновой кислоты, которые содержат ДНК, РНК или и ту, и другую; и другие разновидности полинуклеотидов, известные из уровня техники. Одним типом вектора является "плазмида", которая означает кольцевую петлю двухнитевой ДНК, в которую можно встраивать дополнительные сегменты ДНК, как, например, с помощью стандартных методик молекулярного клонирования. Другим типом вектора является вирусный вектор, где полученные из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (например, ретровирусы, ретровирусы с дефектной системой репликации, аденовирусы, аденовирусы с дефектной системой репликации и аденоассоциированные вирусы). Вирусные векторы также включают полинуклеотиды, переносимые вирусом для трансфекции в клетку-хозяина. Определенные векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы с бактериальной точкой начала репликации и эписомные векторы для млекопитающих). Другие векторы (например, векторы для млекопитающих, отличные от эписомных) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и, таким образом, реплицируются вместе с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы в данном документе обозначены как "векторы экспрессии". Общепринятые пригодные для методик рекомбинантной ДНК векторы экспрессии часто находятся в форме плазмид.In one aspect of the present invention, a vector system is provided, comprising one or more vectors. In some embodiments, the system comprises: (a) a first regulatory element operably linked to a direct repeat sequence and one or more insertion sites for inserting one or more guide sequences upstream or downstream (as appropriate) of the direct repeat sequence, wherein upon expression, the guide sequence directs sequence-specific binding of a DD-CRISPR complex to a target sequence in a eukaryotic cell, wherein the CRISPR complex comprises a DD-CRISPR enzyme in complex with a guide sequence that hybridizes to the target sequence; and (b) a second regulatory element operably linked to an enzyme-coding sequence that encodes said DD-CRISPR enzyme, comprising at least one nuclear localization sequence and/or at least one NES; wherein components (a) and (b) are in the same or different vectors of the system. If applicable, a tracr sequence may also be provided. In some embodiments, component (a) further comprises two or more guide sequences operably linked to the first regulatory element, wherein when expressed, each of the two or more guide sequences directs sequence-specific binding of the DD-CRISPR complex to its target sequence in a eukaryotic cell. In some embodiments, the DD-CRISPR complex comprises one or more nuclear localization sequences and/or one or more NESs that are sufficiently efficient to direct accumulation of said CRISPR complex in a detectable amount in or outside the nucleus of a eukaryotic cell. Without being bound by theory, it is believed that the nuclear localization sequence and/or NES are not necessary for the activity of the DD-CRISPR complex in eukaryotes, but the inclusion of such sequences enhances the activity of the system, particularly with respect to targeting nucleic acid molecules in the nucleus and/or molecules outside the nucleus. In some embodiments, the DD-CRISPR enzyme is DD-Cas9. In some embodiments, the DD-CRISPR enzyme is a DD-Cas9 enzyme. In some embodiments, the DD-Cas9 enzyme is derived from Cas9 Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens, or Porphyromonas macacae (e.g., Cas9 from one of these organisms modified to have or have the ability to associate with at least one DD) and may include additional mutations or changes or may be a chimeric Cas9. The enzyme may be a homolog or ortholog of DD-Cas9. In some embodiments, the DD-CRISPR enzyme is codon-optimized for expression in a eukaryotic cell. In some embodiments, the DD-CRISPR enzyme directs cleavage of one or both strands at a specific position in a target sequence. In some embodiments, the DD-CRISPR enzyme does not have DNA strand cleavage activity. In some embodiments, the first regulatory element is a polymerase III promoter. In some embodiments, the second regulatory element is a polymerase II promoter. In some embodiments, the length of the guide sequence is at least 16, 17, 18, 19, 20, 25 nucleotides, or 16-30, or 16-25, or 16-20 nucleotides. Generally and throughout this specification, the term "vector" refers to a nucleic acid molecule capable of transferring another nucleic acid to which it has been linked. Vectors include, but are not limited to, nucleic acid molecules that are single-stranded, double-stranded, or partially double-stranded; nucleic acid molecules that contain one or more free ends, no free ends (e.g., circular); nucleic acid molecules that contain DNA, RNA, or both; and other varieties of polynucleotides known in the art. One type of vector is a "plasmid," which refers to a circular loop of double-stranded DNA into which additional DNA segments can be inserted, such as by standard molecular cloning techniques. Another type of vector is a viral vector, wherein virally derived DNA or RNA sequences are present in the vector for packaging into the virus (e.g., retroviruses, replication-defective retroviruses, adenoviruses, replication-defective adenoviruses, and adeno-associated viruses). Viral vectors also include polynucleotides carried by the virus for transfection into a host cell. Certain vectors are capable of autonomous replication within the host cell into which they are introduced (e.g., bacterial vectors with a bacterial origin of replication and episomal vectors for mammals). Other vectors (e.g., non-episomal mammalian vectors) integrate into the host cell genome upon introduction into the host cell and are thus replicated along with the host genome. Furthermore, certain vectors are capable of directing the expression of genes to which they are functionally linked. Such vectors are referred to herein as "expression vectors." Common expression vectors suitable for recombinant DNA techniques are often in the form of plasmids.
Рекомбинантные векторы экспрессии могут содержать нуклеиновую кислоту по настоящему изобретению в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается применять для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии предполагается, что выражение "функционально связанный" обозначает то, что представляющая интерес нуклеотидная последовательность связана с регуляторным(регуляторными) элементом(элементами), так что обеспечивается возможность экспрессии нуклеотидной последовательности (например, в системе транскрипции/трансляции in vitro или в клетке-хозяине при введении вектора в клетку-хозяина).Recombinant expression vectors may comprise a nucleic acid of the present invention in a form suitable for expression of the nucleic acid in a host cell, which means that the recombinant expression vectors comprise one or more regulatory elements, which may be selected taking into account the host cells that are intended to be used for expression, which are operably linked to the nucleic acid sequence that is intended to be expressed. In the context of a recombinant expression vector, the term "operably linked" is intended to mean that the nucleotide sequence of interest is linked to the regulatory element(s) such that expression of the nucleotide sequence is allowed (e.g. in an in vitro transcription/translation system or in a host cell upon introduction of the vector into the host cell).
В некоторых вариантах осуществления клетка-хозяин транзиентно или нетранзиентно трасфицирована одним или несколькими векторами, описанными в данном документе. В некоторых вариантах осуществления клетку трансфицируют, когда она находится в естественных условиях у субъекта. В некоторых вариантах осуществления клетка, которую трансфицируют, получена от субъекта. В некоторых вариантах осуществления клетка происходит из клеток, полученных от субъекта, как, например, линии клеток. Из уровня техники известен целый ряд линий клеток, применяемых в качестве культуры тканей. Примеры линий клеток включают без ограничения C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, эпителиальные клетки почки обезьяны BS-C-1, эмбриональные фибробласты мыши BALB/ 3T3, 3T3 Swiss, 3T3-L1, фетальные фибробласты человека 132-d5; фибробласты мыши 10.1, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, клетки BCP-1, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, клетки JY, клетки K562, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, линии клеток OPCN/OPCT, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA/RMAS, клетки Saos-2, Sf-9, SkBr3, T2, T-47D, T84, линию клеток THP1, U373, U87, U937, VCaP, клетки Vero, WM39, WT-49, X63, YAC-1, YAR и их трансгенные разновидности. Линии клеток доступны из множества источников, известных специалистам в данной области (см., например, Американская коллекция типовых культур (ATCC) (Манассас, Вирджиния)). В некоторых вариантах осуществления клетку, трансфицированную с помощью одного или нескольких векторов, описанных в данном документе, используют для получения новой линии клеток, содержащей одну или несколько полученных из вектора последовательностей. В некоторых вариантах осуществления клетку, транзиентно трансфицированную с помощью компонентов системы CRISPR, описанной в данном документе (как, например, путем транзиентной трансфекции с помощью одного или нескольких векторов или трансфекции с использованием РНК), и модифицированную с помощью активности комплекса CRISPR, используют для получения новой линии клеток, содержащей клетки с модификацией, но без любой другой экзогенной последовательности. В некоторых вариантах осуществления клетки, транзиентно или нетранзиентно трансфицированные с помощью одного или нескольких векторов, описанных в данном документе, или линии клеток, полученные из таких клеток, применяют в оценке одного или нескольких тестируемых соединений.In some embodiments, the host cell is transiently or non-transiently transfected with one or more vectors described herein. In some embodiments, the cell is transfected while it is in vivo in the subject. In some embodiments, the cell that is transfected is derived from the subject. In some embodiments, the cell is derived from cells derived from the subject, such as cell lines. A variety of cell lines are known in the art for use in tissue culture. Examples of cell lines include, but are not limited to, C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, monkey kidney epithelial cells BS-C-1, mouse embryonic fibroblasts BALB/3T3, 3T3 Swiss, 3T3-L1, human fetal fibroblasts 132-d5; mouse fibroblasts 10.1, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, BCP-1, BEAS-2B, bEnd.3, BHK-21, BR cells 293, BxPC3, C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, JY cells, K562 cells, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, OPCN/OPCT cell lines, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA/RMAS, Saos-2 cells, Sf-9, SkBr3, T2, T-47D, T84, THP1 cell line, U373, U87, U937, VCaP, Vero cells, WM39, WT-49, X63, YAC-1, YAR, and transgenic variants thereof. Cell lines are available from a variety of sources known to those skilled in the art (see, e.g., American Type Culture Collection (ATCC) (Manassas, VA)). In some embodiments, a cell transfected with one or more vectors described herein is used to generate a new cell line comprising one or more vector-derived sequences. In some embodiments, a cell transiently transfected with components of the CRISPR system described herein (such as by transient transfection with one or more vectors or transfection using RNA) and modified with the activity of the CRISPR complex is used to generate a new cell line comprising cells with the modification but without any other exogenous sequence. In some embodiments, cells transiently or non-transiently transfected with one or more vectors described herein, or cell lines derived from such cells, are used in the evaluation of one or more test compounds.
Предполагается, что термин "регуляторный элемент" подразумевает промоторы, энхансеры, сайты внутренней посадки рибосомы (IRES) и другие элементы контроля экспрессии (например, сигналы терминации транскрипции, такие как сигналы полиаденилирования и поли-U-последовательности). Такие регуляторные элементы описаны, например, в Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Регуляторные элементы включают такие элементы, которые управляют конститутивной экспрессией нуклеотидной последовательности во многих типах клеток-хозяев, и такие элементы, которые управляют экспрессией нуклеотидной последовательности только в определенных клетках-хозяевах (например, тканеспецифичные регуляторные последовательности). Тканеспецифичный промотор может управлять экспрессией преимущественно в представляющей интерес целевой ткани, такой как мышца, нейрон, кость, кожа, кровь, конкретных органах (например, печени, поджелудочной железе) или определенных типах клеток (например, лимфоцитах). Регуляторные элементы также могут управлять экспрессией зависимым от времени образом, как, например, зависимым от клеточного цикла или зависимым от стадии развития образом, который также может быть или может не быть тканеспецифичным или специфичным к типу клеток. В некоторых вариантах осуществления вектор содержит один или несколько промоторов pol III (например, 1, 2, 3, 4, 5 или более промоторов pol III), один или несколько промоторов pol II (например, 1, 2, 3, 4, 5 или более промоторов pol II), один или несколько промоторов pol I (например, 1, 2, 3, 4, 5 или более промоторов pol I) или их комбинации. Примеры промоторов pol III включают без ограничения промоторы U6 и H1. Примеры промоторов pol II включают без ограничения ретровирусный промотор LTR вируса саркомы Рауса (RSV) (необязательно с энхансером RSV), промотор цитомегаловируса (CMV) (необязательно с энхансером CMV) [см., например, Boshart et al, Cell, 41:521-530 (1985)], промотор SV40, промотор гена дигидрофолатредуктазы, промотор гена β-актина, промотор гена глицерофосфаткиназы (PGK) и промотор EF1α. Также термином "регуляторный элемент" охватываются энхансерные элементы, такие как энхансеры WPRE; CMV; сегмент R-U5' в LTR из HTLV-I (Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988); энхансер SV40; а также интронная последовательность между экзонами 2 и 3 гена β-глобина кролика (Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981). Специалистам в данной области техники будет понятно, что конфигурация вектора экспрессии может зависеть от таких факторов, как выбор клетки-хозяина, подлежащей трансформации, требуемый уровень экспрессии и т.п. Вектор можно вводить в клетки-хозяева с получением, таким образом, транскриптов, белков или пептидов, в том числе слитых белков или пептидов, кодируемых нуклеиновыми кислотами, которые описаны в данном документе (например, транскриптов коротких палиндромных повторов, регулярно расположенных группами (CRISPR), белков, ферментов, их мутантных форм, их слитых белков и т.п.).The term "regulatory element" is intended to include promoters, enhancers, internal ribosome entry sites (IRES), and other expression control elements (e.g., transcription termination signals such as polyadenylation signals and poly-U sequences). Such regulatory elements are described, for example, in Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Regulatory elements include those that direct constitutive expression of a nucleotide sequence in many types of host cells and those that direct expression of a nucleotide sequence only in certain host cells (e.g., tissue-specific regulatory sequences). A tissue-specific promoter may direct expression preferentially in a target tissue of interest, such as muscle, neuron, bone, skin, blood, specific organs (e.g., liver, pancreas), or specific cell types (e.g., lymphocytes). Regulatory elements may also direct expression in a time-dependent manner, such as in a cell cycle-dependent or developmental stage-dependent manner, which may or may not also be tissue-specific or cell type-specific. In some embodiments, the vector comprises one or more pol III promoters (e.g., 1, 2, 3, 4, 5 or more pol III promoters), one or more pol II promoters (e.g., 1, 2, 3, 4, 5 or more pol II promoters), one or more pol I promoters (e.g., 1, 2, 3, 4, 5 or more pol I promoters), or combinations thereof. Examples of pol III promoters include, but are not limited to, the U6 and H1 promoters. Examples of pol II promoters include, but are not limited to, the retroviral Rous sarcoma virus (RSV) LTR promoter (optionally with the RSV enhancer), the cytomegalovirus (CMV) promoter (optionally with the CMV enhancer) [see, e.g., Boshart et al, Cell, 41:521-530 (1985)], the SV40 promoter, the dihydrofolate reductase gene promoter, the β-actin gene promoter, the glycerophosphate kinase (PGK) gene promoter, and the EF1α promoter. Also encompassed by the term "regulatory element" are enhancer elements such as the WPRE; CMV; the R-U5' segment of the LTR of HTLV-I (Mol. Cell. Biol., Vol. 8(1), pp. 466-472, 1988); the SV40 enhancer; and the intronic sequence between exons 2 and 3 of the rabbit β-globin gene (Proc. Natl. Acad. Sci. USA., Vol. 78(3), pp. 1527-31, 1981). Those skilled in the art will appreciate that the configuration of the expression vector may depend on factors such as the choice of host cell to be transformed, the desired expression level, etc. The vector can be introduced into host cells to thereby produce transcripts, proteins or peptides, including fusion proteins or peptides, encoded by nucleic acids described herein (e.g., clustered regularly interspaced short palindromic repeats (CRISPR) transcripts, proteins, enzymes, mutant forms thereof, fusion proteins thereof, etc.).
Преимущественные векторы включают лентивирусы и аденоассоциированные вирусы, и типы таких векторов также могут быть выбраны для нацеливания на определенные типы клеток.Preferred vectors include lentiviruses and adeno-associated viruses, and types of such vectors can also be selected to target specific cell types.
В одном аспекте настоящего изобретения предусмотрен вектор, содержащий регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, которая кодирует фермент DD-CRISPR, содержащий одну или несколько последовательностей ядерной локализации и/или NES. В некоторых вариантах осуществления указанный регуляторный элемент управляет транскрипцией фермента DD-CRISPR в эукариотической клетке так, что указанный фермент DD-CRISPR накапливается в обнаруживаемом количестве в ядре эукариотической клетки и/или экспортируется из ядра. В некоторых вариантах осуществления регуляторный элемент представляет собой промотор полимеразы II. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой DD-Cas9. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой фермент DD-Cas9. В некоторых вариантах осуществления фермент DD-Cas9 получен из Cas9 Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens или Porphyromonas macacae (например, модифицированный так, что он имеет по меньшей мере один DD или имеет способность к ассоциации с ним), и он может включать дополнительное изменение или мутацию Cas9 и может представлять собой химерный Cas9. В некоторых вариантах осуществления фермент DD-CRISPR является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент DD-CRISPR управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления фермент DD-CRISPR не обладает или фактически не обладает активностью расщепления нити ДНК (например, характеризуется не более чем 5% нуклеазной активности по сравнению с ферментом дикого типа или ферментом без мутации или изменения, которые снижают нуклеазную активность).In one aspect of the present invention, there is provided a vector comprising a regulatory element operably linked to an enzyme coding sequence that encodes a DD-CRISPR enzyme comprising one or more nuclear localization sequences and/or a NES. In some embodiments, said regulatory element directs transcription of the DD-CRISPR enzyme in a eukaryotic cell such that said DD-CRISPR enzyme accumulates in a detectable amount in the nucleus of the eukaryotic cell and/or is exported from the nucleus. In some embodiments, the regulatory element is a polymerase II promoter. In some embodiments, the DD-CRISPR enzyme is DD-Cas9. In some embodiments, the DD-CRISPR enzyme is DD-Cas9. In some embodiments, the DD-Cas9 enzyme is derived from Cas9 of Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens, or Porphyromonas macacae (e.g., modified to have or have the ability to associate with at least one DD), and may include an additional alteration or mutation of Cas9 and may be a chimeric Cas9. In some embodiments, the DD-CRISPR enzyme is codon-optimized for expression in a eukaryotic cell. In some embodiments, the DD-CRISPR enzyme directs cleavage of one or both strands at a specific position in a target sequence. In some embodiments, the DD-CRISPR enzyme does not have or is substantially free of DNA strand cleavage activity (e.g., has no more than 5% nuclease activity compared to a wild-type enzyme or an enzyme without a mutation or alteration that reduces nuclease activity).
В одном аспекте настоящего изобретения предусмотрен фермент DD-CRISPR, содержащий одну или несколько последовательностей ядерной локализации и/или NES, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного фермента DD-CRISPR в обнаруживаемом количестве в ядре эукариотической клетки и/или за его пределами. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой DD-Cas9. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой фермент DD-Cas9. В некоторых вариантах осуществления фермент DD-Cas9 получен из Cas9 Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens или Porphyromonas macacae (например, модифицированный так, что он имеет по меньшей мере один DD или имеет способность к ассоциации с ним), и он может включать дополнительное изменение или мутацию Cas9 и может представлять собой химерный Cas9. В некоторых вариантах осуществления фермент DD-CRISPR является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент DD-CRISPR управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления фермент DD-CRISPR не обладает или фактически не обладает активностью расщепления нити ДНК (например, характеризуется не более чем 5% нуклеазной активности по сравнению с ферментом дикого типа или ферментом без мутации или изменения, которые снижают нуклеазную активность).In one aspect of the present invention, there is provided a DD-CRISPR enzyme comprising one or more nuclear localization sequences and/or NESs that are sufficiently efficient to direct the accumulation of said DD-CRISPR enzyme in a detectable amount in and/or outside the nucleus of a eukaryotic cell. In some embodiments, the DD-CRISPR enzyme is DD-Cas9. In some embodiments, the DD-CRISPR enzyme is DD-Cas9. In some embodiments, the DD-Cas9 enzyme is derived from Cas9 of Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens, or Porphyromonas macacae (e.g., modified to have or have the ability to associate with at least one DD), and may include an additional alteration or mutation of Cas9 and may be a chimeric Cas9. In some embodiments, the DD-CRISPR enzyme is codon-optimized for expression in a eukaryotic cell. In some embodiments, the DD-CRISPR enzyme directs cleavage of one or both strands at a specific position in a target sequence. In some embodiments, the DD-CRISPR enzyme does not have or is substantially free of DNA strand cleavage activity (e.g., has no more than 5% nuclease activity compared to a wild-type enzyme or an enzyme without a mutation or alteration that reduces nuclease activity).
В одном аспекте настоящего изобретения предусмотрена эукариотическая клетка-хозяин, содержащая (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше или ниже (в зависимости от того, что является подходящим) последовательности прямого повтора, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса DD-CRISPR с целевой последовательностью в эукариотической клетке, где комплекс DD-CRISPR содержит фермент DD-CRISPR в комплексе с направляющей последовательностью, которая гибридизируется с целевой последовательностью; и/или (b) второй регуляторный элемент, функционально связанный с фермент-кодирующей последовательностью, которая кодирует указанный фермент DD-CRISPR, содержащий по меньшей мере одну последовательность ядерной локализации и/или NES. В некоторых вариантах осуществления клетка-хозяин содержит компоненты (a) и (b). Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления компонент (a), компонент (b) или компоненты (a) и (b) стабильно интегрированы в геном эукариотической клетки-хозяина. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса DD-CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления фермент DD-CRISPR содержит одну или несколько последовательность ядерной локализации и/или последовательностей ядерного экспорта или NES, характеризующихся достаточной эффективностью, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки и/или за его пределами. В некоторых вариантах осуществления фермент DD-CRISPR представляет собой Cas9. В некоторых вариантах осуществления фермент CRISPR представляет собой фермент Cas9. В некоторых вариантах осуществления фермент DD-Cas9 получен из Cas9 Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens или Porphyromonas macacae (например, модифицированный так, что он имеет по меньшей мере один DD или имеет способность к ассоциации с ним), и он может включать дополнительное изменение или мутацию Cas9 и может представлять собой химерный Cas9. В некоторых вариантах осуществления фермент DD-CRISPR является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент DD-CRISPR управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления фермент DD-CRISPR не обладает или фактически не обладает активностью расщепления нити ДНК (например, характеризуется не более чем 5% нуклеазной активности по сравнению с ферментом дикого типа или ферментом без мутации или изменения, которые снижают нуклеазную активность). В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления длина направляющей последовательности составляет по меньшей мере 16, 17, 18, 19, 20, 25 нуклеотидов, или 16-30, или 16-25, или 16-20 нуклеотидов. В одном аспекте настоящего изобретения предусмотрен эукариотический организм, отличный от человека; предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина в соответствии с любым из описанных вариантов осуществления. В других аспектах настоящего изобретения предусмотрен эукариотический организм, предпочтительно многоклеточный эукариотический организм, содержащий эукариотическую клетку-хозяина в соответствии с любым из описанных вариантов осуществления. В некоторых вариантах осуществления этих аспектов организм может представлять собой животное; например, млекопитающее. Также организм может представлять собой членистоногое, такое как насекомое. Организм также может представлять собой растение. Кроме того, организм может представлять собой гриб.In one aspect of the present invention, there is provided a eukaryotic host cell comprising (a) a first regulatory element operably linked to a direct repeat sequence and one or more insertion sites for insertion of one or more guide sequences upstream or downstream (as appropriate) of the direct repeat sequence, wherein when expressed, the guide sequence directs sequence-specific binding of a DD-CRISPR complex to a target sequence in a eukaryotic cell, wherein the DD-CRISPR complex comprises a DD-CRISPR enzyme in complex with a guide sequence that hybridizes to the target sequence; and/or (b) a second regulatory element operably linked to an enzyme-coding sequence that encodes said DD-CRISPR enzyme comprising at least one nuclear localization sequence and/or NES. In some embodiments, the host cell comprises components (a) and (b). If applicable, a tracr sequence may also be provided. In some embodiments, component (a), component (b), or components (a) and (b) are stably integrated into the genome of a eukaryotic host cell. In some embodiments, component (a) further comprises two or more guide sequences operably linked to the first regulatory element, wherein when expressed, each of the two or more guide sequences directs sequence-specific binding of the DD-CRISPR complex to its target sequence in a eukaryotic cell. In some embodiments, the DD-CRISPR enzyme comprises one or more nuclear localization sequences and/or nuclear export sequences or NESs that are sufficiently efficient to direct accumulation of said CRISPR enzyme in a detectable amount within and/or outside the nucleus of a eukaryotic cell. In some embodiments, the DD-CRISPR enzyme is Cas9. In some embodiments, the CRISPR enzyme is Cas9. In some embodiments, the DD-Cas9 enzyme is derived from the Cas9 of Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens, or Porphyromonas macacae (e.g., modified to have or have the ability to associate with at least one DD), and may include an additional alteration or mutation of Cas9 and may be a chimeric Cas9. In some embodiments, the DD-CRISPR enzyme is codon-optimized for expression in a eukaryotic cell. In some embodiments, the DD-CRISPR enzyme directs cleavage of one or both strands at a specific position in a target sequence. In some embodiments, the DD-CRISPR enzyme has no or substantially no DNA strand cleavage activity (e.g., has no more than 5% of the nuclease activity of the wild-type enzyme or the enzyme without a mutation or alteration that reduces nuclease activity). In some embodiments, the first regulatory element is a polymerase III promoter. In some embodiments, the second regulatory element is a polymerase II promoter. In some embodiments, the length of the guide sequence is at least 16, 17, 18, 19, 20, 25 nucleotides, or 16-30, or 16-25, or 16-20 nucleotides. In one aspect, the present invention provides a non-human eukaryotic organism; preferably a multicellular eukaryotic organism comprising a eukaryotic host cell according to any of the described embodiments. In other aspects of the present invention, there is provided a eukaryotic organism, preferably a multicellular eukaryotic organism, comprising a eukaryotic host cell according to any of the embodiments described. In some embodiments of these aspects, the organism may be an animal; for example, a mammal. The organism may also be an arthropod, such as an insect. The organism may also be a plant. In addition, the organism may be a fungus.
В отношении применения системы CRISPR-Cas в общем упоминаются документы, в том числе патентные заявки, патенты и патентные публикации, цитируемые по всему настоящему раскрытию, поскольку варианты осуществления настоящего изобретения могут применяться как в этих документах. Система(системы) CRISPR-Cas (например, одиночная(одиночные) или мультиплексная(мультиплексные)) могут быть использованы в сочетании с последними достижениями в геномике сельскохозяйственных культур. Такая(такие) система(системы) CRISPR-Cas может(могут) быть использована (использованы) для осуществления эффективного и рентабельного детального изучения или редактирования гена или генома растений или манипуляции с ними, например, для быстрого исследования, и/или отбора, и/или детальных изучений, и/или сравнения, и/или манипуляций, и/или трансформации генов или геномов растений; например, для получения, идентификации, разработки, оптимизации или придания признака(признаков) или характеристики(характеристик) растению(растениям) или для трансформации генома растения. Соответственно, может быть улучшено получение растений, новых растений с новыми комбинациями признаков или характеристик или новых растений с улучшенными признаками. Такую(такие) систему(системы) CRISPR-Cas можно использовать по отношению к растениям при сайт-направленной интеграции (SDI) или редактировании генов (GE) или в любой из методик приближенной обратной селекции (NRB) или обратной селекции (RB). В отношении применения системы CRISPR-Cas в растениях следует упомянуть веб-сайт "CRISPR-PLANT" Аризонского университета (http://www.genome.arizona.edu/crispr/) (при поддержке Университета штата Пенсильвания и AGI). Варианты осуществления настоящего изобретения можно использовать при редактировании генома у растений или в случае, когда RNAi или аналогичные методики редактирования генома были использованы ранее; см., например, Nekrasov, "Plant genome editing made easy: targeted mutagenesis in model and crop plants using the CRISPR/Cas system", Plant Methods 2013, 9:39 (doi:10.1186/1746-4811-9-39); Brooks, "Efficient gene editing in tomato in the first generation using the CRISPR/Cas9 system", Plant Physiology September 2014 pp 114.247577; Shan, "Targeted genome modification of crop plants using a CRISPR-Cas system", Nature Biotechnology 31, 686-688 (2013); Feng, "Efficient genome editing in plants using a CRISPR/Cas system", Cell Research (2013) 23:1229-1232. doi:10.1038/cr.2013.114; опубликовано онлайн 20 августа 2013 г.; Xie, "RNA-guided genome editing in plants using a CRISPR-Cas system", Mol Plant. 2013 Nov;6(6):1975-83. doi: 10.1093/mp/sst119. электронная публикация 17 августа 2013 г.; Xu, "Gene targeting using the Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice", Rice 2014, 7:5 (2014), Zhou et al., "Exploiting SNPs for biallelic CRISPR mutations in the outcrossing woody perennial Populus reveals 4-coumarate: CoA ligase specificity and Redundancy", New Phytologist (2015) (Forum) 1-4 (доступно только онлайн по адресу www.newphytologist.com); Caliando et al, "Targeted DNA degradation using a CRISPR device stably carried in the host genome", NATURE COMMUNICATIONS 6:6989, DOI: 10.1038/ncomms7989, www.nature.com/naturecommunications DOI: 10.1038/ncomms7989; патент США № 6603061 - Agrobacterium-Mediated Plant Transformation Method; патент США № 7868149 - Plant Genome Sequences and Uses Thereof и US 2009/0100536 - Transgenic Plants with Enhanced Agronomic Traits, все содержание и раскрытие каждого из которых включено в данный документ посредством ссылки во всей полноте. При практическом осуществлении настоящего изобретения содержание и раскрытие Morrell et al "Crop genomics: advances and applications", Nat Rev Genet. 2011 Dec 29;13(2):85-96; которое включено в данный документ посредством ссылки, в том числе то, как варианты осуществления в данном документе могут быть использованы по отношению к растениям. Соответственно, в данном документе ссылка на клетки животных также может быть применима, с учетом необходимых изменений, по отношению к клеткам растений, если не очевидно иное.With respect to the use of the CRISPR-Cas system, reference is generally made to documents, including patent applications, patents, and patent publications, cited throughout this disclosure, since embodiments of the present invention may be practiced as in these documents. The CRISPR-Cas system(s) (e.g., single(s) or multiplex(es)) may be used in conjunction with recent advances in crop genomics. Such CRISPR-Cas system(s) may be used to efficiently and cost-effectively interrogate or edit or manipulate a plant gene or genome, such as to rapidly interrogate and/or select and/or interrogate and/or compare and/or manipulate and/or transform plant genes or genomes; such as to obtain, identify, develop, optimize, or impart trait(s) or characteristic(s) to a plant(s) or to transform a plant genome. Accordingly, the production of plants, new plants with new combinations of traits or characteristics, or new plants with improved traits can be improved. Such a CRISPR-Cas system(s) can be used in plants in site-directed integration (SDI) or gene editing (GE), or in any of the techniques of approximate reverse selection (NRB) or reverse selection (RB). For the use of the CRISPR-Cas system in plants, reference should be made to the website "CRISPR-PLANT" of the University of Arizona (http://www.genome.arizona.edu/crispr/) (supported by Pennsylvania State University and AGI). Embodiments of the present invention can be used in genome editing in plants or in a case where RNAi or similar genome editing techniques have been used previously; see, for example, Nekrasov, “Plant genome editing made easy: targeted mutagenesis in model and crop plants using the CRISPR/Cas system,” Plant Methods 2013, 9:39 (doi:10.1186/1746-4811-9-39); Brooks, “Efficient gene editing in tomato in the first generation using the CRISPR/Cas9 system,” Plant Physiology September 2014 pp 114.247577; Shan, "Targeted genome modification of crop plants using a CRISPR-Cas system", Nature Biotechnology 31, 686-688 (2013); Feng, “Efficient genome editing in plants using a CRISPR/Cas system,” Cell Research (2013) 23:1229–1232. doi:10.1038/cr.2013.114; published online 20 Aug 2013; Xie, "RNA-guided genome editing in plants using a CRISPR-Cas system", Mol Plant. 2013 Nov;6(6):1975-83. doi: 10.1093/mp/sst119. online publication 17 Aug 2013; Xu, "Gene targeting using the Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice", Rice 2014, 7:5 (2014), Zhou et al., "Exploiting SNPs for biallelic CRISPR mutations in the outcrossing woody perennial Populus reveals 4-coumarate: CoA ligase specificity and Redundancy", New Phytologist (2015) (Forum) 1-4 (available online only at www.newphytologist.com); Caliando et al, "Targeted DNA degradation using a CRISPR device stably carried in the host genome", NATURE COMMUNICATIONS 6:6989, DOI: 10.1038/ncomms7989, www.nature.com/naturecommunications DOI: 10.1038/ncomms7989; U.S. Patent No. 6,603,061 - Agrobacterium-Mediated Plant Transformation Method; U.S. Patent No. 7,868,149 - Plant Genome Sequences and Uses Thereof and US 2009/0100536 - Transgenic Plants with Enhanced Agronomic Traits, the entire contents and disclosure of each of which are incorporated herein by reference in their entirety. In the practice of the present invention, the contents and disclosure of Morrell et al, "Crop genomics: advances and applications", Nat Rev Genet. 2011 Dec 29;13(2):85-96; which is incorporated herein by reference, including how embodiments herein may be applied to plants. Accordingly, reference herein to animal cells may also be applied, mutatis mutandis, to plant cells, unless it is obvious otherwise.
В одном аспекте настоящего изобретения предусмотрен набор, содержащий один или несколько компонентов, описанных в данном документе. В некоторых вариантах осуществления набор содержит векторную систему и инструкции по применению набора. В некоторых вариантах осуществления векторная система содержит (a) первый регуляторный элемент, функционально связанный с последовательностью прямого повтора и одним или несколькими сайтами встраивания для встраивания одной или нескольких направляющих последовательностей выше или ниже (в зависимости от того, что является подходящим) последовательности прямого повтора, где при экспрессии направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью в эукариотической клетке, где комплекс CRISPR содержит фермент CRISPR в комплексе с направляющей последовательностью, которая гибридизируется с целевой последовательностью; и/или (b) второй регуляторный элемент, функционально связанный фермент-кодирующей последовательностью, которая кодирует указанный фермент CRISPR, содержащий последовательность ядерной локализации. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления набор содержит компоненты (a) и (b), находящиеся в одном и том же или разных векторах системы. В некоторых вариантах осуществления компонент (a) дополнительно содержит две или более направляющих последовательностей, функционально связанных с первым регуляторным элементом, где при экспрессии каждая из двух или более направляющих последовательностей управляет специфичным к последовательности связыванием комплекса CRISPR со своей целевой последовательностью в эукариотической клетке. В некоторых вариантах осуществления фермент CRISPR содержит одну или несколько последовательностей ядерной локализации, достаточно эффективных, чтобы управлять накоплением указанного фермента CRISPR в обнаруживаемом количестве в ядре эукариотической клетки. В некоторых вариантах осуществления фермент CRISPR представляет собой Cas9. В некоторых вариантах осуществления фермент CRISPR представляет собой фермент Cas9. В некоторых вариантах осуществления фермент Cas9 получен из Cas9 Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens или Porphyromonas macacae (например, модифицированный так, что он имеет по меньшей мере один DD или имеет способность к ассоциации с ним), и он может включать дополнительное изменение или мутацию Cas9 и может представлять собой химерный Cas9. В некоторых вариантах осуществления фермент DD-CRISPR является кодон-оптимизированным для экспрессии в эукариотической клетке. В некоторых вариантах осуществления фермент DD-CRISPR управляет расщеплением одной или двух нитей в определенном положении целевой последовательности. В некоторых вариантах осуществления фермент DD-CRISPR не обладает или фактически не обладает активностью расщепления нити ДНК (например, характеризуется не более чем 5% нуклеазной активности по сравнению с ферментом дикого типа или ферментом без мутации или изменения, которые снижают нуклеазную активность). В некоторых вариантах осуществления первый регуляторный элемент является промотором полимеразы III. В некоторых вариантах осуществления второй регуляторный элемент является промотором полимеразы II. В некоторых вариантах осуществления длина направляющей последовательности составляет по меньшей мере 16, 17, 18, 19, 20, 25 нуклеотидов, или 16-30, или 16-25, или 16-20 нуклеотидов.In one aspect of the present invention, a kit is provided comprising one or more components described herein. In some embodiments, the kit comprises a vector system and instructions for using the kit. In some embodiments, the vector system comprises (a) a first regulatory element operably linked to a direct repeat sequence and one or more insertion sites for inserting one or more guide sequences upstream or downstream (as appropriate) of the direct repeat sequence, wherein when expressed, the guide sequence directs sequence-specific binding of a CRISPR complex to a target sequence in a eukaryotic cell, wherein the CRISPR complex comprises a CRISPR enzyme in complex with a guide sequence that hybridizes to the target sequence; and/or (b) a second regulatory element operably linked by an enzyme-coding sequence that encodes said CRISPR enzyme comprising a nuclear localization sequence. If applicable, a tracr sequence may also be provided. In some embodiments, the kit comprises components (a) and (b) located in the same or different vectors of the system. In some embodiments, component (a) further comprises two or more guide sequences operably linked to the first regulatory element, wherein when expressed, each of the two or more guide sequences directs sequence-specific binding of a CRISPR complex to its target sequence in a eukaryotic cell. In some embodiments, the CRISPR enzyme comprises one or more nuclear localization sequences effective enough to direct accumulation of said CRISPR enzyme in a detectable amount in the nucleus of a eukaryotic cell. In some embodiments, the CRISPR enzyme is Cas9. In some embodiments, the CRISPR enzyme is Cas9. In some embodiments, the Cas9 enzyme is derived from the Cas9 of Francisella tularensis 1, Francisella tularensis subsp. novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp. SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens, or Porphyromonas macacae (e.g., modified to have or have the ability to associate with at least one DD), and may include an additional alteration or mutation of Cas9 and may be a chimeric Cas9. In some embodiments, the DD-CRISPR enzyme is codon-optimized for expression in a eukaryotic cell. In some embodiments, the DD-CRISPR enzyme directs cleavage of one or both strands at a specific position in a target sequence. In some embodiments, the DD-CRISPR enzyme does not have or has substantially no DNA strand cleavage activity (e.g., has no more than 5% of the nuclease activity of the wild-type enzyme or the enzyme without a mutation or alteration that reduces nuclease activity). In some embodiments, the first regulatory element is a polymerase III promoter. In some embodiments, the second regulatory element is a polymerase II promoter. In some embodiments, the length of the guide sequence is at least 16, 17, 18, 19, 20, 25 nucleotides, or 16-30, or 16-25, or 16-20 nucleotides.
В одном аспекте настоящего изобретения предусмотрен способ модифицирования целевого полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса DD-CRISPR с целевым полинуклеотидом, например, для осуществления расщепления указанного целевого полинуклеотида, за счет чего обеспечивается модифицирование целевого полинуклеотида, где комплекс DD-CRISPR содержит фермент DD-CRISPR в комплексе с направляющей последовательностью, гибридизированной с целевой последовательностью в пределах указанного целевого полинуклеотида, где указанная направляющая последовательность связана с последовательностью прямого повтора. Если применимо, также может быть предусмотрена tracr-последовательность (например, для обеспечения одиночной направляющей РНК, sgRNA). В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении целевой последовательности с помощью указанного фермента DD-CRISPR. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида с помощью гомологичной рекомбинации с экзогенной полинуклеотидной матрицей, где указанная репарация приводит к возникновению мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в указанном целевом полинуклеотиде. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот в белке, экспрессируемом с гена, содержащего целевую последовательность. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанную эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из фермента DD-CRISPR и направляющей последовательности, связанной с последовательностью прямого повтора. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления указанные векторы доставляются в эукариотическую клетку в субъекте. В некоторых вариантах осуществления указанное модифицирование происходит в указанной эукариотической клетке в культуре клеток. В некоторых вариантах осуществления способ дополнительно включает выделение указанной эукариотической клетки из организма субъекта перед проведением указанного модифицирования. В некоторых вариантах осуществления способ дополнительно включает возвращение указанной эукариотической клетки и/или клеток, происходящих из нее, указанному субъекту.In one aspect, the present invention provides a method for modifying a target polynucleotide in a eukaryotic cell. In some embodiments, the method comprises causing a DD-CRISPR complex to bind to the target polynucleotide, such as to effect cleavage of said target polynucleotide, thereby causing the target polynucleotide to be modified, wherein the DD-CRISPR complex comprises a DD-CRISPR enzyme in complex with a guide sequence hybridized to a target sequence within said target polynucleotide, wherein said guide sequence is linked to a direct repeat sequence. If applicable, a tracr sequence may also be provided (e.g., to provide a single guide RNA, sgRNA). In some embodiments, said cleavage comprises cleavage of one or both strands at a specific position of the target sequence by said DD-CRISPR enzyme. In some embodiments, said cleavage results in reduced transcription of the target gene. In some embodiments, the method further comprises repairing said cleaved target polynucleotide by homologous recombination with an exogenous polynucleotide template, wherein said repair results in a mutation involving an insertion, deletion or substitution of one or more nucleotides in said target polynucleotide. In some embodiments, said mutation results in a change in one or more amino acids in a protein expressed from a gene comprising the target sequence. In some embodiments, the method further comprises delivering one or more vectors to said eukaryotic cell, wherein the one or more vectors direct the expression of one or more of a DD-CRISPR enzyme and a guide sequence associated with a direct repeat sequence. If applicable, a tracr sequence may also be provided. In some embodiments, said vectors are delivered to a eukaryotic cell in a subject. In some embodiments, said modification occurs in said eukaryotic cell in cell culture. In some embodiments, the method further comprises isolating said eukaryotic cell from the subject's body prior to performing said modification. In some embodiments, the method further comprises returning said eukaryotic cell and/or cells derived therefrom to said subject.
В одном аспекте настоящего изобретения предусмотрен способ модифицирования экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса DD-CRISPR с полинуклеотидом, так что указанное связывание приводит к повышенной или сниженной экспрессии указанного полинуклеотида; где комплекс DD-CRISPR содержит фермент DD-CRISPR, в комплексе с направляющей последовательностью, гибридизирующейся с целевой последовательностью в пределах указанного полинуклеотида, где указанная направляющая последовательность связана с последовательностью прямого повтора. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления способ дополнительно включает доставку одного или нескольких векторов в указанные эукариотические клетки, где один или несколько векторов управляют экспрессией одного или нескольких из фермента DD-CRISPR и направляющей последовательности, связанной с последовательностью прямого повтора. Если применимо, также может быть предусмотрена tracr-последовательность.In one aspect of the present invention, there is provided a method for modifying the expression of a polynucleotide in a eukaryotic cell. In some embodiments, the method comprises causing a DD-CRISPR complex to bind to a polynucleotide, such that said binding results in increased or decreased expression of said polynucleotide; wherein the DD-CRISPR complex comprises a DD-CRISPR enzyme, in complex with a guide sequence hybridizing to a target sequence within said polynucleotide, wherein said guide sequence is linked to a direct repeat sequence. If applicable, a tracr sequence may also be provided. In some embodiments, the method further comprises delivering one or more vectors to said eukaryotic cells, wherein the one or more vectors direct the expression of one or more of a DD-CRISPR enzyme and a guide sequence linked to a direct repeat sequence. If applicable, a tracr sequence may also be provided.
В одном аспекте настоящего изобретения предусмотрен способ получения модельной эукариотической клетки, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) введение одного или нескольких векторов в эукариотическую клетку, где один или несколько векторов управляют экспрессией одного или нескольких из фермента DD-CRISPR, направляющей последовательности, связанной с последовательность прямого повтора (если применимо, также может быть предусмотрена tracr-последовательность); и (b) обеспечение связывания комплекса DD-CRISPR с целевым полинуклеотидом, например, для осуществления расщепления целевого полинуклеотида в пределах указанного гена, ответственного за развитие заболевания, где комплекс DD-CRISPR содержит фермент DD-CRISPR в комплексе с направляющей последовательностью, которая гибридизируется с целевой последовательностью в пределах целевого полинуклеотида, с получением тем самым модельной эукариотической клетки, содержащей мутированный ген, ответственный за развитие заболевания. В некоторых вариантах осуществления указанное расщепление предусматривает расщепление одной или двух нитей в определенном положении целевой последовательности с помощью указанного фермента DD-CRISPR. В некоторых вариантах осуществления указанное расщепление приводит к сниженной транскрипции целевого гена. В некоторых вариантах осуществления способ дополнительно включает репарацию указанного расщепленного целевого полинуклеотида с помощью гомологичной рекомбинации с экзогенной полинуклеотидной матрицей, где указанная репарация приводит к возникновению мутации, предусматривающей вставку, делецию или замену одного или нескольких нуклеотидов в указанном целевом полинуклеотиде. В некоторых вариантах осуществления указанная мутация приводит к изменению одной или нескольких аминокислот при экспрессии белка с гена, содержащего целевую последовательность.In one aspect of the present invention, there is provided a method for producing a model eukaryotic cell comprising a mutated gene responsible for the development of a disease. In some embodiments, the gene responsible for the development of a disease is any gene associated with an increased risk of having or developing a disease. In some embodiments, the method comprises (a) introducing one or more vectors into a eukaryotic cell, wherein the one or more vectors direct the expression of one or more of a DD-CRISPR enzyme, a guide sequence associated with a direct repeat sequence (if applicable, a tracr sequence may also be provided); and (b) causing the DD-CRISPR complex to bind to a target polynucleotide, such as to effect cleavage of the target polynucleotide within said disease-causing gene, wherein the DD-CRISPR complex comprises a DD-CRISPR enzyme in a complex with a guide sequence that hybridizes to a target sequence within the target polynucleotide, thereby producing a model eukaryotic cell comprising a mutated disease-causing gene. In some embodiments, said cleavage comprises cleavage of one or both strands at a specific position of the target sequence by said DD-CRISPR enzyme. In some embodiments, said cleavage results in reduced transcription of the target gene. In some embodiments, the method further comprises repairing said cleaved target polynucleotide by homologous recombination with an exogenous polynucleotide template, wherein said repair results in a mutation involving an insertion, deletion or substitution of one or more nucleotides in said target polynucleotide. In some embodiments, said mutation results in a change in one or more amino acids in the expression of a protein from a gene comprising the target sequence.
В одном аспекте настоящего изобретения предусмотрен способ разработки биологически активного средства, которое модулирует событие передачи сигнала в клетке, ассоциированное с геном, ответственным за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) приведение тестируемого соединения в контакт с модельной клеткой по любому из описанных вариантов осуществления; и (b) обнаружение изменения считываемого показания, что указывает на снижение или возрастание события передачи сигнала в клетке, ассоциированного с указанной мутацией в указанном гене, ответственном за развитие заболевания, с получением тем самым указанного биологически активного средства, которое модулирует указанное событие передачи сигнала в клетке, ассоциированное с указанным геном, ответственным за развитие заболевания.In one aspect of the present invention, there is provided a method for developing a biologically active agent that modulates a cellular signaling event associated with a disease-promoting gene. In some embodiments, the disease-promoting gene is any gene associated with an increased risk of having or developing a disease. In some embodiments, the method comprises (a) contacting a test compound with a model cell according to any of the described embodiments; and (b) detecting a change in a readout that indicates a decrease or increase in a cellular signaling event associated with said mutation in said disease-promoting gene, thereby obtaining said biologically active agent that modulates said cellular signaling event associated with said disease-promoting gene.
В одном аспекте настоящего изобретения предусмотрен рекомбинантный полинуклеотид, содержащий направляющую последовательность выше или ниже (в зависимости от того, что является подходящим) последовательности прямого повтора, где направляющая последовательность при экспрессии управляет специфичным к последовательности связыванием комплекса DD-CRISPR с соответствующей целевой последовательностью, присутствующей в эукариотической клетке. В некоторых вариантах осуществления целевой последовательностью является вирусная последовательность, присутствующая в эукариотической клетке. Если применимо, также может быть предусмотрена tracr-последовательность. В некоторых вариантах осуществления целевая последовательность представляет собой протоонкоген или онкоген.In one aspect of the present invention, there is provided a recombinant polynucleotide comprising a guide sequence upstream or downstream (as appropriate) of a direct repeat sequence, wherein the guide sequence, when expressed, directs sequence-specific binding of a DD-CRISPR complex to a corresponding target sequence present in a eukaryotic cell. In some embodiments, the target sequence is a viral sequence present in a eukaryotic cell. If applicable, a tracr sequence may also be provided. In some embodiments, the target sequence is a proto-oncogene or an oncogene.
В одном аспекте настоящего изобретения предусмотрен способ отбора одной или нескольких клеток путем введения одной или нескольких мутаций в ген в одной или нескольких клетках, при этом способ включает введение одного или нескольких векторов в клетку(клетки), где один или несколько векторов управляют экспрессией одного или нескольких из фермента DD-CRISPR, направляющей последовательности, связанной с последовательностью прямого повтора (если применимо, также может быть предусмотрена tracr-последовательность), и матрицы редактирования; где матрица редактирования содержит одну или несколько мутаций, которые обеспечивают прекращение расщепления под действием фермента DD-CRISPR; обеспечение гомологичной рекомбинации матрицы редактирования с целевым полинуклеотидом в клетке(клетках), подлежащей(подлежащих) отбору; обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления целевого полинуклеотида в пределах указанного гена, где комплекс DD-CRISPR содержит фермент DD-CRISPR в комплексе с направляющей последовательностью, которая гибридизируется с целевой последовательностью в пределах целевого полинуклеотида, где связывание комплекса DD-CRISPR с целевым полинуклеотидом индуцирует гибель клетки, тем самым обеспечивая возможность отбора одной или нескольких клеток, в которые были введены одна или несколько мутаций. В предпочтительном варианте осуществления фермент DD-CRISPR представляет собой DD-Cas9. В другом аспекте настоящего изобретения клетка, подлежащая отбору, может представлять собой эукариотическую клетку. Аспекты настоящего изобретения предусматривают отбор специфических клеток без необходимости наличия маркера отбора или двухстадийного способа, который может включать систему негативного отбора. Клетка(клетки) может(могут) представлять собой прокариотическую или эукариотическую клетки.In one aspect of the present invention, there is provided a method for selecting one or more cells by introducing one or more mutations into a gene in one or more cells, the method comprising introducing one or more vectors into the cell(s), wherein the one or more vectors direct the expression of one or more of a DD-CRISPR enzyme, a guide sequence associated with a direct repeat sequence (if applicable, a tracr sequence may also be provided), and an editing template; wherein the editing template comprises one or more mutations that provide for the termination of cleavage by the DD-CRISPR enzyme; providing for homologous recombination of the editing template with a target polynucleotide in the cell(s) to be selected; allowing the CRISPR complex to bind to a target polynucleotide to effect cleavage of the target polynucleotide within said gene, wherein the DD-CRISPR complex comprises a DD-CRISPR enzyme in complex with a guide sequence that hybridizes to a target sequence within the target polynucleotide, wherein the binding of the DD-CRISPR complex to the target polynucleotide induces cell death, thereby allowing selection of one or more cells into which one or more mutations have been introduced. In a preferred embodiment, the DD-CRISPR enzyme is DD-Cas9. In another aspect of the present invention, the cell to be selected may be a eukaryotic cell. Aspects of the present invention provide for the selection of specific cells without the need for a selection marker or a two-step method that may include a negative selection system. The cell(s) may be a prokaryotic or a eukaryotic cell.
В дополнительном аспекте настоящее изобретение относится к выполняемому с помощью компьютера способу идентификации или разработки потенциальных соединений для помещения или связывания с системой DD-CRISPR-Cas9 или ее функциональной частью или наоборот (выполняемому с помощью компьютера способу идентификации или разработки потенциальных систем DD-CRISPR-Cas9 или их функциональной части для связывания с требуемыми соединениями) или к выполняемому с помощью компьютера способу идентификации или разработки потенциальных систем DD-CRISPR-Cas9 (например, с точки зрения прогнозирования областей в системе DD-CRISPR-Cas9, с которыми можно проводить манипуляции, например, исходя из данных кристаллической структуры или исходя из данных ортологов Cas9, или с учетом того, где можно прикрепить функциональную группу, такую как активатор или репрессор, к системе DD-CRISPR-Cas9, или в отношении усечений Cas9, или в отношении разработки никаз), при этом указанный способ включает применение компьютерной системы, например, компьютера с хранимой программой, содержащего процессор, систему хранения данных, устройство ввода и устройство вывода, стадии (a) ввода в компьютер с хранимой программой посредством указанного устройства ввода данных, содержащих трехмерные координаты подгруппы атомов из кристаллической структуры DD-CRISPR-Cas9 или связанных с таковой, например, в домене связывания системы DD-CRISPR-Cas9 или альтернативно или дополнительно в доменах, которые варьируют, исходя из различий среди ортологов Cas9, или касающихся Cas9, или касающихся никаз, или касающихся функциональных групп, необязательно с информацией по структуре комплекса(комплексов) системы CRISPR-Cas9, с получением тем самым набора данных; (b) сравнения с применением указанного процессора указанного набора данных с компьютерной базой данных по структурам, хранящейся в указанной компьютерной системе хранения данных, например, структурам соединений, которые связываются, или предположительно связываются, или для которых требуется, чтобы они связывались с системой DD-CRISPR-Cas9, или с ортологами DD-Cas9 (например, Cas9 или с доменами или участками, которые варьируют среди ортологов Cas9), или с кристаллической структурой DD-CRISPR-Cas9, или с никазами или с функциональными группами; (c) выбора из указанной базы данных с применением компьютерных способов, структуры(структур), например, структур DD-CRISPR-Cas9, которые могут связываться с требуемыми структурами, требуемых структур, которые могут связываться в определенными структурами DD-CRISPR-Cas9, частей системы DD-CRISPR-Cas9, с которыми можно проводить манипуляции, например, исходя из данных по другим частям кристаллической структуры DD-CRISPR-Cas9 и/или об ортологах DD-Cas9, усеченных Cas9, новых никаз или конкретных функциональных групп или положений для прикрепления функциональных групп или для мутирования систем DD-CRISPR-Cas9; (d) конструирования с применением компьютерных способов модели выбранной(выбранных) структуры(структур), и (e) вывода данных по выбранной(выбранным) структуре(структурам) на указанное устройство вывода, и необязательно синтеза одной или нескольких выбранных структур, и дополнительно необязательного тестирования указанной(указанных) синтезированной(синтезированных) выбранной(выбранных) структуры(структур) как системы CRISPR-Cas9 или таковой(таковыми) в ней; или указанный способ включает получение координат по меньшей мере двух атомов кристаллической структуры DD-CRISPR-Cas9, например, по меньшей мере двух атомов из цитируемых в данном документе материалов, или координат по меньшей мере субдомена кристаллической структуры DD-CRISPR-Cas9 ("выбранных координат"), получение структуры кандидата, содержащего связывающую молекулу, или частей системы DD-CRISPR-Cas9, с которыми можно проводить манипуляцию, например, исходя из данных по другим частям кристаллической структуры DD-CRISPR-Cas9 и/или об ортологах Cas9, или структуре функциональных групп, и подгонку структуры кандидата к выбранным координатам, с получением тем самым данных о продукте, содержащих структуры DD-CRISPR-Cas9, которые могут связываться с требуемыми структурами, требуемых структур, которые могут связываться с определенными структурами DD-CRISPR-Cas9, частей системы CRISPR-Cas9, с которыми можно проводить манипуляции, усеченного Cas9, новых никаз, или конкретных функциональных групп, или положений для прикрепления функциональных групп или для мутирования систем DD-CRISPR-Cas9, с выводом данных о них; и необязательно синтез соединения(соединений) на основании указанных данных о продукте, и дополнительно необязательное тестирование указанного(указанных) синтезированного(синтезированных) соединения(соединений) как системы DD-CRISPR-Cas9 или таковой(таковых) в ней. Тестирование может предусматривать анализ системы DD-CRISPR-Cas9, полученной на основании указанной(указанных) синтезированной(синтезированных) выбранной(выбранных) структуры(структур), например, в отношении связывания или выполнения требуемой функции. Выводная информация в вышеупомянутые способах может предусматривать передачу данных, например, передачу информации через телекоммуникацию, телефон, видеоконференцию, средства массовой информации, например, презентацию, такую как компьютерная презентация (например, POWERPOINT), Интернет, электронную почту, сообщение с помощью документов, таких как документ компьютерной программы (например, WORD) и т.п. Соответственно, настоящее изобретение также охватывает машиночитаемые носители, содержащие данные атомных координат в соответствии с цитируемыми в данном документе материалами, при этом указанные данные определяют трехмерную структуру DD-CRISPR-Cas9 или по меньшей мере одного ее субдомена, или данные по структурному фактору для CRISPR-Cas9, при этом указанные данные по структурному фактору можно получить из цитируемых в данном документе материалов. Машиночитаемые носители также могут содержать любые данные из вышеупомянутых способов. Настоящее изобретение дополнительно охватывает способы с использованием компьютерной системы для получения или выполнения рациональной разработки, как в вышеупомянутых способах, предусматривающей либо данные атомных координат в соответствии с цитируемыми в данном документе материалами, при этом указанные данные определяют трехмерную структуру DD-CRISPR-Cas9 или по меньшей мере одного ее субдомена, либо данные по структурному фактору для CRISPR-Cas9, при этом указанные данные по структурному фактору получают из данных атомных координат из цитируемых в данном документе материалов. Настоящее изобретение дополнительно охватывает способ ведения коммерческой деятельности, включающий обеспечение пользователя компьютерной системой, или носителем, или данными трехмерной структуры DD-CRISPR-Cas9, или по меньшей мере одного ее субдомена, или структурного фактора для DD-CRISPR-Cas9, при этом указанная структура изложена в цитируемых в данном документе материалах, и указанные данные по структурному фактору можно получить из данных атомных координат из цитируемых в данном документе материалов, или электронным носителем, приведенным в данном документе, или передачей данных, приведенной в данном документе.In a further aspect, the present invention relates to a computer-implemented method for identifying or designing potential compounds for insertion or binding to a DD-CRISPR-Cas9 system or a functional part thereof, or vice versa (a computer-implemented method for identifying or designing potential DD-CRISPR-Cas9 systems or a functional part thereof for binding to desired compounds) or to a computer-implemented method for identifying or designing potential DD-CRISPR-Cas9 systems (e.g., in terms of predicting regions in a DD-CRISPR-Cas9 system that can be manipulated, e.g., based on crystal structure data or based on Cas9 ortholog data, or taking into account where a functional group such as an activator or a repressor can be attached to a DD-CRISPR-Cas9 system, or with respect to Cas9 truncations, or with respect to the design of nickases), said method comprising using a computer system, e.g. a stored program computer comprising a processor, a data storage system, an input device and an output device, the steps of (a) inputting into a computer with a stored program, via said input device, data comprising three-dimensional coordinates of a subset of atoms from a crystal structure of DD-CRISPR-Cas9 or related thereto, for example in a binding domain of the DD-CRISPR-Cas9 system or alternatively or additionally in domains that vary based on differences among Cas9 orthologs or concerning Cas9 or concerning niccases or concerning functional groups, optionally with information on the structure of the complex(es) of the CRISPR-Cas9 system, thereby obtaining a data set; (b) comparing, using said processor, said data set with a computer database of structures stored in said computer data storage system, such as structures of compounds that bind, or are predicted to bind, or are claimed to bind, to the DD-CRISPR-Cas9 system, or to DD-Cas9 orthologs (e.g., Cas9 or to domains or regions that vary among Cas9 orthologs), or to a crystal structure of DD-CRISPR-Cas9, or to nickases or to functional groups; (c) selecting from said database, using computational methods, a structure(s), such as DD-CRISPR-Cas9 structures, that can bind to desired structures, desired structures that can bind to specific DD-CRISPR-Cas9 structures, parts of the DD-CRISPR-Cas9 system that can be manipulated, such as based on data on other parts of the DD-CRISPR-Cas9 crystal structure and/or on DD-Cas9 orthologs, truncated Cas9, novel nicks or specific functional groups or positions for attaching functional groups or for mutating DD-CRISPR-Cas9 systems; (d) constructing, using computer methods, a model of the selected structure(s), and (e) outputting data on the selected structure(s) to said output device, and optionally synthesizing one or more selected structures, and further optionally testing said synthesized selected structure(s) as or in a CRISPR-Cas9 system; or the method comprises obtaining coordinates of at least two atoms of a DD-CRISPR-Cas9 crystal structure, such as at least two atoms from the materials cited herein, or coordinates of at least a subdomain of a DD-CRISPR-Cas9 crystal structure ("selected coordinates"), obtaining a candidate structure comprising a binding molecule or parts of the DD-CRISPR-Cas9 system that can be manipulated, such as from data on other parts of the DD-CRISPR-Cas9 crystal structure and/or on Cas9 orthologs or on the structure of functional groups, and fitting the candidate structure to the selected coordinates, thereby obtaining product data comprising DD-CRISPR-Cas9 structures that can bind to desired structures, desired structures that can bind to specific DD-CRISPR-Cas9 structures, parts of the CRISPR-Cas9 system that can be manipulated, truncated Cas9, novel niccases, or specific functional groups, or positions for attaching functional groups or for mutating DD-CRISPR-Cas9 systems, with output data thereof; and optionally synthesizing compound(s) based on said product data, and further optionally testing said synthesized compound(s) as a DD-CRISPR-Cas9 system or the like therein. Testing may include analyzing a DD-CRISPR-Cas9 system obtained based on said synthesized selected structure(s), for example, for binding or performing a desired function. Output information in the above-mentioned methods may include data transmission, for example, transmission of information via telecommunication, telephone, video conference, mass media, for example, a presentation, such as a computer presentation (e.g. POWERPOINT), the Internet, e-mail, communication via documents, such as a computer program document (e.g. WORD), etc. Accordingly, the present invention also encompasses computer-readable media comprising atomic coordinate data in accordance with the materials cited herein, wherein said data define a three-dimensional structure of DD-CRISPR-Cas9 or at least one subdomain thereof, or structure factor data for CRISPR-Cas9, wherein said structure factor data can be obtained from the materials cited herein. The computer-readable media may also comprise any of the data from the above-mentioned methods. The present invention further encompasses methods using a computer system for obtaining or performing rational design as in the above-mentioned methods, providing either atomic coordinate data in accordance with the materials cited herein, wherein said data define a three-dimensional structure of DD-CRISPR-Cas9 or at least one subdomain thereof, or structure factor data for CRISPR-Cas9, wherein said structure factor data is obtained from the atomic coordinate data from the materials cited herein. The present invention further encompasses a method of conducting business, including providing a user with a computer system, or a storage medium, or data of a three-dimensional structure of DD-CRISPR-Cas9, or at least one subdomain thereof, or a structure factor for DD-CRISPR-Cas9, wherein said structure is set forth in the materials cited herein, and said structure factor data can be obtained from the atomic coordinate data from the materials cited herein, or by the electronic storage medium provided herein, or by the data transmission provided herein.
"Сайт связывания" или "активный сайт" предусматривает, или состоит, по сути, из, или состоит из сайта (такого как атом, функциональная группа аминокислотного остатка или множество таких атомов и/или групп) в полости или участке связывания, который может связываться с соединением, таким как молекула нуклеиновой кислоты, которое вовлекается в связывание. Под "подгонкой" подразумевают определение с помощью автоматизированных или полуавтоматизированных средств взаимодействий между одним или несколькими атомами кандидатной молекулы и по меньшей мере одним атомом структуры по настоящему изобретению и вычисление степени стабильности таких взаимодействий. Взаимодействия включают притяжение и отталкивание, обусловленное зарядом, стерическими аспектами и т.п. Далее описаны различные компьютерные способы подгонки. Под "среднеквадратичным (или rms) отклонением" подразумевается квадратный корень из арифметического среднего квадратов отклонений от среднего. Под "компьютерной системой" подразумевают аппаратные программные средства, программные средства и средства хранения данных, применяемые для анализа данных по атомным координатам. Минимальные аппаратные средства компьютерных систем по настоящему изобретению, как правило, содержат центральный процессор (CPU), устройства ввода, устройства вывода и средства хранения данных. Для визуализации данных по структуре желательно обеспечить дисплей или монитор. Средствами хранения данных может быть RAM или средства для доступа к машиночитаемым носителям по настоящему изобретению. Примерами таких систем являются компьютер и планшетные устройства под управлением операционных систем Unix, Windows или Apple. Под "машиночитаемыми носителями" подразумевают любой носитель или носители, которые могут быть считаны, и доступ к которым может быть получен непосредственно или опосредованно с помощью компьютера, например, так, что носители подходят для применения в вышеупомянутой компьютерной системе. Такие носители включают без ограничения магнитные запоминающие устройства, такие как дискеты, запоминающее устройство в виде жесткого диска и магнитная лента; оптические запоминающие устройства, такие как оптические диски или CD-ROM; электрические запоминающие устройства, такие как RAM и ROM; флеш-накопители; устройства с облачным хранилищем данных и гибриды этих категорий, такие как магнитные/оптические запоминающие устройства."Binding site" or "active site" includes, or consists essentially of, or consists of a site (such as an atom, a functional group of an amino acid residue, or a plurality of such atoms and/or groups) in a binding cavity or region that can bind to a compound, such as a nucleic acid molecule, that is involved in the binding. By "fitting" is meant determining, by automated or semi-automated means, interactions between one or more atoms of a candidate molecule and at least one atom of a structure of the present invention and calculating the degree of stability of such interactions. The interactions include attractions and repulsions due to charge, steric aspects, and the like. Various computer fitting methods are described below. By "root mean square (or rms) deviation" is meant the square root of the arithmetic mean of the squares of the deviations from the mean. By "computer system" is meant hardware, software and data storage means used for analyzing the data by atomic coordinates. The minimum hardware of the computer systems of the present invention typically comprises a central processing unit (CPU), input devices, output devices and data storage means. For visualizing the data by structure, it is desirable to provide a display or monitor. The data storage means can be RAM or means for accessing the machine-readable media of the present invention. Examples of such systems are a computer and tablet devices running Unix, Windows or Apple operating systems. By "machine-readable media" is meant any medium or media that can be read and accessed directly or indirectly by a computer, for example, such that the media are suitable for use in the above-mentioned computer system. Such media include, but are not limited to, magnetic storage devices such as floppy disks, hard disk storage and magnetic tape; optical storage devices such as optical disks or CD-ROMs; electrical storage devices such as RAM and ROM; flash drives; cloud storage devices; and hybrids of these categories such as magnetic/optical storage devices.
В конкретных вариантах осуществления настоящего изобретения конформационные изменения кристаллических структур системы DD-CRISPR-Cas9 или компонентов DD-CRISPR-Cas9 обеспечивают важную и необходимую информацию о гибкости или подвижности белковых структурных участков относительно нуклеотидных (РНК или ДНК) структурных участков, которые могут быть важны для функции системы DD-CRISPR-Cas. Информацию о структуре, представленную для Cas9 в цитируемых в данном документе материалах, можно использовать для дополнительного конструирования и оптимизации системы DD-CRISPR-Cas согласно данному документу, и ее можно экстраполировать на детальное исследование структурно-функциональных связей в другом ферменте CRISPR, например, в системах с ферментом DD-CRISPR, а также, например, в других системах с ферментом CRISPR типа V или VI (например, в других системах с ферментом DD-CRISPR типа V или VI). Настоящее изобретение охватывает оптимизированные функциональные ферментные системы DD-CRISPR-Cas. В частности, фермент DD-CRISPR содержит одну или несколько мутаций, которые превращают его в ДНК-связывающий белок, к которому могут быть рекрутированы, или добавлены, или вставлены, или прикреплены функциональные домены, проявляющие представляющую интерес функцию. В определенных вариантах осуществления фермент CRISPR содержит одну или несколько мутаций в RuvC1 фермента DD-CRISPR и/или иную мутацию, обсуждаемую в данном документе. В некоторых вариантах осуществления фермент DD-CRISPR имеет одну или несколько мутаций в каталитическом домене, где, будучи транскрибированной, направляющая последовательность управляет специфичным к последовательности связыванием комплекса DD-CRISPR с целевой последовательностью, и где фермент дополнительно содержит функциональный домен (например, для обеспечения дестабилизированного домена или содействия ему). Информация о структуре, представленная в цитируемых в данном документе материалах, обеспечивает детальное изучение взаимодействия направляющей с целевой ДНК и ферментом CRISPR (например, Cas9; например, ферментом DD-CRISPR, например, DD-Cas9)), предоставляя возможность конструирования или изменения структуры sgRNA для оптимизации функциональности всей системы DD-CRISPR-Cas. Например, петли в направляющей могут быть увеличены без перекрывания с белком Cas9 путем вставки адаптерных белков, которые могут связываться с РНК. Такие адаптерные белки могут дополнительно рекрутировать эффекторные белки или продукты слияния, которые содержат один или несколько функциональных доменов. Функциональный домен может содержать, состоять, по сути, из или состоять из домена активации транскрипции, например, VP64. Функциональный домен может содержать, состоять, по сути, из домена репрессии транскрипции, например, KRAB. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой, или содержит, или состоит, по сути, из SID или конкатемеров SID (например, SID4X). В некоторых вариантах осуществления функциональный домен содержит, состоит, по сути, из домена эпигенетического модифицирования, так что обеспечивается фермент эпигенетического модифицирования. В некоторых вариантах осуществления функциональный домен содержит, состоит, по сути, из домена активации, который может представлять собой домен активации P65.In particular embodiments of the present invention, conformational changes in the crystal structures of the DD-CRISPR-Cas9 system or DD-CRISPR-Cas9 components provide important and necessary information about the flexibility or mobility of protein structural regions relative to nucleotide (RNA or DNA) structural regions, which may be important for the function of the DD-CRISPR-Cas system. The structural information provided for Cas9 in the materials cited herein can be used to further design and optimize the DD-CRISPR-Cas system according to this document, and can be extrapolated to a detailed study of the structure-function relationships in another CRISPR enzyme, such as in systems with a DD-CRISPR enzyme, as well as, for example, in other systems with a type V or VI CRISPR enzyme (e.g., in other systems with a type V or VI DD-CRISPR enzyme). The present invention encompasses optimized functional DD-CRISPR-Cas enzyme systems. In particular, the DD-CRISPR enzyme comprises one or more mutations that convert it into a DNA-binding protein to which functional domains that exhibit a function of interest can be recruited or added or inserted or attached. In certain embodiments, the CRISPR enzyme comprises one or more mutations in RuvC1 of the DD-CRISPR enzyme and/or another mutation discussed herein. In some embodiments, the DD-CRISPR enzyme has one or more mutations in the catalytic domain, wherein, when transcribed, the guide sequence directs sequence-specific binding of the DD-CRISPR complex to a target sequence, and wherein the enzyme further comprises a functional domain (e.g., to provide or facilitate a destabilized domain). The structural information provided in the materials cited herein provides a detailed understanding of the interaction of the guide with the target DNA and the CRISPR enzyme (e.g., Cas9; e.g., a DD-CRISPR enzyme, e.g., DD-Cas9)), providing the ability to design or alter the structure of the sgRNA to optimize the functionality of the overall DD-CRISPR-Cas system. For example, the loops in the guide can be enlarged without overlapping with the Cas9 protein by inserting adaptor proteins that can bind to the RNA. Such adaptor proteins can further recruit effector proteins or fusion products that contain one or more functional domains. A functional domain can comprise, consist essentially of, or consist of a transcriptional activation domain, such as VP64. A functional domain can comprise, consist essentially of, or consist of a transcriptional repression domain, such as KRAB. In some embodiments, the transcriptional repression domain is, or comprises, or consists essentially of SIDs or SID concatemers (e.g., SID4X). In some embodiments, the functional domain comprises, or consists essentially of, an epigenetic modification domain, such that an epigenetic modification enzyme is provided. In some embodiments, the functional domain comprises, or consists essentially of, an activation domain, which may be a P65 activation domain.
Аспекты настоящего изобретения охватывают не встречающуюся в природе или сконструированную композицию, которая может содержать направляющую РНК (gRNA), предусматривающую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, и фермент DD-CRISPR, который может содержать по меньшей мере одну или несколько последовательностей ядерной локализации, где фермент DD-CRISPR содержит одну, или две, или больше мутаций, вследствие которых фермент характеризуется измененной или сниженной нуклеазной активностью по сравнению с ферментом дикого типа, где по меньшей мере одна петля gRNA модифицирована путем вставки отличающейся(отличающихся) последовательности(последовательностей) РНК, которая(которые) связывается(связываются) с одним или несколькими адаптерными белками, и где адаптерный белок дополнительно рекрутирует один или несколько гетерологичных функциональных доменов. В одном варианте осуществления настоящего изобретения фермент DD-CRISPR содержит одну, или две, или больше мутаций. В другом варианте осуществления функциональный домен содержит, состоит, по сути, из домена активации транскрипции, например, VP64. В другом варианте осуществления функциональный домен содержит, состоит, по сути, из домена репрессии транскрипции, например, домена KRAB, домена SID или домена SID4X. В вариантах осуществления настоящего изобретения один или несколько гетерологичных функциональных доменов характеризуются одной или несколькими видами активности, выбранными из группы, включающей, состоящей, по сути, из или состоящей из метилазной активности, деметилазной активности, активности в отношении активации транскрипции, активности в отношении репрессии транскрипции, активности фактора освобождения транскрипта, активности в отношении модификации гистонов, активности расщепления РНК и активности связывания нуклеиновой кислоты. В дополнительных вариантах осуществления настоящего изобретения клетка является эукариотической клеткой, или клеткой млекопитающего, или клеткой человека. В дополнительных вариантах осуществления адаптерный белок выбран из группы, включающей, состоящей, по сути, из или состоящей из MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, фCb5, фCb8r, фCb12r, фCb23r, 7s, PRR1. В другом варианте осуществления по меньшей мере одна петля gRNA представляет собой тетрапетлю и/или петлю 2. Один аспект настоящего изобретения охватывает способы модифицирования представляющего интерес локуса генома для изменения экспрессии гена в клетке путем введения в клетку любой из композиций, описываемых в данном документе.Aspects of the present invention encompass a non-naturally occurring or engineered composition that can comprise a guide RNA (gRNA) that includes a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell, and a DD-CRISPR enzyme that can comprise at least one or more nuclear localization sequences, wherein the DD-CRISPR enzyme comprises one or two or more mutations that cause the enzyme to have altered or reduced nuclease activity compared to a wild-type enzyme, wherein at least one loop of the gRNA is modified by insertion of different RNA sequence(s) that binds to one or more adaptor proteins, and wherein the adaptor protein further recruits one or more heterologous functional domains. In one embodiment of the present invention, the DD-CRISPR enzyme comprises one or two or more mutations. In another embodiment, the functional domain comprises, consists essentially of, a transcriptional activation domain, such as VP64. In another embodiment, the functional domain comprises, consists essentially of, a transcriptional repression domain, such as a KRAB domain, a SID domain, or a SID4X domain. In embodiments of the present invention, the one or more heterologous functional domains are characterized by one or more activities selected from the group consisting of, consisting essentially of, or consisting of, methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, RNA cleavage activity, and nucleic acid binding activity. In further embodiments of the present invention, the cell is a eukaryotic cell or a mammalian cell or a human cell. In further embodiments, the adapter protein is selected from the group consisting of, consisting essentially of, or consisting of MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, φCb5, φCb8r, φCb12r, φCb23r, 7s, PRR1. In another embodiment, at least one loop of the gRNA is a tetraloop and/or loop 2. One aspect of the present invention encompasses methods of modifying a genomic locus of interest to alter gene expression in a cell by introducing into the cell any of the compositions described herein.
Один аспект настоящего изобретения заключается в том, что вышеупомянутые элементы содержатся в одной композиции или содержатся в отдельных композициях. Эти композиции преимущественно могут быть применимы в отношении хозяина для индуцирования функционального эффекта на уровне генома.One aspect of the present invention is that the above-mentioned elements are contained in a single composition or are contained in separate compositions. These compositions can advantageously be applied to a host to induce a functional effect at the genome level.
В целом, gRNA модифицируют таким способом, который обеспечивает специфические сайты связывания (например, аптамеры) для адаптерных белков, содержащих один или несколько функциональных доменов (например, посредством образования слитого белка) для связывания. Модифицированные sgRNA модифицированы таким образом, что как только gRNA образует комплекс DD-CRISPR (т.е. фермент DD-CRISPR связывается с gRNA и мишенью), происходит связывание адаптерных белков, и функциональный домен на адаптерном белке располагается в пространственной ориентации, которая является преимущественной для эффективности присущей ему функции. Например, если функциональный домен содержит, состоит, по сути, из активатора транскрипции (например, VP64 или p65), то активатор транскрипции размещается в пространственной ориентации, которая позволяет ему влиять на транскрипцию мишени. Подобным образом, репрессор транскрипции будет размещаться преимущественно, чтобы воздействовать на транскрипцию мишени, а нуклеаза (например, Fok1) будет размещаться преимущественно для расщепления или частичного расщепления мишени.In general, gRNAs are modified in a manner that provides specific binding sites (e.g., aptamers) for adaptor proteins containing one or more functional domains (e.g., by forming a fusion protein) to bind. Modified sgRNAs are modified such that once the gRNA forms a DD-CRISPR complex (i.e., the DD-CRISPR enzyme binds to the gRNA and the target), binding of the adaptor proteins occurs and the functional domain on the adaptor protein is positioned in a spatial orientation that is advantageous for the efficiency of its inherent function. For example, if the functional domain contains, consists essentially of, a transcriptional activator (e.g., VP64 or p65), the transcriptional activator is positioned in a spatial orientation that allows it to affect the transcription of the target. Similarly, a transcriptional repressor will be positioned preferentially to affect transcription of the target, and a nuclease (e.g., Fok1) will be positioned preferentially to cleave or partially cleave the target.
Специалисту в данной области будет понятно, что модификации в gRNA, которые обеспечивают возможность связывания адаптер + функциональный домен, но не обеспечивают надлежащее размещение адаптор + функциональный домен (например, из-за стерического несоответствия в трехмерной структуре комплекса CRISPR), представляют собой модификации, которые не подразумеваются. Одна или несколько модифицированных gRNA могут быть модифицированы по тетрапетле, "петле-на-стебле" 1, "петле-на-стебле" 2 или "петле-на-стебле" 3, описываемым в данном документе, предпочтительно либо по тетрапетле, либо по "петле-на-стебле" 2, и наиболее предпочтительно как по терапетле, так и по "петле-на-стебле" 2.It will be appreciated by those skilled in the art that modifications to a gRNA that allow binding of the adapter + functional domain but do not allow proper placement of the adapter + functional domain (e.g., due to steric hindrance in the three-dimensional structure of the CRISPR complex) are modifications that are not intended. The one or more modified gRNAs may be modified at a tetraloop, stem-loop 1, stem-loop 2, or stem-loop 3 described herein, preferably at either the tetraloop or stem-loop 2, and most preferably at both the teraloop and stem-loop 2.
Как объясняется в данном документе, функциональные домены могут представлять собой, например, один или несколько доменов из группы, включающей, состоящей, по сути, из или состоящей из доменов с метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, активностью расщепления РНК, активностью расщепления ДНК, активностью связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). В некоторых случаях преимущественным является дополнительное обеспечение по меньшей мере одного NLS и/или NES. В некоторых случаях преимущественно размещать NLS и/или NES на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными.As explained herein, the functional domains may be, for example, one or more domains from the group comprising, consisting essentially of, or consisting of domains with methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, RNA cleavage activity, DNA cleavage activity, nucleic acid binding activity, and molecular switches (e.g., light-inducible). In some cases, it is advantageous to further provide at least one NLS and/or NES. In some cases, it is advantageous to place the NLS and/or NES at the N-terminus. When more than one functional domain is included, the functional domains may be the same or different.
gRNA может быть разработана с включением множественных связывающих сайтов распознавания (например, аптамеров), специфических в отношении одного и того же или разных адаптерных белков. gRNA может быть разработана так, чтобы связываться с промоторным участком, расположенным на -1000 - +1 нуклеотидов выше сайта начала транскрипции (т.е. TSS), предпочтительно -200 нуклеотидов. Такое размещение улучшает функциональные домены, которые воздействуют на активацию гена (например, активаторы транскрипции) или ингибирование гена (например, репрессоры транскрипции). Модифицированная gRNA может представлять собой одну или несколько модифицированных gRNA (например, по меньшей мере 1 gRNA, по меньшей мере 2 gRNA, по меньшей мере 5 gRNA, по меньшей мере 10 gRNA, по меньшей мере 20 gRNA, по меньшей мере 30 gRNA, по меньшей мере 50 gRNA), нацеленных на один или несколько целевых локусов, содержащихся в композиции.The gRNA can be designed to include multiple recognition binding sites (e.g., aptamers) specific for the same or different adaptor proteins. The gRNA can be designed to bind to a promoter region located -1000 to +1 nucleotides upstream of the transcription start site (i.e., TSS), preferably -200 nucleotides. This placement improves functional domains that affect gene activation (e.g., transcriptional activators) or gene inhibition (e.g., transcriptional repressors). The modified gRNA can be one or more modified gRNAs (e.g., at least 1 gRNA, at least 2 gRNA, at least 5 gRNA, at least 10 gRNA, at least 20 gRNA, at least 30 gRNA, at least 50 gRNA) targeting one or more target loci contained in the composition.
Кроме того, фермент DD-CRISPR со сниженной нуклеазной активностью является наиболее эффективным, если нуклеазная активность инактивирована (например, инактивация нуклеазы по меньшей мере на 70%, по меньшей мере на 80%, по меньшей мере на 90%, по меньшей мере на 95%, по меньшей мере на 97% или на 100% по сравнению с ферментом дикого типа; или, другими словами, фермент DD-Cas9 или фермент DD-CRISPR характеризуется преимущественно приблизительно 0% нуклеазной активностью относительно немутированного фермента Cas9 или фермента CRISPR или фермента дикого типа, или не более чем приблизительно 3%, или приблизительно 5%, или приблизительно 10% нуклеазной активностью относительно немутированного фермента Cas9 или фермента CRISPR или фермента дикого типа). Это возможно путем введения мутаций в нуклеазный домен RuvC Cas9 и его ортологов. Инактивированный фермент CRISPR может быть ассоциирован (например, посредством образования слитого белка) с одним или несколькими функциональными доменами, например, по меньшей мере с одним дестабилизирующим доменом; или, например, подобными описываемым в данном документе для модифицированных gRNA, связывающих адаптерные белки, в том числе, например, с одним или несколькими доменами из группы, включающей, состоящей, по сути, из или состоящей из доменов с метилазной активностью, деметилазной активности, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, активностью расщепления РНК, активностью расщепления ДНК, активностью связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). Предпочтительными доменами являются Fok1, VP64, P65, HSF1, MyoD1. В случае, когда предусматривается Fok1, преимущественно, чтобы предусматривались множественные функциональные домены Fok1 для обеспечения функционального димера, и чтобы разрабатывались gRNA, обеспечивающие надлежащее расстояние для функционального применения (Fok1), как конкретно описано в Tsai et al. Nature Biotechnology, Vol. 32, Number 6, June 2014). В адаптерном белке можно использовать известные линкеры для прикрепления таких функциональных доменов. В некоторых случаях преимущественным является дополнительное обеспечение по меньшей мере одного NLS или NES. В некоторых случаях преимущественно размещать NLS или NES на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными. В целом, размещение одного или нескольких функциональных доменом в инактивированном ферменте DD-CRISPR обеспечивает корректную пространственную ориентацию функционального домена, чтобы воздействовать на мишень с присущим ему функциональным эффектом. Например, если функциональный домен представляет собой активатор транскрипции (например, VP64 или p65), то активатор транскрипции размещается в пространственной ориентации, которая позволяет ему влиять на транскрипцию мишени. Подобным образом, репрессор транскрипции будет размещаться преимущественно, чтобы воздействовать на транскрипцию мишени, а нуклеаза (например, Fok1) будет размещаться преимущественно для расщепления или частичного расщепления мишени. Могут быть предусмотрены положения, отличные от N-/C-конца фермента DD-CRISPR.In addition, the DD-CRISPR enzyme with reduced nuclease activity is most effective if the nuclease activity is inactivated (e.g., at least 70%, at least 80%, at least 90%, at least 95%, at least 97%, or 100% nuclease inactivation compared to the wild-type enzyme; or, in other words, the DD-Cas9 enzyme or DD-CRISPR enzyme is characterized by predominantly about 0% nuclease activity relative to the unmutated Cas9 enzyme or CRISPR enzyme or wild-type enzyme, or no more than about 3%, or about 5%, or about 10% nuclease activity relative to the unmutated Cas9 enzyme or CRISPR enzyme or wild-type enzyme). This is possible by introducing mutations into the nuclease domain of RuvC Cas9 and its orthologs. The inactivated CRISPR enzyme may be associated (e.g., by forming a fusion protein) with one or more functional domains, such as at least one destabilizing domain; or, for example, similar to those described herein for modified gRNAs that bind adaptor proteins, including, for example, one or more domains from the group comprising, consisting essentially of, or consisting of domains with methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, RNA cleavage activity, DNA cleavage activity, nucleic acid binding activity, and molecular switches (e.g., light-inducible). Preferred domains are Fok1, VP64, P65, HSF1, MyoD1. In the case where Fok1 is provided, it is advantageous that multiple functional domains of Fok1 are provided to provide a functional dimer, and that gRNAs are designed to provide the appropriate distance for functional use (Fok1, as specifically described in Tsai et al. Nature Biotechnology, Vol. 32, Number 6, June 2014). Known linkers can be used in the adapter protein to attach such functional domains. In some cases, it is advantageous to additionally provide at least one NLS or NES. In some cases, it is advantageous to place the NLS or NES at the N-terminus. When more than one functional domain is included, the functional domains can be the same or different. In general, the placement of one or more functional domains in the inactivated DD-CRISPR enzyme ensures the correct spatial orientation of the functional domain to act on the target with its inherent functional effect. For example, if the functional domain is a transcriptional activator (e.g., VP64 or p65), the transcriptional activator is positioned in a spatial orientation that allows it to affect transcription of the target. Similarly, a transcriptional repressor would be positioned preferentially to affect transcription of the target, and a nuclease (e.g., Fok1) would be positioned preferentially to cleave or partially cleave the target. Positions other than the N-/C-terminus of the DD-CRISPR enzyme may be envisaged.
Адаптерный белок может представлять собой любой из ряда белков, который связывается с аптамером или сайтом распознавания, введенным в модифицированную gRNA, и который обеспечивает возможность правильного размещения одного или нескольких функциональных доменов, после того как gRNA встроилась в комплекс CRISPR, чтобы воздействовать на мишень в пределах присущей ему функции. Как подробно объясняется в настоящей заявке, они могут представлять собой белки оболочки, предпочтительно белки оболочки бактериофагов. Функциональные домены, ассоциированные с такими адаптерными белками (например, в форме слитого белка), могут включать, например, один или несколько доменов из группы, включающей, состоящей, по сути, из или состоящей из доменов с метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, активностью расщепления РНК, активностью расщепления ДНК, активностью связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). Предпочтительными доменами являются Fok1, VP64, P65, HSF1, MyoD1. В случае, если функциональный домен представляет собой активатор транскрипции или репрессор транскрипции, преимущественным является дополнительное обеспечение по меньшей мере NLS или NES и предпочтительно на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными. В адаптерном белке можно использоваться известные линкеры для прикрепления таких функциональных доменов. Такие линкеры можно применять для ассоциации DD с ферментом CRISPR или для обеспечения фермента CRISPR, содержащего DD.The adaptor protein may be any of a number of proteins that bind to an aptamer or recognition site introduced into the modified gRNA and that allows one or more functional domains to be correctly positioned after the gRNA has been incorporated into the CRISPR complex to act on the target within its intended function. As explained in detail in this application, they may be coat proteins, preferably bacteriophage coat proteins. Functional domains associated with such adapter proteins (e.g. in the form of a fusion protein) may comprise, for example, one or more domains from the group comprising, consisting essentially of or consisting of domains with methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, RNA cleavage activity, DNA cleavage activity, nucleic acid binding activity and molecular switches (e.g. inducible by light). Preferred domains are Fok1, VP64, P65, HSF1, MyoD1. In case the functional domain is a transcriptional activator or a transcriptional repressor, it is advantageous to additionally provide at least an NLS or NES and preferably at the N-terminus. When including more than one functional domain, the functional domains may be the same or different. The adaptor protein can use known linkers to attach such functional domains. Such linkers can be used to associate the DD with the CRISPR enzyme or to provide a CRISPR enzyme containing the DD.
Таким образом, все из gRNA, например, модифицированной gRNA, инактивированного фермента DD-CRISPR (с функциональными доменами или без них) и связывающего белка с одним или несколькими функциональными доменами могут по отдельности содержаться в композиции и их можно вводить хозяину по отдельности или совместно. Альтернативно эти компоненты могут обеспечиваться в одной композиции для введения хозяину. Введение хозяину может быть выполнено посредством вирусных векторов, известных специалисту или описываемых в данном документе для доставки хозяину (например, лентивирусного вектора, аденовирусного вектора, вектора на основе AAV). Как объясняется в данном документе, применение различных маркеров отбора (например, для отбора лентивирусной sgRNA) и различной концентрации gRNA (например, в зависимости от того, применяются ли множественные gRNA) может быть предпочтительным для индуцирования улучшенного эффекта. Исходя из этой концепции для индукции преобразования в локусе генома подходят несколько вариантов, включая расщепление ДНК, активацию гена или дезактивацию гена. С применением предусмотренных композиций специалист в данной области сможет осуществить эффективное и специфическое нацеливание на один или множественные локусы с помощью одинаковых или различных функциональных доменов для индукции одного или нескольких преобразований в локусе генома. Композиции можно применять в целом ряде способов скрининга библиотек в клетках и функционального моделирования in vivo (например, активации генов lincRNA и идентификации функций; моделирования мутации с приобретением функции; моделирования мутации с потерей функции; применения композиций в соответствии с настоящим изобретением для создания линий клеток и трансгенных животных в целях оптимизации и скрининга).Thus, all of the gRNA, such as the modified gRNA, the inactivated DD-CRISPR enzyme (with or without functional domains) and the binding protein with one or more functional domains may be separately contained in a composition and may be administered to the host separately or together. Alternatively, these components may be provided in a single composition for administration to the host. Administration to the host may be accomplished via viral vectors known to the skilled artisan or described herein for delivery to the host (e.g., a lentiviral vector, an adenoviral vector, an AAV-based vector). As explained herein, the use of different selection markers (e.g., for lentiviral sgRNA selection) and different gRNA concentrations (e.g., depending on whether multiple gRNAs are used) may be advantageous to induce an improved effect. Based on this concept, several options are suitable for inducing transformation at a genomic locus, including DNA cleavage, gene activation or gene inactivation. Using the provided compositions, a person skilled in the art will be able to efficiently and specifically target one or multiple loci using the same or different functional domains to induce one or more transformations at a genomic locus. The compositions can be used in a variety of methods for screening libraries in cells and functional modeling in vivo (e.g., lincRNA gene activation and function identification; gain-of-function modeling; loss-of-function modeling; using the compositions of the present invention to create cell lines and transgenic animals for optimization and screening purposes).
Настоящее изобретение охватывает применение композиций по настоящему изобретению для создания и использования трансгенных клеток/животных с зависимой от условий или индуцируемой DD-CRISPR; см, например, Platt et al., Cell (2014), 159(2): 440-455, или патентные публикации согласно PCT, процитированные в данном документе, такие как WO 2014/093622 (PCT/US2013/074667). Например, клетки или животные, такие как отличные от человека животные, например, позвоночные или млекопитающие, такие как грызуны, например, мыши, крысы, или другие лабораторные или внелабораторные животные, например, кошки, собаки, овцы и т.д., могут характеризоваться состоянием "нокин", в результате чего у животного в зависимости от условий или индуцируемо экспрессируется DD-Cas9, как описано в Platt et al. Таким образом, целевая клетка или животное содержат зависимый от условий или индуцируемый фермент DD-CRISPR (например, DD-Cas9) (например, в форме Cre-зависимых конструкций) и/или зависимый от условий или индуцируемый адаптерный белок или DD, и при экспрессии вектора, введенного в целевую клетку, вектор экспрессирует то, что индуцирует или обеспечивает условие для экспрессии фермента DD-CRISPR (например, DD-Cas9) и/или экспрессии адаптера или DD в целевой клетке. С применением идей и композиций в соответствии с настоящим изобретением с известным способом создания комплекса CRISPR индуцируемые преобразования генома также являются аспектом настоящего изобретения. Одним из примеров этого является создание трансгенного животного с нокином CRISPR/зависимой от условий экспрессией (например, мыши, содержащей, например, кассету Lox-Stop-polyA-Lox(LSL)) и последующая доставка одной или нескольких композиций, обеспечивающих одну или несколько модифицированных gRNA (например, -200 нуклеотидов до TSS в представляющем интерес целевом гене для целей активации гена, например, модифицированных gRNA с одним или несколькими аптамерами, распознаваемыми белками оболочки, например, MS2), один или несколько адаптерных белков, описываемых в данном документе (MS2-связывающий белок, связанный с одним или несколькими VP64), и средств для индуцирования животного с зависимой от условий экспрессией (например, рекомбиназы Cre для обеспечения индуцируемой экспрессии DD-Cas9). Альтернативно адаптерный белок или DD может обеспечиваться как зависимый от условий или индуцируемый элемент с зависимым от условий или индуцируемым ферментом CRISPR, чтобы обеспечить эффективную модель для целей скрининга, для которой преимущественно требуется только минимальная разработка и введение специфических gRNA для целого ряда применений.The present invention encompasses the use of the compositions of the present invention to generate and use transgenic cells/animals with conditionally or inducibly expressed DD-CRISPR; see, e.g., Platt et al., Cell (2014), 159(2):440-455, or the PCT patent publications cited therein, such as WO 2014/093622 (PCT/US2013/074667). For example, cells or animals, such as non-human animals, e.g., vertebrates or mammals, such as rodents, e.g., mice, rats, or other laboratory or non-laboratory animals, e.g., cats, dogs, sheep, etc., can be characterized by a "knockin" state, whereby the animal conditionally or inducibly expresses DD-Cas9, as described in Platt et al. Thus, the target cell or animal comprises a conditionally dependent or inducible DD-CRISPR enzyme (e.g., DD-Cas9) (e.g., in the form of Cre-dependent constructs) and/or a conditionally dependent or inducible adapter protein or DD, and when the vector introduced into the target cell is expressed, the vector expresses that which induces or provides a condition for the expression of the DD-CRISPR enzyme (e.g., DD-Cas9) and/or the expression of the adapter or DD in the target cell. By applying the ideas and compositions according to the present invention with a known method for creating a CRISPR complex, inducible genome transformations are also an aspect of the present invention. One example of this is the generation of a CRISPR knockin/conditional expression transgenic animal (e.g., a mouse containing, e.g., a Lox-Stop-polyA-Lox (LSL) cassette) and subsequent delivery of one or more compositions providing one or more modified gRNAs (e.g., -200 nucleotides to the TSS in a target gene of interest for purposes of gene activation, e.g., modified gRNAs with one or more aptamers recognized by coat proteins, e.g., MS2), one or more adaptor proteins described herein (MS2 binding protein linked to one or more VP64), and means for inducing the animal to have conditional expression (e.g., Cre recombinase to provide inducible expression of DD-Cas9). Alternatively, the adaptor protein or DD can be provided as a conditionally dependent or inducible element with a conditionally dependent or inducible CRISPR enzyme to provide an efficient model for screening purposes that advantageously requires only minimal design and introduction of specific gRNAs for a variety of applications.
В некоторых вариантах осуществления фенотипическое изменение предпочтительно является результатом модификации генома при осуществлении нацеливания на генетическое заболевание, особенно в способах терапии, и предпочтительно, если обеспечивается матрица для репарации для коррекции или изменения фенотипа.In some embodiments, the phenotypic change is preferably the result of modification of the genome in targeting a genetic disease, particularly in therapeutic methods, and preferably if a repair template is provided to correct or alter the phenotype.
В некоторых вариантах осуществления заболевания, на которые можно осуществлять нацеливание, включают заболевания, которые обусловлены патогенными дефектами сплайсинга.In some embodiments, diseases that can be targeted include diseases that are caused by pathogenic splicing defects.
В некоторых вариантах осуществления клеточные цели включают в себя гемопоэтические стволовые клетки/клетки-предшественники (CD34+); человеческие T-клетки и клетки глаза (клетки сетчатки), например, фоторецепторные клетки-предшественники.In some embodiments, cellular targets include hematopoietic stem/progenitor cells (CD34+); human T cells, and ocular cells (retinal cells), such as photoreceptor progenitor cells.
В некоторых вариантах осуществления гены-мишени включают: ген бета-глобина человека - HBB (для лечения серповидноклеточной анемии, в том числе путем стимуляции конверсии генов (с использованием близкородственного гена HBD в качестве эндогенной матрицы)); CD3 (T-клетки) и CEP920 - сетчатка (глаза).In some embodiments, target genes include: human beta globin gene - HBB (for the treatment of sickle cell anemia, including by stimulating gene conversion (using the closely related HBD gene as an endogenous template)); CD3 (T cells) and CEP920 - retina (eyes).
В некоторых вариантах осуществления заболевания-мишени также включают рак; серповидноклеточную анемию (обусловленную точечной мутацией); HBV, HIV; бета-талассемию; а также офтальмологическое или глазное заболевание, например, врожденный амавроз Лебера (LCA), вызванный дефектом сплайсинга.In some embodiments, the target diseases also include cancer; sickle cell anemia (caused by a point mutation); HBV, HIV; beta-thalassemia; and an ophthalmologic or eye disease, such as Leber congenital amaurosis (LCA), caused by a splicing defect.
В некоторых вариантах осуществления способы доставки включают опосредованную катионным липидом "прямую" доставку комплекса фермент-направляющая (рибонуклеопротеин) и электропорацию плазмидной ДНК.In some embodiments, delivery methods include cationic lipid-mediated "direct" delivery of the enzyme-targeting (ribonucleoprotein) complex and electroporation of plasmid DNA.
Способы, продукты и варианты применения, описанные в данном документе, можно применять для целей, не связанных с терапией. Кроме того, любой из способов, описанных в данном документе, можно применять in vitro и ex vivo.The methods, products, and uses described herein may be used for purposes other than therapy. In addition, any of the methods described herein may be used in vitro and ex vivo.
В одном аспекте предусмотрена не встречающаяся в природе или сконструированная композиция, содержащая:In one aspect, there is provided a non-naturally occurring or engineered composition comprising:
I. две или более полинуклеотидные последовательности системы CRISPR-Cas, предусматривающиеI. two or more polynucleotide sequences of the CRISPR-Cas system, providing
(a) первую направляющую последовательность, способную гибридизироваться с первой целевой последовательностью в полинуклеотидном локусе,(a) a first guide sequence capable of hybridizing to a first target sequence at a polynucleotide locus,
(b) вторую направляющую последовательность, способную гибридизироваться со второй целевой последовательностью в полинуклеотидном локусе,(b) a second guide sequence capable of hybridizing to a second target sequence at the polynucleotide locus,
(c) последовательность прямого повтора,(c) direct repeat sequence,
(d) необязательно, если применимо, tracr-последовательность; и(d) optionally, if applicable, the tracr sequence; and
II. фермент Cas9 или вторую полинуклеотидную последовательность, кодирующую его,II. the Cas9 enzyme or a second polynucleotide sequence encoding it,
где фермент Cas9 представляет собой модифицированный фермент, содержащий один или несколько DD, описываемых в данном документе,wherein the Cas9 enzyme is a modified enzyme comprising one or more DDs described herein,
где будучи транскрибированными, первая и вторая направляющие последовательности управляют специфичным к последовательности связыванием первого и второго комплекса CRISPR с первой и второй целевыми последовательностями соответственно,wherein, when transcribed, the first and second guide sequences direct sequence-specific binding of the first and second CRISPR complexes to the first and second target sequences, respectively,
где первый комплекс CRISPR содержит фермент Cas9 в комплексе с первой направляющей последовательностью, которая может гибридизироваться с первой целевой последовательностью,wherein the first CRISPR complex comprises a Cas9 enzyme in complex with a first guide sequence that can hybridize to a first target sequence,
где второй комплекс CRISPR содержит фермент Cas9 в комплексе со второй направляющей последовательностью, которая может гибридизироваться со второй целевой последовательностью, иwherein the second CRISPR complex comprises a Cas9 enzyme in complex with a second guide sequence that can hybridize to a second target sequence, and
где первая направляющая последовательность управляет расщеплением одной нити ДНК-дуплекса возле первой целевой последовательности, и вторая направляющая последовательность управляет расщеплением другой нити возле второй целевой последовательности, при этом индуцируется двухнитевой разрыв, за счет чего обеспечивается модифицирование организма, или отличного от человеческого, или отличного от животного организма.wherein the first guide sequence directs cleavage of one strand of a DNA duplex near a first target sequence, and the second guide sequence directs cleavage of the other strand near a second target sequence, thereby inducing a double-strand break, thereby providing modification of an organism, either non-human or non-animal.
В другом варианте осуществления Cas9 доставляется в клетку в виде белка. В другом и особенно предпочтительном варианте осуществления Cas9 доставляется в клетку в виде белка или в виде нуклеотидной последовательности, кодирующей его. Доставка в клетку в виде белка может включать доставку рибонуклеопротеинового (RNP) комплекса, где белок находится в комплексе с направляющей.In another embodiment, Cas9 is delivered to the cell as a protein. In another and particularly preferred embodiment, Cas9 is delivered to the cell as a protein or as a nucleotide sequence encoding it. Delivery to the cell as a protein may include delivery of a ribonucleoprotein (RNP) complex, where the protein is in a complex with a guide.
В одном аспекте предусмотрены клетки-хозяева и линии клеток, модифицированные с помощью композиций, систем или модифицированных ферментов по настоящему изобретению или содержащие их, в том числе стволовые клетки и их потомство.In one aspect, host cells and cell lines modified with or containing the compositions, systems or modified enzymes of the present invention are provided, including stem cells and their progeny.
В одном аспекте предусмотрены способы клеточной терапии, при которых, например, отдельную клетку или популяцию клеток отбирают или культивируют, где такую клетку или клетки модифицируют или они были модифицированы ex vivo, как описано в данном документе, а затем возвращают (отобранные клетки) или вводят (культивируемые клетки) в организм. Стволовые клетки, будь то эмбриональные, индуцированные плюрипотентные или тотипотентные стволовые клетки, также особенно предпочтительны в этом отношении. Но, разумеется, также предусматриваются варианты осуществления in vivo.In one aspect, methods of cell therapy are provided in which, for example, a single cell or population of cells is isolated or cultured, wherein such cell or cells are or have been modified ex vivo as described herein, and then returned (selected cells) or introduced (cultured cells) into the body. Stem cells, whether embryonic, induced pluripotent or totipotent stem cells, are also particularly preferred in this regard. But, of course, in vivo embodiments are also contemplated.
Способы в соответствии с настоящим изобретением могут дополнительно предусматривать доставку матриц, таких как матрицы для репарации, которые могут представлять собой dsODN или ssODN, см. ниже. Доставка матриц может осуществляться одновременно или отдельно от доставки какого-либо или всех из фермента CRISPR или направляющей и с помощью одного и того же или различных механизмов доставки. В некоторых вариантах осуществления предпочтительно, чтобы матрица доставлялась вместе с направляющей и, предпочтительно, также с ферментом CRISPR. Примером может служить вектор на основе AAV, при этом фермент CRISPR представляет собой AsCas9 или LbCas9.The methods according to the present invention may further comprise delivery of templates, such as repair templates, which may be dsODN or ssODN, see below. Delivery of the templates may be carried out simultaneously or separately from delivery of any or all of the CRISPR enzyme or guide and by the same or different delivery mechanisms. In some embodiments, it is preferred that the template is delivered together with the guide and, preferably, also with the CRISPR enzyme. An example is an AAV-based vector, wherein the CRISPR enzyme is AsCas9 or LbCas9.
Способы в соответствии с настоящим изобретением могут дополнительно включать: (a) доставку в клетку двухнитевого олигодезоксинуклеотида (dsODN), содержащего "липкие" концы, комплементарные "липким" концам, создаваемым с помощью указанного двухнитевого разрыва, где указанный dsODN интегрируется в представляющий интерес локус; или (b) доставку в клетку однонитевого олигодезоксинуклеотида (ssODN), где указанный ssODN действует как матрица для гомологичной репарации указанного двухнитевого разрыва. Способы в соответствии с настоящим изобретением можно применять для предупреждения или лечения заболевания у индивидуума, при этом необязательно указанное заболевание вызвано дефектом в указанном представляющем интерес локусе. Способы в соответствии с настоящим изобретением можно выполнять in vivo у индивидуума или ex vivo в отношении клетки, извлеченной из индивидуума, где необязательно указанную клетку возвращают в организм индивидуума.The methods of the present invention may further comprise: (a) delivering to a cell a double-stranded oligodeoxynucleotide (dsODN) comprising sticky ends complementary to the sticky ends created by said double-strand break, wherein said dsODN integrates into a locus of interest; or (b) delivering to a cell a single-stranded oligodeoxynucleotide (ssODN), wherein said ssODN acts as a template for homologous repair of said double-strand break. The methods of the present invention may be used to prevent or treat a disease in an individual, optionally wherein said disease is caused by a defect in said locus of interest. The methods of the present invention may be performed in vivo in an individual or ex vivo on a cell removed from an individual, optionally wherein said cell is returned to the individual.
Настоящее изобретение также охватывает продукты, полученные в результате применения фермента CRISPR, или фермента Cas, или фермента Cas9, или фермента CRISPR-CRISPR, или системы CRISPR-Cas, или системы CRISPR-Cas9 по настоящему изобретению.The present invention also encompasses products obtained by using a CRISPR enzyme, or a Cas enzyme, or a Cas9 enzyme, or a CRISPR-CRISPR enzyme, or a CRISPR-Cas system, or a CRISPR-Cas9 system of the present invention.
Структурная гомология, гомологи и ортологиStructural homology, homologues and orthologues
В вариантах осуществления белок Cas9, упоминаемый в данном документе, также охватывает гомолога или ортолога Cas9, такого как SpCas9 или eSpCas9. Термины "ортологичный" (также в данном документе называемый "ортолог") и "гомологичный" (также в данном документе называемый "гомолог") хорошо известны из уровня техники. В качестве дополнительного руководства, "гомологичный" белок, как используется в данном документе, представляет собой белок того же вида, который выполняет ту же или подобную функцию, что и белок, которому он гомологичен. Гомологи и ортологи могут быть идентифицированы с помощью моделирования гомологии (см., например, Greer, Science vol. 228 (1985) 1055, и Blundell et al. Eur J Biochem vol 172 (1988), 513) или "структурного BLAST" (Dey F, Cliff Zhang Q, Petrey D, Honig B. Toward a "structural BLAST": using structural relationships to infer function. Protein Sci. 2013 Apr;22(4):359-66. doi: 10.1002/pro.2225.). См. также Shmakov et al. (2015) в рамках применения в области локусов CRISPR-Cas. Гомологичные белки могут, но не обязательно должны быть структурно родственными, или они являются только частично структурно родственными. "Ортологичный" белок, как используется в настоящем документе, представляет собой белок от другого вида, который выполняет ту же или подобную функцию, что и белок, которому он ортологичен. Ортологичные белки могут, но не обязательно должны быть структурно родственными, или они являются только частично структурно родственными. В конкретных вариантах осуществления гомолог или ортолог Cas9, упоминаемого в данном документе, характеризуется гомологией или идентичностью последовательности, составляющими по меньшей мере 80%, более предпочтительно по меньшей мере 85%, еще более предпочтительно по меньшей мере 90%, как, например, по меньшей мере 95%, с Cas9. В дополнительных вариантах осуществления гомолог или ортолог Cas9, упоминаемого в данном документе, характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, более предпочтительно по меньшей мере 85%, еще более предпочтительно по меньшей мере 90%, как, например, по меньшей мере 95%, с Cas9 дикого типа. В конкретных вариантах осуществления гомолог или ортолог Cas9, упоминаемого в данном документе, характеризуется гомологией или идентичностью последовательности, составляющими по меньшей мере 80%, более предпочтительно по меньшей мере 85%, еще более предпочтительно по меньшей мере 90%, как, например, по меньшей мере 95%, с Cas9. В дополнительных вариантах осуществления гомолог или ортолог Cas9, упоминаемого в данном документе, характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, более предпочтительно по меньшей мере 85%, еще более предпочтительно по меньшей мере 90%, как, например, по меньшей мере 95%, с SpCas9 дикого типа. Если Cas9 имеет одну или несколько мутаций (мутированный), то гомолог или ортолог указанного Cas9, упоминаемого в данном документе, характеризуется идентичностью последовательности, составляющей по меньшей мере 80%, более предпочтительно по меньшей мере 85%, еще более предпочтительно по меньшей мере 90%, как, например, по меньшей мере 95%, с мутированным Cas9.In embodiments, a Cas9 protein referred to herein also encompasses a homolog or ortholog of Cas9, such as SpCas9 or eSpCas9. The terms "orthologous" (also referred to herein as an "ortholog") and "homologous" (also referred to herein as a "homolog") are well known in the art. As a further guide, a "homologous" protein, as used herein, is a protein of the same species that performs the same or similar function as the protein to which it is homologous. Homologs and orthologs can be identified using homology modeling (see, e.g., Greer, Science vol. 228 (1985) 1055, and Blundell et al. Eur J Biochem vol 172 (1988), 513) or "structural BLAST" (Dey F, Cliff Zhang Q, Petrey D, Honig B. Toward a "structural BLAST": using structural relationships to infer function. Protein Sci. 2013 Apr;22(4):359-66. doi: 10.1002/pro.2225.). See also Shmakov et al. (2015) for applications to CRISPR-Cas loci. Homologous proteins may, but do not necessarily, be structurally related, or they are only partially structurally related. An "orthologous" protein, as used herein, is a protein from another species that performs the same or similar function as the protein to which it is orthologous. Orthologous proteins may, but need not, be structurally related, or are only partially structurally related. In particular embodiments, a homolog or ortholog of Cas9 as referred to herein has a homology or sequence identity of at least 80%, more preferably at least 85%, even more preferably at least 90%, such as at least 95%, to Cas9. In further embodiments, a homolog or ortholog of Cas9 as referred to herein has a sequence identity of at least 80%, more preferably at least 85%, even more preferably at least 90%, such as at least 95%, to wild-type Cas9. In particular embodiments, a homolog or ortholog of Cas9 as referred to herein has a homology or sequence identity of at least 80%, more preferably at least 85%, even more preferably at least 90%, such as at least 95%, with Cas9. In further embodiments, a homolog or ortholog of Cas9 as referred to herein has a sequence identity of at least 80%, more preferably at least 85%, even more preferably at least 90%, such as at least 95%, with wild-type SpCas9. If Cas9 has one or more mutations (mutated), then the homolog or ortholog of said Cas9 as referred to herein has a sequence identity of at least 80%, more preferably at least 85%, even more preferably at least 90%, such as at least 95%, with the mutated Cas9.
Конкретные домены ортологичных белков, подобным образом, являются родственными. В определенных вариантах осуществления ортологичный домен Cas9, упоминаемого в данном документе, характеризуется гомологией или идентичностью последовательности, составляющими по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90% или по меньшей мере 95%, с Cas9. В конкретных вариантах осуществления ортологичный домен Cas9, упоминаемого в данном документе, характеризуется гомологией или идентичностью последовательности, составляющими по меньшей мере 60%, по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90% или по меньшей мере 95%, с SpCas9.Specific domains of orthologous proteins are similarly related. In certain embodiments, an orthologous domain of Cas9 as referred to herein has at least 60%, at least 70%, at least 80%, at least 90%, or at least 95% homology or sequence identity with Cas9. In particular embodiments, an orthologous domain of Cas9 as referred to herein has at least 60%, at least 70%, at least 80%, at least 90%, or at least 95% homology or sequence identity with SpCas9.
Доставка комплекса CRISPR-Cas9 или его компонентовDelivery of the CRISPR-Cas9 complex or its components
Благодаря использованию данного раскрытия и сведений из уровня техники, систему CRISPR-Cas, особенно новые системы CRISPR, описанные в данном документе, или ее компоненты, или ее молекулы нуклеиновой кислоты (в том числе, например, матрицу для HDR), или молекулы нуклеиновой кислоты, кодирующие или представляющие собой ее компоненты, можно доставлять с помощью системы доставки, описываемой в данном документе как в целом, так и в подробностях.By utilizing this disclosure and the prior art, a CRISPR-Cas system, particularly the novel CRISPR systems described herein, or components thereof, or nucleic acid molecules thereof (including, for example, an HDR template), or nucleic acid molecules encoding or comprising components thereof, can be delivered using a delivery system described herein, both generally and in detail.
Векторная доставка, например, доставка с помощью плазмиды, вируса. Фермент CRISPR, например, Cas9, ортолог Cas9 или его мутант, и/или любую из РНК по настоящему изобретению, например, направляющую РНК, можно доставлять с помощью любого подходящего вектора, например, плазмиды или вирусных векторов, таких как аденоассоциированный вирус (AAV), лентивирус, аденовирус или другие типы вирусных векторов, или их комбинации. Cas9 и одна или несколько направляющих РНК могут быть упакованы в одном или нескольких векторах, например, плазмиде или вирусных векторах. В некоторых вариантах осуществления вектор, например, плазмиду или вирусный вектор, доставляют в представляющую интерес ткань посредством, например, внутримышечной инъекции, тогда как в других случаях доставка осуществляется посредством внутривенного, трансдермального, интраназального, перорального, трансмукозального или других способов доставки. Такая доставка может осуществляться в виде однократной дозы или многократных доз. Специалисту в данной области понятно, что фактическая доза, подлежащая доставке согласно данному документу, может в значительной степени варьировать в зависимости от ряда факторов, таких как выбор вектора, целевые клетка, организм или ткань, общее состояние субъекта, подлежащего лечению, степень требуемой трансформации/модификации, путь введения, способ введения, тип требуемой трансформации/модификации и т.п.Vector delivery, e.g., plasmid, viral delivery. A CRISPR enzyme, e.g., Cas9, a Cas9 ortholog or mutant thereof, and/or any of the RNAs of the present invention, e.g., a guide RNA, can be delivered using any suitable vector, e.g., a plasmid or viral vectors such as an adeno-associated virus (AAV), a lentivirus, an adenovirus, or other types of viral vectors, or combinations thereof. Cas9 and one or more guide RNAs can be packaged in one or more vectors, e.g., a plasmid or viral vectors. In some embodiments, a vector, e.g., a plasmid or a viral vector, is delivered to the tissue of interest by, e.g., intramuscular injection, while in other cases, delivery is via intravenous, transdermal, intranasal, oral, transmucosal, or other delivery methods. Such delivery can be in the form of a single dose or multiple doses. One skilled in the art will appreciate that the actual dose to be delivered herein may vary significantly depending on a number of factors such as the choice of vector, the target cell, organism or tissue, the general condition of the subject being treated, the degree of transformation/modification required, the route of administration, the route of administration, the type of transformation/modification required, etc.
Такая доза может дополнительно содержать, например, носитель (воду, солевой раствор, этанол, глицерин, лактозу, сахарозу, фосфат кальция, желатин, декстран, агар, пектин, арахисовое масло, кунжутное масло и т.д.), разбавитель, фармацевтически приемлемый носитель (например, фосфатно-солевой буфер), фармацевтически приемлемый наполнитель и/или другие соединения, известные из уровня техники. Доза может дополнительно содержать одну или несколько фармацевтически приемлемых солей, таких как, например, соль неорганической кислоты, такая как гидрохлорид, гидробромид, фосфат, сульфат и т.д.; и соли органических кислот, такие как ацетаты, пропионаты, малонаты, бензоаты и т.д. Дополнительно в ней также могут присутствовать вспомогательные вещества, такие как смачивающие или эмульгирующие средства, буферные вещества, поддерживающие pH, гели или гелеобразующие материалы, ароматизаторы, красители, микросферы, полимеры, суспендирующие средства и т.д. Кроме того, также могут присутствовать один или несколько других традиционных фармацевтических ингредиентов, таких как консерванты, увлажнители, суспендирующие средства, поверхностно-активные вещества, антиоксиданты, средства против слеживания, заполнители, хелатообразователи, средства для нанесения покрытий, химические стабилизаторы и т.д., особенно если лекарственная форма представляет собой форму, подлежащую восстановлению. Подходящие иллюстративные ингредиенты включают микрокристаллическую целлюлозу, натрий-карбоксиметилцеллюлозу, полисорбат 80, фенилэтиловый спирт, хлорбутанол, сорбат калия, сорбиновую кислоту, диоксид серы, пропилгаллат, парабены, этилванилин, глицерин, фенол, парахлорфенол, желатин, альбумин и их комбинацию. Подробное обсуждение фармацевтически приемлемых наполнителей доступно в REMINGTON'S PHARMACEUTICAL SCIENCES (Mack Pub. Co., N.J. 1991), включенном в данный документ посредством ссылки.Such a dose may further comprise, for example, a carrier (water, saline, ethanol, glycerol, lactose, sucrose, calcium phosphate, gelatin, dextran, agar, pectin, peanut oil, sesame oil, etc.), a diluent, a pharmaceutically acceptable carrier (e.g., phosphate buffered saline), a pharmaceutically acceptable excipient, and/or other compounds known in the art. The dose may further comprise one or more pharmaceutically acceptable salts, such as, for example, a salt of an inorganic acid, such as hydrochloride, hydrobromide, phosphate, sulfate, etc.; and salts of organic acids, such as acetates, propionates, malonates, benzoates, etc. Additionally, it may also contain auxiliary substances such as wetting or emulsifying agents, pH buffering agents, gels or gelling materials, flavorings, coloring agents, microspheres, polymers, suspending agents, etc. In addition, one or more other conventional pharmaceutical ingredients such as preservatives, humectants, suspending agents, surfactants, antioxidants, anti-caking agents, fillers, chelating agents, coating agents, chemical stabilizers, etc. may also be present, especially if the dosage form is a form to be reconstituted. Suitable illustrative ingredients include microcrystalline cellulose, sodium carboxymethylcellulose, polysorbate 80, phenylethyl alcohol, chlorobutanol, potassium sorbate, sorbic acid, sulfur dioxide, propyl gallate, parabens, ethyl vanillin, glycerin, phenol, parachlorophenol, gelatin, albumin, and combinations thereof. A detailed discussion of pharmaceutically acceptable excipients is available in REMINGTON'S PHARMACEUTICAL SCIENCES (Mack Pub. Co., N.J. 1991), incorporated herein by reference.
В одном варианте осуществления согласно данному документу доставку осуществляют посредством аденовируса, который может находиться в однократной бустерной дозе, содержащей по меньшей мере 1 x 105 частиц (также называемых единицами частиц, pu) аденовирусного вектора. В одном варианте осуществления согласно данному документу доза предпочтительно составляет по меньшей мере приблизительно 1 x 106 частиц (например, приблизительно 1 x 106 - 1 x 1012 частиц), более предпочтительно по меньшей мере приблизительно 1 x 107 частиц, более предпочтительно по меньшей мере приблизительно 1 x 108 частиц (например, приблизительно 1 x 108 - 1 x 1011 частиц или приблизительно 1 x 108 - 1 x 1012 частиц) и наиболее предпочтительно по меньшей мере приблизительно 1 x 109 частиц (например, приблизительно 1 x 109 - 1 x 1010 частиц или приблизительно 1 x 109 - 1 x 1012 частиц) или даже по меньшей мере приблизительно 1 x 1010 частиц (например, приблизительно 1 x 1010 - 1 x 1012 частиц) аденовирусного вектора. Альтернативно доза содержит не более чем приблизительно 1 x 1014 частиц, предпочтительно не более чем приблизительно 1 x 1013 частиц, еще более предпочтительно не более чем приблизительно 1 x 1012 частиц, еще более предпочтительно не более чем приблизительно 1 x 1011 частиц и наиболее предпочтительно не более чем приблизительно 1 x 1010 частиц (например, не более чем приблизительно 1 x 109 частиц). Таким образом, доза может включать в себя однократную дозу аденовирусного вектора, например, с приблизительно 1 x 106 единиц частиц (pu), приблизительно 2 x 106 pu, приблизительно 4 x 106 pu, приблизительно 1 x 107 pu, приблизительно 2 x 107 pu, приблизительно 4 x 107 pu, приблизительно 1 x 108 pu, приблизительно 2 x 108 pu, приблизительно 4 x 108 pu, приблизительно 1 x 109 pu, приблизительно 2 x 109 pu, приблизительно 4 x 109 pu, приблизительно 1 x 1010 pu, приблизительно 2 x 1010 pu, приблизительно 4 x 1010 pu, приблизительно 1 x 1011 pu, приблизительно 2 x 1011 pu, приблизительно 4 x 1011 pu, приблизительно 1 x 1012 pu, приблизительно 2 x 1012 pu или приблизительно 4 x 1012 pu аденовирусного вектора. См., например, аденовирусные векторы в патенте США № 8454972 B2 Nabel, et. al., выданном 4 июня 2013 г.; включенном в данный документ посредством ссылки, и дозы в столбце 29, строках 36-58 данного патента. В одном варианте осуществления согласно данному документу аденовирус доставляется посредством многократных доз.In one embodiment according to this document, delivery is carried out via adenovirus, which can be in a single booster dose containing at least 1 x 10 5 particles (also referred to as particle units, pu) of adenoviral vector. In one embodiment according to this document, the dose is preferably at least about 1 x 10 6 particles (e.g., about 1 x 10 6 - 1 x 10 12 particles), more preferably at least about 1 x 10 7 particles, more preferably at least about 1 x 10 8 particles (e.g., about 1 x 10 8 - 1 x 10 11 particles or about 1 x 10 8 - 1 x 10 12 particles) and most preferably at least about 1 x 10 9 particles (e.g., about 1 x 10 9 - 1 x 10 10 particles or about 1 x 10 9 - 1 x 10 12 particles) or even at least about 1 x 10 10 particles (e.g., about 1 x 10 10 - 1 x 10 12 particles) of adenoviral vector. Alternatively, the dose contains no more than about 1 x 10 14 particles, preferably no more than about 1 x 10 13 particles, even more preferably no more than about 1 x 10 12 particles, even more preferably no more than about 1 x 10 11 particles, and most preferably no more than about 1 x 10 10 particles (e.g., no more than about 1 x 10 9 particles). Thus, the dose may comprise a single dose of adenoviral vector, for example, with about 1 x 10 6 particle units (pu), about 2 x 10 6 pu, about 4 x 10 6 pu, about 1 x 10 7 pu, about 2 x 10 7 pu, about 4 x 10 7 pu, about 1 x 10 8 pu, about 2 x 10 8 pu, about 4 x 10 8 pu, about 1 x 10 9 pu, about 2 x 10 9 pu, about 4 x 10 9 pu, about 1 x 10 10 pu, about 2 x 10 10 pu, about 4 x 10 10 pu, about 1 x 10 11 pu, about 2 x 10 11 pu, about 4 x 10 11 pu, about 1 x 10 12 pu, about 2 x 10 12 pu, or about 4 x 10 12 pu of an adenovirus vector. See, for example, the adenovirus vectors in U.S. Patent No. 8,454,972 B2 to Nabel, et al., issued June 4, 2013; incorporated herein by reference, and the doses at column 29, lines 36-58 of that patent. In one embodiment according to this document, the adenovirus is delivered via multiple doses.
В одном варианте осуществления согласно данному документу доставку осуществляют посредством AAV. Полагают, что терапевтически эффективная доза для in vivo доставки AAV человеку находится в диапазоне от приблизительно 20 до приблизительно 50 мл физиологического раствора, содержащего от приблизительно 1 x 1010 до приблизительно 1 x 1010 функциональных частиц AAV/мл раствора. Дозу можно скорректировать для уравновешивания терапевтической пользы и любых побочных эффектов. В одном варианте осуществления согласно данному документу доза AAV, как правило, находится в диапазоне концентраций от приблизительно 1 x 105 до 1 x 1050 геномов AAV, от приблизительно 1 x 108 до 1 x 1020 геномов AAV, от приблизительно 1 x 1010 до приблизительно 1 x 1016 геномов или от приблизительно 1 x 1011 до приблизительно 1 x 1016 геномов AAV. Доза для человека может составлять приблизительно 1 x 1013 геномов AAV. Такие концентрации можно доставлять в растворе носителя объемом от приблизительно 0,001 мл до приблизительно 100 мл, от приблизительно 0,05 до приблизительно 50 мл или от приблизительно 10 до приблизительно 25 мл. Другие эффективные дозы может без труда установить средний специалист в данной области посредством стандартных испытаний с построением кривых зависимости "доза-эффект". См., например, патент США № 8404658 B2 Hajjar, et al., выданный 26 марта 2013 г., в столбце 27, строках 45-60.In one embodiment according to the present document, delivery is carried out via AAV. It is believed that a therapeutically effective dose for in vivo delivery of AAV to a human is in the range of about 20 to about 50 ml of saline solution containing about 1 x 10 10 to about 1 x 10 10 functional AAV particles/ml of solution. The dose can be adjusted to balance the therapeutic benefit and any side effects. In one embodiment according to the present document, the dose of AAV is typically in the concentration range of about 1 x 10 5 to 1 x 10 50 AAV genomes, about 1 x 10 8 to 1 x 10 20 AAV genomes, about 1 x 10 10 to about 1 x 10 16 genomes, or about 1 x 10 11 to about 1 x 10 16 AAV genomes. A human dose may be about 1 x 10 13 AAV genomes. Such concentrations may be delivered in a carrier solution of about 0.001 ml to about 100 ml, about 0.05 ml to about 50 ml, or about 10 ml to about 25 ml. Other effective doses may be readily determined by one of ordinary skill in the art through routine dose-response testing. See, for example, U.S. Patent No. 8,404,658 B2 to Hajjar, et al., issued March 26, 2013, at column 27, lines 45-60.
В одном варианте осуществления согласно данному документу доставку осуществляют посредством плазмиды. В таких композициях с плазмидами доза должна представлять собой количество плазмид, достаточное для вызывания эффекта. Например, подходящие количества плазмидной ДНК в композициях с плазмидами могут составлять от приблизительно 0,1 до приблизительно 2 мг или от приблизительно 1 мкг до приблизительно 10 мкг из расчет на индивидуума весом 70 кг. Плазмиды по настоящему изобретению в общем будут содержать (i) промотор; (ii) последовательность, кодирующую фермент CRISPR, функционально связанную с указанным промотором; (iii) селектируемый маркер; (iv) точку начала репликациии и (v) расположенный ниже нее терминатор транскрипции, функционально связанный с (ii). Плазмида может также кодировать компоненты РНК комплекса CRISPR, но наряду с этим один или несколько из них могут кодироваться другим вектором.In one embodiment according to the present document, delivery is carried out via a plasmid. In such plasmid compositions, the dose should be an amount of plasmid sufficient to cause an effect. For example, suitable amounts of plasmid DNA in plasmid compositions can be from about 0.1 to about 2 mg, or from about 1 μg to about 10 μg, based on an individual weighing 70 kg. Plasmids of the present invention will generally comprise (i) a promoter; (ii) a sequence encoding a CRISPR enzyme operably linked to said promoter; (iii) a selectable marker; (iv) an origin of replication; and (v) a downstream transcription terminator operably linked to (ii). The plasmid may also encode RNA components of the CRISPR complex, but along with this, one or more of them may be encoded by another vector.
Дозы в данном документе определяются в расчете на индивидуума со средним весом 70 кг. Частота введения находится в пределах компетенции практикующего врача или ветеринара (например, доктора, ветеринарного врача) или ученого, являющегося специалистом в данной области. Также отмечено, что вес используемых в эксперименте мышей, как правило, составляет приблизительно 20 г, что при проведении экспериментов с мышами пропорционально индивидууму весом 70 кг.The doses in this document are based on an average weight of 70 kg. The frequency of administration is within the competence of a medical practitioner or veterinarian (e.g., a doctor, a veterinarian) or a scientist who is a specialist in this field. It is also noted that the weight of the mice used in the experiment is usually approximately 20 g, which is proportional to an individual weighing 70 kg when experiments are carried out with mice.
В некоторых вариантах осуществления молекулы РНК по настоящему изобретению доставляют в липосомных составах или составах на основе Lipofectin и им подобных, и их можно получить с помощью способов, хорошо известных специалистам в данной области. Такие способы описаны, например, в патентах США №№ 5593972, 5589466 и 5580859, включенных в данный документ посредством ссылки. Были разработаны системы доставки, специально предназначенные для повышения эффективности и улучшения доставки siRNA в клетки млекопитающих (см., например, Shen et al FEBS Let. 2003, 539:111-114; Xia et al., Nat. Biotech. 2002, 20:1006-1010; Reich et al., Mol. Vision. 2003, 9: 210-216; Sorensen et al., J. Mol. Biol. 2003, 327: 761-766; Lewis et al., Nat. Gen. 2002, 32: 107-108 и Simeoni et al., NAR 2003, 31, 11: 2717-2724), и их можно применять в настоящем изобретении. Недавно siRNA успешно применили для ингибирования экспрессии генов у приматов (см., например, Tolentino et al., Retina 24(4):660), и их также можно применять в настоящем изобретении.In some embodiments, the RNA molecules of the present invention are delivered in liposomal or Lipofectin-based formulations and the like, and can be prepared using methods well known to those skilled in the art. Such methods are described, for example, in U.S. Patent Nos. 5,593,972, 5,589,466, and 5,580,859, incorporated herein by reference. Delivery systems specifically designed to enhance the efficiency and improve the delivery of siRNA into mammalian cells have been developed (see, for example, Shen et al FEBS Let. 2003, 539:111-114; Xia et al., Nat. Biotech. 2002, 20:1006-1010; Reich et al., Mol. Vision. 2003, 9: 210-216; Sorensen et al., J. Mol. Biol. 2003, 327: 761-766; Lewis et al., Nat. Gen. 2002, 32: 107-108 and Simeoni et al., NAR 2003, 31, 11: 2717-2724), and they can be used in the present invention. Recently, siRNAs have been successfully used to inhibit gene expression in primates (see, e.g., Tolentino et al., Retina 24(4):660), and they can also be used in the present invention.
И действительно, доставка РНК также является применимым способом доставки in vivo. Cas9 и gRNA (и, например, матрицу для HR-репарации) можно доставлять в клетки с использованием липосом, или частиц, или наночастиц. Таким образом, доставка фермента CRISPR, такого как Cas9, и/или доставка РНК по настоящему изобретению может осуществляться в форме РНК и посредством микровезикул, липосом, или частиц, или наночастиц. Например, мРНК Cas9 и gRNA могут быть упакованы в липосомные частицы для доставки in vivo. Реагенты для липосомной трансфекции, такие как Lipofectamine от Life Technologies, и другие реагенты, имеющиеся в продаже, могут эффективно доставлять молекулы РНК в печень.Indeed, RNA delivery is also a useful method for in vivo delivery. Cas9 and gRNA (and, for example, a template for HR repair) can be delivered to cells using liposomes or particles or nanoparticles. Thus, the delivery of a CRISPR enzyme, such as Cas9, and/or the delivery of RNA according to the present invention can be carried out in the form of RNA and via microvesicles, liposomes or particles or nanoparticles. For example, Cas9 mRNA and gRNA can be packaged in liposomal particles for in vivo delivery. Liposomal transfection reagents, such as Lipofectamine from Life Technologies and other reagents available commercially, can efficiently deliver RNA molecules to the liver.
Также предпочтительные средства доставки РНК включают доставку РНК посредством частиц или наночастиц (Cho, S., Goldberg, M., Son, S., Xu, Q., Yang, F., Mei, Y., Bogatyrev, S., Langer, R. and Anderson, D., Lipid-like nanoparticles for small interfering RNA delivery to endothelial cells, Advanced Functional Materials, 19: 3112-3118, 2010) или экзосом (Schroeder, A., Levins, C., Cortez, C., Langer, R., and Anderson, D., Lipid-based nanotherapeutics for siRNA delivery, Journal of Internal Medicine, 267: 9-21, 2010, PMID: 20059641). И действительно, как было показано, экзосомы являются особенно применимыми в доставке siRNA, системы, в некоторой степени сходной с системой CRISPR. Например, El-Andaloussi S, et al. ("Exosome-mediated delivery of siRNA in vitro and in vivo." Nat Protoc. 2012 Dec;7(12):2112-26. doi: 10.1038/nprot.2012.131. электронная публикация от 15 ноября 2012 г.) описывают как экзосомы, являющиеся перспективными инструментами доставки лекарственных средств через различные биологические барьеры, можно приспособить для доставки siRNA in vitro и in vivo. Данный подход заключается в создании целенаправленных экзосом посредством трансфекции вектором экспрессии, содержащим экзосомный белок, слитый с пептидным лигандом. Экзосомы затем очищают от супернатанта с трансфицированными клетками и характеризуют, а затем в экзосомы загружают РНК. Доставку или введение в соответствии с настоящим изобретением можно осуществлять с помощью экзосом, в частности, без ограничения в головной мозг. Витамин E (α-токоферол) можно конъюгировать с CRISPR-Cas и доставлять в головной мозг вместе с липопротеином высокой плотности (HDL), например, аналогично тому, как это было выполнено Uno et al. (HUMAN GENE THERAPY 22:711-719 (June 2011)) для доставки короткой интерферирующей РНК (siRNA) в головной мозг. Мышам проводили инфузию с помощью осмотических мининасосов (модель 1007D; Alzet, Купертино, Калифорния), наполненных фосфатно-солевым буфером (PBS) или свободной Toc-siBACE или Toc-siBACE/HDL, и соединенных с набором 3 для инфузий в головной мозг (Alzet). Канюлю для инфузий в головной мозг размещали приблизительно на 0,5 мм кзади от брегмы на средней линии для инфузии в дорсальную часть третьего желудочка. Uno et al. обнаружили, что всего 3 нмоль Toc-siRNA с HDL в том же способе ICV инфузии могут индуцировать аналогичную степень целенаправленного снижения. Аналогичная доза CRISPR-Cas, конъюгированной с α-токоферолом и вводимой совместно с HDL, целенаправленно воздействующей на головной мозг, может предусматриваться в настоящем изобретении для людей, например, может предусматриваться в количестве от приблизительно 3 нмоль до приблизительно 3 мкмоль CRISPR-Cas, целенаправленно воздействующей на головной мозг. Zou et al. (HUMAN GENE THERAPY 22:465-475 (April 2011)) описывают способ опосредованной лентивирусами доставки коротких шпилечных РНК, нацеливающихся на PKCγ, для сайленсинга in vivo генов в спинном мозге крыс. Zou et al. вводили приблизительно 10 мкл рекомбинантного лентивируса с титром 1 x 109 трансдуцирующих единиц (TU)/мл с помощью интратекального катетера. Аналогичная доза экспрессируемой CRISPR-Cas в лентивирусном векторе, нацеливающемся на головной мозг, может предусматриваться в настоящем изобретении для людей, например, может предусматриваться приблизительно 10-50 мл CRISPR-Cas, нацеливающейся на головной мозг, в лентивирусе с титром 1 x 109 трансдуцирующих единиц (TU)/мл.Also preferred RNA delivery vehicles include RNA delivery via particles or nanoparticles (Cho, S., Goldberg, M., Son, S., Xu, Q., Yang, F., Mei, Y., Bogatyrev, S., Langer, R. and Anderson, D., Lipid-like nanoparticles for small interfering RNA delivery to endothelial cells, Advanced Functional Materials, 19: 3112–3118, 2010) or exosomes (Schroeder, A., Levins, C., Cortez, C., Langer, R., and Anderson, D., Lipid-based nanotherapeutics for siRNA delivery, Journal of Internal Medicine, 267: 9–21, 2010, PMID: 20059641). Indeed, exosomes have been shown to be particularly useful in siRNA delivery, a system somewhat similar to the CRISPR system. For example, El-Andaloussi S, et al. ("Exosome-mediated delivery of siRNA in vitro and in vivo." Nat Protoc. 2012 Dec;7(12):2112-26. doi: 10.1038/nprot.2012.131. electronic publication November 15, 2012) describe how exosomes, which are promising tools for drug delivery across various biological barriers, can be adapted to deliver siRNA in vitro and in vivo. This approach involves the generation of targeted exosomes by transfection with an expression vector containing the exosomal protein fused to a peptide ligand. The exosomes are then purified from the supernatant of transfected cells and characterized, and then the exosomes are loaded with RNA. The delivery or administration according to the present invention can be carried out by means of exosomes, in particular without limitation to the brain. Vitamin E (α-tocopherol) can be conjugated to CRISPR-Cas and delivered to the brain together with high-density lipoprotein (HDL), for example, similar to what was done by Uno et al. (HUMAN GENE THERAPY 22:711-719 (June 2011)) for the delivery of short interfering RNA (siRNA) to the brain. Mice were infused using osmotic minipumps (model 1007D; Alzet, Cupertino, CA) filled with phosphate-buffered saline (PBS) or free Toc-siBACE or Toc-siBACE/HDL and connected to Brain Infusion Kit 3 (Alzet). The brain infusion cannula was placed approximately 0.5 mm posterior to bregma in the midline for infusion into the dorsal third ventricle. Uno et al. found that as little as 3 nmol of Toc-siRNA with HDL in the same ICV infusion route could induce a similar degree of targeting. A similar dose of α-tocopherol-conjugated CRISPR-Cas co-administered with HDL targeting the brain could be provided in the present invention for humans, for example, could be provided in an amount of from about 3 nmol to about 3 μmol of brain-targeting CRISPR-Cas. Zou et al. (HUMAN GENE THERAPY 22:465-475 (April 2011)) describe a method for lentiviral-mediated delivery of short hairpin RNAs targeting PKCγ for in vivo gene silencing in the rat spinal cord. Zou et al. administered approximately 10 μl of recombinant lentivirus at a titer of 1 x 10 9 transducing units (TU)/ml via an intrathecal catheter. A similar dose of expressed CRISPR-Cas in a brain-targeting lentiviral vector may be provided in the present invention for humans, for example, approximately 10-50 ml of brain-targeting CRISPR-Cas in a lentivirus at a titer of 1 x 10 9 transducing units (TU)/ml may be provided.
Если подразумевают местную доставку в головной мозг, то этого можно достичь разными способами. Например, материал можно доставлять интрастриатально, например, с помощью инъекции. Инъекцию можно осуществлять стереотаксически посредством краниотомии.If local delivery to the brain is intended, this can be achieved in a variety of ways. For example, the material can be delivered intrastriatically, such as by injection. The injection can be performed stereotactically via craniotomy.
Повышение эффективности NHEJ или HR также способствует доставке. Предпочтительно, чтобы эффективность NHEJ повышали посредством совместной экспрессии ферментов для обработки концов, таких как Trex2 (Dumitrache et al. Genetics. 2011 August; 188(4): 787-797). Предпочтительно, чтобы эффективность HR повышалась путем транзиентного ингибирования компонентов аппарата NHEJ, таких как Ku70 и Ku86. Эффективность HR также можно повысить путем совместной экспрессии прокариотических или эукариотических ферментов гомологичной рекомбинации, таких как RecBCD, RecA.Increasing the efficiency of NHEJ or HR also facilitates delivery. Preferably, NHEJ efficiency is increased by co-expression of end-processing enzymes such as Trex2 (Dumitrache et al. Genetics. 2011 August; 188(4): 787-797). Preferably, HR efficiency is increased by transient inhibition of components of the NHEJ machinery such as Ku70 and Ku86. HR efficiency can also be increased by co-expression of prokaryotic or eukaryotic homologous recombination enzymes such as RecBCD, RecA.
Упаковка и промоторыPackaging and promoters
Существуют следующие способы упаковки молекул нуклеиновой кислоты, кодирующих Cas9 по настоящему изобретению, например ДНК, в векторы, например вирусные векторы, для опосредования модификации генома in vivo.The following methods exist for packaging nucleic acid molecules encoding Cas9 of the present invention, such as DNA, into vectors, such as viral vectors, to mediate genome modification in vivo.
Для обеспечения опосредованного NHEJ нокаута гена необходимо следующее.To achieve NHEJ-mediated gene knockout, the following is required.
Один вирусный векторOne viral vector
Вектор, содержащий две или более кассет экспрессии:A vector containing two or more expression cassettes:
промотор-молекула нуклеиновой кислоты, кодирующая Cas9-терминатор;promoter - a nucleic acid molecule encoding the Cas9 terminator;
промотор-gRNA1-терминатор;promoter-gRNA1-terminator;
промотор-gRNA2-терминатор;promoter-gRNA2-terminator;
промотор-gRNA(N)-терминатор (до предельного размера вектора).promoter-gRNA(N)-terminator (up to the maximum vector size).
Два вирусных вектораTwo viral vectors
Вектор 1, содержащий одну кассету экспрессии для управления экспрессией Cas9:Vector 1 containing one expression cassette to drive Cas9 expression:
промотор-молекула нуклеиновой кислоты, кодирующая Cas9-терминатор;promoter - a nucleic acid molecule encoding the Cas9 terminator;
вектор 2, содержащий одну или несколько кассет экспрессии для управления экспрессией одной или нескольких направляющих РНК:vector 2 containing one or more expression cassettes for directing the expression of one or more guide RNAs:
промотор-gRNA1-терминатор;promoter-gRNA1-terminator;
промотор-gRNA(N)-терминатор (до предельного размера вектора).promoter-gRNA(N)-terminator (up to the maximum vector size).
Для опосредования репарации с участием гомологичной рекомбинации.To mediate repair involving homologous recombination.
В дополнение к подходам с одним и двумя вирусными векторами, описанными выше, можно использовать дополнительный вектор для доставки матрицы для репарации с участием гомологичной рекомбинации.In addition to the single and dual viral vector approaches described above, an additional vector can be used to deliver a template for repair involving homologous recombination.
Промотор, используемый для управления экспрессией молекулы нуклеиновой кислоты, кодирующей Cas9, может включать следующее.The promoter used to drive expression of the nucleic acid molecule encoding Cas9 may include the following.
- ITR AAV может служить в качестве промотора: это является преимущественным для устранения необходимости в дополнительном промоторном элементе (который может занимать пространство в векторе). Освободившееся дополнительное пространство можно задействовать для управления экспрессией дополнительных элементов (gRNA и т.д.). Также активность ITR является относительно более слабой, поэтому ее можно использовать для снижения потенциальной токсичности, обусловленной сверхэкспрессией Cas9.- AAV ITR can serve as a promoter: this is advantageous in that it eliminates the need for an additional promoter element (which may take up space in the vector). The freed up extra space can be used to drive the expression of additional elements (gRNA, etc.). Also, the ITR activity is relatively weaker, so it can be used to reduce the potential toxicity caused by Cas9 overexpression.
- Для повсеместной экспрессии промоторы, которые могут быть использованы, включают: CMV, CAG, CBh, PGK, SV40, генов тяжелой или легкой цепей ферритина и т.д.- For ubiquitous expression, promoters that can be used include: CMV, CAG, CBh, PGK, SV40, ferritin heavy or light chain genes, etc.
Для экспрессии в головном мозге или в другом отделе ЦНС можно использовать следующие промоторы: гена синапсина I для всех нейронов, гена CaMKII-альфа для возбуждающих нейронов, GAD67, или GAD65, или VGAT для GABA-эргических нейронов и т.д. Для экспрессии в печени можно использовать промотор гена альбумина. Для экспрессии в легком можно использовать SP-B. Для эндотелиальных клеток можно использовать ICAM. Для кроветворных клеток можно использовать промотор гена IFN-бета или CD45. Для остеобластов можно использовать OG-2.For expression in the brain or another part of the CNS, the following promoters can be used: the synapsin I gene for all neurons, the CaMKII-alpha gene for excitatory neurons, GAD67 or GAD65 or VGAT for GABAergic neurons, etc. For expression in the liver, the albumin gene promoter can be used. For expression in the lung, SP-B can be used. For endothelial cells, ICAM can be used. For hematopoietic cells, the IFN-beta or CD45 gene promoter can be used. For osteoblasts, OG-2 can be used.
Промотор, используемый для управления направляющей РНК, может включать в себя следующее:The promoter used to drive the guide RNA may include the following:
- промоторы Pol III, такие как U6 или H1;- Pol III promoters such as U6 or H1;
- использование промотора Pol II и интронных кассет для экспрессии gRNA.- use of the Pol II promoter and intron cassettes for gRNA expression.
Аденоассоциированный вирус (AAV)Adeno-associated virus (AAV)
Cas9 или мутант или ортолог Cas9 и одну или несколько направляющих РНК можно доставлять с помощью аденоассоциированного вируса (AAV), лентивируса, аденовируса или других типов плазмидных или вирусных векторов, в частности, с применением составов и доз согласно, например, патентам США №№ 8454972 (составы, дозы для аденовируса), 8404658 (составы, дозы для AAV) и 5846946 (составы, дозы для плазмидных ДНК) и клиническим испытаниям и публикациям результатов клинических испытаний с использованием лентивируса, AAV и аденовируса. Например, для AAV путь введения, состав и доза могут быть такими, как определено в патенте США № 8454972 и в клинических испытаниях с использованием AAV. Для аденовируса путь введения, состав и доза могут быть такими, как определено в патенте США № 8404658 и в клинических испытаниях с использованием аденовируса. Для доставки с помощью плазмид путь введения, состав и доза могут быть такими, как определено в патенте США № 5846946 и в клинических испытаниях с использованием плазмид. Дозы могут быть определены в расчете на или экстраполированы на индивидуума со средним весом 70 кг (например, взрослый мужчина), и могут быть скорректированы для пациентов, субъектов, млекопитающих с другим весом и другого вида. Частота введения входит в пределы компетенции практикующего врача или ветеринара (например, доктора, ветеринарного врача) и зависит от обычных факторов, в том числе от возраста, пола, общего состояния здоровья, других состояний пациента или субъекта и конкретных рассматриваемых состояний или симптомов. Вирусные векторы можно инъецировать в представляющую интерес ткань. В случае специфичной относительно типа клетки модификации генома, экспрессия Cas9 может управляться промотором, специфичным относительно типа клетки. Например, при печеночноспецифической экспрессии может использоваться промотор гена альбумина, а при нейрон-специфической экспрессии (например, для нацеливания на нарушения ЦНС) может использоваться промотор гена синапсина I.Cas9 or a Cas9 mutant or ortholog and one or more guide RNAs can be delivered using an adeno-associated virus (AAV), lentivirus, adenovirus or other types of plasmid or viral vectors, in particular using formulations and dosages according to, for example, U.S. Patent Nos. 8,454,972 (formulations, dosages for adenovirus), 8,404,658 (formulations, dosages for AAV) and 5,846,946 (formulations, dosages for plasmid DNA) and clinical trials and publications of clinical trial results using lentivirus, AAV and adenovirus. For example, for AAV, the route of administration, formulation and dosage can be as defined in U.S. Patent No. 8,454,972 and in clinical trials using AAV. For adenovirus, the route of administration, formulation, and dosage may be as defined in U.S. Patent No. 8,404,658 and in clinical trials using adenovirus. For plasmid delivery, the route of administration, formulation, and dosage may be as defined in U.S. Patent No. 5,846,946 and in clinical trials using plasmids. Doses may be based on or extrapolated to an individual with an average weight of 70 kg (e.g., an adult male), and may be adjusted for patients, subjects, mammals of other weights, and other species. The frequency of administration is within the discretion of the practitioner or veterinarian (e.g., a doctor, a veterinarian) and will depend on conventional factors, including the age, sex, general health, other conditions of the patient or subject, and the particular conditions or symptoms being addressed. Viral vectors may be injected into the tissue of interest. In the case of cell type-specific genome modification, Cas9 expression can be driven by a cell type-specific promoter. For example, liver-specific expression could use the albumin gene promoter, while neuron-specific expression (e.g., to target CNS disorders) could use the synapsin I gene promoter.
Что касается доставки in vivo, то AAV является преимущественным по сравнению с другими вирусными векторами по двум причинам:With regard to in vivo delivery, AAV is advantageous over other viral vectors for two reasons:
низкая токсичность (она может быть обусловлена способом очистки, не требующим ультрацентрифугирования клеточных частиц, которые могут активировать иммунный ответ);low toxicity (this may be due to the purification method, which does not require ultracentrifugation of cellular particles that can activate the immune response);
низкая вероятность вызова инсерционного мутагенеза, поскольку он не интегрируется в геном хозяина.low probability of causing insertional mutagenesis since it does not integrate into the host genome.
AAV имеет предел упаковки, составляющий 4,5 или 4,75 т. п. о. Это означает, что все из Cas9, а также промотора и терминатора транскрипции должны помещаться в одном и том же вирусном векторе. Конструкции, размер которых превышает 4,5 или 4,75 т. п. о., будут обуславливать значительное снижение продуцирования вируса. SpCas9 является достаточно крупным, размер гена самого по себе превышает 4,1 т. п. о., затрудняя его упаковку в AAV. Следовательно, варианты осуществления настоящего изобретения включают использование более коротких гомологов Cas9. Например:AAV has a packaging limit of 4.5 or 4.75 kb. This means that all of Cas9, as well as the promoter and transcription terminator, must fit into the same viral vector. Constructs larger than 4.5 or 4.75 kb will result in a significant reduction in virus production. SpCas9 is quite large, the gene itself being larger than 4.1 kb, making it difficult to package into AAV. Therefore, embodiments of the present invention include the use of shorter Cas9 homologues. For example:
Эти виды, таким образом, в целом являются предпочтительными видами для получения Cas9.These species are thus generally preferred species for Cas9 production.
Что касается AAV, то AAV может представлять собой AAV1, AAV2, AAV5 или любую их комбинацию. Можно выбрать AAV из AAV с учетом клеток, подлежащих нацеливанию; например, можно выбрать AAV серотипов 1, 2, 5 или гибридный капсид AAV1, AAV2, AAV5 или любую их комбинацию для нацеливания на головной мозг или нейроны; и можно выбрать AAV4 для нацеливания на сердечную ткань. AAV8 применим для доставки в печень. Вышеуказанные промоторы и векторы в данном документе являются предпочтительными по отдельности. Сопоставление определенных серотипов AAV по отношению к определенным клеткам (см. Grimm, D. et al, J. Virol. 82: 5887-5911 (2008)) представлено следующим образом:With respect to AAV, the AAV may be AAV1, AAV2, AAV5 or any combination thereof. One may select an AAV from among AAVs based on the cells to be targeted; for example, one may select AAV serotypes 1, 2, 5 or a hybrid capsid of AAV1, AAV2, AAV5 or any combination thereof to target the brain or neurons; and one may select AAV4 to target cardiac tissue. AAV8 is useful for liver delivery. The above promoters and vectors are individually preferred herein. The mapping of specific AAV serotypes to specific cells (see Grimm, D. et al, J. Virol. 82: 5887-5911 (2008)) is shown as follows:
ЛентивирусLentivirus
Лентивирусы являются сложными ретровирусами, которые обладают способностью инфицировать как митотические, так и постмитотические клетки и экспрессировать в них свои гены. Наиболее известным лентивирусом является вирус иммунодефицита человека (HIV), который использует гликопротеины оболочки других вирусов для нацеливания на широкий спектр типов клеток.Lentiviruses are complex retroviruses that have the ability to infect both mitotic and postmitotic cells and express their genes in them. The best-known lentivirus is the human immunodeficiency virus (HIV), which uses the envelope glycoproteins of other viruses to target a wide range of cell types.
Лентивирусы можно получить следующим образом. После клонирования pCasES10 (которая содержит остов лентивирусной плазмиды-переносчика) HEK293FT, прошедшие малое количество пассажей (p=5), высевали во флакон T-75 до 50% конфлюэнтности за день до трансфекции в DMEM с 10% фетальной бычьей сывороткой и без антибиотиков. Через 20 часов среду заменяли на среду OptiMEM (бессывороточную) и через 4 часа проводили трансфекцию. Клетки трансфицировали с помощью 10 мкг лентивирусной плазмиды-переносчика (pCasES10) и следующих пакующих плазмид: 5 мкг pMD2.G (псевдотип VSV-g) и 7,5 мкг psPAX2 (gag/pol/rev/tat). Трансфекцию проводили в 4 мл OptiMEM со средством доставки на основе катионного липида (50 мкл Lipofectamine 2000 и 100 мкл реагента Plus). Через 6 часов среду заменяли на DMEM, не содержащую антибиотиков, с 10% фетальной бычьей сыворотки. В данных способах при культивировании клеток использовали сыворотку, но использование бессывороточных способов является предпочтительным.Lentiviruses can be generated as follows. After cloning pCasES10 (which contains the lentiviral transfer plasmid backbone), low-passage HEK293FT cells (p=5) were seeded in a T-75 flask to 50% confluency the day before transfection in DMEM with 10% fetal bovine serum and no antibiotics. After 20 h, the medium was changed to OptiMEM (serum-free) and transfection was performed 4 h later. Cells were transfected with 10 μg of the lentiviral transfer plasmid (pCasES10) and the following packaging plasmids: 5 μg of pMD2.G (pseudotype VSV-g) and 7.5 μg of psPAX2 (gag/pol/rev/tat). Transfections were performed in 4 ml OptiMEM with a cationic lipid delivery vehicle (50 µl Lipofectamine 2000 and 100 µl Plus reagent). After 6 h, the medium was replaced with antibiotic-free DMEM with 10% fetal bovine serum. These methods used serum during cell culture, but serum-free methods are preferred.
Лентивирус можно очистить следующим способом. Вируссодержащие супернатанты собирали через 48 часов. Супернатанты сперва очищали от дебриса и фильтровали через фильтр с низкой степенью связывания белка (PVDF) на 0,45 мкм. Затем их центрифугировали на ультрацентрифуге в течение 2 часов при 24000 об./мин. Вируссодержащие супернатанты ресуспендировали в 50 мкл DMEM в течение ночи при 4°C. Затем их разделяли на аликвоты и сразу же замораживали при -80°C.Lentivirus can be purified as follows. Virus-containing supernatants were collected after 48 h. The supernatants were first cleared of debris and filtered through a 0.45 μm low protein binding filter (PVDF). They were then centrifuged in an ultracentrifuge for 2 h at 24,000 rpm. Virus-containing supernatants were resuspended in 50 μl DMEM overnight at 4°C. They were then aliquoted and immediately frozen at -80°C.
В другом варианте осуществления также предусмотрены минимальные лентивирусные векторы для отличных от приматов организмов на основе вируса инфекционной анемии лошадей (EIAV), особенно для генной терапии заболеваний глаз (см., например, Balagaan, J Gene Med 2006; 8: 275-285). В другом варианте осуществления также предусмотрен RetinoStat®, лентивирусный вектор на основе вируса инфекционной анемии лошадей для генной терапии, экспрессирующий ангиостатические белки эндостатин и ангиостатин, который доставляют посредством субретинальной инъекции для лечения влажной формы возрастной дегенерации желтого пятна (см., например, Binley et al., HUMAN GENE THERAPY 23:980-991 (September 2012)), и данный вектор может быть модифицирован для системы CRISPR-Cas по настоящему изобретению.In another embodiment, minimal lentiviral vectors for non-primate organisms based on equine infectious anemia virus (EIAV) are also provided, especially for gene therapy of ocular diseases (see, for example, Balagaan, J Gene Med 2006; 8: 275-285). In another embodiment, RetinoStat®, an equine infectious anemia virus lentiviral vector for gene therapy expressing the angiostatic proteins endostatin and angiostatin, which is delivered by subretinal injection for the treatment of wet age-related macular degeneration (see, for example, Binley et al., HUMAN GENE THERAPY 23:980-991 (September 2012)), is also provided, and this vector can be modified for the CRISPR-Cas system of the present invention.
В другом варианте осуществления самоинактивирующиеся лентивирусные векторы с siRNA, нацеленной на общий экзон, который имеет tat/rev HIV, сигналом ядрышковой локализации TAR-ловушкой и специфичным к CCR5 рибозимом в виде головки молотка (см., например, DiGiusto et al. (2010) Sci Transl Med 2:36ra43) можно использовать и/или адаптировать для системы CRISPR-Cas по настоящему изобретению. Не менее 2,5 × 106 клеток CD34+ на килограмм массы пациента можно собирать и предварительно стимулировать в течение 16-20 часов в среде X-VIVO 15 (Lonza), содержащей 2 мкмоля/L-глутамина, фактор стволовых клеток (100 нг/мл), лиганд Flt-3 (Flt-3L) (100 нг/мл) и тромбопоэтин (10 нг/мл) (CellGenix), при плотности 2 × 106 клеток/мл. Предварительно стимулированные клетки можно трансдуцировать лентивирусом при множественности заражения 5 в течение 16-24 часов во флаконах с культурой тканей на 75 см2, покрытых фибронектином (25 мг/см2) (RetroNectin, Takara Bio Inc.).In another embodiment, self-inactivating lentiviral vectors with siRNA targeting a common exon that has tat/rev HIV, a TAR trap nucleolar localization signal, and a CCR5-specific hammerhead ribozyme (see, e.g., DiGiusto et al. (2010) Sci Transl Med 2:36ra43) can be used and/or adapted for the CRISPR-Cas system of the present invention. At least 2.5 × 10 6 CD34+ cells/kg patient weight can be harvested and prestimulated for 16-20 hours in X-VIVO 15 medium (Lonza) containing 2 μmol/L-glutamine, stem cell factor (100 ng/mL), Flt-3 ligand (Flt-3L) (100 ng/mL), and thrombopoietin (10 ng/mL) (CellGenix) at a density of 2 × 10 6 cells/mL. Prestimulated cells can be transduced with lentivirus at an MOI of 5 for 16-24 hours in 75 cm 2 tissue culture flasks coated with fibronectin (25 mg/cm 2 ) (RetroNectin, Takara Bio Inc.).
Лентивирусные векторы были раскрыты в отношении лечения болезни Паркинсона, см., например, публикацию заявки на патент США № 20120295960 и патенты США №№ 7303910 и 7351585. Лентивирусные векторы также были раскрыты в отношении лечения заболеваний глаз, см., например, публикации заявок на патенты США №№ 20060281180, 20090007284, US20110117189; US20090017543; US20070054961, US20100317109. Лентивирусные векторы также были раскрыты в отношении доставки в головной мозг, см., например, публикации заявок на патенты США №№ US20110293571; US20110293571, US20040013648, US20070025970, US20090111106 и патент США № US7259015.Lentiviral vectors have been disclosed with respect to the treatment of Parkinson's disease, see, e.g., U.S. Patent Application Publication No. 20120295960 and U.S. Patent Nos. 7,303,910 and 7,351,585. Lentiviral vectors have also been disclosed with respect to the treatment of eye diseases, see, e.g., U.S. Patent Application Publication Nos. 20060281180, 20090007284, US20110117189; US20090017543; US20070054961, US20100317109. Lentiviral vectors have also been disclosed with respect to delivery to the brain, see, e.g., U.S. Patent Application Publication Nos. US20110293571; US20110293571, US20040013648, US20070025970, US20090111106 and US Patent No. US7259015.
Доставка РНКRNA delivery
Доставка РНК. Фермент CRISPR, например Cas9, и/или любую из РНК по настоящему изобретению, например направляющую РНК, также можно доставлять в форме РНК. С помощью транскрипции in vitro можно получить мРНК Cas9. Например, мРНК Cas9 можно синтезировать с помощью кассеты для ПЦР, содержащей следующие элементы: промотор T7-последовательность Козак (GCCACC)-Cas9-3’-UTR гена бета-глобина-поли(A)-хвост (цепь из 120 или больше адениновых остатков). Кассету можно использовать для транскрипции полимеразой T7. Направляющие РНК также можно транскрибировать с помощью транскрипции in vitro с кассеты, содержащей промотор T7-GG-последовательность направляющей РНК.Delivery of RNA. The CRISPR enzyme, such as Cas9, and/or any of the RNAs of the present invention, such as guide RNA, can also be delivered in the form of RNA. Cas9 mRNA can be produced by in vitro transcription. For example, Cas9 mRNA can be synthesized using a PCR cassette comprising the following elements: T7 promoter-Kozak sequence (GCCACC)-Cas9-3'-UTR of the beta-globin gene-poly(A) tail (a chain of 120 or more adenine residues). The cassette can be used for transcription by T7 polymerase. Guide RNAs can also be transcribed by in vitro transcription from a cassette comprising the T7 promoter-GG-guide RNA sequence.
Для повышения экспрессии и снижения возможной токсичности последовательность, кодирующую фермент CRISPR, и/или направляющую РНК можно модифицировать для включения одного или нескольких модифицированных нуклеозидов, например, с использованием псевдо-U или 5-метил-C.To enhance expression and reduce potential toxicity, the CRISPR enzyme coding sequence and/or guide RNA can be modified to include one or more modified nucleosides, such as pseudo-U or 5-methyl-C.
Способы доставки мРНК в настоящее время являются особенно перспективными для доставки в печень.mRNA delivery methods are currently particularly promising for delivery to the liver.
Многие клинические работы по доставке РНК были сосредоточены на RNAi или антисмысловых РНК, но данные системы можно адаптировать для доставки РНК для осуществления настоящего изобретения. Соответственно, также ниже необходимо ознакомиться с использованной литературой по RNAi и т.д. И действительно, доставка РНК также является применимым способом доставки in vivo. Cas9 и gRNA (и, например, матрицу для HR-репарации) можно доставлять в клетки с использованием липосом или наночастиц. Таким образом, доставка фермента CRISPR, такого как Cas9, и/или доставка РНК по настоящему изобретению может осуществляться в форме РНК и посредством микровезикул, липосом или наночастиц. Например, мРНК Cas9 и gRNA могут быть упакованы в липосомные частицы для доставки in vivo. Реагенты для липосомной трансфекции, такие как Lipofectamine от Life Technologies, и другие реагенты, имеющиеся в продаже, могут эффективно доставлять молекулы РНК в печень.Many clinical studies on RNA delivery have focused on RNAi or antisense RNA, but these systems can be adapted to deliver RNA for the practice of the present invention. Accordingly, referenced literature on RNAi, etc. is also needed below. Indeed, RNA delivery is also a useful method for in vivo delivery. Cas9 and gRNA (and, for example, a template for HR repair) can be delivered to cells using liposomes or nanoparticles. Thus, the delivery of a CRISPR enzyme such as Cas9 and/or the delivery of RNA according to the present invention can be carried out in the form of RNA and via microvesicles, liposomes or nanoparticles. For example, Cas9 mRNA and gRNA can be packaged in liposomal particles for in vivo delivery. Liposomal transfection reagents such as Lipofectamine from Life Technologies and other reagents available commercially can efficiently deliver RNA molecules to the liver.
Доставка РНК посредством частицParticle-mediated RNA delivery
Также предпочтительные средства доставки РНК включают доставку РНК посредством наночастиц (Cho, S., Goldberg, M., Son, S., Xu, Q., Yang, F., Mei, Y., Bogatyrev, S., Langer, R. and Anderson, D., Lipid-like nanoparticles for small interfering RNA delivery to endothelial cells, Advanced Functional Materials, 19: 3112-3118, 2010) или экзосом (Schroeder, A., Levins, C., Cortez, C., Langer, R., and Anderson, D., Lipid-based nanotherapeutics for siRNA delivery, Journal of Internal Medicine, 267: 9-21, 2010, PMID: 20059641). И действительно, как было показано, экзосомы являются особенно применимыми в доставке siRNA, системы, в некоторой степени сходной с системой CRISPR. Например, El-Andaloussi S, et al. ("Exosome-mediated delivery of siRNA in vitro and in vivo." Nat Protoc. 2012 Dec;7(12):2112-26. doi: 10.1038/nprot.2012.131. электронная публикация от 15 ноября 2012 г.) описывают как экзосомы, являющиеся перспективными инструментами доставки лекарственных средств через различные биологические барьеры, можно приспособить для доставки siRNA in vitro и in vivo. Данный подход заключается в создании целенаправленных экзосом посредством трансфекции вектором экспрессии, содержащим экзосомный белок, слитый с пептидным лигандом. Экзосомы затем очищают от супернатанта с трансфицированными клетками и характеризуют, а затем в экзосомы загружают РНК. Доставку или введение в соответствии с настоящим изобретением можно осуществлять с помощью экзосом, в частности, без ограничения в головной мозг. Витамин E (α-токоферол) можно конъюгировать с CRISPR-Cas и доставлять в головной мозг вместе с липопротеином высокой плотности (HDL), например, аналогично тому, как это было выполнено Uno et al. (HUMAN GENE THERAPY 22:711-719 (June 2011)) для доставки короткой интерферирующей РНК (siRNA) в головной мозг. Мышам проводили инфузию с помощью осмотических мининасосов (модель 1007D; Alzet, Купертино, Калифорния), наполненных фосфатно-солевым буфером (PBS) или свободной Toc-siBACE или Toc-siBACE/HDL, и соединенных с набором 3 для инфузий в головной мозг (Alzet). Канюлю для инфузий в головной мозг размещали приблизительно на 0,5 мм кзади от брегмы на средней линии для инфузии в дорсальную часть третьего желудочка. Uno et al. обнаружили, что всего 3 нмоль Toc-siRNA с HDL в том же способе ICV инфузии могут индуцировать аналогичную степень целенаправленного снижения. Аналогичная доза CRISPR-Cas, конъюгированной с α-токоферолом и вводимой совместно с HDL, целенаправленно воздействующей на головной мозг, может предусматриваться в настоящем изобретении для людей, например, может предусматриваться в количестве от приблизительно 3 нмоль до приблизительно 3 мкмоль CRISPR-Cas, целенаправленно воздействующей на головной мозг. Zou et al. (HUMAN GENE THERAPY 22:465-475 (April 2011)) описывают способ опосредованной лентивирусами доставки коротких шпилечных РНК, нацеливающихся на PKCγ, для сайленсинга in vivo генов в спинном мозге крыс. Zou et al. вводили приблизительно 10 мкл рекомбинантного лентивируса с титром 1 x 109 трансдуцирующих единиц (TU)/мл с помощью интратекального катетера. Аналогичная доза экспрессируемой CRISPR-Cas в лентивирусном векторе, нацеливающемся на головной мозг, может предусматриваться в настоящем изобретении для людей, например, может предусматриваться приблизительно 10-50 мл CRISPR-Cas, нацеливающейся на головной мозг, в лентивирусе с титром 1 x 109 трансдуцирующих единиц (TU)/мл.Also preferred RNA delivery vehicles include RNA delivery via nanoparticles (Cho, S., Goldberg, M., Son, S., Xu, Q., Yang, F., Mei, Y., Bogatyrev, S., Langer, R. and Anderson, D., Lipid-like nanoparticles for small interfering RNA delivery to endothelial cells, Advanced Functional Materials, 19: 3112–3118, 2010) or exosomes (Schroeder, A., Levins, C., Cortez, C., Langer, R., and Anderson, D., Lipid-based nanotherapeutics for siRNA delivery, Journal of Internal Medicine, 267: 9–21, 2010, PMID: 20059641). Indeed, exosomes have been shown to be particularly useful in siRNA delivery, a system somewhat similar to the CRISPR system. For example, El-Andaloussi S, et al. ("Exosome-mediated delivery of siRNA in vitro and in vivo." Nat Protoc. 2012 Dec;7(12):2112-26. doi: 10.1038/nprot.2012.131. electronic publication from November 15, 2012) describe how exosomes, which are promising tools for drug delivery across various biological barriers, can be adapted to deliver siRNA in vitro and in vivo. This approach involves the creation of targeted exosomes by transfection with an expression vector containing an exosomal protein fused to a peptide ligand. The exosomes are then purified from the supernatant with transfected cells and characterized, and then RNA is loaded into the exosomes. Delivery or administration according to the present invention can be carried out using exosomes, in particular, but not limited to the brain. Vitamin E (α-tocopherol) can be conjugated to CRISPR-Cas and delivered to the brain along with high-density lipoprotein (HDL), for example, similar to what was done by Uno et al. (HUMAN GENE THERAPY 22:711–719 (June 2011)) to deliver short interfering RNA (siRNA) to the brain. Mice were infused using osmotic minipumps (model 1007D; Alzet, Cupertino, CA) filled with phosphate-buffered saline (PBS) or free Toc-siBACE or Toc-siBACE/HDL and connected to Brain Infusion Set 3 (Alzet). The brain infusion cannula was positioned approximately 0.5 mm posterior to bregma in the midline for infusion into the dorsal third ventricle. Uno et al. found that as little as 3 nmol of Toc-siRNA with HDL in the same ICV infusion route could induce a similar degree of targeted reduction. A similar dose of α-tocopherol-conjugated HDL that targets the brain could be provided in the present invention for humans, for example, could be provided in an amount of from about 3 nmol to about 3 μmol of brain-targeting CRISPR-Cas. Zou et al. (HUMAN GENE THERAPY 22:465-475 (April 2011)) describe a method for lentiviral-mediated delivery of short hairpin RNAs targeting PKCγ for in vivo gene silencing in the rat spinal cord. Zou et al. Approximately 10 μl of the recombinant lentivirus with a titer of 1 x 10 9 transducing units (TU)/ml were administered via an intrathecal catheter. A similar dose of the expressed CRISPR-Cas in the lentiviral vector targeting the brain can be provided in the present invention for humans, for example, approximately 10-50 ml of the CRISPR-Cas targeting the brain in the lentivirus with a titer of 1 x 10 9 transducing units (TU)/ml can be provided.
Если подразумевают местную доставку в головной мозг, то этого можно достичь разными способами. Например, материал можно доставлять интрастриатально, например, с помощью инъекции. Инъекцию можно осуществлять стереотаксически посредством краниотомии.If local delivery to the brain is intended, this can be achieved in a variety of ways. For example, the material can be delivered intrastriatically, such as by injection. The injection can be performed stereotactically via craniotomy.
Повышение эффективности NHEJ или HR также способствует доставке. Предпочтительно, чтобы эффективность NHEJ повышали посредством совместной экспрессии ферментов для обработки концов, таких как Trex2 (Dumitrache et al. Genetics. 2011 August; 188(4): 787-797). Предпочтительно, чтобы эффективность HR повышалась путем транзиентного ингибирования компонентов аппарата NHEJ, таких как Ku70 и Ku86. Эффективность HR также можно повысить путем совместной экспрессии прокариотических или эукариотических ферментов гомологичной рекомбинации, таких как RecBCD, RecA.Increasing the efficiency of NHEJ or HR also facilitates delivery. Preferably, NHEJ efficiency is increased by co-expression of end-processing enzymes such as Trex2 (Dumitrache et al. Genetics. 2011 August; 188(4): 787-797). Preferably, HR efficiency is increased by transient inhibition of components of the NHEJ machinery such as Ku70 and Ku86. HR efficiency can also be increased by co-expression of prokaryotic or eukaryotic homologous recombination enzymes such as RecBCD, RecA.
Доставка посредством плазмидDelivery via plasmids
В одном варианте осуществления согласно данному документу доставку осуществляют посредством плазмиды. В таких композициях с плазмидами доза должна представлять собой количество плазмид, достаточное для вызывания эффекта. Например, подходящие количества плазмидной ДНК в композициях с плазмидами могут составлять от приблизительно 0,1 до приблизительно 2 мг или от приблизительно 1 мкг до приблизительно 10 мкг из расчет на индивидуума весом 70 кг. Плазмиды по настоящему изобретению в общем будут содержать (i) промотор; (ii) последовательность, кодирующую фермент CRISPR, функционально связанную с указанным промотором; (iii) селектируемый маркер; (iv) точку начала репликациии и (v) расположенный ниже нее терминатор транскрипции, функционально связанный с (ii). Плазмида может также кодировать компоненты РНК комплекса CRISPR, но наряду с этим один или несколько из них могут кодироваться другим вектором.In one embodiment according to the present document, delivery is carried out via a plasmid. In such plasmid compositions, the dose should be an amount of plasmid sufficient to cause an effect. For example, suitable amounts of plasmid DNA in plasmid compositions can be from about 0.1 to about 2 mg, or from about 1 μg to about 10 μg, based on an individual weighing 70 kg. Plasmids of the present invention will generally comprise (i) a promoter; (ii) a sequence encoding a CRISPR enzyme operably linked to said promoter; (iii) a selectable marker; (iv) an origin of replication; and (v) a downstream transcription terminator operably linked to (ii). The plasmid may also encode RNA components of the CRISPR complex, but along with this, one or more of them may be encoded by another vector.
Дозы в данном документе определяются в расчете на индивидуума со средним весом 70 кг. Частота введения находится в пределах компетенции практикующего врача или ветеринара (например, доктора, ветеринарного врача) или ученого, являющегося специалистом в данной области. Также отмечено, что вес используемых в эксперименте мышей, как правило, составляет приблизительно 20 г, что при проведении экспериментов с мышами пропорционально индивидууму весом 70 кг.The doses in this document are based on an average weight of 70 kg. The frequency of administration is within the competence of a medical practitioner or veterinarian (e.g., a doctor, a veterinarian) or a scientist who is a specialist in this field. It is also noted that the weight of the mice used in the experiment is usually approximately 20 g, which is proportional to an individual weighing 70 kg when experiments are carried out with mice.
В некоторых вариантах осуществления молекулы РНК по настоящему изобретению доставляют в липосомных составах или составах на основе Lipofectin и им подобных, и их можно получить с помощью способов, хорошо известных специалистам в данной области. Такие способы описаны, например, в патентах США №№ 5593972, 5589466 и 5580859, включенных в данный документ посредством ссылки. Были разработаны системы доставки, специально предназначенные для повышения эффективности и улучшения доставки siRNA в клетки млекопитающих (см., например, Shen et al FEBS Let. 2003, 539:111-114; Xia et al., Nat. Biotech. 2002, 20:1006-1010; Reich et al., Mol. Vision. 2003, 9: 210-216; Sorensen et al., J. Mol. Biol. 2003, 327: 761-766; Lewis et al., Nat. Gen. 2002, 32: 107-108 и Simeoni et al., NAR 2003, 31, 11: 2717-2724), и их можно применять в настоящем изобретении. Недавно siRNA успешно применили для ингибирования экспрессии генов у приматов (см., например, Tolentino et al., Retina 24(4):660), и их также можно применять в настоящем изобретении.In some embodiments, the RNA molecules of the present invention are delivered in liposomal or Lipofectin-based formulations and the like, and can be prepared using methods well known to those skilled in the art. Such methods are described, for example, in U.S. Patent Nos. 5,593,972, 5,589,466, and 5,580,859, incorporated herein by reference. Delivery systems specifically designed to enhance the efficiency and improve the delivery of siRNA into mammalian cells have been developed (see, for example, Shen et al FEBS Let. 2003, 539:111-114; Xia et al., Nat. Biotech. 2002, 20:1006-1010; Reich et al., Mol. Vision. 2003, 9: 210-216; Sorensen et al., J. Mol. Biol. 2003, 327: 761-766; Lewis et al., Nat. Gen. 2002, 32: 107-108 and Simeoni et al., NAR 2003, 31, 11: 2717-2724), and they can be used in the present invention. Recently, siRNAs have been successfully used to inhibit gene expression in primates (see, e.g., Tolentino et al., Retina 24(4):660), and they can also be used in the present invention.
Общая информация касательно доставки посредством частицGeneral information regarding particle delivery
Кроме того, упоминается заявка согласно PCT PCT/US14/70057, ссылка на номер дела у патентного поверенного 47627.99.2060 и BI-2013/107, под названием "DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS" (заявляется приоритет по одной или нескольких или всех из предварительных заявок на патент США: 62/054490, поданной 24 сентября 2014 г.; 62/010441, поданной 10 июня 2014 г.; и 61/915118, 61/915215 и 61/915148, каждая из которых подана 12 декабря 2013 г.) ("the Particle Delivery PCT"), включенная в данный документ посредством ссылки, в отношении способа получения частицы, содержащей sgRNA-и-белок Cas9, включающего смешивание смеси, содержащей sgRNA и белок Cas9 (и необязательно матрицу для HDR), со смесью, содержащей, состоящей, по сути, из или состоящей из поверхностно-активного вещества, фосфолипида, биоразлагаемого полимера, липопротеина и спирта; с получением с помощью такого способа частиц. Например, при этом белок Cas9 и sgRNA смешивали вместе при подходящем молярном соотношении, например, 3:1 - 1:3, или 2:1 - 1:2 или 1:1, при подходящей температуре, например, 15-30°C, например, 20-25°C, например, комнатной температуре, в течение подходящего периода времени, например, 15-45, как, например, 30 минут, преимущественно в стерильном буфере без нуклеаз, например, 1X PBS. В отдельности, компоненты частиц, такие как или включающие поверхностно-активное вещество, например, катионный липид, например, 1,2-диолеоил-3-триметиламмонийпропан (DOTAP); фосфолипид, например, димиристоилфосфатидилхолин (DMPC); биоразлагаемый полимер, такой как этиленгликолевый полимер или PEG, и липопротеин, такой как липопротеин низкой плотности, например, холестерин, растворяли в спирте, преимущественно C1-6алкиловом спирте, таком как метанол, этанол, изопропанол, например, 100% этанол. Два раствора смешивали вместе с образованием частиц, содержащих комплексы Cas9-sgRNA. Соответственно, можно обеспечивать предварительное образование комплекса sgRNA с белком Cas9 перед составлением целого комплекса в частице. Составы можно получать с различным молярным соотношением различных компонентов, известных как способствующие доставке нуклеиновых кислот в клетки (например, 1,2-диолеоил-3-триметиламмоний-пропан (DOTAP), 1,2-дитетрадеканоил-sn-глицеро-3-фосфохолин (DMPC), полиэтиленгликоль (PEG) и холестерин). Например, молярные соотношения DOTAP: DMPC: PEG: холестерин могут быть следующими: DOTAP 100, DMPC 0, PEG 0, холестерин 0; или DOTAP 90, DMPC 0, PEG 10, холестерин 0; или DOTAP 90, DMPC 0, PEG 5, холестерин 5. DOTAP 100, DMPC 0, PEG 0, холестерин 0. Данная заявка, соответственно, охватывает смешивание sgRNA, белка Cas9 и компонентов, которые образуют частицу; а также частицы, полученные в результате такого добавления. Аспекты настоящего изобретения могут охватывать частицы; например, частицы с применением способа, аналогичного таковому в "Particle Delivery PCT", например, путем добавления смеси, содержащей sgRNA и/или Cas9, как в настоящем изобретении, и компоненты, которые образуют частицу, например, как в "Particle Delivery PCT", с образованием частицы и частиц в результате такого смешивания (или, конечно же, другие частицы, содержащие sgRNA и/или Cas9, как в настоящем изобретении).Also cited is PCT application PCT/US14/70057, Attorney Docket No. 47627.99.2060 and BI-2013/107, entitled "DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS" (claiming priority to one or more or all of U.S. Provisional Patent Applications 62/054,490, filed September 24, 2014; 62/010,441, filed June 10, 2014; and 61/915,118, 61/915,215, and 61/915,148, each filed December 12, 2013) ("the Particle Delivery PCT"), incorporated herein by reference, regarding a method of producing a particle comprising an sgRNA and a Cas9 protein, comprising mixing a mixture comprising an sgRNA and a Cas9 protein (and optionally a matrix for HDR) with a mixture comprising, consisting essentially of, or consisting of a surfactant, a phospholipid, a biodegradable polymer, a lipoprotein, and an alcohol; thereby producing particles. For example, the Cas9 protein and sgRNA are mixed together at a suitable molar ratio, such as 3:1 to 1:3, or 2:1 to 1:2, or 1:1, at a suitable temperature, such as 15-30°C, such as 20-25°C, such as room temperature, for a suitable period of time, such as 15-45, such as 30 minutes, preferably in a sterile nuclease-free buffer, such as 1X PBS. Individually, the particle components, such as or including a surfactant, such as a cationic lipid, such as 1,2-dioleoyl-3-trimethylammoniumpropane (DOTAP); a phospholipid, such as dimyristoylphosphatidylcholine (DMPC); a biodegradable polymer such as ethylene glycol polymer or PEG and a lipoprotein such as low density lipoprotein, for example cholesterol, were dissolved in an alcohol, preferably a C1-6 alkyl alcohol such as methanol, ethanol, isopropanol, for example 100% ethanol. The two solutions were mixed together to form particles containing Cas9-sgRNA complexes. Accordingly, it is possible to provide a pre-complex of sgRNA with Cas9 protein before assembling the entire complex in the particle. The formulations can be prepared with different molar ratios of various components known to facilitate the delivery of nucleic acids into cells (e.g. 1,2-dioleoyl-3-trimethylammonium propane (DOTAP), 1,2-ditetradecanoyl-sn-glycero-3-phosphocholine (DMPC), polyethylene glycol (PEG) and cholesterol). For example, the molar ratios of DOTAP: DMPC: PEG: cholesterol can be as follows: DOTAP 100, DMPC 0, PEG 0, cholesterol 0; or DOTAP 90, DMPC 0, PEG 10, cholesterol 0; or DOTAP 90, DMPC 0, PEG 5, cholesterol 5. DOTAP 100, DMPC 0, PEG 0, cholesterol 0. This application accordingly encompasses mixing of sgRNA, Cas9 protein and components that form a particle; as well as particles obtained as a result of such addition. Aspects of the present invention can encompass particles; for example, particles using a method similar to that in "Particle Delivery PCT", for example by adding a mixture containing sgRNA and/or Cas9, as in the present invention, and components that form a particle, for example as in "Particle Delivery PCT", to form a particle and particles as a result of such mixing (or, of course, other particles containing sgRNA and/or Cas9, as in the present invention).
Системы доставки и/или составы на основе частицDelivery systems and/or particle-based formulations
Известно, что несколько типов систем доставки и/или составов на основе частиц являются применимыми в разнообразном спектре биомедицинских применений. Частицу обычно определяют как небольшой объект, ведущий себя как целая единица в том, что касается ее транспорта и свойств. Частицы дополнительно классифицируют в соответствии с диаметром. Крупные частицы охватывают диапазон от 2500 до 10000 нанометров. Тонкодисперсные частицы имеют размер от 100 до 2500 нанометров. Ультрадисперсные частицы или наночастицы, как правило, имеют размер от 1 до 100 нанометров. Основанием для предела в 100 нм является тот факт, что новые свойства, отличающие частицы от насыпного материала, обычно проявляются в критическом линейном масштабе менее 100 нм.Several types of particle-based delivery systems and/or formulations are known to be applicable in a wide range of biomedical applications. A particle is generally defined as a small object that behaves as a whole unit with respect to its transport and properties. Particles are further classified according to diameter. Large particles cover the range from 2,500 to 10,000 nanometers. Fine particles have a size of 100 to 2,500 nanometers. Ultrafine particles or nanoparticles typically have a size of 1 to 100 nanometers. The basis for the 100 nm limit is the fact that novel properties that distinguish particles from bulk material typically occur at a critical linear scale of less than 100 nm.
Используемые в данном документе система доставки и/или состав на основе частиц определяют как любые биологическая система доставки/состав, содержащие частицы в соответствии с настоящим изобретением. Частица в соответствии с настоящим изобретением представляет собой любой объект, имеющий наибольший размер (например, диаметр) менее 100 микрон (мкм). В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер менее 10 мкм. В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер менее 2000 нанометров (нм). В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер менее 1000 нанометров (нм). В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер менее 900 нм, 800 нм, 700 нм, 600 нм, 500 нм, 400 нм, 300 нм, 200 нм или 100 нм. Частицы по настоящему изобретению, как правило, имеют наибольший размер (например, диаметр) 500 нм или менее. В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер (например, диаметр) 250 нм или менее. В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер (например, диаметр) 200 нм или менее. В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер (например, диаметр) 150 нм или менее. В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер (например, диаметр) 100 нм или менее. В некоторых вариантах осуществления настоящего изобретения применяют меньшие частицы, например, имеющие наибольший размер 50 нм или менее. В некоторых вариантах осуществления частицы по настоящему изобретению имеют наибольший размер, варьирующий в диапазоне от 25 нм до 200 нм.As used herein, a particle-based delivery system and/or formulation is defined as any biological delivery system/formulation comprising particles according to the present invention. A particle according to the present invention is any object having a largest dimension (e.g., diameter) of less than 100 microns (μm). In some embodiments, the particles of the present invention have a largest dimension of less than 10 μm. In some embodiments, the particles of the present invention have a largest dimension of less than 2000 nanometers (nm). In some embodiments, the particles of the present invention have a largest dimension of less than 1000 nanometers (nm). In some embodiments, the particles of the present invention have a largest dimension of less than 900 nm, 800 nm, 700 nm, 600 nm, 500 nm, 400 nm, 300 nm, 200 nm, or 100 nm. The particles of the present invention typically have a largest dimension (e.g., diameter) of 500 nm or less. In some embodiments, the particles of the present invention have a largest dimension (e.g., diameter) of 250 nm or less. In some embodiments, the particles of the present invention have a largest dimension (e.g., diameter) of 200 nm or less. In some embodiments, the particles of the present invention have a largest dimension (e.g., diameter) of 150 nm or less. In some embodiments, the particles of the present invention have a largest dimension (e.g., diameter) of 100 nm or less. In some embodiments, smaller particles are used, for example, having a largest dimension of 50 nm or less. In some embodiments, the particles of the present invention have a largest dimension ranging from 25 nm to 200 nm.
Определение характеристик частиц (в том числе, например, определение характеристик морфологии, размеров и т.д.) осуществляют с применением ряда различных методик. Стандартными методиками являются электронная микроскопия (TEM, SEM), атомно-силовая микроскопия (AFM), динамическое рассеяние света (DLS), рентгеновская фотоэлектронная спектроскопия (XPS), порошковая рентгеновская дифракция (XRD), инфракрасная спектроскопия с преобразованием Фурье (FTIR), времяпролетная масс-спектрометрия с лазерной десорбцией и ионизацией из матрицы (MALDI-TOF), спектроскопия в ультрафиолетовой и видимой области спектра, двойная поляризационная интерферометрия и ядерный магнитный резонанс (ЯМР). Получение характеристик (измерения размеров) можно проводить в отношении нативных частиц (т.е. до загрузки) или после загрузки молекулы-карго (в данном документе молекула-карго относится, например, к одному или нескольким компонентам системы CRISPR-Cas, например, ферменту или мРНК CRISPR, или направляющей РНК, или к любой их комбинации, и может включать дополнительные носители и/или наполнители) для получения частиц, имеющих оптимальный размер для доставки, для любого применения настоящего изобретения in vitro, ex vivo и/или in vivo. В определенных предпочтительных вариантах осуществления определение характеристик размеров частиц (например, диаметра) основано на измерениях с применением динамического рассеяния лазерного излучения (DLS). Упоминаются патент США № 8709843; патент США № 6007845; патент США № 5855913; патент США № 5985309; патент № 5543158 и публикация James E. Dahlman and Carmen Barnes et al. Nature Nanotechnology (2014), опубликованная в интернете 11 мая 2014 года, doi:10.1038/nnano.2014.84, касаются частиц, способов их получения и применения, а также их измерения.Particle characterization (including, for example, characterization of morphology, size, etc.) is performed using a number of different techniques. Standard techniques include electron microscopy (TEM, SEM), atomic force microscopy (AFM), dynamic light scattering (DLS), X-ray photoelectron spectroscopy (XPS), powder X-ray diffraction (XRD), Fourier transform infrared spectroscopy (FTIR), matrix-assisted laser desorption ionization time-of-flight mass spectrometry (MALDI-TOF), ultraviolet-visible spectroscopy, dual polarization interferometry, and nuclear magnetic resonance (NMR). Characterization (size measurements) can be performed on the native particles (i.e., prior to loading) or after loading of the cargo molecule (herein, cargo molecule refers to, e.g., one or more components of the CRISPR-Cas system, e.g., a CRISPR enzyme or mRNA, or a guide RNA, or any combination thereof, and may include additional carriers and/or excipients) to produce particles having an optimal size for delivery for any in vitro, ex vivo, and/or in vivo use of the present invention. In certain preferred embodiments, particle size characterization (e.g., diameter) is based on dynamic laser light scattering (DLS) measurements. Reference is made to U.S. Patent No. 8,709,843; U.S. Patent No. 6,007,845; U.S. Patent No. 5,855,913; U.S. Patent No. 5,985,309; Patent No. 5,543,158 and James E. Dahlman and Carmen Barnes et al. Nature Nanotechnology (2014), published online May 11, 2014, doi:10.1038/nnano.2014.84, relate to the particles, methods for producing and using them, and their measurement.
Системы доставки на основе частиц в пределах объема настоящего изобретения могут быть представлены в любой форме, в том числе без ограничения в форме твердых, полутвердых, эмульгированных или коллоидных частиц. Таким образом, любые системы доставки, описанные в данном документе, в том числе без ограничения, например, системы на основе липидов, липосомы, мицеллы, микровезикулы, экзосомы или генная пушка, могут предусматриваться в качестве систем доставки на основе частиц в пределах объема настоящего изобретения.Particle-based delivery systems within the scope of the present invention may be in any form, including but not limited to solid, semi-solid, emulsified or colloidal particles. Thus, any delivery systems described herein, including but not limited to, for example, lipid-based systems, liposomes, micelles, microvesicles, exosomes or gene guns, may be envisaged as particle-based delivery systems within the scope of the present invention.
ЧастицыParticles
мРНК фермента CRISPR и направляющую РНК могут быть доставлены одновременно с использованием частиц или липидных оболочек; например, фермент CRISPR и РНК по настоящему изобретению, например, в виде комплекса, могут быть доставлены посредством частицы, как в Dahlman et al., WO 2015089419 A2 и документах, цитируемых там, такой как 7C1 (см., например, James E. Dahlman и Carmen Barnes et al. Nature Nanotechnology (2014), опубликованный онлайн 11 мая 2014 г., doi:10.1038/nnano.2014.84), например, частицы для доставки, содержащей липид или липидоид и гидрофильный полимер, например, катионный липид и гидрофильный полимер, например, где катионный липид содержит 1,2-диолеоил-3-триметиламмония-пропан (DOTAP) или 1,2-дитетерадеканоил-sn-глицеро-3-фосфохолин (DMPC), и/или где гидрофильный полимер содержит этиленгликоль или полиэтиленгликоль (PEG); и/или где частица дополнительно содержит холестерин (например, частица из состава 1 = DOTAP 100, DMPC 0, PEG 0, холестерин 0; состава номер 2 = DOTAP 90, DMPC 0, PEG 10, холестерин 0; состава номер 3 = DOTAP 90, DMPC 0, PEG 5, холестерин 5), где частицы образуются с использованием эффективного многостадийного способа, при котором первый эффекторный белок и РНК смешивают вместе, например, при молярном соотношении 1:1, например, при комнатной температуре, например, в течение 30 минут, например, в стерильном не содержащем нуклеазу 1X PBS; и отдельно DOTAP, DMPC, PEG и холестерин, применимые для состава, растворяют в спирте, например, 100% этаноле; и два раствора смешивают вместе с образованием частиц, содержащих комплексы).CRISPR enzyme mRNA and guide RNA can be delivered simultaneously using particles or lipid shells; for example, the CRISPR enzyme and RNA of the present invention, e.g. as a complex, can be delivered via a particle as in Dahlman et al., WO 2015089419 A2 and documents cited therein, such as 7C1 (see, e.g., James E. Dahlman and Carmen Barnes et al., Nature Nanotechnology (2014), published online May 11, 2014, doi:10.1038/nnano.2014.84), e.g., a delivery particle comprising a lipid or lipidoid and a hydrophilic polymer, e.g., a cationic lipid and a hydrophilic polymer, e.g., wherein the cationic lipid comprises 1,2-dioleoyl-3-trimethylammonium propane (DOTAP) or 1,2-diteteradecanoyl-sn-glycero-3-phosphocholine (DMPC), and/or wherein the hydrophilic polymer comprises ethylene glycol or polyethyleneglycol (PEG); and/or wherein the particle further comprises cholesterol (e.g., a particle of Formulation 1 = DOTAP 100, DMPC 0, PEG 0, cholesterol 0; Formulation Number 2 = DOTAP 90, DMPC 0, PEG 10, cholesterol 0; Formulation Number 3 = DOTAP 90, DMPC 0, PEG 5, cholesterol 5), wherein the particles are formed using an efficient multi-step process in which the first effector protein and RNA are mixed together, e.g., at a 1:1 molar ratio, e.g., at room temperature, e.g., for 30 minutes, e.g., in sterile nuclease-free 1X PBS; and separately DOTAP, DMPC, PEG, and cholesterol applicable to the formulation are dissolved in an alcohol, e.g., 100% ethanol; and the two solutions are mixed together to form particles containing the complexes).
Например, у Su X, Fricke J, Kavanagh DG, Irvine DJ ("In vitro and in vivo mRNA delivery using lipid-enveloped pH-responsive polymer nanoparticles" Mol Pharm. 2011 Jun 6;8(3):774-87. doi: 10.1021/mp100390w. электронная публикация 1 апреля 2011 г.) описаны биоразлагаемые частицы со структурой ядро-оболочка с ядром из сложного поли(β-аминоэфира) (PBAE), окруженным фосфолипидной двухслойной оболочкой. Они были разработаны для доставки мРНК in vivo. Чувствительный к рН компонент PBAE был выбран для содействия разрушению эндосом, тогда как поверхностный липидный слой был выбран для сведения к минимуму токсичности поликатионного ядра. Таким образом, они являются предпочтительными для доставки РНК по настоящему изобретению.For example, Su X, Fricke J, Kavanagh DG, Irvine DJ ("In vitro and in vivo mRNA delivery using lipid-enveloped pH-responsive polymer nanoparticles" Mol Pharm. 2011 Jun 6;8(3):774-87. doi: 10.1021/mp100390w. electronic publication April 1, 2011) describe biodegradable core-shell particles with a poly(β-amino ester) (PBAE) core surrounded by a phospholipid bilayer shell. They were designed for in vivo mRNA delivery. The pH-sensitive component of the PBAE was chosen to promote endosomal disruption, while the surface lipid layer was chosen to minimize the toxicity of the polycationic core. Thus, they are preferred for RNA delivery according to the present invention.
В одном варианте осуществления предусмотрены частицы на основе самособирающихся биоадгезивных полимеров, которые можно применять для пероральной доставки пептидов, внутривенной доставки пептидов и интраназальной доставки пептидов, во всех случаях в головной мозг. Также предусмотрены другие варианты осуществления, такие как абсорбция при пероральном применении и внутриглазная доставка гидрофобных лекарственных средств. Технология молекулярных оболочек предусматривает сконструированную полимерную оболочку, защищающую и доставляющую в очаг заболевания (см., например, Mazza, M. et al. ACSNano, 2013. 7(2): 1016-1026; Siew, A., et al. Mol Pharm, 2012. 9(1):14-28; Lalatsa, A., et al. J Contr Rel, 2012. 161(2):523-36; Lalatsa, A., et al., Mol Pharm, 2012. 9(6):1665-80; Lalatsa, A., et al. Mol Pharm, 2012. 9(6):1764-74; Garrett, N.L., et al. J Biophotonics, 2012. 5(5-6):458-68; Garrett, N.L., et al. J Raman Spect, 2012. 43(5):681-688; Ahmad, S., et al. J Royal Soc Interface 2010. 7:S423-33; Uchegbu, I.F. Expert Opin Drug Deliv, 2006. 3(5):629-40; Qu, X.,et al. Biomacromolecules, 2006. 7(12):3452-9 и Uchegbu, I.F., et al. Int J Pharm, 2001. 224:185-199). Предусмотрены дозы, составляющие приблизительно 5 мг/кг, которые в зависимости от целевой ткани будут однократными или многократными дозами.In one embodiment, particles based on self-assembling bioadhesive polymers are provided, which can be used for oral delivery of peptides, intravenous delivery of peptides and intranasal delivery of peptides, in all cases to the brain. Other embodiments are also provided, such as absorption by oral use and intraocular delivery of hydrophobic drugs. Molecular shell technology involves an engineered polymer shell that protects and delivers to the site of disease (see, e.g., Mazza, M. et al. ACSNano, 2013. 7(2): 1016–1026; Siew, A., et al. Mol Pharm, 2012. 9(1):14–28; Lalatsa, A., et al. J Contr Rel, 2012. 161(2):523–36; Lalatsa, A., et al., Mol Pharm, 2012. 9(6):1665–80; Lalatsa, A., et al. Mol Pharm, 2012. 9(6):1764–74; Garrett, N.L., et al. J Biophotonics, 2012. 5(5–6):458–68; Garrett, N.L., et al. J Raman Spect, 2012. 43(5):681-688; Ahmad, S., et al. J Royal Soc Interface 2010. 7:S423-33; Uchegbu, I.F. Expert Opin Drug Deliv, 2006. 3(5):629-40; Qu, X., et al. Biomacromolecules, 2006. 7(12):3452-9 and Uchegbu, I.F., et al. Int J Pharm, 2001. 224:185-199). Doses of approximately 5 mg/kg are envisaged, which will be single or multiple doses depending on the target tissue.
В одном варианте осуществления частицы, которые могут доставлять РНК в раковые клетки для прекращения роста опухолей, разработанные в лаборатории Дэна Андерсона в MIT, можно использовать для системы CRISPR-Cas по настоящему изобретению и/или приспосабливать к ней. В частности, в лаборатории Андерсона были разработаны полностью автоматизированные, комбинаторные системы для синтеза, очистки, определения характеристик и составления новых биоматериалов и наносоставов. См., например, Alabi et al., Proc Natl Acad Sci U S A. 2013 Aug 6;110(32):12881-6; Zhang et al., Adv Mater. 2013 Sep 6;25(33):4641-5; Jiang et al., Nano Lett. 2013 Mar 13;13(3):1059-64; Karagiannis et al., ACS Nano. 2012 Oct 23;6(10):8484-7; Whitehead et al., ACS Nano. 2012 Aug 28;6(8):6922-9 и Lee et al., Nat Nanotechnol. 2012 Jun 3;7(6):389-93.In one embodiment, particles that can deliver RNA to cancer cells to stop tumor growth, developed in the laboratory of Dan Anderson at MIT, can be used for and/or adapted to the CRISPR-Cas system of the present invention. In particular, the Anderson laboratory has developed fully automated, combinatorial systems for synthesizing, purifying, characterizing, and formulating novel biomaterials and nanoformulations. See, e.g., Alabi et al., Proc Natl Acad Sci U S A. 2013 Aug 6;110(32):12881-6; Zhang et al., Adv Mater. 2013 Sep 6;25(33):4641-5; Jiang et al., Nano Lett. 2013 Mar 13;13(3):1059-64; Karagiannis et al., ACS Nano. 2012 Oct 23;6(10):8484-7; Whitehead et al., ACS Nano. 2012 Aug 28;6(8):6922-9 and Lee et al., Nat Nanotechnol. 2012 Jun 3;7(6):389-93.
Заявка на патент США 20110293703 относится к липидоподобным соединениям, также являющимся особенно применимыми при введении полинуклеотидов, которые можно применять для доставки системы CRISPR-Cas по настоящему изобретению. В одном аспекте аминоспиртовые липидоподобные соединения объединяют со средством, подлежащим доставке в клетку или субъекту, с образованием микрочастиц, наночастиц, липосом или мицелл. Средство, подлежащее доставке с помощью частиц, липосом или мицелл, может быть в форме газа, жидкости или твердого вещества, и средство может представлять собой полинуклеотид, белок, пептид или малую молекулу. Аминоспиртовые липидоподобные соединения можно объединять с другими аминоспиртовыми липидоподобными соединениями, полимерами (синтетическими или природными), поверхностно-активными веществами, холестерином, углеводами, белками, липидами и т.д. с образованием частиц. Эти частицы можно затем необязательно объединять с фармацевтическим наполнителем с образованием фармацевтической композиции.US Patent Application 20110293703 relates to lipid-like compounds that are also particularly useful in the administration of polynucleotides that can be used to deliver the CRISPR-Cas system of the present invention. In one aspect, amino alcohol lipid-like compounds are combined with an agent to be delivered to a cell or subject to form microparticles, nanoparticles, liposomes or micelles. The agent to be delivered by particles, liposomes or micelles can be in the form of a gas, liquid or solid, and the agent can be a polynucleotide, protein, peptide or small molecule. Amino alcohol lipid-like compounds can be combined with other amino alcohol lipid-like compounds, polymers (synthetic or natural), surfactants, cholesterol, carbohydrates, proteins, lipids, etc. to form particles. These particles may then optionally be combined with a pharmaceutical excipient to form a pharmaceutical composition.
В публикации заявки на патент США № 20110293703 также представлены способы получения аминоспиртовых липидоподобных соединений. Одному или нескольким эквивалентам амина позволяют вступать в реакцию с одним или несколькими эквивалентами соединения с концевыми эпоксидными группами в подходящих условиях с образованием аминоспиртового липидоподобного соединения по настоящему изобретению. В определенных вариантах осуществления все аминогруппы амина полностью реагируют с соединением с концевыми эпоксидными группами с образованием третичных аминов. В других вариантах осуществления все аминогруппы амина не полностью реагируют с соединением с концевыми эпоксидными группами для образования третичных аминогрупп, в результате чего, таким образом, образуются первичные или вторичные аминогруппы аминоспиртового липидоподобного соединения. Эти первичные или вторичные аминогруппы оставляют в существующем состоянии или могут вводить в реакцию с другим электрофилом, таким как другое соединение с концевыми эпоксидными группами. Специалисту в данной области будет понятно, что введение амина в реакцию с меньшим, чем избыточное, количеством соединения с концевыми эпоксидными группами приведет к получению множества различных аминоспиртовых липидоподобных соединений с различным количеством "хвостов". Определенные амины могут быть полностью функционализированными с помощью двух "хвостов" соединений, полученных из эпоксидов, тогда как другие молекулы могут быть не полностью функционализированными с помощью "хвостов" соединений, полученных из эпоксидов. Например, диамин или полиамин может содержать один, два, три или четыре "хвоста" соединений, полученных из эпоксидов, у различных аминофрагментов молекулы, в результате чего образуются первичные, вторичные и третичные аминогруппы. В определенных вариантах осуществления все аминогруппы являются не полностью функционализированными. В определенных вариантах осуществления используют два соединения с концевыми эпоксидными группами одного типа. В других вариантах осуществления используют два или более различных соединений с концевыми эпоксидными группами. Синтез аминоспиртовых липидоподобных соединений осуществляют с помощью растворителя или без него, и синтез можно осуществлять при более высоких температурах, варьирующих в диапазоне 30-100°C, предпочтительно при примерно 50-90°C. Получаемые аминоспиртовые липидоподобные соединения необязательно можно очищать. Например, смесь аминоспиртовых липидоподобных соединений можно очищать с получением аминоспиртового липидоподобного соединения с определенным количеством "хвостов" соединений, полученных из эпоксидов. Или же смесь можно очищать с получением определенного стерео- или региоизомера. Аминоспиртовые липидоподобные соединения можно также алкилировать с помощью алкилгалогенида (например, йодистого метила) или другого алкилирующего средства и/или их можно ацилировать.U.S. Patent Application Publication No. 20110293703 also provides methods for preparing amino alcohol lipid-like compounds. One or more equivalents of an amine are allowed to react with one or more equivalents of an epoxide-terminated compound under suitable conditions to form an amino alcohol lipid-like compound of the present invention. In certain embodiments, all of the amino groups of the amine are completely reacted with the epoxide-terminated compound to form tertiary amines. In other embodiments, all of the amino groups of the amine are not completely reacted with the epoxide-terminated compound to form tertiary amine groups, thereby forming primary or secondary amine groups of the amino alcohol lipid-like compound. These primary or secondary amine groups are left as is or may be reacted with another electrophile, such as another epoxide-terminated compound. One skilled in the art will appreciate that reacting an amine with less than an excess of an epoxide-terminated compound will result in a variety of different amino alcohol lipid-like compounds with varying numbers of tails. Certain amines may be fully functionalized with two epoxide-derived tails, while other molecules may be incompletely functionalized with epoxide-derived tails. For example, a diamine or polyamine may contain one, two, three, or four epoxide-derived tails at different amino moieties of the molecule, resulting in primary, secondary, and tertiary amine groups. In certain embodiments, all of the amine groups are incompletely functionalized. In certain embodiments, two epoxide-terminated compounds of the same type are used. In other embodiments, two or more different epoxide-terminated compounds are used. The synthesis of the amino alcohol lipid-like compounds is carried out with or without a solvent, and the synthesis can be carried out at higher temperatures ranging from 30-100°C, preferably at about 50-90°C. The resulting amino alcohol lipid-like compounds can optionally be purified. For example, a mixture of amino alcohol lipid-like compounds can be purified to obtain an amino alcohol lipid-like compound with a certain amount of "tails" of compounds derived from epoxides. Or, the mixture can be purified to obtain a certain stereo- or regioisomer. The amino alcohol lipid-like compounds can also be alkylated with an alkyl halide (e.g., methyl iodide) or other alkylating agent and/or they can be acylated.
В публикации заявки на патент США № 20110293703 также представлены библиотеки аминоспиртовых липидоподобных соединений, полученных согласно способам по настоящему изобретению. Эти аминоспиртовые липидоподобные соединения можно получать и/или подвергать скринингу с применением высокопроизводительных методик, предусматривающих использование дозаторов жидкостей, автоматических манипуляторов, планшетов для микротитрования, компьютеров и т.д. В определенных вариантах осуществления аминоспиртовые липидоподобные соединения подвергают скринингу в отношении их способности к трансфекции полинуклеотидов или других средств (например, белков, пептидов, малых молекул) в клетку.U.S. Patent Application Publication No. 20110293703 also discloses libraries of amino alcohol lipid-like compounds produced according to the methods of the present invention. These amino alcohol lipid-like compounds can be produced and/or screened using high-throughput techniques involving the use of liquid dispensers, robotic handlers, microtiter plates, computers, etc. In certain embodiments, the amino alcohol lipid-like compounds are screened for their ability to transfect polynucleotides or other agents (e.g., proteins, peptides, small molecules) into a cell.
Публикация заявки на патент США № 20130302401 относится к классу поли(бета-аминоспиртов) (PBAA), получаемых с помощью комбинаторных методик полимеризации. PBAA по настоящему изобретению можно применять в биотехнологии и биомедицинских применениях в качестве покрытий (таких как пленочные покрытия или многослойные пленки для медицинских инструментов или имплантатов), добавок, материалов, наполнителей, средств, предотвращающих биологическое обрастание, средств для формирования микроструктуры и средств для инкапсулирования клеток. В случае применения в качестве поверхностных покрытий эти PBAA вызывают различные уровни воспаления как in vitro, так и in vivo в зависимости от их химических структур. Большое химическое разнообразие этого класса материалов позволяет идентифицировать полимерные покрытия, ингибирующие активацию макрофагов in vitro. Более того, эти покрытия уменьшают рекрутирование воспалительных клеток и уменьшают выраженность фиброза после подкожной имплантации микрочастиц карбоксилированного полистирола. Эти полимеры можно использовать для образования капсул на основе полиэлектролитных комплексов для инкапсулирования клеток. Настоящее изобретение также может иметь много других применений в биологии, таких как получение антимикробных покрытий, доставка ДНК или siRNA и тканевая инженерия с применением стволовых клеток. Идеи, изложенные в публикации заявки на патент США № 20130302401, можно применять по отношению к системе CRISPR-Cas по настоящему изобретению. В некоторых вариантах осуществления могут быть использованы частицы на основе сахара, например GalNAc, как описывается в данном документе и со ссылкой на WO 2014118272 (включенной в данный документ посредством ссылки) и Nair, JK et al., 2014, Journal of the American Chemical Society 136 (49), 16958-16961), а также согласно идеям в данном документе, особенно в отношении применений в доставке для всех частиц, если не очевидно иное.U.S. Patent Application Publication No. 20130302401 relates to a class of poly(beta-amino alcohols) (PBAAs) prepared by combinatorial polymerization techniques. The PBAAs of the present invention can be used in biotechnology and biomedical applications as coatings (such as film coatings or multilayer films for medical instruments or implants), additives, materials, fillers, antifouling agents, micropatterning agents, and cell encapsulating agents. When used as surface coatings, these PBAAs induce varying levels of inflammation both in vitro and in vivo depending on their chemical structures. The wide chemical diversity of this class of materials allows the identification of polymer coatings that inhibit macrophage activation in vitro. Moreover, these coatings reduce inflammatory cell recruitment and reduce the severity of fibrosis following subcutaneous implantation of carboxylated polystyrene microparticles. These polymers can be used to form capsules based on polyelectrolyte complexes for encapsulating cells. The present invention can also have many other applications in biology, such as the production of antimicrobial coatings, DNA or siRNA delivery, and tissue engineering using stem cells. The teachings of U.S. Patent Application Publication No. 20130302401 can be applied to the CRISPR-Cas system of the present invention. In some embodiments, sugar-based particles, such as GalNAc, can be used as described herein and with reference to WO 2014118272 (incorporated herein by reference) and Nair, JK et al., 2014, Journal of the American Chemical Society 136 (49), 16958-16961), as well as according to the teachings herein, especially with respect to delivery applications for all particles, unless otherwise obvious.
В другом варианте осуществления предусмотрены липидные частицы (LNP). В частности, малые интерферирующие РНК, воздействующие на транстиретин, инкапсулировали в липидные частицы и использовали для доставки у людей (см., например, Coelho et al., N Engl J Med 2013;369:819-29), и такую систему можно приспосабливать и применять в отношении системы CRISPR-Cas по настоящему изобретению. Предусмотрены дозы, составляющие от приблизительно 0,01 до приблизительно 1 мг на кг массы тела, вводимые внутривенно. Предусмотрены лекарственные препараты для снижения риска возникновения инфузионных реакций, такие как дексаметазон, ацетаминофен, дифенгидрамин или цетиризин и ранитидин. Также предусмотрены многократные дозы, состоящие из пяти доз по приблизительно 0,3 мг на килограмм, принимаемых каждые 4 недели.In another embodiment, lipid particles (LNPs) are provided. In particular, small interfering RNAs targeting transthyretin have been encapsulated in lipid particles and used for delivery in humans (see, for example, Coelho et al., N Engl J Med 2013;369:819-29), and such a system can be adapted and used with the CRISPR-Cas system of the present invention. Doses of about 0.01 to about 1 mg per kg of body weight administered intravenously are provided. Medications to reduce the risk of infusion reactions are provided, such as dexamethasone, acetaminophen, diphenhydramine or cetirizine and ranitidine. Multiple doses of five doses of about 0.3 mg per kilogram taken every 4 weeks are also provided.
Было показано, что LNP являются высокоэффективными в доставке siRNA в печень (см., например, Tabernero et al., Cancer Discovery, April 2013, Vol. 3, No. 4, pages 363-470) и, таким образом, предусмотрены для доставки в печень РНК, кодирующей CRISPR-Cas. Может быть предусмотрен режим дозирования с приемом приблизительно четырех доз по 6 мг/кг LNP каждые две недели. Tabernero et al. продемонстрировали, что после первых 2 циклов дозирования LNP при 0,7 мг/кг наблюдалась регрессия опухоли, а к концу 6 циклов у пациента достигался частичный ответ с полной регрессией метастазов в лимфатических узлах и значительным уменьшением размеров опухолей в печени. У данного пациента, у которого сохранялась ремиссия и который завершил лечение после получения доз в течение 26 месяцев, полный ответ достигался после приема 40 доз. У двух пациентов с RCC и внепеченочными очагами заболевания, включающими почку, легкое и лимфатические узлы, в которых наблюдалось прогрессирование после предшествующей терапии ингибиторами сигнального пути VEGF, наблюдалась стабилизация заболевания во всех очагах в течение примерно 8-12 месяцев, а пациент с PNET и метастазами в печени продолжал участие в расширенном исследовании в течение 18 месяцев (36 доз) при стабилизации заболевания.LNPs have been shown to be highly efficient in delivering siRNA to the liver (see, e.g., Tabernero et al., Cancer Discovery, April 2013, Vol. 3, No. 4, pages 363-470) and are thus envisaged for liver delivery of RNA encoding CRISPR-Cas. A dosing regimen of approximately four doses of 6 mg/kg LNPs every two weeks may be envisaged. Tabernero et al. demonstrated that tumor regression was observed after the first 2 dosing cycles of LNPs at 0.7 mg/kg and by the end of 6 cycles the patient had achieved a partial response with complete regression of lymph node metastases and significant reduction in liver tumor size. In this patient, who remained in remission and completed treatment after receiving dosing for 26 months, a complete response was achieved after 40 doses. Two patients with RCC and extrahepatic sites of disease including kidney, lung, and lymph nodes that had progressed after prior VEGF pathway inhibitor therapy had stable disease in all sites for approximately 8-12 months, and a patient with PNET and liver metastases continued in the extension study for 18 months (36 doses) with stable disease.
Однако следует принимать во внимание заряд LNP. Так, объединение катионных липидов с отрицательно заряженными липидами индуцирует образование структур, не являющихся двуслойными, которые облегчают внутриклеточную доставку. Поскольку заряженные LNP быстро выводятся из кровотока после внутривенной инъекции, были разработаны ионизируемые катионные липиды со значениями pKa ниже 7 (см., например, Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011). Отрицательно заряженные полимеры, такие как РНК, можно загружать в LNP при низких значениях pH (например, pH 4), где ионизируемые липиды проявляют положительный заряд. Однако при физиологических значениях pH LNP проявляют низкий поверхностный заряд, совместимый с большими значениями времени пребывания в кровотоке. Основное внимание сосредоточено на четырех видах молекул ионизируемых катионных липидов, а именно 1,2-дилинолеоил-3-диметиламмонийпропане (DLinDAP), 1,2-дилинолеилокси-3-N,N-диметиламинопропане (DLinDMA), 1,2-дилинолеилоксикето-N,N-диметил-3-аминопропане (DLinKDMA) и 1,2-дилинолеил-4-(2-диметиламиноэтил)-[1,3]-диоксолане (DLinKC2-DMA). Было показано, что системы LNP с siRNA, содержащие эти липиды, проявляют существенно отличающиеся свойства сайленсинга генов в гепатоцитах in vivo, при этом их активность изменяется в ряду DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP при использовании модели сайленсинга гена фактора VII (см., например, Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011). Может быть предусмотрена доза 1 мкг/мл LNP или РНК CRISPR-Cas в LNP или ассоциированная с ней, в особенности для состава, содержащего DLinKC2-DMA.However, the charge of LNPs must be taken into account. Thus, association of cationic lipids with negatively charged lipids induces the formation of non-bilayer structures that facilitate intracellular delivery. Since charged LNPs are rapidly cleared from the circulation following intravenous injection, ionizable cationic lipids with pKa values below 7 have been developed (see, e.g., Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011). Negatively charged polymers such as RNA can be loaded into LNPs at low pH (e.g., pH 4), where ionizable lipids exhibit a positive charge. However, at physiological pH, LNPs exhibit a low surface charge compatible with long residence times in the circulation. The main focus is on four kinds of ionizable cationic lipid molecules, namely 1,2-dilinoleoyl-3-dimethylammoniumpropane (DLinDAP), 1,2-dilinoleyloxy-3-N,N-dimethylaminopropane (DLinDMA), 1,2-dilinoleyloxyketo-N,N-dimethyl-3-aminopropane (DLinKDMA) and 1,2-dilinoleyl-4-(2-dimethylaminoethyl)-[1,3]-dioxolane (DLinKC2-DMA). LNP-siRNA systems containing these lipids have been shown to exhibit significantly different gene silencing properties in hepatocytes in vivo, with their activity ranging from DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP using the factor VII gene silencing model (see, e.g., Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011). A dose of 1 μg/mL LNP or CRISPR-Cas RNA in or associated with LNP may be envisaged, particularly for a formulation containing DLinKC2-DMA.
Получение LNP и инкапсулирование CRISPR-Cas можно применять и/или адаптировать согласно Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011. Катионные липиды 1,2-дилинолеоил-3-диметиламмонийпропан (DLinDAP), 1,2-дилинолеилокси-3-N,N-диметиламинопропан (DLinDMA), 1,2-дилинолеилоксикето-N,N-диметил-3-аминопропан (DLinK-DMA), 1,2-дилинолеил-4-(2-диметиламиноэтил)-[1,3]-диоксолан (DLinKC2-DMA), (3-o-[2″-(метоксиполиэтиленгликоль 2000)-сукциноил]-1,2-димиристоил-sn-гликоль (PEG-S-DMG) и R-3-[(ω-метоксиполи(этиленгликоль)2000)-карбамоил]-1,2-димиристилоксипропил-3-амин (PEG-C-DOMG) могут быть предоставлены Tekmira Pharmaceuticals (Ванкувер, Канада) или синтезированы. Холестерин можно приобрести у Sigma (Сент-Луис, Миссури). Конкретную РНК CRISPR-Cas можно инкапсулировать в LNP, содержащую DLinDAP, DLinDMA, DLinK-DMA и DLinKC2-DMA (катионный липид:DSPC:холестерин: PEG-S-DMG или PEG-C-DOMG в молярном соотношении 40:10:40:10). При необходимости можно включать в состав 0,2% SP-DiOC18 (Invitrogen, Берлингтон, Канада) для определения клеточного поглощения, внутриклеточной доставки и биораспределения. Инкапсулирование можно осуществлять путем растворения липидных смесей, содержащих катионный липид:DSPC:холестерин:PEG-C-DOMG (молярное соотношение 40:10:40:10), в этаноле до конечной концентрации липидов 10 ммолей/л. Этот раствор липидов в этаноле можно добавлять по каплям к 50 ммолей/л цитрата, pH 4,0, с образованием многослойных везикул до получения конечной концентрации этанола 30% об./об. Крупные однослойные везикулы могут быть образованы после экструзии многослойных пузырьков через два установленных один над другим поликарбонатных фильтра Nuclepore на 80 нм с помощью экструдера (Northern Lipids, Ванкувер, Канада). Инкапсулирование можно осуществлять путем добавления РНК, растворенной при 2 мг/мл в 50 ммолей/л цитрата, pH 4,0, содержащего 30% этанол об./об., по каплям к экструдированным предварительно сформированным крупным однослойным везикулам и инкубирования при 31°C в течение 30 минут при постоянном перемешивании до конечного весового соотношения РНК/липид 0,06/1 вес./вес. Удаление этанола и нейтрализацию буфера для получения состава проводили путем диализа против фосфатно-солевого буфера (PBS), pH 7,4, в течение 16 часов с помощью диализных мембран Spectra/Por 2 из регенерированной целлюлозы. Распределение частиц по размеру можно определить посредством динамического рассеяния света с использованием измерителя размера частиц NICOMP 370, режимов объема пузырьков/интенсивности рассеянного света и аппроксимации функцией Гаусса (Nicomp Particle Sizing, Санта-Барбара, Калифорния). Размер частиц для всех трех систем LNP может составлять ~70 нм в диаметре. Эффективность инкапсулирования siRNA можно определить путем удаления свободной РНК из образцов, отобранных до или после диализа, с помощью колонок VivaPureD MiniH (Sartorius Stedim Biotech). Инкапсулированную РНК можно экстрагировать из элюированных частиц и подвергнуть количественной оценке при 260 нм. Соотношение РНК и липидов определяли путем измерения содержания холестерина в везикулах с помощью ферментативного анализа Cholesterol E от Wako Chemicals USA (Ричмонд, Виргиния). В связи с обсуждением в данном документе LNP и PEG-липидов, ПЭГилированные липосомы или LNP являются также подходящими для доставки системы CRISPR-Cas или ее компонентов.The production of LNPs and encapsulation of CRISPR-Cas can be used and/or adapted according to Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011. Cationic lipids 1,2-dilinoleoyl-3-dimethylammoniumpropane (DLinDAP), 1,2-dilinoleyloxy-3-N,N-dimethylaminopropane (DLinDMA), 1,2-dilinoleyloxyketo-N,N-dimethyl-3-aminopropane (DLinK-DMA), 1,2-dilinoleyl-4-(2-dimethylaminoethyl)-[1,3]-dioxolane (DLinKC2-DMA), (3-o-[2″-(methoxypolyethyleneglycol 2000)-succinoyl]-1,2-dimyristoyl-sn-glycol (PEG-S-DMG) and R-3-[(ω-methoxypoly(ethylene glycol)2000)-carbamoyl]-1,2-dimyristyloxypropyl-3-amine (PEG-C-DOMG) can be purchased from Tekmira Pharmaceuticals (Vancouver, Canada) or synthesized. Cholesterol can be purchased from Sigma (St. Louis, MO). Specific CRISPR-Cas RNA can be encapsulated in LNPs containing DLinDAP, DLinDMA, DLinK-DMA, and DLinKC2-DMA (cationic lipid:DSPC:cholesterol: PEG-S-DMG or PEG-C-DOMG in a 40:10:40:10 molar ratio). If desired, 0.2% SP-DiOC18 (Invitrogen, Burlington, Canada) can be included to determine cellular uptake, intracellular delivery, and biodistribution. Encapsulation can be accomplished by dissolving lipid mixtures containing cationic lipid:DSPC:cholesterol:PEG-C-DOMG (molar ratio 40:10:40:10) in ethanol to a final lipid concentration of 10 mmol/L. This ethanolic lipid solution can be added dropwise to 50 mmol/L citrate, pH 4.0, to form multilamellar vesicles to a final ethanol concentration of 30% v/v. Large unilamellar vesicles can be formed by extruding the multilamellar vesicles through two stacked Nuclepore 80 nm polycarbonate filters using an extruder (Northern Lipids, Vancouver, Canada). Encapsulation can be accomplished by adding RNA dissolved at 2 mg/mL in 50 mmol/L citrate, pH 4.0, containing 30% ethanol. v/v, dropwise into extruded preformed large unilamellar vesicles and incubated at 31°C for 30 min with constant agitation to a final RNA/lipid weight ratio of 0.06/1 w/w. Ethanol removal and neutralization of the formulation buffer were performed by dialysis against phosphate-buffered saline (PBS), pH 7.4, for 16 h using Spectra/Por 2 regenerated cellulose dialysis membranes. Particle size distribution can be determined by dynamic light scattering using a NICOMP 370 Particle Sizer, bubble volume/scattered light intensity modes, and Gaussian fit (Nicomp Particle Sizing, Santa Barbara, CA). Particle size for all three LNP systems can be ~70 nm in diameter. Encapsulation efficiency of siRNA can be determined by removing free RNA from samples collected before or after dialysis using VivaPureD MiniH columns (Sartorius Stedim Biotech). Encapsulated RNA can be extracted from the eluted particles and quantified at 260 nm. The RNA to lipid ratio was determined by measuring the cholesterol content of the vesicles using the Cholesterol E enzymatic assay from Wako Chemicals USA (Richmond, VA). In connection with the discussion of LNPs and PEG-lipids in this paper, PEGylated liposomes or LNPs are also suitable for delivery of the CRISPR-Cas system or its components.
Получение крупных LNP можно применять и/или адаптировать согласно Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011. Раствор предварительно приготовленной смеси липидов (общая концентрация липидов 20,4 мг/мл) можно получать в этаноле, содержащем DLinKC2-DMA, DSPC и холестерин в молярном соотношении 50:10:38,5. К предварительно приготовленной смеси липидов можно добавлять ацетат натрия в молярном соотношении 0,75:1 (ацетат натрия:DLinKC2-DMA). Липиды затем можно гидрировать путем объединения смеси с 1,85 объема цитратного буфера (10 ммоль/л, pH 3,0) при энергичном перемешивании, вызывая самопроизвольное образование липосом в водном буфере, содержащем 35% этанол. Раствор липосом можно инкубировать при 37°C для обеспечения зависимого от времени увеличения размера частиц. Можно отбирать аликвоты в различные моменты времени в ходе инкубирования для изучения изменений размера липосом посредством динамического рассеяния света (Zetasizer Nano ZS, Malvern Instruments, Вустершир, Великобритания). По достижении желаемого размера частиц к смеси липосом можно добавлять водный раствор конъюгатов PEG-липид (исходный раствор = 10 мг/мл PEG-DMG в 35% (об./об.) этаноле) с получением конечной молярной концентрации PEG 3,5% от общего количества липидов. После добавления конъюгатов PEG-липид липосомы должны сохранять свой размер с эффективным подавлением дальнейшего роста. К пустым липосомам затем можно добавлять РНК при соотношении РНК и общих липидов, составляющим примерно 1:10 (вес:вес.), с последующим инкубированием в течение 30 минут при 37°C с образованием нагруженных LNP. Смесь затем можно подвергнуть диализу в течение ночи в PBS и отфильтровать через фильтрующий шприц с диаметром пор 0,45 мкм.The preparation of large LNPs can be used and/or adapted from Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011. A solution of a pre-mixed lipid (total lipid concentration 20.4 mg/mL) can be prepared in ethanol containing DLinKC2-DMA, DSPC, and cholesterol in a molar ratio of 50:10:38.5. Sodium acetate can be added to the pre-mixed lipid in a molar ratio of 0.75:1 (sodium acetate:DLinKC2-DMA). The lipids can then be hydrogenated by combining the mixture with 1.85 volumes of citrate buffer (10 mmol/L, pH 3.0) with vigorous stirring to induce spontaneous formation of liposomes in aqueous buffer containing 35% ethanol. The liposome solution can be incubated at 37°C to provide a time-dependent increase in particle size. Aliquots can be taken at various time points during the incubation to study liposome size changes using dynamic light scattering (Zetasizer Nano ZS, Malvern Instruments, Worcestershire, UK). Once the desired particle size has been achieved, an aqueous solution of PEG-lipid conjugates (stock solution = 10 mg/mL PEG-DMG in 35% (v/v) ethanol) can be added to the liposome mixture to give a final molar concentration of PEG of 3.5% of total lipid. Following addition of the PEG-lipid conjugates, the liposomes should maintain their size with effective inhibition of further growth. RNA can then be added to the empty liposomes at a ratio of RNA to total lipids of approximately 1:10 (w:w) followed by incubation for 30 min at 37°C to form loaded LNPs. The mixture can then be dialyzed overnight in PBS and filtered through a 0.45 μm syringe filter.
Конструкции сферических нуклеиновых кислот (SNA™) и другие частицы (в частности, частицы золота) также предусмотрены в качестве средства доставки системы CRISPR/Cas к предполагаемым мишеням. Репрезентативные данные показывают, что конструкции сферических нуклеиновых кислот (SNA™) AuraSense лекарственных препаратов на основе частиц золота, функционализированных нуклеиновыми кислотами, также являются применимыми.Spherical nucleic acid constructs (SNAs™) and other particles (particularly gold particles) are also envisaged as a means of delivering the CRISPR/Cas system to intended targets. Representative data show that AuraSense Spherical Nucleic Acid (SNAs™) constructs of nucleic acid-functionalized gold particles are also useful.
Литературные источники, которые можно использовать совместно с изложенными в данном документе идеями, включают: Cutler et al., J. Am. Chem. Soc. 2011 133:9254-9257, Hao et al., Small. 2011 7:3158-3162, Zhang et al., ACS Nano. 2011 5:6962-6970, Cutler et al., J. Am. Chem. Soc. 2012 134:1376-1391, Young et al., Nano Lett. 2012 12:3867-71, Zheng et al., Proc. Natl. Acad. Sci. USA. 2012 109:11975-80, Mirkin, Nanomedicine 2012 7:635-638 Zhang et al., J. Am. Chem. Soc. 2012 134:16488-1691, Weintraub, Nature 2013 495:S14-S16, Choi et al., Proc. Natl. Acad. Sci. USA. 2013 110(19):7625-7630, Jensen et al., Sci. Transl. Med. 5, 209ra152 (2013) и Mirkin, et al., Small, 10:186-192.Literature sources that may be useful in conjunction with the ideas presented in this paper include: Cutler et al., J. Am. Chem. Soc. 2011 133:9254–9257, Hao et al., Small. 2011 7:3158–3162, Zhang et al., ACS Nano. 2011 5:6962–6970, Cutler et al., J. Am. Chem. Soc. 2012 134:1376–1391, Young et al., Nano Lett. 2012 12:3867–71, Zheng et al., Proc. Natl. Acad. Sci. USA. 2012 109:11975-80, Mirkin, Nanomedicine 2012 7:635-638 Zhang et al., J. Am. Chem. Soc. 2012 134:16488-1691, Weintraub, Nature 2013 495:S14-S16, Choi et al., Proc. Natl. Acad. Sci. USA. 2013 110(19):7625-7630, Jensen et al., Sci. Transl. Med. 5, 209ra152 (2013) and Mirkin, et al., Small, 10:186-192.
Самособирающиеся частицы с РНК можно конструировать с полиэтиленимином (PEI), который пэгилирован с пептидным лигандом Arg-Gly-Asp (RGD), прикрепленным к дистальному концу цепи полиэтиленгликоля (PEG). Данную систему использовали, например, в качестве средства для целенаправленного воздействия на сосудистую сеть опухолей, экспрессирующую интегрины, и для доставки siRNA, подавляющей экспрессию рецептора 2 сосудистого эндотелиального фактора роста (VEGF R2), добиваясь тем самым подавления опухолевого ангиогенеза (см., например, Schiffelers et al., Nucleic Acids Research, 2004, Vol. 32, No. 19). Наноплексы можно получать путем смешивания равных объемов водных растворов катионного полимера и нуклеиновой кислоты с получением чистого молярного избытка ионизируемого азота (полимера) относительно фосфата (нуклеиновой кислоты) в диапазоне от 2 до 6. Электростатические взаимодействия между катионными полимерами и нуклеиновой кислотой приводят в результате к образованию полиплексов, характеризующихся распределением частиц по размеру со средним размером, составляющим приблизительно 100 нм, в связи с чем их называют наноплексами. Для доставки в самособирающихся частицах согласно Schiffelers et al. предполагается доза, составляющая приблизительно от 100 до 200 мг CRISPR-Cas.Self-assembling RNA particles can be constructed with polyethyleneimine (PEI) that is pegylated with an Arg-Gly-Asp (RGD) peptide ligand attached to the distal end of a polyethyleneglycol (PEG) chain. This system has been used, for example, as a means to target integrin-expressing tumor vasculature and to deliver siRNA that down-regulates vascular endothelial growth factor receptor 2 (VEGF R2), thereby suppressing tumor angiogenesis (see, for example, Schiffelers et al., Nucleic Acids Research, 2004, Vol. 32, No. 19). Nanoplexes can be prepared by mixing equal volumes of aqueous solutions of a cationic polymer and nucleic acid to produce a net molar excess of ionizable nitrogen (polymer) relative to phosphate (nucleic acid) in the range of 2 to 6. Electrostatic interactions between the cationic polymers and nucleic acid result in the formation of polyplexes characterized by a particle size distribution with an average size of approximately 100 nm, hence the name nanoplexes. For delivery in self-assembling particles, a dose of approximately 100 to 200 mg of CRISPR-Cas is suggested by Schiffelers et al.
Наноплексы согласно Bartlett et al. (PNAS, September 25, 2007,vol. 104, no. 39) также можно применять в настоящем изобретении. Наноплексы согласно Bartlett et al. получают путем смешивания равных объемов водных растворов катионного полимера и нуклеиновой кислоты с получением чистого молярного избытка ионизируемого азота (полимера) относительно фосфата (нуклеиновой кислоты) в диапазоне от 2 до 6. Электростатические взаимодействия между катионными полимерами и нуклеиновой кислотой приводят в результате к образованию полиплексов, характеризующихся распределением частиц по размеру со средним размером, составляющим приблизительно 100 нм, в связи с чем их называют наноплексами. Конъюгаты DOTA-siRNA согласно Bartlett et al. синтезировали следующим образом. Сложный моно(N-гидроксисукцинимидный эфир) 1,4,7,10-тетраазациклододекан-1,4,7,10-тетрауксусной кислоты (сложный эфир DOTA-NHS) заказывали у Macrocyclics (Даллас, Техас). В микроцентрифужную пробирку добавляли аминомодифицированную смысловую нить РНК со 100-кратным молярным избытком сложного эфира DOTA-NHS в карбонатном буфере (pH 9). Содержимое вводили в реакцию путем перемешивания в течение 4 ч. при комнатной температуре. Конъюгат DOTA-смысловая нить РНК осаждали этанолом, ресуспендировали в воде и отжигали с немодифицированной антисмысловой нитью с получением конъюгата DOTA-siRNA. Все жидкости предварительно обрабатывали с помощью Chelex-100 (Bio-Rad, Геркулес, Калифорния) для удаления следовых количеств металлических примесей. Частицы с siRNA, нацеливающиеся на Tf и ненацеливающиеся, могут быть образованы с использованием поликатионов, содержащих циклодекстрин. Как правило, частицы получают в воде при соотношении зарядов 3 (+/-) и концентрации siRNA 0,5 г/литр. Один процент молекул конъюгатов адамантан-PEG на поверхности нацеленных частиц модифицировали с помощью Tf (адамантан-PEG-Tf). Частицы суспендировали в 5% (вес./об.) растворе глюкозы в качестве носителя для инъекции.Nanoplexes according to Bartlett et al. (PNAS, September 25, 2007, vol. 104, no. 39) can also be used in the present invention. Nanoplexes according to Bartlett et al. are prepared by mixing equal volumes of aqueous solutions of a cationic polymer and nucleic acid to obtain a net molar excess of ionizable nitrogen (polymer) relative to phosphate (nucleic acid) in the range of 2 to 6. Electrostatic interactions between the cationic polymers and nucleic acid result in the formation of polyplexes characterized by a particle size distribution with an average size of approximately 100 nm, hence they are called nanoplexes. DOTA-siRNA conjugates according to Bartlett et al. were synthesized as follows. 1,4,7,10-Tetraazacyclododecane-1,4,7,10-tetraacetic acid mono(N-hydroxysuccinimide ester) (DOTA-NHS ester) was purchased from Macrocyclics (Dallas, TX). Amine-modified sense strand RNA was added to a microcentrifuge tube with a 100-fold molar excess of DOTA-NHS ester in carbonate buffer (pH 9). The contents were reacted by stirring for 4 h at room temperature. The DOTA-sense strand RNA conjugate was precipitated with ethanol, resuspended in water, and annealed with the unmodified antisense strand to yield the DOTA-siRNA conjugate. All fluids were pretreated with Chelex-100 (Bio-Rad, Hercules, CA) to remove trace amounts of metal impurities. Tf-targeting and non-targeting siRNA particles could be formed using cyclodextrin-containing polycations. Typically, particles were prepared in water at a charge ratio of 3 (+/-) and an siRNA concentration of 0.5 g/liter. One percent of the adamantane-PEG conjugate molecules on the surface of the targeted particles were modified with Tf (adamantane-PEG-Tf). The particles were suspended in 5% (w/v) glucose as the injection vehicle.
Davis et al. (Nature, Vol 464, 15 April 2010) проводили клиническое испытание с РНК, в котором использовали систему доставки на основе нацеленных частиц (регистрационный номер клинического испытания NCT00689065). Пациентам с солидными формами рака, трудно поддающимися стандартным методикам лечения, вводили дозы нацеленных частиц в дни 1, 3, 8 и 10 21-дневного цикла посредством 30-минутной внутривенной инфузии. Частицы состоят из синтетической системы доставки, содержащей: (1) линейный полимер на основе циклодекстрина (CDP), (2) лиганд, нацеливающийся на белок трансферрин человека (TF), представленный на внешней поверхности частиц, который входит в контакт с рецепторами TF (TFR) на поверхности раковых клеток, (3) гидрофильный полимер (полиэтиленгликоль (PEG), используемый для обеспечения стабильности частиц в биологических жидкостях), и (4) siRNA, предназначенную для снижения экспрессии RRM2 (последовательность, применяемая в клинической практике, ранее была обозначена как siR2B+5). Давно известно, что в злокачественных клетках повышена экспрессия TFR, а RRM2 является общепризнанной мишенью для противораковой терапии. Было показано, что эти частицы (клинический вариант обозначен как CALAA-01) хорошо переносятся в исследованиях с использованием многократных доз у отличных от человека приматов. Даже при том, что отдельному пациенту с хроническим миелоидным лейкозом вводили siRNA посредством доставки с помощью липосом, клиническое испытание Davis et al. является первым испытанием с участием человека, в котором проводят системную доставку siRNA с помощью системы целенаправленной доставки и лечат пациентов с солидным раком. Для того, чтобы выяснить, может ли система целенаправленной доставки обеспечивать эффективную доставку функциональных siRNA в опухоли человека, Davis et al. исследовали биоптаты от трех пациентов из трех различных групп дозирования; пациентов A, B и C, все из которых имели метастазирующую меланому и получали дозы CALAA-01 с 18, 24 и 30 мг м-2 siRNA соответственно. Аналогичные дозы также могут быть предусмотрены для системы CRISPR-Cas по настоящему изобретению. Доставку по настоящему изобретению можно осуществлять с помощью частиц, содержащих линейный полимер на основе циклодекстрина (CDP), лиганд, нацеливающийся на белок трансферрин человека (TF), представленный на внешней поверхности частиц, который входит в контакт с рецепторами TF (TFR) на поверхности раковых клеток, и/или гидрофильный полимер (например, полиэтиленгликоль (PEG), применяемый для обеспечения стабильности частиц в биологических жидкостях).Davis et al. (Nature, Vol 464, 15 April 2010) conducted a clinical trial with RNA using a targeted particle delivery system (clinical trial registration number NCT00689065). Patients with solid cancers refractory to standard treatments were given doses of targeted particles on days 1, 3, 8, and 10 of a 21-day cycle via a 30-minute intravenous infusion. The particles consist of a synthetic delivery system containing: (1) a linear cyclodextrin (CDP)-based polymer, (2) a ligand targeting human transferrin protein (TF) displayed on the outer surface of the particles, which engages TF receptors (TFRs) on the surface of cancer cells, (3) a hydrophilic polymer (polyethylene glycol (PEG), used to ensure particle stability in biological fluids), and (4) siRNA designed to downregulate RRM2 expression (the sequence used in clinical practice was previously designated siR2B+5). TFR expression has long been known to be increased in cancer cells, and RRM2 is a well-established target for anti-cancer therapy. These particles (clinical variant designated CALAA-01) have been shown to be well tolerated in repeated-dose studies in non-human primates. Even though a single patient with chronic myeloid leukemia was administered siRNA via liposome delivery, the clinical trial by Davis et al. is the first human trial to systemically deliver siRNA using a targeted delivery system and treat patients with solid cancer. To determine whether a targeted delivery system could efficiently deliver functional siRNA to human tumors, Davis et al. examined biopsies from three patients in three different dosing groups; Patients A, B, and C, all of whom had metastatic melanoma and received CALAA-01 doses of 18, 24, and 30 mg m -2 siRNA, respectively. Similar doses can also be envisaged for the CRISPR-Cas system of the present invention. Delivery according to the present invention can be achieved using particles comprising a linear cyclodextrin-based polymer (CDP), a human transferrin protein (TF) targeting ligand presented on the outer surface of the particles that contacts TF receptors (TFRs) on the surface of cancer cells, and/or a hydrophilic polymer (e.g., polyethylene glycol (PEG) used to provide stability of the particles in biological fluids).
В контексте настоящего изобретения предпочтительно, чтобы один или несколько компонентов комплекса CRISPR, например, фермент CRISPR, или мРНК, или направляющая РНК, были доставлены с помощью частиц или липидных оболочек. Вместе с аспектами частиц по настоящему изобретению можно применять другие системы доставки или векторы.In the context of the present invention, it is preferred that one or more components of the CRISPR complex, such as the CRISPR enzyme or mRNA or guide RNA, are delivered using particles or lipid shells. Other delivery systems or vectors may be used together with the particle aspects of the present invention.
В целом, "наночастица" относится к любой частице, имеющей диаметр менее 1000 нм. В определенных предпочтительных вариантах осуществления наночастицы по настоящему изобретению имеют наибольший размер (например, диаметр) 500 нм или менее. В других предпочтительных вариантах осуществления наночастицы по настоящему изобретению имеют наибольший размер, варьирующий в диапазоне от 25 нм до 200 нм. В других предпочтительных вариантах осуществления наночастицы по настоящему изобретению имеют наибольший размер 100 нм или менее. В других предпочтительных вариантах осуществления наночастицы по настоящему изобретению имеют наибольший размер, варьирующий в диапазоне от 35 нм до 60 нм.In general, a "nanoparticle" refers to any particle having a diameter of less than 1000 nm. In certain preferred embodiments, the nanoparticles of the present invention have a largest dimension (e.g., diameter) of 500 nm or less. In other preferred embodiments, the nanoparticles of the present invention have a largest dimension ranging from 25 nm to 200 nm. In other preferred embodiments, the nanoparticles of the present invention have a largest dimension of 100 nm or less. In other preferred embodiments, the nanoparticles of the present invention have a largest dimension ranging from 35 nm to 60 nm.
Частицы, охватываемые настоящим изобретением, могут быть представлены в различных формах, например, в виде твердых частиц (например, металла, такого как серебро, золото, железо, титан, неметалла, липидных твердых веществ, полимеров), суспензий частиц или их комбинаций. Могут быть получены частицы металла, диэлектрика и полупроводника, а также гибридные структуры (например, частицы типа ядро/оболочка). Частицы, изготовленные из полупроводникового материала, также могут являться меченными квантовыми точками, если они достаточно малы (как правило, менее 10 нм), чтобы происходило квантование уровней энергии электронов. Такие наноразмерные частицы используются в биомедицинских применениях в качестве носителей лекарственных средств или визуализирующих средств и могут быть приспособлены для аналогичных целей в настоящем изобретении.The particles encompassed by the present invention may be in various forms, such as solid particles (e.g., metal such as silver, gold, iron, titanium, non-metal, lipid solids, polymers), suspensions of particles, or combinations thereof. Metal, dielectric, and semiconductor particles may be produced, as well as hybrid structures (e.g., core/shell particles). Particles made of a semiconductor material may also be labeled with quantum dots if they are small enough (typically less than 10 nm) to allow quantization of electron energy levels. Such nanosized particles are used in biomedical applications as drug carriers or imaging agents, and may be adapted for similar purposes in the present invention.
Были получены полутвердые и мягкие частицы, и они находятся в пределах объема настоящего изобретения. Частицей-прототипом полутвердой природы является липосома. Различные типы частиц-липосом в настоящее время применяют в клинической практике в качестве систем доставки противораковых лекарственных средств и вакцин. Частицы, одна полусфера которых является гидрофильной, а другая полусфера - гидрофобной, называются частицами Януса и являются особенно эффективными в стабилизации эмульсий. Они способны к самосборке на поверхностях раздела вода/масло и действовать в качестве твердых поверхностно-активных веществ.Semi-solid and soft particles have been obtained and are within the scope of the present invention. The prototype particle of semi-solid nature is the liposome. Various types of liposome particles are currently used in clinical practice as delivery systems for anti-cancer drugs and vaccines. Particles with one hemisphere hydrophilic and the other hemisphere hydrophobic are called Janus particles and are particularly effective in stabilizing emulsions. They are capable of self-assembly at water/oil interfaces and act as solid surfactants.
В патенте США № 8709843, включенном в данный документ посредством ссылки, представлена система доставки лекарственных средств для целенаправленной доставки частиц, содержащих терапевтическое средство, в ткани, клетки и внутриклеточные компартменты. Настоящее изобретение предусматривает нацеленные частицы, содержащие полимер, конъюгированный с поверхностно-активным веществом, гидрофильным полимером или липидом. В патенте США № 6007845, включенном в данный документ посредством ссылки, предусмотрены частицы, имеющие ядро из мультиблочного сополимера, образованного путем ковалентного связывания соединения с несколькими функциональными группами с одним или несколькими гидрофобными полимерами и одним или несколькими гидрофильными полимерами, и содержащие биологически активный материал. В патенте США № 5855913, включенном в данный документ посредством ссылки, представлена композиция в форме частиц, содержащая аэродинамически легкие частицы, имеющие плотность после утряски менее 0,4 г/см3 и средний диаметр от 5 мкм до 30 мкм, содержащие поверхностно-активное вещество на их поверхности, для доставки лекарственных средств в легочную систему. В патенте США № 5985309, включенном в данный документ посредством ссылки, предусмотрены частицы, содержащие поверхностно-активное вещество и/или гидрофильный или гидрофобный комплекс положительно или отрицательно заряженного терапевтического или диагностического средства и заряженной молекулы, имеющей противоположный заряд, для доставки в легочную систему. В патенте США № 5543158, включенном в данный документ посредством ссылки, предусмотрены биоразлагаемые инъекционные частицы, имеющие биоразлагаемую твердую сердцевину, содержащую биологически активный материал, и поли(алкиленгликолевые) фрагменты на поверхности. В WO2012135025 (также опубликованном как US20120251560), включенном в данный документ посредством ссылки, описаны конъюгированные полимеры на основе полиэтиленимина (PEI) и конъюгированные азамакроциклы (совместно именуемые "конъюгированным липополимером" или "липополимерами"). В определенных вариантах осуществления может быть предусмотрено, что такие конъюгированные липополимеры можно применять в случае с системой CRISPR-Cas для осуществления внесения изменений в геном in vitro, ex vivo и in vivo с модификацией экспрессии гена, включающей модулирование экспрессии белка.U.S. Patent No. 8,709,843, incorporated herein by reference, provides a drug delivery system for targeted delivery of particles containing a therapeutic agent to tissues, cells, and intracellular compartments. The present invention provides targeted particles comprising a polymer conjugated to a surfactant, a hydrophilic polymer, or a lipid. U.S. Patent No. 6,007,845, incorporated herein by reference, provides particles having a core of a multiblock copolymer formed by covalently bonding a compound with multiple functional groups to one or more hydrophobic polymers and one or more hydrophilic polymers, and containing a biologically active material. U.S. Patent No. 5,855,913, incorporated herein by reference, provides a particulate composition comprising aerodynamically lightweight particles having a tapped density of less than 0.4 g/cm3 and an average diameter of 5 μm to 30 μm containing a surfactant on their surface for delivery of drugs to the pulmonary system. U.S. Patent No. 5,985,309, incorporated herein by reference, provides particles comprising a surfactant and/or a hydrophilic or hydrophobic complex of a positively or negatively charged therapeutic or diagnostic agent and a charged molecule having an opposite charge for delivery to the pulmonary system. U.S. Patent No. 5,543,158, incorporated herein by reference, provides biodegradable injectable particles having a biodegradable solid core comprising a biologically active material and poly(alkylene glycol) moieties on the surface. WO2012135025 (also published as US20120251560), incorporated herein by reference, describes conjugated polyethyleneimine (PEI)-based polymers and conjugated azamacrocycles (collectively referred to as "conjugated lipopolymer" or "lipopolymers"). In certain embodiments, it may be envisaged that such conjugated lipopolymers can be used in the case of the CRISPR-Cas system to effect genome editing in vitro, ex vivo and in vivo with modification of gene expression, including modulation of protein expression.
В одном варианте осуществления частица может представлять собой гибрид липида, модифицированного эпоксидными группами, и полимера, преимущественно 7C1 (см., например, James E. Dahlman and Carmen Barnes et al. Nature Nanotechnology (2014), опубликовано онлайн 11 мая 2014 г., doi:10.1038/nnano.2014.84). C71 синтезировали путем введения липидов C15 с концевыми эпоксидными группами в реакцию с PEI600 в молярном соотношении 14:1 и составляли с C14PEG2000 с получением частиц (диаметром от 35 до 60 нм), которые были стабильными в растворе PBS в течение по меньшей мере 40 дней.In one embodiment, the particle may be a hybrid of an epoxide-terminated lipid and a polymer, preferably 7C1 (see, e.g., James E. Dahlman and Carmen Barnes et al. Nature Nanotechnology (2014), published online May 11, 2014, doi:10.1038/nnano.2014.84). C71 was synthesized by reacting epoxide-terminated C15 lipids with PEI600 in a 14:1 molar ratio and formulated with C14PEG2000 to produce particles (35 to 60 nm in diameter) that were stable in PBS solution for at least 40 days.
Гибрид липида, модифицированного эпоксидными группами, и полимера можно использовать для доставки системы CRISPR-Cas по настоящему изобретению в клетки легких, сердечно-сосудистой системы или почек, однако, специалист в данной области может приспособить систему для доставки в другие целевые органы. Предусмотрена доза, варьирующая в диапазоне от приблизительно 0,05 до приблизительно 0,6 мг/кг. Также предусмотрен прием доз в течение нескольких дней или недель, при этом общая доза составляет приблизительно 2 мг/кг.The hybrid of lipid modified with epoxide groups and polymer can be used to deliver the CRISPR-Cas system of the present invention to cells of the lung, cardiovascular system or kidney, however, one skilled in the art can adapt the system for delivery to other target organs. A dose ranging from about 0.05 to about 0.6 mg/kg is contemplated. Dosing over several days or weeks is also contemplated, with a total dose of about 2 mg/kg.
ЭкзосомыExosomes
Экзосомы являются эндогенными нановезикулами, переносящими РНК и белки, и которые могут доставлять РНК в головной мозг и другие целевые органы. Для снижения иммуногенности Alvarez-Erviti et al. (2011, Nat Biotechnol 29: 341) использовали аутогенные дендритные клетки для получения экзосом. Нацеливания на головной мозг достигали путем конструирования дендритных клеток, экспрессирующих Lamp2b, мембранный белок экзосом, слитый с нейрон-специфическим пептидом RVG. Очищенные экзосомы нагружали экзогенной РНК путем электропорации. Меченные RVG нацеленные экзосомы, инъецируемые внутривенно, осуществляли специфическую доставку siRNA для GAPDH в нейроны, микроглию, олигодендроциты в головном мозге, обуславливая нокдаун конкретного гена. Предварительное воздействие меченных RVG экзосом не ослабляло выраженность нокдауна, и неспецифическое поглощение в других тканях не наблюдалось. Терапевтические возможности опосредованной экзосомами доставки siRNA были продемонстрированы сильно выраженным нокдауном мРНК (60%) и белка (62%) BACE1, терапевтической мишени при болезни Альцгеймера.Exosomes are endogenous RNA and protein-carrying nanovesicles that can deliver RNA to the brain and other target organs. To reduce immunogenicity, Alvarez-Erviti et al. (2011, Nat Biotechnol 29: 341) used autologous dendritic cells to produce exosomes. Brain targeting was achieved by engineering dendritic cells expressing Lamp2b, an exosome membrane protein fused to the neuron-specific peptide RVG. Purified exosomes were loaded with exogenous RNA by electroporation. RVG-labeled targeting exosomes injected intravenously specifically delivered siRNA for GAPDH to neurons, microglia, and oligodendrocytes in the brain, causing knockdown of the specific gene. Pre-exposure to RVG-labeled exosomes did not attenuate the magnitude of knockdown, and non-specific uptake into other tissues was not observed. The therapeutic potential of exosome-mediated siRNA delivery was demonstrated by the potent mRNA (60%) and protein (62%) knockdown of BACE1, a therapeutic target in Alzheimer's disease.
Для получения пула иммунологически инертных экзосом Alvarez-Erviti et al. отбирали костный мозг у инбредных мышей C57BL/6 с гомогенным гаплотипом главного комплекса гистосовместимости (MHC). Поскольку незрелые дендритные клетки вырабатывают большие количества экзосом, лишенных активаторов T-клеток, таких как MHC-II и CD86, Alvarez-Erviti et al. проводили отбор дендритных клеток с помощью гранулоцитарно-макрофагального колониестимулирующего фактора (GM-CSF) в течение 7 дней. Экзосомы очищали от культуральной надосадочной жидкости на следующий день с применением общепринятых протоколов ультрацентрифугирования. Вырабатываемые экзосомы были физически однородными и характеризовались распределением по размеру с пиком при 80 нм в диаметре, как определяли с помощью анализа отслеживания частиц (NTA) и электронной микроскопии. Alvarez-Erviti et al. получали 6-12 мкг экзосом (измерено по концентрации белка) на 106 клеток.To generate a pool of immunologically inert exosomes, Alvarez-Erviti et al. collected bone marrow from inbred C57BL/6 mice with a homogeneous major histocompatibility complex (MHC) haplotype. Because immature dendritic cells produce large amounts of exosomes lacking T cell activators such as MHC-II and CD86, Alvarez-Erviti et al. selected dendritic cells with granulocyte-macrophage colony-stimulating factor (GM-CSF) for 7 days. Exosomes were purified from the culture supernatant the following day using established ultracentrifugation protocols. The exosomes produced were physically homogeneous and characterized by a size distribution with a peak at 80 nm in diameter, as determined by particle tracking assay (NTA) and electron microscopy. Alvarez-Erviti et al. 6-12 μg of exosomes (measured by protein concentration) were obtained per 10 6 cells.
Затем Alvarez-Erviti et al. исследовали возможность загрузки модифицированных экзосом экзогенными молекулами-карго с применением протоколов электропорации, приспособленных для применений на наноразмерном уровне. Поскольку электропорация для мембранных частиц в нанометрическом масштабе изучена недостаточно хорошо, для эмпирической оптимизации протокола электропорации использовали неспецифичную меченную Cy5 РНК. Количество инкапсулированной РНК анализировали после ультрацентрифугирования и лизиса экзосом. Электропорация при 400 В и 125 мкФ приводила к наибольшему удержанию РНК и применялась для всех последующих экспериментов.Alvarez-Erviti et al. then investigated the possibility of loading modified exosomes with exogenous cargo molecules using electroporation protocols tailored for nanoscale applications. Since electroporation for membrane particles at the nanometer scale is not well understood, non-specific Cy5-labeled RNA was used to empirically optimize the electroporation protocol. The amount of encapsulated RNA was analyzed after ultracentrifugation and lysis of exosomes. Electroporation at 400 V and 125 μF resulted in the highest RNA retention and was used for all subsequent experiments.
Alvarez-Erviti et al. вводили по 150 мкг каждой siRNA для BACE1, инкапсулированной в 150 мкг меченных RVG экзосом, нормальным мышам C57BL/6 и сравнивали эффективность нокдауна с таковой в четырех контрольных группах: необработанные мыши, мыши, которым инъецировали только меченные RVG экзосомы, мыши, которым инъецировали siRNA для BACE1, образующую комплекс с реагентом на основе катионных липосом для доставки in vivo, и мыши, которым инъецировали siRNA для BACE1, образующую комплекс с RVG-9R, пептидом RVG, конъюгированным с 9 остатками D-аргинина, который электростатически связывается с siRNA. Образцы кортикальной ткани анализировали через 3 дня после введения, и как у обработанных siRNA-RVG-9R, так и у обработанных меченными RVG экзосомами с siRNA мышей наблюдали значительный нокдаун белка (45%, P < 0,05 и 62%, P < 0,01), обусловленный значительным снижением уровней мРНК BACE1 (66% [+ или -] 15%, P < 0,001 и 61% [+ или -] 13%, P < 0,01 соответственно). Более того, заявители продемонстрировали значительное снижение (55%, P < 0,05) общих уровней [бета]-амилоидного пептида 1-42, основного компонента амилоидных бляшек в патологическом процессе при болезни Альцгеймера у животных, обработанных меченными RVG экзосомами. Наблюдавшееся снижение было большим, чем снижение уровней β-амилоидного пептида 1-40, демонстрируемое у нормальных мышей после внутрижелудочковой инъекции ингибиторов BACE1. Alvarez-Erviti et al. проводили быструю амплификацию 5'-концов кДНК (RACE) в отношении продукта расщепления BACE1, что свидетельствовало об опосредованном RNAi нокдауне с помощью siRNA.Alvarez-Erviti et al. injected 150 μg of each BACE1 siRNA encapsulated in 150 μg of RVG-labeled exosomes into normal C57BL/6 mice and compared the knockdown efficiency with that of four control groups: untreated mice, mice injected with RVG-labeled exosomes only, mice injected with BACE1 siRNA complexed with a cationic liposome-based in vivo delivery reagent, and mice injected with BACE1 siRNA complexed with RVG-9R, an RVG peptide conjugated to 9 D-arginine residues that electrostatically binds to the siRNA. Cortical tissue samples were analyzed 3 days after administration and both siRNA-RVG-9R and RVG-labeled exosomes-siRNA-treated mice showed significant protein knockdown (45%, P < 0.05 and 62%, P < 0.01) due to significant reductions in BACE1 mRNA levels (66% [+ or -] 15%, P < 0.001 and 61% [+ or -] 13%, P < 0.01, respectively). Furthermore, we demonstrated a significant reduction (55%, P < 0.05) in total [beta]-amyloid peptide 1-42 levels, a major component of amyloid plaques in the Alzheimer's disease pathology process, in animals treated with RVG-labeled exosomes. The observed reduction was greater than the reduction in β-amyloid peptide 1-40 levels demonstrated in normal mice following intracerebroventricular injection of BACE1 inhibitors. Alvarez-Erviti et al. performed rapid amplification of 5' cDNA ends (RACE) on the BACE1 cleavage product, indicating RNAi-mediated knockdown by siRNA.
Наконец, Alvarez-Erviti et al. исследовали, индуцируют ли меченные RVG экзосомы с РНК иммунные ответы in vivo, путем определения концентраций IL-6, IP-10, TNFα и IFN-α в сыворотке крови. После обработки экзосомами для всех цитокинов регистрировали незначительные изменения подобно обработке реагентом для трансфекции с siRNA и в отличие от siRNA-RVG-9R, который активно стимулировал секрецию IL-6, что подтверждало иммунологическую инертность как особенность обработки экзосомами. С учетом того, что экзосомы инкапсулируют только 20% siRNA, доставка с помощью меченных RVG экзосом, по-видимому, является более эффективной, чем доставка с помощью RVG-9R, поскольку с использованием в пять раз меньшего количества siRNA без соответствующего уровня стимуляции иммунного ответа достигали сопоставимого нокдауна мРНК и большего нокдауна белка. Данный эксперимент продемонстрировал терапевтические возможности технологии меченных RVG экзосом, которая потенциально подходит для долговременного сайленсинга генов, связанных с нейродегенеративными заболеваниями. Систему доставки на основе экзосом по Alvarez-Erviti et al. можно использовать для доставки системы CRISPR-Cas по настоящему изобретению к терапевтическим мишеням, особенно при нейродегенеративных заболеваниях. В настоящем изобретении может быть предусмотрена доза, составляющая приблизительно 100-1000 мг CRISPR-Cas, инкапсулированных в приблизительно 100-1000 мг меченных RVG экзосом.Finally, Alvarez-Erviti et al. investigated whether RVG-labeled RNA exosomes induce immune responses in vivo by determining serum concentrations of IL-6, IP-10, TNFα, and IFN-α. All cytokines showed little change after exosome treatment, similar to siRNA transfection reagent treatment and unlike siRNA-RVG-9R, which strongly stimulated IL-6 secretion, confirming the immunological inertness of exosome treatment. Given that exosomes encapsulate only 20% of siRNA, delivery by RVG-labeled exosomes appears to be more efficient than that by RVG-9R, since comparable mRNA knockdown and greater protein knockdown were achieved using fivefold less siRNA without corresponding stimulation of the immune response. This experiment demonstrated the therapeutic potential of RVG-labeled exosome technology, which is potentially suitable for long-term silencing of genes associated with neurodegenerative diseases. The exosome-based delivery system of Alvarez-Erviti et al. can be used to deliver the CRISPR-Cas system of the present invention to therapeutic targets, especially in neurodegenerative diseases. The present invention can provide a dose of about 100-1000 mg of CRISPR-Cas encapsulated in about 100-1000 mg of RVG-labeled exosomes.
El-Andaloussi et al. (Nature Protocols 7, 2112-2126(2012)) раскрывают, как экзосомы, полученные из культивируемых клеток, можно приспособить для доставки РНК in vitro и in vivo. В данном протоколе впервые описано создание нацеленных экзосом посредством трансфекции вектором экспрессии, содержащим экзосомный белок, слитый с пептидным лигандом. Затем El-Andaloussi et al. объясняют, как очищать и характеризовать экзосомы из надосадочной жидкости с трансфицированными клетками. Затем El-Andaloussi et al. подробно описывают важнейшие стадии загрузки РНК в экзосомы. Наконец, El-Andaloussi et al. излагают в общих чертах, как использовать экзосомы для эффективной доставки РНК in vitro и in vivo в головной мозг мышей. Также приведены примеры предполагаемых результатов, в которых опосредованная экзосомами доставка РНК оценивается посредством функциональных анализов и визуализации. Выполнение полного протокола занимает ~3 недели. Доставку или введение согласно настоящему изобретению можно осуществлять с помощью экзосом, полученных из аутогенных дендритных клеток. Среди приведенных в данном документе идей, эту можно использовать в практическом применении настоящего изобретения.El-Andaloussi et al. (Nature Protocols 7, 2112–2126(2012)) describe how exosomes derived from cultured cells can be tailored for RNA delivery in vitro and in vivo. This protocol describes for the first time the generation of targeted exosomes by transfection with an expression vector containing an exosomal protein fused to a peptide ligand. El-Andaloussi et al. then explain how to purify and characterize exosomes from the supernatant of transfected cells. El-Andaloussi et al. then detail the critical steps in loading RNA into exosomes. Finally, El-Andaloussi et al. outline how to use exosomes to efficiently deliver RNA in vitro and in vivo to the mouse brain. Examples of predictive results are also provided, in which exosome-mediated RNA delivery is assessed through functional assays and imaging. The complete protocol takes ~3 weeks to complete. The delivery or administration according to the present invention can be carried out using exosomes obtained from autologous dendritic cells. Among the ideas given herein, this one can be used in the practical application of the present invention.
В другом варианте осуществления предполагаются экзосомы плазмы крови согласно Wahlgren et al. (Nucleic Acids Research, 2012, Vol. 40, No. 17 e130). Экзосомы представляют собой наноразмерные везикулы (размером 30-90 нм), вырабатываемые многими типами клеток, в том числе дендритными клетками (DC), B-клетками, T-клетками, тучными клетками, эпителиальными клетками и опухолевыми клетками. Данные везикулы образуются путем внутреннего почкования поздних эндосом, а затем высвобождаются во внеклеточную среду при слиянии с плазматической мембраной. Поскольку в естественных условиях экзосомы переносят РНК между клетками, данное свойство может быть полезным в генной терапии, и согласно данному раскрытию может быть использовано в практическом раскрытии настоящего изобретения.In another embodiment, plasma exosomes are provided according to Wahlgren et al. (Nucleic Acids Research, 2012, Vol. 40, No. 17 e130). Exosomes are nanosized vesicles (30-90 nm in size) produced by many types of cells, including dendritic cells (DCs), B cells, T cells, mast cells, epithelial cells, and tumor cells. These vesicles are formed by inward budding of late endosomes and are then released into the extracellular environment upon fusion with the plasma membrane. Since exosomes naturally transfer RNA between cells, this property may be useful in gene therapy and, according to this disclosure, may be used in the practice of the present invention.
Экзосомы из плазмы крови могут быть получены путем центрифугирования лейкоцитарной пленки при 900 g в течение 20 мин. для отделения плазмы крови с последующим сбором надосадочных жидкостей культуры клеток, центрифугированием при 300 g в течение 10 мин. для удаления клеток и при 16500 g в течение 30 мин. с последующей фильтрацией через фильтр с диаметром пор 0,22 мм. Экзосомы осаждают путем ультрацентрифугирования при 120000 g в течение 70 мин. Введение siRNA в экзосомы посредством химической трансфекции проводят согласно инструкциям производителя в наборе RNAi Human/Mouse Starter Kit (Quiagen, Хильден, Германия). К 100 мл PBS добавляют siRNA при конечной концентрации 2 ммоля/мл. После добавления реагента для трансфекции HiPerFect смесь инкубируют в течение 10 мин. при КТ. С целью удаления избытка мицелл экзосомы повторно выделяют с помощью латексных частиц с альдегидными/сульфатными группами. Введение CRISPR-Cas в экзосомы посредством химической трансфекции можно проводить аналогично введению siRNA. Экзосомы можно совместно культивировать с моноцитами и лимфоцитами, выделенными из периферической крови здоровых доноров. Таким образом, может быть предусмотрено, чтобы экзосомы, содержащие CRISPR-Cas, можно было вводить в моноциты и лимфоциты и подвергать аутологическому обратному введению в организм человека. Соответственно, доставку или введение согласно настоящему изобретению можно осуществлять с помощью плазменных экзосом.Exosomes can be prepared from plasma by centrifugation of the buffy coat at 900 g for 20 min to separate the plasma, followed by collection of the cell culture supernatants, centrifugation at 300 g for 10 min to remove cells and at 16,500 g for 30 min followed by filtration through a 0.22 mm filter. Exosomes are pelleted by ultracentrifugation at 120,000 g for 70 min. The introduction of siRNA into exosomes by chemical transfection is carried out according to the manufacturer's instructions in the RNAi Human/Mouse Starter Kit (Quiagen, Hilden, Germany). siRNA is added to 100 ml PBS at a final concentration of 2 mmol/ml. After addition of HiPerFect transfection reagent, the mixture is incubated for 10 min at RT. In order to remove excess micelles, exosomes are re-isolated using latex particles with aldehyde/sulfate groups. The introduction of CRISPR-Cas into exosomes by chemical transfection can be carried out similarly to the introduction of siRNA. Exosomes can be co-cultured with monocytes and lymphocytes isolated from the peripheral blood of healthy donors. Thus, it can be envisaged that exosomes containing CRISPR-Cas can be introduced into monocytes and lymphocytes and autologously reintroduced into the human body. Accordingly, the delivery or administration according to the present invention can be carried out using plasma exosomes.
ЛипосомыLiposomes
Доставку или введение согласно настоящему изобретению можно осуществлять с помощью липосом. Липосомы являются сферическими везикулярными структурами, содержащими одно- или многослойный липидный бислой, окружающий внутренние водные компартменты, и относительно непроницаемый внешний липофильный фосфолипидный бислой. Липосомы получили значительное внимание в качестве носителей для доставки лекарственных средств, поскольку они являются биологически совместимыми, нетоксичными, могут доставлять как гидрофильные, так и липофильные молекулы лекарственных средств, защищают свою молекулу-карго от разрушения плазматическими ферментами и переносят свой "груз" через биологические мембраны и гематоэнцефалический барьер (BBB) (для обзора см., например, Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679).The delivery or administration according to the present invention can be carried out using liposomes. Liposomes are spherical vesicular structures containing a mono- or multi-lamellar lipid bilayer surrounding internal aqueous compartments and a relatively impermeable outer lipophilic phospholipid bilayer. Liposomes have received considerable attention as drug delivery vehicles because they are biocompatible, non-toxic, can deliver both hydrophilic and lipophilic drug molecules, protect their cargo molecule from degradation by plasma enzymes, and transport their "cargo" across biological membranes and the blood-brain barrier (BBB) (for review, see, e.g., Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679).
Липосомы можно получать из нескольких различных типов липидов; однако для создания липосом в качестве носителей лекарственных средств чаще всего применяют фосфолипиды. Хотя образование липосом является самопроизвольным при смешивании липидной пленки с водным раствором, его также можно ускорить путем приложения силы в виде встряхивания посредством применения гомогенизатора, ультразвукового диспергатора или экструзионного аппарата (для обзора см., например, Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679).Liposomes can be prepared from several different types of lipids; however, phospholipids are most commonly used to create liposomes as drug carriers. Although liposome formation is spontaneous upon mixing of the lipid film with an aqueous solution, it can also be accelerated by applying force in the form of shaking using a homogenizer, ultrasonic disperser, or extrusion apparatus (for a review, see, e.g., Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679).
К липосомам можно добавлять некоторые другие добавки с целью модификации их структуры и свойств. Например, холестерин либо сфингомиелин можно добавлять к смеси липосом в целях содействия стабилизации структуры липосом и предотвращения утечки внутренних молекул-карго липосом. Кроме того, липосомы получают из гидрогенизированного яичного фосфатидилхолина или яичного фосфатидилхолина, холестерина и диацетилфосфата, и их средние размеры пузырьков доводят до приблизительно 50 и 100 нм (для обзора см., например, Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679).Some other additives can be added to liposomes to modify their structure and properties. For example, cholesterol or sphingomyelin can be added to the liposome mixture to help stabilize the liposome structure and prevent leakage of the internal liposome cargo molecules. In addition, liposomes are prepared from hydrogenated egg phosphatidylcholine or egg phosphatidylcholine, cholesterol and diacetyl phosphate, and their average vesicle sizes are adjusted to approximately 50 and 100 nm (for a review, see, e.g., Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679).
Липосомный состав может содержать главным образом природные фосфолипиды и липиды, такие как 1,2-дистеароил-sn-глицеро-3-фосфатидилхолин (DSPC), сфингомиелин, формы яичного фосфатидилхолина и моносиалоганглиозид. Поскольку данный состав состоит только из фосфолипидов, липосомные составы сталкиваются со многими проблемами, одной из которых является нестабильность в плазме. Было предпринято несколько попыток преодоления данных проблем, в частности, посредством манипуляции с липидной мембраной. Одна из этих попыток направлена на манипуляцию с холестерином. Добавление холестерина к традиционным составам уменьшает быстрое высвобождение инкапсулированного биологически активного соединения в плазму крови или 1,2-диолеоил-sn-глицеро-3-фосфоэтаноламин (DOPE) повышает стабильность (для обзора см., например, Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679).The liposomal formulation may contain mainly natural phospholipids and lipids such as 1,2-distearoyl-sn-glycero-3-phosphatidylcholine (DSPC), sphingomyelin, egg forms of phosphatidylcholine, and monosialoganglioside. Since this formulation consists only of phospholipids, liposomal formulations face many problems, one of which is instability in plasma. Several attempts have been made to overcome these problems, particularly through manipulation of the lipid membrane. One of these attempts is aimed at manipulating cholesterol. The addition of cholesterol to traditional formulations reduces the rapid release of the encapsulated bioactive compound into blood plasma, or 1,2-dioleoyl-sn-glycero-3-phosphoethanolamine (DOPE) increases stability (for review, see, e.g., Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679).
В особенно преимущественном варианте осуществления желательными являются липосомы "троянские кони" (также известные как "молекулярные троянские кони"), и протоколы можно найти на http://cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.long. Эти частицы обеспечивают доставку трансгена в головной мозг в целом после внутрисосудистой инъекции. Без ограничений полагают, что нейтральные липидные частицы со специфичными антителами, конъюгированными с поверхностью, обеспечивают проникновение через гематоэнцефалический барьер посредством эндоцитоза. Заявитель теоретически допускает использование липосом "троянских коней" для доставки нуклеаз семейства CRISPR в головной мозг посредством внутрисосудистой инъекции, что будет обеспечивать получение животных с трансгенами во всем головном мозге без необходимости в манипуляции с эмбрионами. Для введения in vivo в липосомы может быть предусмотрено приблизительно 1-5 г ДНК или РНК.In a particularly advantageous embodiment, liposomes "Trojan horses" (also known as "molecular Trojan horses") are desirable and protocols can be found at http://cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.long. These particles provide for delivery of the transgene to the entire brain following intravascular injection. Without limitation, it is believed that neutral lipid particles with specific antibodies conjugated to the surface provide for penetration of the blood-brain barrier via endocytosis. Applicant theoretically envisions the use of liposomes "Trojan horses" to deliver CRISPR family nucleases to the brain via intravascular injection, which would provide animals with transgenes throughout the brain without the need for embryo manipulation. For in vivo administration, approximately 1-5 g of DNA or RNA can be provided in the liposomes.
В другом варианте осуществления систему CRISPR-Cas можно вводить в липосомы, такие как стабильная частица из нуклеиновой кислоты и липидов (SNALP) (см., например, Morrissey et al., Nature Biotechnology, Vol. 23, No. 8, August 2005). Предусматриваются ежедневные внутривенные инъекции приблизительно 1, 3 или 5 мг/кг/день специфичной целенаправленно воздействующей CRISPR-Cas в SNALP. Обработку можно осуществлять ежедневно в течение приблизительно трех дней, а затем еженедельно в течение приблизительно пяти недель. В другом варианте осуществления также предусмотрена специфичная CRISPR-Cas, инкапсулированная в SNALP, вводимая посредством внутривенной инъекции в дозах, составляющих приблизительно 1 или 2,5 мг/кг (см., например, Zimmerman et al., Nature Letters, Vol. 441, 4 May 2006). Состав на основе SNALP может содержать липиды 3-N-[(ω-метоксиполи(этиленгликоль)2000)-карбамоил]-1,2-димиристилоксипропиламин (PEG-C-DMA), 1,2-дилинолеилокси-N,N-диметил-3-аминопропан (DLinDMA), 1,2-дистеароил-sn-глицеро-3-фосфохолин (DSPC) и холестерин в молярном процентном соотношении 2:40:10:48 (см., например, Zimmerman et al., Nature Letters, Vol. 441, 4 May 2006).In another embodiment, the CRISPR-Cas system can be administered in liposomes, such as a stable nucleic acid lipid particle (SNALP) (see, e.g., Morrissey et al., Nature Biotechnology, Vol. 23, No. 8, August 2005). Daily intravenous injections of about 1, 3, or 5 mg/kg/day of specific targeting CRISPR-Cas in the SNALP are contemplated. Treatment can be performed daily for about three days and then weekly for about five weeks. In another embodiment, specific CRISPR-Cas encapsulated in the SNALP is also contemplated and administered by intravenous injection at doses of about 1 or 2.5 mg/kg (see, e.g., Zimmerman et al., Nature Letters, Vol. 441, 4 May 2006). The SNALP-based formulation may contain the lipids 3-N-[(ω-methoxypoly(ethylene glycol)2000)-carbamoyl]-1,2-dimyristyloxypropylamine (PEG-C-DMA), 1,2-dilinoleyloxy-N,N-dimethyl-3-aminopropane (DLinDMA), 1,2-distearoyl-sn-glycero-3-phosphocholine (DSPC) and cholesterol in a molar percentage ratio of 2:40:10:48 (see, e.g., Zimmerman et al., Nature Letters, Vol. 441, 4 May 2006).
В другом варианте осуществления было подтверждено, что стабильные частицы из нуклеиновой кислоты и липидов (SNALP) являются эффективными молекулами для доставки в высоковаскуляризированные опухоли печени, происходящие из HepG2, но не в слабо васкуляризированные опухоли печени, происходящие из HCT-116 (см., например, Li, Gene Therapy (2012) 19, 775-780). SNALP-липосомы можно получать путем составления D-Lin-DMA и PEG-C-DMA с дистеароилфосфатидилхолином (DSPC), холестерином и siRNA с использованием соотношения липид/siRNA 25:1 и молярного соотношения холестерин/D-Lin-DMA/DSPC/PEG-C-DMA 48/40/10/2. Полученные в результате SNALP-липосомы имеют размер приблизительно 80-100 нм.In another embodiment, stable nucleic acid lipid particles (SNALPs) were confirmed to be effective delivery molecules for highly vascularized HepG2-derived liver tumors, but not for poorly vascularized HCT-116-derived liver tumors (see, e.g., Li, Gene Therapy (2012) 19, 775-780). SNALP liposomes can be prepared by formulating D-Lin-DMA and PEG-C-DMA with distearoylphosphatidylcholine (DSPC), cholesterol, and siRNA using a lipid/siRNA ratio of 25:1 and a cholesterol/D-Lin-DMA/DSPC/PEG-C-DMA molar ratio of 48/40/10/2. The resulting SNALP liposomes have a size of approximately 80-100 nm.
В еще одном варианте осуществления SNALP может содержать синтетический холестерин (Sigma-Aldrich, Сент-Луис, Миссури, США), дипальмитоилфосфатидилхолин (Avanti Polar Lipids, Алабастер, Алабама, США), 3-N-[(ω-метоксиполи(этиленгликоль)2000)карбамоил]-1,2-димиристилоксипропиламин и катионный 1,2-дилинолеилокси-3-N,N-диметиламинопропан (см., например, Geisbert et al., Lancet 2010; 375: 1896-905). Может предусматриваться режим дозирования с приемом приблизительно 2 мг/кг общего количества CRISPR-Cas на дозу, вводимую, например, в виде болюсной внутривенной инфузии.In another embodiment, the SNALP may comprise synthetic cholesterol (Sigma-Aldrich, St. Louis, MO, USA), dipalmitoylphosphatidylcholine (Avanti Polar Lipids, Alabaster, AL, USA), 3-N-[(ω-methoxypoly(ethylene glycol)2000)carbamoyl]-1,2-dimyristyloxypropylamine, and cationic 1,2-dilinoleyloxy-3-N,N-dimethylaminopropane (see, e.g., Geisbert et al., Lancet 2010; 375: 1896-905). A dosing regimen of approximately 2 mg/kg total CRISPR-Cas per dose may be contemplated, administered, e.g., as a bolus intravenous infusion.
В еще одном варианте осуществления SNALP может содержать синтетический холестерин (Sigma-Aldrich), 1,2-дистеароил-sn-глицеро-3-фосфохолин (DSPC; Avanti Polar Lipids Inc.), PEG-C-DMA и 1,2-дилинолеилокси-3-(N,N-диметил)аминопропан (DLinDMA) (см., например, Judge, J. Clin. Invest. 119:661-673 (2009)). Составы, используемые для исследований in vivo, могут содержать липиды и РНК в конечном массовом соотношении, составляющем приблизительно 9:1.In another embodiment, the SNALP may comprise synthetic cholesterol (Sigma-Aldrich), 1,2-distearoyl-sn-glycero-3-phosphocholine (DSPC; Avanti Polar Lipids Inc.), PEG-C-DMA, and 1,2-dilinoleyloxy-3-(N,N-dimethyl)aminopropane (DLinDMA) (see, e.g., Judge, J. Clin. Invest. 119:661-673 (2009)). Formulations used for in vivo studies may comprise lipids and RNA in a final weight ratio of about 9:1.
Профиль безопасности нанопрепаратов для RNAi был рассмотрен Barros and Gollob из Alnylam Pharmaceuticals (см., например, Advanced Drug Delivery Reviews 64 (2012) 1730-1737). Стабильная частица из нуклеиновой кислоты и липидов (SNALP) содержит четыре различных липида - ионизируемый липид (DLinDMA), который является катионным при низком pH, нейтральный липид-помощник, холестерин и диффундирующий конъюгат полиэтиленгликоль (PEG)-липид. Частица имеет диаметр примерно 80 нм и является электронейтральной при физиологическом значении pH. Во время составления ионизируемый липид служит для конденсации липида с анионной РНК в ходе образования частиц. Будучи положительно заряженным в условиях возрастающей кислотности в эндосомах, ионизируемый липид также опосредует слияние SNALP с мембраной эндосомы, обеспечивая высвобождение РНК в цитоплазму. Конъюгат PEG-липид стабилизирует частицу и уменьшает агрегацию во время составления, а также впоследствии обеспечивает нейтральную гидрофильную наружную поверхность, улучшающую фармакокинетические свойства.The safety profile of RNAi nanomedicines has been reviewed by Barros and Gollob of Alnylam Pharmaceuticals (see, e.g., Advanced Drug Delivery Reviews 64 (2012) 1730–1737). The stable nucleic acid–lipid particle (SNALP) contains four different lipids—an ionizable lipid (DLinDMA) that is cationic at low pH, a neutral helper lipid, cholesterol, and a diffusible polyethyleneglycol (PEG)–lipid conjugate. The particle is approximately 80 nm in diameter and is electroneutral at physiological pH. During formulation, the ionizable lipid serves to condense the lipid onto the anionic RNA during particle formation. Being positively charged under the increasingly acidic conditions of endosomes, the ionizable lipid also mediates the fusion of the SNALP with the endosomal membrane, allowing the release of RNA into the cytoplasm. The PEG-lipid conjugate stabilizes the particle and reduces aggregation during formulation and subsequently provides a neutral hydrophilic outer surface that improves pharmacokinetic properties.
К настоящему времени была начата реализация двух программ клинических исследований с применением составов на основе SNALP с РНК. В Tekmira Pharmaceuticals недавно завершили фазу I однодозового исследования SNALP-ApoB с участием взрослых добровольцев с повышенным уровнем холестерина LDL. ApoB преимущественно экспрессируется в печени и тонкой кишке и является ключевым для сборки и секреции VLDL и LDL. Семнадцать субъектов получали однократную дозу SNALP-ApoB (повышение дозы, охватывающее 7 уровней дозирования). Не наблюдалось свидетельств гепатотоксичности (предполагаемой в качестве возможной дозолимитирующей токсичности на основании доклинических исследований). Один (или два) субъекта при наиболее высокой дозе испытывали симптомы гриппоподобных заболеваний, указывающие на стимуляцию иммунной системы, и было принято решение завершить испытание.To date, two clinical trial programs have been initiated using SNALP RNA-based formulations. Tekmira Pharmaceuticals recently completed a Phase I, single-dose study of SNALP-ApoB in adult volunteers with elevated LDL-C. ApoB is primarily expressed in the liver and small intestine and is key for the assembly and secretion of VLDL and LDL. Seventeen subjects received a single dose of SNALP-ApoB (dose escalation spanning 7 dose levels). No evidence of hepatotoxicity (suggested as a possible dose-limiting toxicity based on preclinical studies) was observed. One (or two) subjects at the highest dose experienced flu-like symptoms consistent with immune stimulation and the decision was made to terminate the trial.
В Alnylam Pharmaceuticals аналогичным образом успешно провели исследование ALN-TTR01, в котором используется технология SNALP, описанная выше, и целенаправленное воздействие на выработку гепатоцитами TTR, как мутантного, так и дикого типа, для лечения опосредованного TTR амилоидоза (ATTR). Были описаны три синдрома при ATTR: семейная амилоидическая полинейропатия (FAP) и семейная амилоидическая кардиомиопатия (FAC) - оба из которых обусловлены аутосомно-доминантными мутациями в TTR; и старческий системный амилоидоз (SSA), обусловленный отложением TTR дикого типа. Недавно завершили I фазу плацебо-контролируемого испытания с повышением однократной дозы ALN-TTR01 с участием пациентов с ATTR. Введение ALN-TTR01 осуществляли в виде 15-минутной IV инфузии 31 пациенту (исследуемое лекарственное средство для 23 и плацебо для 8) в диапазоне доз 0,01-1,0 мг/кг (из расчета по siRNA). Лечение хорошо переносилось без значительного повышения показателей печеночных проб. Инфузионные реакции отмечались у 3 из 23 пациентов при ≥ 0,4 мг/кг; все они реагировали на замедление скорости инфузии и все они продолжали исследование. Минимальные и временные повышения уровней цитокинов IL-6, IP-10 и IL-1ra в сыворотке отмечались у двух пациентов при наиболее высокой дозе 1 мг/кг (как предполагалось на основании доклинических исследований и исследований с участием NHP). Снижение уровня TTR в сыворотке, ожидаемый фармакодинамический эффект ALN-TTR01, наблюдалось при 1 мг/кг.Alnylam Pharmaceuticals has similarly successfully conducted the ALN-TTR01 study, which uses the SNALP technology described above and targets hepatocyte production of both mutant and wild-type TTR to treat TTR-mediated amyloidosis (ATTR). Three syndromes have been described in ATTR: familial amyloid polyneuropathy (FAP) and familial amyloid cardiomyopathy (FAC), both caused by autosomal dominant mutations in TTR; and senile systemic amyloidosis (SSA), caused by deposition of wild-type TTR. They recently completed a phase I, placebo-controlled, single-dose escalation trial of ALN-TTR01 in patients with ATTR. ALN-TTR01 was administered as a 15-minute IV infusion to 31 patients (study drug in 23 and placebo in 8) over a dose range of 0.01-1.0 mg/kg (based on siRNA). Treatment was well tolerated, with no significant elevations in liver function tests. Infusion reactions were observed in 3 of 23 patients at ≥ 0.4 mg/kg; all responded to slowing the infusion rate and all continued in the study. Minimal and transient increases in serum cytokines IL-6, IP-10, and IL-1ra were observed in two patients at the highest dose of 1 mg/kg (as expected based on preclinical and NHP studies). A decrease in serum TTR, an expected pharmacodynamic effect of ALN-TTR01, was observed at 1 mg/kg.
В еще одном варианте осуществления SNALP можно получить путем солюбилизации катионного липида, DSPC, холестерина и конъюгата PEG-липид, например, в этаноле, например, при молярном соотношении 40:10:40:10 соответственно (см. Semple et al., Nature Biotechnology, Volume 28 Number 2 February 2010, pp. 172-177). Смесь липидов добавляли к водному буферу (50 мМ цитрат, pH 4) с перемешиванием до конечной концентрации этанола и липидов 30% (об./об.) и 6,1 мг/мл соответственно, и ей позволяли уравновешиваться при 22°C в течение 2 мин. перед экструзией. Гидрированные липиды экструдировали через два установленных один над другим фильтра с размером пор 80 нм (Nuclepore) при 22°C с помощью экструдера Lipex (Northern Lipids) до достижения диаметра пузырьков 70-90 нм, определяемого посредством анализа по методу динамического рассеяния света. Для этого обычно требовалось 1-3 прохождения. Добавляли siRNA (солюбилизированную в водном растворе, содержащем 30% этанол, с 50 мМ цитратом, pH 4) к предварительно уравновешенным (35°C) везикулам со скоростью ~5 мл/мин. при перемешивании. После достижения конечного целевого соотношения siRNA/липиды 0,06 (вес./вес.) смесь инкубировали в течение дополнительных 30 мин. при 35°C для обеспечения реорганизации пузырьков и инкапсулирования siRNA. Этанол затем удаляли, а внешний буфер заменяли на PBS (155 мМ NaCl, 3 мМ Na2HPO4, 1 мМ KH2PO4, pH 7,5) путем диализа либо тангенциальной поточной диафильтрации. В SNALP инкапсулировали siRNA посредством регулируемого способа по методу ступенчатого разбавления. Липидные составляющие KC2-SNALP представляли собой DLin-KC2-DMA (катионный липид), дипальмитоилфосфатидилхолин (DPPC; Avanti Polar Lipids), синтетический холестерин (Sigma) и PEG-C-DMA, используемые в молярном соотношении 57,1:7,1:34,3:1,4. После образования нагруженных частиц SNALP подвергали диализу против PBS и стерилизации путем фильтрации через фильтр с диаметром пор 0,2 мкм перед применением. Средние значения размера частиц составляли 75-85 нм, и 90-95% siRNA были инкапсулированы в липидных частицах. Конечное соотношение siRNA/липиды в составах, используемых для in vivo тестирования, составляло ~0,15 (вес./вес.). Системы LNP-siRNA, содержащие siRNA для фактора VII, разбавляли до соответствующих концентраций в стерильном PBS непосредственно перед применением, и составы вводили внутривенно через латеральную хвостовую вену в общем объеме 10 мл/кг. Данный способ и данные системы доставки можно экстраполировать на систему CRISPR-Cas по настоящему изобретению.In another embodiment, SNALP can be prepared by solubilizing the cationic lipid, DSPC, cholesterol, and PEG-lipid conjugate, such as in ethanol, such as at a molar ratio of 40:10:40:10, respectively (see Semple et al., Nature Biotechnology, Volume 28 Number 2 February 2010, pp. 172-177). The lipid mixture was added to aqueous buffer (50 mM citrate, pH 4) with stirring to a final ethanol and lipid concentration of 30% (v/v) and 6.1 mg/mL, respectively, and allowed to equilibrate at 22°C for 2 min prior to extrusion. Hydrogenated lipids were extruded through two stacked 80 nm filters (Nuclepore) at 22°C using a Lipex extruder (Northern Lipids) until vesicle diameters of 70–90 nm were achieved as determined by dynamic light scattering analysis. This typically required 1–3 passes. siRNA (solubilized in aqueous solution containing 30% ethanol with 50 mM citrate, pH 4) was added to pre-equilibrated (35°C) vesicles at ~5 ml/min with mixing. After reaching a final target siRNA/lipid ratio of 0.06 (w/w), the mixture was incubated for an additional 30 min at 35°C to allow vesicle reorganization and siRNA encapsulation. Ethanol was then removed and the external buffer was exchanged with PBS (155 mM NaCl, 3 mM Na2HPO4 , 1 mM KH2PO4 , pH 7.5) by either dialysis or tangential flow diafiltration. SNALPs were encapsulated with siRNA using a controlled step-dilution method. The lipid moieties of KC2-SNALPs were DLin-KC2-DMA (a cationic lipid), dipalmitoylphosphatidylcholine (DPPC; Avanti Polar Lipids), synthetic cholesterol (Sigma), and PEG-C-DMA used at a molar ratio of 57.1:7.1:34.3:1.4. Following formation of loaded particles, SNALPs were dialyzed against PBS and sterilized by filtration through a 0.2 μm filter prior to use. The average particle size was 75-85 nm, and 90-95% of the siRNA was encapsulated in the lipid particles. The final siRNA/lipid ratio in the formulations used for in vivo testing was ~0.15 (w/w). The LNP-siRNA systems containing siRNA for Factor VII were diluted to the appropriate concentrations in sterile PBS immediately prior to use, and the formulations were administered intravenously via the lateral tail vein in a total volume of 10 ml/kg. This method and delivery system data can be extrapolated to the CRISPR-Cas system of the present invention.
Другие липидыOther lipids
Другие катионные липиды, такие как аминолипид 2,2-дилинолеил-4-диметиламиноэтил-[1,3]-диоксолан (DLin-KC2-DMA), можно использовать для инкапсулирования CRISPR-Cas, или ее компонентов, или кодирующих их молекул нуклеиновых кислот, аналогично siRNA (см., например, Jayaraman, Angew. Chem. Int. Ed. 2012, 51, 8529-8533), и, следовательно, можно применять в практическом осуществлении настоящего изобретения. Может быть предусмотрен предварительно сформированный пузырек со следующим составом липидов: аминолипид, дистеароилфосфатидилхолин (DSPC), холестерин и (R)-2,3-бис(октадецилокси)пропил-1-(метоксиполи (этиленгликоль)2000)пропилкарбамат (конъюгат PEG-липид) в молярном соотношении 40/10/40/10 соответственно и с соотношением siRNA для FVII/общее количество липидов, составляющим примерно 0,05 (вес./вес.). Для обеспечения узкого распределения частиц по размеру в диапазоне 70-90 нм и низкого коэффициента полидисперсности 0,11+0,04 (n = 56) частицы можно экструдировать до трех раз через мембраны с диаметром пор 80 нм перед добавлением РНК CRISPR-Cas. Можно использовать частицы, содержащие высокоактивный аминолипид 16, в которых молярное соотношение четырех липидных компонентов 16, DSPC, холестерина и конъюгата PEG-липид (50/10/38,5/1,5) можно дополнительно оптимизировать для повышения активности in vivo.Other cationic lipids, such as the aminolipid 2,2-dilinoleyl-4-dimethylaminoethyl-[1,3]-dioxolane (DLin-KC2-DMA), can be used to encapsulate CRISPR-Cas or its components or nucleic acid molecules encoding them, similar to siRNA (see, e.g., Jayaraman, Angew. Chem. Int. Ed. 2012, 51, 8529-8533), and therefore can be used in the practice of the present invention. A preformed vial with the following lipid composition can be provided: aminolipid, distearoylphosphatidylcholine (DSPC), cholesterol and (R)-2,3-bis(octadecyloxy)propyl-1-(methoxypoly(ethyleneglycol)2000)propylcarbamate (PEG-lipid conjugate) in a molar ratio of 40/10/40/10, respectively, and with a FVII siRNA/total lipid ratio of approximately 0.05 (w/w). To ensure a narrow particle size distribution in the range of 70-90 nm and a low polydispersity index of 0.11+0.04 (n=56), the particles can be extruded up to three times through 80 nm membranes before addition of CRISPR-Cas RNA. Particles containing highly active aminolipid 16 can be used, in which the molar ratio of the four lipid components 16, DSPC, cholesterol, and PEG-lipid conjugate (50/10/38.5/1.5) can be further optimized to enhance in vivo activity.
Michael S D Kormann et al. ("Expression of therapeutic proteins after delivery of chemically modified mRNA in mice: Nature Biotechnology, Volume:29, Pages: 154-157 (2011)) описывают применение липидных оболочек для доставки РНК. Применение липидных оболочек также является предпочтительным в настоящем изобретении.Michael S D Kormann et al. ("Expression of therapeutic proteins after delivery of chemically modified mRNA in mice: Nature Biotechnology, Volume:29, Pages: 154-157 (2011)) describe the use of lipid membranes for RNA delivery. The use of lipid membranes is also preferred in the present invention.
В другом варианте осуществления липиды можно составлять с системой CRISPR-Cas по настоящему изобретению с образованием липидных частиц (LNP). Липиды включают без ограничения DLin-KC2-DMA4, C12-200 и совместно действующие липиды дистеароилфосфатидилхолин, холестерин и PEG-DMG, которые можно составлять с CRISPR-Cas вместо siRNA (см., например, Novobrantseva, Molecular Therapy-Nucleic Acids (2012) 1, e4; doi:10.1038/mtna.2011.3) с помощью процедуры самопроизвольного образования пузырьков. Молярное соотношение компонентов может составлять приблизительно 50/10/38,5/1,5 (DLin-KC2-DMA или C12-200/дистеароилфосфатидилхолин/холестерин/PEG-DMG). Конечное весовое соотношение липиды:siRNA может составлять ~12:1 и 9:1 в случае липидных частиц (LNP) на основе DLin-KC2-DMA и C12-200 соответственно. Составы могут характеризоваться средними диаметрами частиц ~80 нм при >90% эффективности включения. Может быть предусмотрена доза 3 мг/кг.In another embodiment, lipids can be formulated with the CRISPR-Cas system of the present invention to form lipid particles (LNPs). Lipids include, but are not limited to, DLin-KC2-DMA4, C12-200, and the co-lipids distearoylphosphatidylcholine, cholesterol, and PEG-DMG, which can be formulated with CRISPR-Cas in place of siRNA (see, e.g., Novobrantseva, Molecular Therapy-Nucleic Acids (2012) 1, e4; doi:10.1038/mtna.2011.3) using a spontaneous vesicle formation procedure. The molar ratio of the components can be approximately 50/10/38.5/1.5 (DLin-KC2-DMA or C12-200/distearoylphosphatidylcholine/cholesterol/PEG-DMG). The final lipid:siRNA weight ratio can be ~12:1 and 9:1 for DLin-KC2-DMA and C12-200 based lipid particles (LNPs), respectively. The formulations can have average particle diameters of ~80 nm with >90% incorporation efficiency. A dose of 3 mg/kg can be envisaged.
Tekmira имеет портфель из примерно 95 семейств патентов-аналогов, выданных в США и за границей, которые направлены на различные аспекты LNP и составы на основе LNP (см., например, патенты США №№ 7982027; 7799565; 8058069; 8283333; 7901708; 7745651; 7803397; 8101741; 8188263; 7915399; 8236943 и 7838658 и европейские патенты №№ 1766035; 1519714; 1781593 и 1664316), все из которых можно применять в настоящем изобретении и/или адаптировать к нему.Tekmira has a portfolio of approximately 95 patent families issued in the United States and abroad that are directed to various aspects of LNP and LNP-based formulations (see, e.g., U.S. Patent Nos. 7,982,027; 7,799,565; 8,058,069; 8,283,333; 7,901,708; 7,745,651; 7,803,397; 8,101,741; 8,188,263; 7,915,399; 8,236,943; and 7,838,658 and European Patent Nos. 1,766,035; 1,519,714; 1,781,593; and 1,664,316), all of which may be applied and/or adapted to the present invention.
Систему CRISPR-Cas, или ее компоненты, или кодирующие их молекулы нуклеиновых кислот можно доставлять инкапсулированными в микросферах на основе PLGA, таких как дополнительно описанные в опубликованных заявках на патенты США 20130252281, и 20130245107, и 20130244279 (закрепленных за Moderna Therapeutics), которые относятся к аспектам составления композиций, содержащих модифицированные молекулы нуклеиновых кислот, которые могут кодировать белок, предшественник белка или частично или полностью процессированную форму белка или предшественника белка. Состав может характеризоваться молярным соотношением 50:10:38,5:1,5-3,0 (катионный липид:фузогенный липид:холестерин:конъюгат PEG-липид). Конъюгат PEG-липид может быть выбран без ограничения из PEG-C-DOMG, PEG-DMG. Фузогенный липид может представлять собой DSPC. См. также Schrum et al., Delivery and Formulation of Engineered Nucleic Acids, опубликованную заявку на патент США 20120251618.The CRISPR-Cas system, or components thereof, or nucleic acid molecules encoding them can be delivered encapsulated in PLGA-based microspheres, such as those further described in published U.S. patent applications 20130252281, and 20130245107, and 20130244279 (assigned to Moderna Therapeutics), which relate to aspects of formulating compositions comprising modified nucleic acid molecules that can encode a protein, a protein precursor, or a partially or fully processed form of a protein or protein precursor. The formulation can be characterized by a molar ratio of 50:10:38.5:1.5-3.0 (cationic lipid:fusogenic lipid:cholesterol:PEG-lipid conjugate). The PEG-lipid conjugate can be selected from, but is not limited to, PEG-C-DOMG, PEG-DMG. The fusogenic lipid may be DSPC. See also Schrum et al., Delivery and Formulation of Engineered Nucleic Acids, U.S. Patent Application Published 20120251618.
Технология Nanomerics преодолевает проблемы, связанные с биологической доступностью, для широкого спектра терапевтических средств, в том числе низкомолекулярных гидрофобных лекарственных средств, пептидов и терапевтических средств на основе нуклеиновых кислот (плазмид, siRNA, miRNA). Конкретные пути введения, для которых технология продемонстрировала очевидные преимущества, включают пероральный путь, перенос через гематоэнцефалический барьер, доставку в солидные опухоли, а также в глаз. См., например, Mazza et al., 2013, ACS Nano. 2013 Feb 26;7(2):1016-26; Uchegbu and Siew, 2013, J Pharm Sci. 102(2):305-10 и Lalatsa et al., 2012, J Control Release. 2012 Jul 20; 161(2):523-36.Nanomerics technology overcomes bioavailability challenges for a wide range of therapeutics, including small molecule hydrophobic drugs, peptides, and nucleic acid-based therapeutics (plasmids, siRNA, miRNA). Specific routes of administration for which the technology has demonstrated clear advantages include the oral route, blood-brain barrier transport, delivery to solid tumors, and to the eye. See, e.g., Mazza et al., 2013, ACS Nano. 2013 Feb 26;7(2):1016–26; Uchegbu and Siew, 2013, J Pharm Sci. 102(2):305–10; and Lalatsa et al., 2012, J Control Release. 2012 Jul 20;161(2):523–36.
В публикации заявки на патент США № 20050019923 описаны катионные дендримеры для доставки биологически активных молекул, таких как молекулы полинуклеотидов, пептиды и полипептиды и/или фармацевтические средства, в организм млекопитающего. Дендримеры подходят для обеспечения нацеленной доставки биологически активных молекул, например, в печень, селезенку, легкое, почку или сердце (или даже головной мозг). Дендримеры являются синтетическими 3-мерными макромолекулами, получаемыми ступенчатым способом из простых разветвленных мономерных звеньев, природу и количество функциональных групп которых можно легко регулировать и изменять. Дендримеры синтезируют путем повторяющегося присоединения "строительных блоков" в направлении от сердцевины с несколькими функциональными группами (дивергентный подход к синтезу) или к сердцевине с несколькими функциональными группами (конвергентный подход к синтезу), и каждое присоединение 3-мерной оболочки из "строительных блоков" приводит к образованию дендримеров более высокой генерации. Синтез полипропилениминовых дендримеров начинается с диаминобутановой сердцевины, к которой присоединяют удвоенное количество аминогрупп посредством двойного присоединения по Михаэлю ацетонитрила к первичным аминогруппам с последующим гидрированием нитрильных групп. Это обуславливает удвоение количества аминогрупп. Полипропилениминовые дендримеры содержат 100% протонируемых атомов азота и до 64 концевых аминогрупп (генерация 5, DAB 64). Протонируемые группы обычно представляют собой аминогруппы, способные принимать протоны при нейтральном pH. Применение дендримеров в качестве средств для доставки генов в основном ориентировано на использование полиамидоамина и фосфорсодержащих соединений со смесью из амина/амида или N--P(O2)S в качестве конъюгирующих единиц соответственно, при этом в работах не сообщалось о применении полипропилениминовых дендримеров низкой генерации для доставки генов. Полипропилениминовые дендримеры также изучали в качестве pH-чувствительных систем с контролируемым высвобождением для доставки лекарственных средств и для инкапсулирования в них "гостевых" молекул в случае химической модификации периферических аминокислотных групп. Также изучали цитотоксичность и взаимодействие полипропилениминовых дендримеров с ДНК, а также эффективность трансфекции с помощью DAB 64.U.S. Patent Application Publication No. 20050019923 describes cationic dendrimers for delivering biologically active molecules, such as polynucleotide molecules, peptides and polypeptides and/or pharmaceuticals, to a mammal. Dendrimers are suitable for providing targeted delivery of biologically active molecules, such as to the liver, spleen, lung, kidney or heart (or even the brain). Dendrimers are synthetic 3-dimensional macromolecules obtained in a stepwise manner from simple branched monomer units, the nature and number of functional groups of which can be easily controlled and changed. Dendrimers are synthesized by repeated addition of building blocks from a multifunctional core (divergent synthesis) or from a multifunctional core (convergent synthesis), each addition of a 3-dimensional shell of building blocks yielding a higher generation of dendrimers. Synthesis of polypropyleneimine dendrimers starts with a diaminobutane core to which double the number of amino groups is added by double Michael addition of acetonitrile to the primary amino groups followed by hydrogenation of the nitrile groups. This results in a doubling of the number of amino groups. Polypropyleneimine dendrimers contain 100% protonatable nitrogen atoms and up to 64 terminal amino groups (generation 5, DAB 64). The protonatable groups are typically amino groups capable of accepting protons at neutral pH. The application of dendrimers as gene delivery vehicles has mainly focused on the use of polyamidoamine and phosphorus-containing compounds with an amine/amide mixture or N--P(O 2 )S as conjugating units, respectively, while the use of low-generation polypropyleneimine dendrimers for gene delivery has not been reported. Polypropyleneimine dendrimers have also been studied as pH-sensitive, controlled-release systems for drug delivery and for encapsulation of guest molecules in the case of chemical modification of peripheral amino acid groups. The cytotoxicity and interaction of polypropyleneimine dendrimers with DNA, as well as the transfection efficiency using DAB 64, have also been studied.
Публикация заявки на патент США № 20050019923 основана на наблюдении того, что в противоположность более ранним сообщениям, катионные дендримеры, такие как полипропилениминовые дендримеры, проявляют подходящие свойства, такие как специфичное нацеливание и низкая токсичность, для применения в целенаправленной доставке биологически активных молекул, таких как генетический материал. В дополнение, производные катионного дендримера также проявляют подходящие свойства для нацеленной доставки биологически активных молекул. См. также "Биологически активные полимеры", публикация заявки на патент США 20080267903, в которой раскрыто следующее: "Показано, что различные полимеры, в том числе катионные полиаминные полимеры и дендримерные полимеры, обладают антипролиферативной активностью и могут, таким образом, быть применимыми для лечения нарушений, характеризующихся нежелательной пролиферацией клеток, таких как неоплазии и опухоли, воспалительные нарушения (в том числе аутоиммунные нарушения), псориаз и атеросклероз. Полимеры можно применять в отдельности в качестве активных средств или в качестве средств доставки других терапевтических средств, таких как молекулы лекарственных средств или нуклеиновые кислоты, для генной терапии. В таких случаях присущая полимерам собственная противоопухолевая активность может дополнять активность средства, подлежащего доставке. Раскрытия данных патентных публикаций можно использовать совместно с идеями данного документа для доставки системы(систем) CRISPR Cas, или ее компонента(компонентов), или кодирующей(кодирующих) их молекулы(молекул) нуклеиновой кислоты(нуклеиновых кислот).The publication of U.S. Patent Application No. 20050019923 is based on the observation that, contrary to earlier reports, cationic dendrimers such as polypropyleneimine dendrimers exhibit favorable properties such as specific targeting and low toxicity for use in targeted delivery of biologically active molecules such as genetic material. In addition, cationic dendrimer derivatives also exhibit favorable properties for targeted delivery of biologically active molecules. See also "Bioactive Polymers," U.S. Patent Application Publication No. 20080267903, which discloses the following: "Various polymers, including cationic polyamine polymers and dendrimeric polymers, have been shown to have antiproliferative activity and may thus be useful for the treatment of disorders characterized by unwanted cell proliferation, such as neoplasias and tumors, inflammatory disorders (including autoimmune disorders), psoriasis, and atherosclerosis. The polymers may be used alone as active agents or as delivery vehicles for other therapeutic agents, such as drug molecules or nucleic acids for gene therapy. In such cases, the intrinsic antitumor activity of the polymers may complement the activity of the agent to be delivered. The disclosures of these patent publications may be used in conjunction with the teachings of this document to deliver the CRISPR Cas system(s), or component(s) thereof, or encoding(s) thereof nucleic acid molecule(s).
Белки с избыточным зарядомOvercharged proteins
Белки с избыточным зарядом представляют собой класс сконструированных или встречающихся в природе белков, которые обычно имеют высокий положительный или отрицательный суммарный теоретический заряд, и их можно использовать в доставке системы(систем) CRISPR Cas, или ее компонента(компонентов), или кодирующей(кодирующих) их молекулы(молекул) нуклеиновой кислоты(нуклеиновых кислот). Белки как с избыточным отрицательным, так и с избыточным положительным зарядом проявляют особое свойство устойчивости к термически или химически индуцированной агрегации. Белки с избыточным положительным зарядом также способны проникать в клетки млекопитающих. Ассоциация молекул-карго, таких как плазмидная ДНК, РНК, с этими белками или другими белками может обеспечивать функциональную доставку данных макромолекул в клетки млекопитающих как in vitro, так и in vivo. В 2007 г. в лаборатории Дэвида Лю сообщили о создании и определении характеристик белков с избыточным зарядом (Lawrence et al., 2007, Journal of the American Chemical Society 129, 10110-10112).Overcharged proteins are a class of engineered or naturally occurring proteins that typically have a high net theoretical charge, either positive or negative, and can be used to deliver the CRISPR Cas system(s) or component(s) thereof or the nucleic acid molecule(s) encoding them. Both overcharged negative and overcharged positive proteins exhibit the unique property of being resistant to thermally or chemically induced aggregation. Overcharged positive proteins are also capable of entering mammalian cells. Association of cargo molecules such as plasmid DNA, RNA with these proteins or other proteins can provide functional delivery of these macromolecules to mammalian cells both in vitro and in vivo. In 2007, David Liu's laboratory reported the creation and characterization of proteins with excess charge (Lawrence et al., 2007, Journal of the American Chemical Society 129, 10110-10112).
Невирусная доставка РНК и плазмидной ДНК в клетки млекопитающих является значимой как в исследованиях, так и в терапевтических применениях (Akinc et al., 2010, Nat. Biotech. 26, 561-569). Очищенный белок GFP с зарядом +36 (или другой белок с избыточным положительным зарядом) смешивают с РНК в подходящей бессывороточной среде и обеспечивают возможность образования ими комплекса перед добавлением к клеткам. Включение сыворотки на этой стадии ингибирует образование комплексов белок с избыточным зарядом-РНК и снижает эффективность обработки. Следующий протокол был найден эффективным для ряда линий клеток (McNaughton et al., 2009, Proc. Natl. Acad. Sci. USA 106, 6111-6116) (однако, следовало выполнить пилотные эксперименты с варьирующей дозой белка и РНК для оптимизации процедуры для конкретных линий клеток). (1) За один день до обработки высеять 1 x 105 клеток на лунку в 48-луночный планшет. (2) В день обработки развести очищенный белок GFP с зарядом +36 в бессывороточной среде до конечной концентрации 200 нМ. Добавить РНК до конечной концентрации 50 нМ. Перемешать в вихревой мешалке и инкубировать при комнатной температуре в течение 10 мин. (3) Во время инкубирования аспирировать среду от клеток и промыть один раз с помощью PBS. (4) После инкубирования GFP с зарядом +36 и РНК добавить к клеткам комплексы белок-РНК. (5) Инкубировать клетки с комплексами при 37°C в течение 4 ч. (6) После инкубирования аспирировать среду и промыть три раза с помощью 20 ед./мл гепарина в PBS. Инкубировать клетки в сывороточной среде в течение дополнительных 48 ч. или дольше в зависимости от анализа активности. (7) Анализировать клетки с помощью иммуноблоттинга, qPCR, фенотипического анализа или другого соответствующего способа.Non-viral delivery of RNA and plasmid DNA into mammalian cells is of interest for both research and therapeutic applications (Akinc et al., 2010, Nat. Biotech. 26, 561-569). Purified +36 GFP protein (or another positively charged protein) is mixed with RNA in a suitable serum-free medium and allowed to complex before addition to cells. Inclusion of serum at this step inhibits the formation of positively charged protein-RNA complexes and reduces the efficiency of the treatment. The following protocol has been found effective for a range of cell lines (McNaughton et al., 2009, Proc. Natl. Acad. Sci. USA 106, 6111-6116) (however, pilot experiments with varying doses of protein and RNA should be performed to optimize the procedure for specific cell lines). (1) One day before treatment, seed 1 x 10 5 cells/well in a 48-well plate. (2) On the day of treatment, dilute purified +36 GFP protein in serum-free medium to a final concentration of 200 nM. Add RNA to a final concentration of 50 nM. Vortex and incubate at room temperature for 10 min. (3) During incubation, aspirate medium from cells and wash once with PBS. (4) After incubation of +36 GFP and RNA, add protein-RNA complexes to cells. (5) Incubate cells with complexes at 37°C for 4 h. (6) After incubation, aspirate medium and wash three times with 20 U/ml heparin in PBS. Incubate cells in serum-free medium for an additional 48 h or longer depending on the activity assay. (7) Analyze cells by immunoblotting, qPCR, phenotypic analysis, or other appropriate method.
В лаборатории Дэвида Лю дополнительно обнаружили, что GFP с зарядом +36 является эффективным реагентом для доставки плазмид в ряд клеток. Поскольку плазмидная ДНК является более крупной молекулой-карго, чем siRNA, то для образования эффективного комплекса с плазмидами требуется пропорционально больше белка GFP с зарядом +36. Для эффективной доставки плазмид заявители разработали вариант GFP с зарядом +36, несущий C-концевую пептидную метку HA2, известный пептид, разрушающий эндосомы, происходящий из белка гемагглютинина вируса гриппа. Следующий протокол был эффективным для многих клеток, но, как изложено выше, рекомендуется, чтобы дозы плазмидной ДНК и белка с избыточным зарядом были оптимизированы для конкретных линий клеток и путей применения в доставке. (1) За один день до обработки высеять 1 x 105 клеток на лунку в 48-луночный планшет. (2) В день обработки разбавить очищенный белок GFP с зарядом þ36 в бессывороточной среде до конечной концентрации 2 мМ. Добавить 1 мг плазмидной ДНК. Перемешать в вихревой мешалке и инкубировать при комнатной температуре в течение 10 мин. (3) Во время инкубирования аспирировать среду от клеток и промыть один раз с помощью PBS. (4) После инкубирования GFP с зарядом þ36 и плазмидной ДНК осторожно добавить к клеткам комплексы белок-ДНК. (5) Инкубировать клетки с комплексами при 37°C в течение 4 ч. (6) После инкубирования аспирировать среду и промыть с помощью PBS. Инкубировать клетки в сывороточной среде и инкубировать в течение дополнительных 24-48 ч. (7) При необходимости проанализировать доставку плазмид (например, посредством экспрессии генов, обусловленной плазмидами). Cм., например, McNaughton et al., Proc. Natl. Acad. Sci. USA 106, 6111-6116 (2009); Cronican et al., ACS Chemical Biology 5, 747-752 (2010); Cronican et al., Chemistry & Biology 18, 833-838 (2011); Thompson et al., способs in Enzymology 503, 293-319 (2012); Thompson, D.B., et al., Chemistry & Biology 19 (7), 831-843 (2012). Способы применения белков с избыточным зарядом можно использовать для доставки системы CRISPR-Cas по настоящему изобретению и/или приспосабливать к ней. Эти системы согласно Доктору Лю и приведенные в данном документе публикации в связи с идеями данного документа можно использовать в доставке системы(систем) CRISPR Cas, или ее компонента(компонентов), или кодирующей(кодирующих) их молекулы(молекул) нуклеиновой кислоты(нуклеиновых кислот).David Liu's laboratory further discovered that +36-charge GFP is an efficient reagent for delivering plasmids into a variety of cells. Because plasmid DNA is a larger cargo molecule than siRNA, proportionally more +36-charge GFP protein is required to form an efficient complex with plasmids. To efficiently deliver plasmids, we engineered a +36-charge GFP variant carrying a C-terminal peptide tag of HA2, a known endosomal disrupting peptide derived from the influenza virus hemagglutinin protein. The following protocol was effective for many cells, but as outlined above, it is recommended that the doses of plasmid DNA and excess-charge protein be optimized for specific cell lines and delivery routes. (1) One day prior to treatment, seed 1 x 10 5 cells per well in a 48-well plate. (2) On the day of treatment, dilute purified þ36-charged GFP protein in serum-free medium to a final concentration of 2 mM. Add 1 mg of plasmid DNA. Vortex and incubate at room temperature for 10 min. (3) During incubation, aspirate medium from cells and wash once with PBS. (4) After incubation of þ36-charged GFP and plasmid DNA, carefully add protein-DNA complexes to cells. (5) Incubate cells with complexes at 37°C for 4 h. (6) After incubation, aspirate medium and wash with PBS. Incubate cells in serum-containing medium and incubate for an additional 24–48 h. (7) If desired, analyze plasmid delivery (e.g., via plasmid-mediated gene expression). See, e.g., McNaughton et al., Proc. Natl. Acad. Sci. USA 106, 6111-6116 (2009); Cronican et al., ACS Chemical Biology 5, 747-752 (2010); Cronican et al., Chemistry & Biology 18, 833-838 (2011); Thompson et al., methods in Enzymology 503, 293-319 (2012); Thompson, DB, et al., Chemistry & Biology 19 (7), 831-843 (2012). Methods using overcharged proteins can be used to deliver and/or adapted to the CRISPR-Cas system of the present invention. These systems, according to Dr. Liu and the publications cited in this document in connection with the ideas of this document, can be used in the delivery of the CRISPR Cas system(s), or its component(s), or the nucleic acid molecule(s) encoding them.
Пептиды, приникающие в клетку (CPP)Cell Penetrating Peptides (CPP)
В еще одном варианте осуществления предусмотрены пептиды, проникающие в клетку (CPP), для доставки системы CRISPR-Cas. CPP представляют собой короткие пептиды, способствующие поглощению клетками различных молекул-карго (от наноразмерных частиц до малых химических молекул и крупных фрагментов ДНК). Термин “молекула-карго”, используемый в данном документе, включает без ограничения группу, состоящую из терапевтических средств, диагностических зондов, пептидов, нуклеиновых кислот, антисмысловых олигонуклеотидов, плазмид, белков, частиц, липосом, хромофоров, малых молекул и радиоактивных материалов. В аспектах настоящего изобретения молекула-карго может также содержать любой компонент системы CRISPR-Cas или всю функциональную систему CRISPR-Cas. В аспектах настоящего изобретения дополнительно представлены способы доставки желаемой молекулы-карго субъекту, включающие: (a) получение комплекса, содержащего пептид, проникающий в клетку, по настоящему изобретению и требуемую молекулу-карго, и (b) пероральное, внутрисуставное, внутрибрюшинное, интратекальное, внутриартериальное, интраназальное, интрапаренхиматозное, подкожное, внутримышечное, внутривенное, накожное, ректальное или местное введение комплекса субъекту. Молекула-карго связана с пептидами химической связью посредством ковалентных связей либо посредством нековалентных взаимодействий.In another embodiment, cell penetrating peptides (CPPs) are provided for delivering a CRISPR-Cas system. CPPs are short peptides that facilitate the uptake of various cargo molecules (ranging from nanosized particles to small chemical molecules and large DNA fragments) by cells. The term "cargo molecule" as used herein includes, but is not limited to, a group consisting of therapeutic agents, diagnostic probes, peptides, nucleic acids, antisense oligonucleotides, plasmids, proteins, particles, liposomes, chromophores, small molecules, and radioactive materials. In aspects of the present invention, a cargo molecule may also comprise any component of a CRISPR-Cas system or an entire functional CRISPR-Cas system. Aspects of the present invention further provide methods of delivering a desired cargo molecule to a subject comprising: (a) providing a complex comprising a cell penetrating peptide of the present invention and the desired cargo molecule, and (b) orally, intra-articularly, intraperitoneally, intrathecally, intra-arterially, intranasally, intraparenchymatously, subcutaneously, intramuscularly, intravenously, cutaneously, rectally or topically administering the complex to the subject. The cargo molecule is chemically linked to the peptides via covalent bonds or via non-covalent interactions.
Функцией CPP является доставка молекулы-карго в клетки, при этом процесс, который обычно происходит посредством эндоцитоза, приводит к доставке молекулы-карго в эндосомы живых клеток млекопитающих. Пептиды, проникающие в клетку, имеют разные размер, аминокислотные последовательности и заряды, но все CPP имеют одну отличительную характеристику, которая представляет собой способность к перемещению через плазматическую мембрану и содействию доставке различных молекул-карго в цитоплазму или органеллу. Перемещение CPP можно подразделить на три основных механизма поступления: прямое прохождение через мембрану, поступление, опосредованное эндоцитозом, и перемещение посредством образования промежуточной структуры. CPP нашли многочисленные применения в медицине в качестве средств для доставки лекарственных средств при лечении различных заболеваний, в том числе рака, и ингибиторов вирусов, а также контрастных веществ для мечения клеток. Примеры последних включают действие в качестве носителя GFP, контрастных веществ для MRI или квантовых точек. CPP обладают большим потенциалом в качестве векторов доставки in vitro и in vivo для применения в научно-исследовательской работе и медицине. CPP обычно имеют такой аминокислотный состав, при котором они характеризуются высокой относительной распространенностью положительно заряженных аминокислот, таких как лизин или аргинин, либо имеют последовательности, характеризующиеся чередующимся расположением полярных/заряженных аминокислот и неполярных гидрофобных аминокислот. Эти два типа структур называются поликатионными или амфипатическими соответственно. Третьим классом CPP являются гидрофобные пептиды, содержащие только неполярные остатки с низким суммарным зарядом или имеющие гидрофобные группы аминокислот, крайне важные для поглощения клетками. Одним из первых обнаруженных CPP был трансактивирующий активатор транскрипции (Tat) вируса иммунодефицита человека 1 (HIV-1), который, как было выявлено, эффективно поглощался из окружающей среды многочисленными типами клеток в культуре. С тех пор количество известных CPP значительно увеличилось, и были созданы низкомолекулярные синтетические аналоги с более эффективными свойствами белковой трансдукции. CPP включают без ограничения пенетратин, Tat (48-60), транспортан и (R-AhX-R4) (Ahx = аминогексаноил).The function of CPPs is to deliver cargo molecules into cells, a process that typically occurs via endocytosis, resulting in the delivery of cargo molecules into endosomes of living mammalian cells. Cell-penetrating peptides vary in size, amino acid sequence, and charge, but all CPPs share one distinguishing characteristic, which is the ability to translocate across the plasma membrane and facilitate the delivery of various cargo molecules into the cytoplasm or organelle. CPP trafficking can be divided into three main entry mechanisms: direct membrane passage, endocytosis-mediated entry, and trafficking via intermediate structure formation. CPPs have found numerous applications in medicine as drug delivery vehicles for a variety of diseases, including cancer, and virus inhibitors, as well as cell labeling contrast agents. Examples of the latter include acting as a carrier for GFP, MRI contrast agents, or quantum dots. CPPs have great potential as in vitro and in vivo delivery vectors for applications in research and medicine. CPPs typically have an amino acid composition that is characterized by a high relative abundance of positively charged amino acids such as lysine or arginine, or have sequences characterized by alternating polar/charged amino acids and non-polar hydrophobic amino acids. These two types of structures are called polycationic or amphipathic, respectively. A third class of CPPs are hydrophobic peptides that contain only non-polar residues with a low net charge or have hydrophobic amino acid groups that are essential for cellular uptake. One of the first CPPs discovered was the transactivating activator of transcription (Tat) of human immunodeficiency virus 1 (HIV-1), which was found to be efficiently taken up from the environment by numerous cell types in culture. Since then, the number of known CPPs has increased significantly, and small molecule synthetic analogs with more efficient protein transduction properties have been developed. CPPs include, but are not limited to, penetratin, Tat (48-60), transportan, and (R-AhX-R4) (Ahx = aminohexanoyl).
В патенте США 8372951 представлен CPP, полученный из катионного белка эозинофилов (ECP), проявляющий высокую эффективность проникновения в клетку и низкую токсичность. Также представлены аспекты доставки CPP со своей молекулой-карго позвоночному субъекту. Дополнительные аспекты, касающиеся CPP и их доставки, описаны в патентах США 8575305; 8614194 и 8044019. CPP можно применять для доставки системы CRISPR-Cas или ее компонентов. Эти CPP можно использовать для доставки системы CRISPR-Cas или ее компонентов, что также представлено в рукописи “Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA” Suresh Ramakrishna, Abu-Bonsrah Kwaku Dad, Jagadish Beloor, et al. Genome Res. 2014 Apr 2. [Электронная публикация, предшествующая печатной], включенной посредством ссылки во всей своей полноте, где продемонстрировано, что обработка с помощью рекомбинантного белка Cas9 конъюгированного с CPP, и направляющих РНК, образующих комплекс с CPP, приводит к нарушениям функционирования эндогенных генов в линиях клеток человека. В данной статье белок Cas9 был конъюгирован с CPP с помощью тиоэфирной связи, тогда как направляющая РНК образовывала комплекс с CPP с образованием конденсированных положительно заряженных частиц. Было показано, что одновременная и последовательная обработка клеток человека, в том числе эмбриональных стволовых клеток, дермальных фибробластов, клеток HEK293T, клеток HeLa и клеток эмбриональной карциномы, модифицированным Cas9 и направляющей РНК приводила к эффективным нарушениям функционирования генов со снижением частоты нецелевых мутаций по сравнению с трансфекциями плазмидами.U.S. Patent 8,372,951 discloses a CPP derived from eosinophil cationic protein (ECP) that exhibits high cell penetration efficiency and low toxicity. Aspects of delivering the CPP with its cargo molecule to a vertebrate subject are also disclosed. Additional aspects regarding CPPs and their delivery are disclosed in U.S. Patents 8,575,305; 8,614,194; and 8,044,019. The CPPs can be used to deliver the CRISPR-Cas system or components thereof. These CPPs can be used to deliver the CRISPR-Cas system or components thereof, as also disclosed in the manuscript “Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA” by Suresh Ramakrishna, Abu-Bonsrah Kwaku Dad, Jagadish Beloor, et al. Genome Res. 2014 Apr 2. [Electronic publication preceding print], incorporated by reference in its entirety, showing that treatment with recombinant Cas9 protein conjugated to CPP and guide RNA complexed with CPP results in disruption of endogenous genes in human cell lines. In this paper, Cas9 protein was conjugated to CPP via a thioester linkage, while guide RNA was complexed with CPP to form condensed positively charged particles. It was shown that simultaneous and sequential treatment of human cells, including embryonic stem cells, dermal fibroblasts, HEK293T cells, HeLa cells, and embryonal carcinoma cells, with modified Cas9 and guide RNA resulted in efficient gene disruption with a reduced frequency of off-target mutations compared to plasmid transfections.
Имплантируемые устройстваImplantable devices
В другом варианте осуществления также предполагаются имплантируемые устройства для доставки системы CRISPR Cas, или ее компонента(компонентов), или кодирующей(кодирующих) их молекулы(молекул) нуклеиновой кислоты(нуклеиновых кислот). Например, в публикации заявки на патент США 20110195123 раскрыто имплантируемое медицинское устройство, высвобождающее лекарственное средство локально и в течение длительного периода, в том числе несколько типов такого устройства, реализуемые способы лечения и способы имплантации. Устройство содержит полимерный субстрат, такой как матрица, например, применяемый в качестве корпуса устройства, и лекарственные средства, и в некоторых случаях дополнительные трехмерные подложки-носители, такие как металлы или дополнительные полимеры, и материалы для улучшения видимости и визуализации. Имплантируемое устройство для доставки может быть преимущественным в обеспечении высвобождения локально и в течение длительного периода, где лекарственное средство высвобождается непосредственно во внеклеточный матрикс (ECM) пораженного заболеванием участка, как, например, в случае опухоли, воспаления, дегенерации, или в целях симптоматической терапии, или в пораженные гладкомышечные клетки, или для предупреждения. Одной разновидностью лекарственного средства является РНК, что раскрыто выше, и данную систему можно применять для системы CRISPR-Cas по настоящему изобретению и/или адаптировать к ней. Способы имплантации в некоторых вариантах осуществления представляют собой существующие процедуры имплантации, разработанные и применяемые в настоящее время для других видов лечения, в том числе для брахитерапии и пункционной биопсии. В таких случаях размеры нового имплантата, описанного в настоящем изобретении, аналогичны размерам первоначального имплантата. Как правило, в ходе одной процедуры лечения имплантируют несколько устройств.In another embodiment, implantable devices for delivering the CRISPR Cas system, or component(s) thereof, or the nucleic acid molecule(s) encoding them are also contemplated. For example, US Patent Application Publication 20110195123 discloses an implantable medical device that releases a drug locally and over a prolonged period, including several types of such a device, methods of treatment and methods of implantation implemented. The device comprises a polymeric substrate, such as a matrix, for example, used as a body of the device, and drugs, and in some cases additional three-dimensional carrier substrates, such as metals or additional polymers, and materials for improving visibility and visualization. An implantable delivery device may be advantageous in providing local and long-term release, where the drug is released directly into the extracellular matrix (ECM) of a diseased site, such as in the case of a tumor, inflammation, degeneration, or for symptomatic therapy, or into diseased smooth muscle cells, or for prevention. One type of drug is RNA, as disclosed above, and this system can be used for and/or adapted to the CRISPR-Cas system of the present invention. The implantation methods in some embodiments are existing implantation procedures developed and currently used for other treatments, including brachytherapy and needle biopsy. In such cases, the dimensions of the new implant described in the present invention are similar to the dimensions of the original implant. Typically, several devices are implanted during a single treatment.
В публикации заявки на патент США 20110195123 представлена имплантируемая или вставная система доставки лекарственных средств, в том числе системы, применимые для введения в полость, такую как брюшная полость, и/или для любого другого типа введения, в которой система доставки лекарственных средств не закреплена и не присоединена, содержащая биоустойчивый, и/или разлагаемый, и/или биопоглощаемый полимерный субстрат, который может, например, необязательно представлять собой матрицу. Следует отметить, что термин "вставка" также включает имплантацию. Система доставки лекарственных средств преимущественно реализуется как "Loder", описанная в публикации заявки на патент США 20110195123.U.S. Patent Application Publication No. 20110195123 discloses an implantable or insertable drug delivery system, including systems useful for insertion into a cavity such as the peritoneal cavity and/or for any other type of administration, in which the drug delivery system is not fixed or attached, comprising a biostable and/or degradable and/or bioabsorbable polymeric substrate, which may, for example, optionally be a matrix. It should be noted that the term "insert" also includes implantation. The drug delivery system is preferably implemented as a "Loder" described in U.S. Patent Application Publication No. 20110195123.
Полимер или множество полимеров, содержащие средство и/или множество средств, являются биосовместимыми, обеспечивая высвобождение средства с контролируемой скоростью, где общий объем полимерного субстрата, такого как матрица, например, в некоторых вариантах осуществления необязательно и предпочтительно не превосходит максимальный объем, позволяющий достигнуть терапевтического уровня средства. В качестве неограничивающего примера, такой объем предпочтительно находится в диапазоне от 0,1 м3 до 1000 мм3, как того требует объем загруженного средства. Loder необязательно может иметь больший размер, например, будучи включенным в состав устройства, размер которого определяется функциональным назначением, например, без ограничения коленного сустава, внутриматочного или шеечного кольца и т.п.The polymer or plurality of polymers containing the agent and/or plurality of agents are biocompatible, providing for the release of the agent at a controlled rate, where the total volume of the polymer substrate, such as a matrix, for example, in some embodiments, optionally and preferably does not exceed the maximum volume that allows achieving a therapeutic level of the agent. As a non-limiting example, such a volume is preferably in the range of 0.1 m 3 to 1000 mm 3 , as required by the volume of the loaded agent. The loader may optionally have a larger size, for example, being included in a device, the size of which is determined by the functional purpose, for example, without limiting the knee joint, intrauterine or cervical ring, etc.
Система доставки лекарственных средств (для доставки композиции) в некоторых вариантах осуществления предназначена для предпочтительного использования разлагаемых полимеров, где основным механизмом высвобождения является объемная эрозия; или же в некоторых вариантах осуществления применяются неразлагаемые или медленно разлагаемые полимеры, где основным механизмом высвобождения является диффузия, а не объемная эрозия, так что их наружная часть функционирует в качестве мембраны, а их внутренняя часть функционирует в качестве депо лекарственного средства, которое практически не подвергается воздействию окружения в течение продолжительного периода (например, от приблизительно недели до приблизительно нескольких месяцев). Также можно необязательно применять комбинации различных полимеров с различными механизмами высвобождения. Градиент концентраций на поверхности предпочтительно эффективно поддерживается постоянным в течение значительного периода в ходе общего периода высвобождения лекарственного средства, и, таким образом, скорость диффузии (называемой "диффузией нулевого порядка") является эффективно постоянной. Под выражением "постоянный" подразумевают скорость диффузии, которая предпочтительно поддерживается выше нижнего порога терапевтической эффективности, но которая, тем не менее, может необязательно характеризоваться начальным всплеском и/или колебаться, например, повышаясь и понижаясь в некоторой степени. Скорость диффузии предпочтительно поддерживается таким образом в течение длительного периода, и до определенного уровня она может считаться постоянной для оптимизации терапевтически эффективного периода, например, эффективного периода сайленсинга.The drug delivery system (for delivering the composition) in some embodiments is designed to preferably use degradable polymers, where the main release mechanism is bulk erosion; or in some embodiments, non-degradable or slowly degradable polymers are used, where the main release mechanism is diffusion, rather than bulk erosion, so that their outer part functions as a membrane and their inner part functions as a drug depot, which is substantially not exposed to the environment for an extended period (e.g., from about a week to about several months). Combinations of different polymers with different release mechanisms can also optionally be used. The concentration gradient across the surface is preferably effectively maintained constant for a significant period during the overall period of drug release, and thus the diffusion rate (called "zero-order diffusion") is effectively constant. By "constant" is meant a diffusion rate that is preferably maintained above the lower threshold of therapeutic efficacy, but which may nevertheless optionally exhibit an initial burst and/or fluctuate, such as rising and falling to some extent. The diffusion rate is preferably maintained in this manner over a long period, and up to a certain level it may be considered constant to optimize the therapeutically effective period, such as the effective silencing period.
Система доставки лекарственных средств необязательно и предпочтительно предназначена для защиты нуклеотидного лечебного средства от разрушения, химического по своей природе или обусловленного воздействием ферментов и других факторов в организме субъекта.The drug delivery system is optionally and preferably designed to protect the nucleotide therapeutic agent from degradation, whether chemical in nature or due to the action of enzymes and other factors in the body of the subject.
Система доставки лекарственных средств из публикации заявки на патент США № 20110195123 необязательно связана с чувствительными и/или активирующими приборами, функционирующими во время и/или после имплантации устройства посредством неинвазивных и/или минимально инвазивных способов активации и/или ускорения/замедления, например, необязательно в том числе без ограничения способов или устройств с применением термического нагревания и охлаждения, лазерных пучков и ультразвука, в том числе фокусированного ультразвука, и/или RF (радиочастот).The drug delivery system of U.S. Patent Application Publication No. 20110195123 is optionally related to sensing and/or actuating devices that operate during and/or after implantation of the device via non-invasive and/or minimally invasive actuation and/or acceleration/deceleration methods, such as, but not limited to, methods or devices using thermal heating and cooling, laser beams, and ultrasound, including focused ultrasound, and/or RF (radio frequencies).
Согласно некоторым вариантам осуществления публикации заявки на патент США № 20110195123 участок для локальной доставки может необязательно включать целевые участки, характеризующиеся высокой аномальной пролиферацией клеток и подавлением апоптоза, в том числе опухоли, очаги активного и/или хронического воспаления и инфекции, включающих аутоиммунные болезненные состояния, ткань с дегенеративными изменениями, включающую мышечную и нервную ткань, очаги хронической боли, участки с дегенеративными изменениями, и местоположения переломов костей, и другие местоположения ран, для усиления регенерации ткани, а также поврежденные сердечные, гладкие и поперечно-полосатые мышцы.According to some embodiments of U.S. Patent Application Publication No. 20110195123, the local delivery site may optionally include target sites characterized by high abnormal cell proliferation and suppression of apoptosis, including tumors, sites of active and/or chronic inflammation and infection, including autoimmune disease states, tissue with degenerative changes, including muscle and nerve tissue, sites of chronic pain, sites with degenerative changes, and bone fracture locations, and other wound locations, to enhance tissue regeneration, as well as damaged cardiac, smooth and striated muscles.
Участок для имплантации композиции или целевой участок предпочтительно характеризуется радиусом, площадью и/или объемом, достаточно малыми для целенаправленной локальной доставки. Например, целевой участок необязательно имеет диаметр в диапазоне от приблизительно 0,1 мм до приблизительно 5 см.The site for implantation of the composition or the target site is preferably characterized by a radius, area and/or volume small enough for targeted local delivery. For example, the target site optionally has a diameter in the range of about 0.1 mm to about 5 cm.
Местоположение целевого участка предпочтительно выбирают для достижения максимальной терапевтической эффективности. Например, композицию системы доставки лекарственных средств (необязательно вместе с устройством для имплантации, описанным выше) необязательно и предпочтительно имплантируют в опухолевое окружение, или рядом с ним, или в кровеносную сеть, связанную с ним.The location of the target site is preferably selected to achieve maximum therapeutic efficacy. For example, the composition of the drug delivery system (optionally together with the implantation device described above) is optionally and preferably implanted in or near the tumor environment or in the bloodstream associated therewith.
Например, композицию (необязательно вместе с устройством) необязательно имплантируют в поджелудочную железу, предстательную железу, молочную железу, печень или рядом с ними, через сосок, в сосудистую систему и т.д.For example, the composition (optionally together with the device) is optionally implanted into or near the pancreas, prostate gland, mammary gland, liver, through the nipple, into the vascular system, etc.
Целевое местоположение необязательно выбирают из группы, состоящей из (только в качестве неограничивающих примеров, поскольку любой участок в организме необязательно может подходить для имплантации Loder): 1. участков головного мозга, таких как базальные ганглии, белое и серое вещество, с дегенеративными изменениями подобными таковым при болезни Паркинсона или Альцгеймера; 2. спинного мозга, как в случае бокового амиотрофического склероза (ALS); 3. шейки матки для предупреждения инфекции, обусловленной HPV; 4. суставов с активным и хроническим воспалением; 5. дермы, как в случае псориаза; 6. участков симпатических и чувствительных нервов для обезболивающего эффекта; 7. участков внутрикостной имплантации; 8. очагов острой и хронической инфекции; 9. интравагинальных участков; 10. внутреннего уха слуховой системы, лабиринта внутреннего уха, вестибулярной системы; 11. внутритрахеальных участков; 12. внутрисердечных участков; участков коронарных сосудов, эпикардиальных участков; 13. мочевого пузыря; 14. желчевыделительной системы; 15. участков паренхимной ткани, в том числе без ограничения почки, печени, селезенки; 16. лимфатических узлов; 17. слюнных желез; 18. участков десен вокруг зубов; 19. внутрисуставных участков (имплантация в суставы); 20. внутриглазных участков; 21. ткани головного мозга; 22. желудочков головного мозга; 23. полостей, в том числе брюшной полости (например, без ограничения для лечения рака яичника); 24. внутрипищеводных участков и 25. внутрипрямокишечных участков.The target location is optionally selected from the group consisting of (by way of non-limiting examples only, since not all areas of the body may be suitable for implantation of Loder): 1. areas of the brain such as the basal ganglia, white matter and gray matter, with degenerative changes similar to those in Parkinson's disease or Alzheimer's disease; 2. the spinal cord, as in amyotrophic lateral sclerosis (ALS); 3. the cervix to prevent infection due to HPV; 4. joints with active and chronic inflammation; 5. the dermis, as in psoriasis; 6. areas of sympathetic and sensory nerves for an analgesic effect; 7. areas of intraosseous implantation; 8. foci of acute and chronic infection; 9. intravaginal sites; 10. the inner ear of the auditory system, the labyrinth of the inner ear, the vestibular system; 11. intratracheal sites; 12. Intracardiac sites; Coronary vessel sites, epicardial sites; 13. Urinary bladder; 14. Biliary system; 15. Parenchymatous tissue sites, including but not limited to kidney, liver, spleen; 16. Lymph nodes; 17. Salivary glands; 18. Gum sites around teeth; 19. Intra-articular sites (implantation into joints); 20. Intraocular sites; 21. Brain tissue; 22. Cerebral ventricles; 23. Cavities, including the abdominal cavity (e.g., without limitation for the treatment of ovarian cancer); 24. Intraesophageal sites; and 25. Intrarectal sites.
Вставка системы (например, устройства, содержащего композицию) необязательно связана с инъекцией материала в ECM в целевом участке и окруженности этого участка для воздействия на локальные pH, и/или температуру, и/или другие биологические факторы, влияющие на диффузию лекарственного средства и/или кинетику лекарственного средства в ECM целевого участка и окруженности такого участка.Insertion of the system (e.g., device containing the composition) optionally involves injection of material into the ECM at the target site and the surrounding area of that site to affect local pH and/or temperature and/or other biological factors that influence drug diffusion and/or drug kinetics into the ECM of the target site and the surrounding area of that site.
Согласно некоторым вариантам осуществления высвобождение указанного средства необязательно может быть связано с чувствительными и/или активирующими приборами, функционирующими до, и/или во время, и/или после вставки посредством неинвазивных, и/или минимально инвазивных, и/или других способов активации и/или ускорения/замедления, включающих способы или устройства с применением лазерных пучков, ионизирующего излучения, термического нагревания и охлаждения, и ультразвука, в том числе фокусированного ультразвука, и/или RF (радиочастот), а также химических активаторов.According to some embodiments, the release of said agent may optionally be associated with sensing and/or activating devices operating before and/or during and/or after insertion by means of non-invasive and/or minimally invasive and/or other activation and/or acceleration/deceleration methods, including methods or devices using laser beams, ionizing radiation, thermal heating and cooling, and ultrasound, including focused ultrasound, and/or RF (radio frequencies), as well as chemical activators.
Согласно другим вариантам осуществления в публикации заявки на патент США № 20110195123 лекарственное средство предпочтительно содержит РНК, например, для лечения случаев локализованного рака молочной железы, поджелудочной железы, головного мозга, почки, мочевого пузыря, легкого и предстательной железы, описанных ниже. Несмотря на то, что примеры были приведены с RNAi, многие применимые лекарственные средства подлежат инкапсуляции в Loder, и их можно применять в контексте настоящего изобретения, при условии, что такие лекарственные средства можно инкапсулировать в субстрате Loder, таком как, например, матрица, и данную систему можно использовать и/или приспособить для доставки системы CRISPR Cas по настоящему изобретению.According to other embodiments, in U.S. Patent Application Publication No. 20110195123, the medicament preferably comprises RNA, for example, for the treatment of localized breast, pancreatic, brain, kidney, bladder, lung, and prostate cancers described below. Although examples have been given with RNAi, many useful medicaments are amenable to encapsulation in Loder and can be used in the context of the present invention, provided that such medicaments can be encapsulated in a Loder substrate, such as, for example, a matrix, and this system can be used and/or adapted to deliver the CRISPR Cas system of the present invention.
В качестве другого примера конкретного применения, дегенеративные заболевания нервной системы и мышц развиваются в связи с аномальной экспрессией генов. Локальная доставка РНК может иметь терапевтические свойства, препятствующие такой аномальной экспрессии генов. Локальная доставка антиапоптотических, противовоспалительных и антидегенеративных лекарственных средств, в том числе низкомолекулярных лекарственных средств и макромолекул, может также необязательно быть терапевтической. В таких случаях Loder применяют для пролонгированного высвобождения при постоянной скорости и/или посредством выделенного устройства, которое имплантируют отдельно. Все из этого можно применять для системы CRISPR-Cas по настоящему изобретению и/или приспосабливать к ней.As another example of a specific application, degenerative diseases of the nervous system and muscles develop due to abnormal gene expression. Local delivery of RNA may have therapeutic properties that prevent such abnormal gene expression. Local delivery of anti-apoptotic, anti-inflammatory and anti-degenerative drugs, including small molecule drugs and macromolecules, may also optionally be therapeutic. In such cases, Loder is used for prolonged release at a constant rate and/or via a dedicated device that is implanted separately. All of this can be used for and/or adapted to the CRISPR-Cas system of the present invention.
В качестве еще одного примера конкретного применения, психические и когнитивные нарушения лечат с помощью модификаторов генов. Нокдаун гена является возможным методом лечения. Применение Loder для локальной доставки средств в участки центральной нервной системы является возможным методом терапии психических и когнитивных нарушений, в том числе без ограничения психоза, биполярных расстройств, невротических расстройств и расстройств поведения. Loder могут также обеспечивать локальную доставку лекарственных средств, в том числе низкомолекулярных лекарственных средств и макромолекул, при имплантации в конкретные участки головного мозга. Все из этого можно применять для системы CRISPR-Cas по настоящему изобретению и/или приспосабливать к ней.As another example of a specific application, mental and cognitive disorders are treated with gene modifiers. Gene knockdown is a possible treatment method. The use of Loders for local delivery of agents to areas of the central nervous system is a possible treatment method for mental and cognitive disorders, including but not limited to psychosis, bipolar disorders, neurotic disorders and behavioral disorders. Loders can also provide local delivery of drugs, including small molecule drugs and macromolecules, when implanted in specific areas of the brain. All of this can be used for and/or adapted to the CRISPR-Cas system of the present invention.
В качестве другого примера конкретного применения сайленсинг генов медиаторов врожденного и/или приобретенного иммунного ответа в локальных участках обеспечивает предупреждение отторжения трансплантированного органа. Локальная доставка РНК и иммуномодулирующих реагентов с помощью Loder, имплантированного в трансплантированный орган и/или участок имплантации, активирует подавление местного иммунитета в отношении трансплантированного органа путем отвлечения иммунных клеток, таких как CD8. Все из этого можно применять для системы CRISPR-Cas по настоящему изобретению и/или адаптировать к ней.As another example of a specific application, silencing of genes mediating the innate and/or adaptive immune response at local sites prevents rejection of a transplanted organ. Local delivery of RNA and immunomodulatory reagents by Loder implanted in a transplanted organ and/or implantation site activates suppression of local immunity to the transplanted organ by diverting immune cells such as CD8. All of this can be used for and/or adapted to the CRISPR-Cas system of the present invention.
В качестве другого примера конкретного применения, факторы роста сосудов, в том числе VEGF, и ангиогенин, и другие, являются существенно важными для неоваскуляризации. Локальная доставка факторов, пептидов, пептидомиметиков или подавление их репрессоров является важным терапевтическим воздействием; сайленсинг репрессоров и локальная доставка факторов, пептидов, макромолекул и низкомолекулярных лекарственных средств, стимулирующих ангиогенез, с помощью Loder являются терапевтическими мерами в отношении заболевания периферических сосудов, системного заболевания сосудов и заболевания сосудов сердца.As another example of a specific application, vascular growth factors, including VEGF and angiogenin, and others, are essential for neovascularization. Local delivery of factors, peptides, peptidomimetics or suppression of their repressors is an important therapeutic intervention; silencing of repressors and local delivery of factors, peptides, macromolecules and small molecule drugs that stimulate angiogenesis by Loder are therapeutic measures for peripheral vascular disease, systemic vascular disease and cardiac vascular disease.
Способ вставки, такой как имплантация, необязательно можно еще применять для других типов имплантации в ткань, и/или для вставок, и/или для отбора образцов тканей необязательно без модификаций или, в альтернативном случае, необязательно лишь с незначительными модификациями таких способов. Такие способы необязательно включают без ограничения способы брахитерапии, биопсию, эндоскопию с применением ультразвуковых технологий и/или без них, такую как ERCP, стереотаксические способы в отношении тканей головного мозга, лапароскопию, в том числе имплантацию с помощью лапароскопа в суставы, органы брюшной полости, стенку мочевого пузыря и полости тела.An insertion method such as implantation may optionally also be used for other types of tissue implantation and/or insertions and/or tissue sampling, optionally without modifications or, alternatively, optionally with only minor modifications of such methods. Such methods optionally include, but are not limited to, brachytherapy methods, biopsy, endoscopy with and/or without ultrasound technologies such as ERCP, stereotactic methods in relation to brain tissue, laparoscopy, including implantation using a laparoscope in joints, abdominal organs, bladder wall and body cavities.
Технологию имплантируемого устройства, описанную в данном документе, можно применять с руководствами в данном документе и, таким образом, с помощью данного раскрытия и знаний в данной области систему CRISPR-Cas, или ее компоненты, или ее молекулы нуклеиновой кислоты, или кодируемые или обеспечиваемые компоненты можно доставлять посредством имплантируемого устройства.The implantable device technology described herein can be used with the teachings herein and thus, using this disclosure and the knowledge in the art, the CRISPR-Cas system, or its components, or its nucleic acid molecules, or the encoded or provided components can be delivered via an implantable device.
Аэрозольная доставкаAerosol delivery
Субъекты, которых лечат от заболевания легкого, например, могут получать фармацевтически эффективное количество векторной системы на основе AAV в форме аэрозоля на легкое, доставляемое эндобронхиально при самостоятельном дыхании. Вследствие этого доставка в форме аэрозоля является предпочтительной для доставки AAV. Аденовирус или частицу AAV можно применять для доставки. Подходящие конструкции с генами, каждый из которых функционально связан с одной или несколькими регуляторными последовательностями, можно клонировать в вектор доставки. В этом случае следующие конструкции представлены в качестве примеров: промотор Cbh или EF1a для Cas (Cas9), промотор U6 или H1 для направляющей РНК. Предпочтительной схемой является применение направляющей, целенаправленно воздействующей на CFTR с мутацией дельта-508, матрицы для репарации мутации дельта-F508 и кодон-оптимизированного фермента Cas9 необязательно с одним или несколькими сигналами или последовательностями ядерной локализации (NLS), например, с двумя (2) NLS. Также предусматриваются конструкции без NLS.Subjects treated for a lung disease, for example, may receive a pharmaceutically effective amount of an AAV-based vector system in the form of an aerosol per lung, delivered endobronchially during spontaneous breathing. Therefore, delivery in the form of an aerosol is preferred for the delivery of AAV. An adenovirus or an AAV particle can be used for delivery. Suitable constructs with genes, each operably linked to one or more regulatory sequences, can be cloned into the delivery vector. In this case, the following constructs are given as examples: the Cbh or EF1a promoter for Cas (Cas9), the U6 or H1 promoter for the guide RNA. A preferred scheme is to use a guide targeting CFTR with the delta-508 mutation, a template for repair of the delta-F508 mutation and a codon-optimized Cas9 enzyme, optionally with one or more nuclear localization signals or sequences (NLS), for example with two (2) NLS. Designs without NLS are also provided.
мРНК фермента CRISPR и направляющая РНКCRISPR enzyme mRNA and guide RNA
Направляющую РНК и мРНК фермента CRISPR можно также доставлять по отдельности. мРНК фермента CRISPR можно доставлять перед направляющей РНК, чтобы предоставить время для экспрессии фермента CRISPR. За 1-12 часов (предпочтительно за около 2-6 часов) до введения направляющей РНК можно вводить мРНК фермента CRISPR.The guide RNA and CRISPR enzyme mRNA can also be delivered separately. The CRISPR enzyme mRNA can be delivered before the guide RNA to allow time for the CRISPR enzyme to be expressed. The CRISPR enzyme mRNA can be administered 1-12 hours (preferably about 2-6 hours) before the guide RNA is administered.
Альтернативно мРНК фермента CRISPR и направляющую РНК можно вводить совместно. Вторую бустерную дозу направляющей РНК можно преимущественно вводить через 1-12 часов (предпочтительно примерно через 2-6 часов) после первого введения мРНК фермента CRISPR + направляющей РНК.Alternatively, CRISPR enzyme mRNA and guide RNA can be co-administered. A second booster dose of guide RNA can advantageously be administered 1-12 hours (preferably approximately 2-6 hours) after the first administration of CRISPR enzyme mRNA + guide RNA.
Введение дополнительных доз мРНК фермента CRISPR и/или направляющей РНК может быть полезным для достижения наиболее эффективных уровней модификации генома. В некоторых вариантах осуществления фенотипическое изменение предпочтительно является результатом модификации генома при осуществлении нацеливания на генетическое заболевание, особенно в способах терапии, и предпочтительно, если обеспечивается матрица для репарации для коррекции или изменения фенотипа.Administration of additional doses of CRISPR enzyme mRNA and/or guide RNA may be useful to achieve the most effective levels of genome modification. In some embodiments, the phenotypic change is preferably the result of genome modification when targeting a genetic disease, especially in therapeutic methods, and preferably provides a repair template to correct or alter the phenotype.
В некоторых вариантах осуществления заболевания, на которые можно осуществлять нацеливание, включают заболевания, которые обусловлены патогенными дефектами сплайсинга.In some embodiments, diseases that can be targeted include diseases that are caused by pathogenic splicing defects.
В некоторых вариантах осуществления клеточные цели включают в себя гемопоэтические стволовые клетки/клетки-предшественники (CD34+); человеческие T-клетки и клетки глаза (клетки сетчатки), например, фоторецепторные клетки-предшественники.In some embodiments, cellular targets include hematopoietic stem/progenitor cells (CD34+); human T cells, and ocular cells (retinal cells), such as photoreceptor progenitor cells.
В некоторых вариантах осуществления гены-мишени включают: ген бета-глобина человека - HBB (для лечения серповидноклеточной анемии, в том числе путем стимуляции конверсии генов (с использованием близкородственного гена HBD в качестве эндогенной матрицы)); CD3 (T-клетки) и CEP920 - сетчатка (глаза).In some embodiments, target genes include: human beta globin gene - HBB (for the treatment of sickle cell anemia, including by stimulating gene conversion (using the closely related HBD gene as an endogenous template)); CD3 (T cells) and CEP920 - retina (eyes).
В приведенных в данном документе обсуждениях, касающихся цели, являющейся ассоциированной с мутацией или с состоянием заболевания, такие мутация или состояние заболевания могут представлять собой, например, гемофилию B, SCID, SCID-X1, ADA-SCID, наследственную тирозинемию, серповидноклеточную анемию, β-талассемию, сцепленную с Х-хромосомой CGD, синдром Вискотта-Олдрича, анемию Фанкони, адренолейкодистрофию (ALD), метахроматическую лейкодистрофию (MLD), синдром Ушера, пигментный ретинит, врожденный амавроз Лебера, кистозный фиброз, HIV/AIDS, HSV-1, HSV-2, или в более широком смысле иммунодефицитное нарушение, гематологическое состояние или болезнь лизосомального накопления. Цель может быть ассоциирована с иммунотерапией, такой как, например, иммунотерапия рака.In the discussions herein regarding a target being associated with a mutation or a disease state, such mutation or disease state may be, for example, hemophilia B, SCID, SCID-X1, ADA-SCID, hereditary tyrosinemia, sickle cell anemia, β-thalassemia, X-linked CGD, Wiskott-Aldrich syndrome, Fanconi anemia, adrenoleukodystrophy (ALD), metachromatic leukodystrophy (MLD), Usher syndrome, retinitis pigmentosa, Leber congenital amaurosis, cystic fibrosis, HIV/AIDS, HSV-1, HSV-2, or more broadly an immunodeficiency disorder, hematological condition, or lysosomal storage disease. The target may be associated with immunotherapy, such as, for example, cancer immunotherapy.
В некоторых вариантах осуществления способы доставки включают опосредованную катионным липидом "прямую" доставку комплекса фермент-направляющая (рибонуклеопротеин) и электропорацию плазмидной ДНК.In some embodiments, delivery methods include cationic lipid-mediated "direct" delivery of the enzyme-targeting (ribonucleoprotein) complex and electroporation of plasmid DNA.
Способы в соответствии с настоящим изобретением могут дополнительно предусматривать доставку матриц, таких как матрицы для репарации, которые могут представлять собой dsODN или ssODN, см. ниже. Доставка матриц может осуществляться одновременно или отдельно от доставки какого-либо или всех из фермента CRISPR, направляющей, парной tracr или tracr-РНК и путем одного и того же или другого механизма доставки. В некоторых вариантах осуществления предпочтительным является то, что матрицу доставляют вместе с направляющей, парной tracr и/или tracr-РНК, а также предпочтительно с ферментом CRISPR. Примером может служить вектор на основе AAV, при этом фермент CRISPR представляет собой SaCas9 (с мутацией N580).The methods of the present invention may further comprise delivery of templates, such as repair templates, which may be dsODN or ssODN, see below. Delivery of templates may be simultaneous or separate from delivery of any or all of the CRISPR enzyme, guide, tracr-mate or tracr-RNA, and by the same or a different delivery mechanism. In some embodiments, it is preferred that the template is delivered together with the guide, tracr-mate and/or tracr-RNA, and also preferably with the CRISPR enzyme. An example is an AAV-based vector, wherein the CRISPR enzyme is SaCas9 (with the N580 mutation).
Способы в соответствии с настоящим изобретением могут дополнительно включать: (a) доставку в клетку двухнитевого олигодезоксинуклеотида (dsODN), содержащего "липкие" концы, комплементарные "липким" концам, создаваемым с помощью указанного двухнитевого разрыва, где указанный dsODN интегрируется в представляющий интерес локус; или (b) доставку в клетку однонитевого олигодезоксинуклеотида (ssODN), где указанный ssODN действует как матрица для гомологичной репарации указанного двухнитевого разрыва. Способы в соответствии с настоящим изобретением можно применять для предупреждения или лечения заболевания у индивидуума, при этом необязательно указанное заболевание вызвано дефектом в указанном представляющем интерес локусе. Способы в соответствии с настоящим изобретением можно выполнять in vivo у индивидуума или ex vivo в отношении клетки, извлеченной из индивидуума, где необязательно указанную клетку возвращают в организм индивидуума.The methods of the present invention may further comprise: (a) delivering to a cell a double-stranded oligodeoxynucleotide (dsODN) comprising sticky ends complementary to the sticky ends created by said double-strand break, wherein said dsODN integrates into a locus of interest; or (b) delivering to a cell a single-stranded oligodeoxynucleotide (ssODN), wherein said ssODN acts as a template for homologous repair of said double-strand break. The methods of the present invention may be used to prevent or treat a disease in an individual, optionally wherein said disease is caused by a defect in said locus of interest. The methods of the present invention may be performed in vivo in an individual or ex vivo on a cell removed from an individual, optionally wherein said cell is returned to the individual.
Ферменты в соответствии с настоящим изобретением могут быть применимы в оптимизированных функциональных системах CRISPR-Cas, которые представляют интерес для функционального скрининга; тест SAMThe enzymes according to the present invention can be used in optimized functional CRISPR-Cas systems that are of interest for functional screening; SAM test
В одном аспекте настоящее изобретение относится к не встречающийся в природе или сконструированной композиции, содержащей V типа, более конкретно направляющие РНК Cas9 CRISPR, содержащие направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, где направляющая РНК модифицирована путем вставки отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается(связываются) с двумя или более адаптерными белками (например, аптамерами), и где каждый адаптерный белок ассоциируется с одним или несколькими функциональными доменами; или где направляющая РНК модифицирована так, что она имеет по меньшей мере одну некодирующую функциональную петлю. В конкретных вариантах осуществления направляющая РНК модифицирована путем вставки отличной(отличных) последовательности(последовательностей) РНК на 5'-конец прямого повтора, в прямом повторе или на 3'-конец направляющей последовательности. При наличии более одного функционального домена функциональные домены могут быть одинаковыми или разными, например, два одинаковых или два разных активатора или репрессора. В одном аспекте настоящее изобретение относится к композиции на основе не встречающейся в природе или сконструированной композиции комплекса CRISPR-Cas, содержащей направляющую РНК, обсуждаемую в данном документе, и фермент CRISPR, который представляет собой фермент Cas9, при этом необязательно фермент Cas9 содержит по меньшей мере одну мутацию, так что фермент Cas9 имеет не более чем 5% нуклеазной активности фермента Cas9, не имеющего по меньшей мере одной мутации, и необязательно одна или несколько содержат по меньшей мере одну или несколько последовательностей ядерной локализации. В одном аспекте настоящее изобретение относится к обсуждаемым в данном документе направляющей РНК Cas9 CRISPR или комплексу CRISPR-Cas на основе Cas9, в том числе к не встречающейся в природе или сконструированной композиции, содержащей два или более адаптерных белка, где каждый белок ассоциируется с одним или несколькими функциональными доменами и где адаптерный белок связывается с отличной(отличными) последовательностью (последовательностями) РНК, вставленной(вставленными) в направляющую РНК. В конкретных вариантах осуществления направляющая РНК, в качестве дополнения или альтернативы, модифицирована так, что все еще обеспечивает связывание комплекса Cas9 CRISPR, но предотвращает расщепление ферментом Cas9 (как подробно описывается в других разделах настоящего документа).In one aspect, the present invention relates to a non-naturally occurring or engineered composition comprising a Type V, more particularly a Cas9 CRISPR guide RNA comprising a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell, wherein the guide RNA is modified by inserting different RNA sequence(s) that bind(s) to two or more adaptor proteins (e.g., aptamers), and wherein each adaptor protein is associated with one or more functional domains; or wherein the guide RNA is modified such that it has at least one non-coding functional loop. In particular embodiments, the guide RNA is modified by inserting different RNA sequence(s) at the 5' end of a direct repeat, in a direct repeat, or at the 3' end of the guide sequence. If there is more than one functional domain, the functional domains may be the same or different, such as two same or two different activators or repressors. In one aspect, the present invention relates to a composition based on a non-naturally occurring or engineered composition of a CRISPR-Cas complex comprising a guide RNA discussed herein and a CRISPR enzyme that is a Cas9 enzyme, optionally wherein the Cas9 enzyme comprises at least one mutation such that the Cas9 enzyme has no more than 5% of the nuclease activity of a Cas9 enzyme lacking the at least one mutation, and optionally one or more comprise at least one or more nuclear localization sequences. In one aspect, the present invention relates to a Cas9 CRISPR guide RNA or Cas9-based CRISPR-Cas complex as discussed herein, including a non-naturally occurring or engineered composition comprising two or more adaptor proteins, wherein each protein associates with one or more functional domains and wherein the adaptor protein binds to a different RNA sequence(s) inserted into the guide RNA. In particular embodiments, the guide RNA is additionally or alternatively modified to still allow binding of the Cas9 CRISPR complex, but prevents cleavage by the Cas9 enzyme (as described in detail elsewhere herein).
В одном аспекте настоящее изобретение относится к не встречающейся в природе или сконструированной композиции, содержащей направляющую РНК (gRNA), содержащую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, фермент Cas9, содержащий по меньшей мере одну или несколько последовательностей ядерной локализации, где фермент Cas9 содержит по меньшей мере одну мутацию так, что фермент Cas9 имеет не более чем 5% нуклеазной активности фермента Cas9, не имеющего по меньшей мере одной мутации, где направляющая РНК модифицирована путем вставки отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается(связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциируется с одним или несколькими функциональными доменами; или где направляющая РНК модифицирована так, что она имеет по меньшей мере одну некодирующую функциональную петлю, и где композиция содержит два или более адаптерных белка, при этом каждый белок ассоциируется с одним или несколькими функциональными доменами. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где фермент Cas9 обладает пониженной нуклеазной активностью по меньшей мере на 97% или 100% по сравнению с ферментом Cas9, не имеющим по меньшей мере одной мутации. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где фермент Cas9 содержит две или более мутаций. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где фермент Cas9 ассоциируется с одним или несколькими функциональными доменами. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где каждый из двух или более функциональных доменов, ассоциированных с адаптерным белком, является гетерологичным функциональным доменом. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где каждый из одного или нескольких функциональных доменов, ассоциированных с ферментом Cas9, является гетерологичным функциональным доменом. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где адаптерным белком является слитый белок, содержащий функциональный домен, при этом слитый белок необязательно содержит линкер между адаптерным белком и функциональным доменом, при этом линкер необязательно включает в себя линкер GlySer. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где gRNA не является модифицированной путем вставки отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается (связываются) с двумя или более адаптерными белками. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов, ассоциированных с адаптерным белком, являются доменами активации транскрипции. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются доменами активации транскрипции. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов, ассоциированных с адаптерным белком, являются доменами активации транскрипции, содержащими VP64, p65, MyoD1, HSF1, RTA или SET7/9. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются доменами активации транскрипции, содержащими VP64, p65, MyoD1, HSF1, RTA или SET7/9. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов, ассоциированных с адаптерным белком, являются доменами репрессии транскрипции. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются доменами репрессии транскрипции. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где домен репрессии транскрипции является доменом KRAB. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где домен репрессии транскрипции представляет собой домен NuE, домен NcoR, домен SID или домен SID4X. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где по меньшей мере один из одного или нескольких функциональных доменов, ассоциированных с адаптерным белком, характеризуются одной или несколькими видами активности, предусматривающими метилазную активность, деметилазную активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность интеграции ДНК, активность расщепления РНК, активность расщепления ДНК или активность связывания нуклеиновой кислоты. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, характеризуются одной или несколькими видами активности, предусматривающими метилазную активность, деметилазную активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность интеграции ДНК, активность расщепления РНК, активность расщепления ДНК, активность связывания нуклеиновой кислоты, или активность молекулярного переключателя, или химическую индуцируемость, или световую индуцируемость. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где активность расщепления ДНК обусловлена нуклеазой Fok1. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов присоединяются к ферменту Cas9 так, что при связывании с gRNA и мишенью функциональный домен находится в пространственной ориентации, позволяющей функциональному домену функционировать с присущей ему функцией; или необязательно где один или несколько функциональных доменов присоединяются к ферменту Cas9 через линкер, необязательно линкер GlySer. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где gRNA модифицируется так, что после связывания gRNA с адаптерным белком и дальнейшего связывания с ферментом Cas9 и мишенью функциональный домен находится в пространственной ориентации, позволяющей функциональному домену функционировать с присущей ему функцией. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются присоединенными к домену RuvC Cas9. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где прямой повтор направляющей РНК модифицируется путем вставки отличной(отличных) последовательности(последовательностей) РНК. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где вставка отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается с одним или несколькими адаптерными белками, представляет собой аптамерную последовательность. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где аптамерная последовательность представляет собой две или более аптамерных последовательностей, специфичных в отношении одного и того же адаптерного белка. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где аптамерная последовательность представляет собой две или более аптамерных последовательностей, специфичных в отношении разных адаптерных белков. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где адаптерный белок включает в себя MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, ϕCb5, ϕCb8r, ϕCb12r, ϕCb23r, 7s, PRR1. Следовательно, в конкретных вариантах осуществления аптамер выбран из связывающегося белка, специфически связывающего любой из адаптерных белков, перечисленных выше. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где клеткой является эукариотическая клетка. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где эукариотической клеткой является клетка млекопитающих, растительная клетка или дрожжевая клетка, при этом клетка млекопитающих необязательно представляет собой клетку мыши. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где клеткой млекопитающих является клетка человека. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где первый адаптерный белок ассоциируется с доменом p65, а второй адаптерный белок ассоциируется с доменом HSF1. В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где композиция содержит комплекс CRISPR-Cas, имеющий по меньшей мере три функциональных домена, по меньшей мере один из которых ассоциируется с ферментом Cas9, и по меньшей мере два из которых ассоциируются с gRNA. In one aspect, the present invention relates to a non-naturally occurring or engineered composition comprising a guide RNA (gRNA) comprising a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell, a Cas9 enzyme comprising at least one or more nuclear localization sequences, wherein the Cas9 enzyme comprises at least one mutation such that the Cas9 enzyme has no more than 5% of the nuclease activity of a Cas9 enzyme lacking the at least one mutation, wherein the guide RNA is modified by inserting different RNA sequence(s) that bind(s) to one or more adaptor proteins, and wherein the adaptor protein is associated with one or more functional domains; or wherein the guide RNA is modified such that it has at least one non-coding functional loop, and wherein the composition comprises two or more adaptor proteins, wherein each protein is associated with one or more functional domains. In one aspect, the present invention relates to a composition as discussed herein, wherein a Cas9 enzyme has a reduced nuclease activity of at least 97% or 100% compared to a Cas9 enzyme lacking at least one mutation. In one aspect, the present invention relates to a composition as discussed herein, wherein the Cas9 enzyme comprises two or more mutations. In one aspect, the present invention relates to a composition as discussed herein, wherein the Cas9 enzyme is associated with one or more functional domains. In one aspect, the present invention relates to a composition as discussed herein, wherein each of the two or more functional domains associated with the adapter protein is a heterologous functional domain. In one aspect, the present invention relates to a composition as discussed herein, wherein each of the one or more functional domains associated with the Cas9 enzyme is a heterologous functional domain. In one aspect, the present invention relates to a composition as discussed herein, wherein the adapter protein is a fusion protein comprising a functional domain, wherein the fusion protein optionally comprises a linker between the adapter protein and the functional domain, wherein the linker optionally comprises a GlySer linker. In one aspect, the present invention relates to a composition as discussed herein, wherein the gRNA is not modified by insertion of different RNA sequence(s) that bind(s) to two or more adapter proteins. In one aspect, the present invention relates to a composition as discussed herein, wherein one or more functional domains associated with the adapter protein are transcriptional activation domains. In one aspect, the present invention relates to a composition as discussed herein, wherein one or more functional domains associated with the Cas9 enzyme are transcriptional activation domains. In one aspect, the present invention relates to a composition as discussed herein, wherein one or more functional domains associated with an adapter protein are transcriptional activation domains comprising VP64, p65, MyoD1, HSF1, RTA, or SET7/9. In one aspect, the present invention relates to a composition as discussed herein, wherein one or more functional domains associated with a Cas9 enzyme are transcriptional activation domains comprising VP64, p65, MyoD1, HSF1, RTA, or SET7/9. In one aspect, the present invention relates to a composition as discussed herein, wherein one or more functional domains associated with an adapter protein are transcriptional repression domains. In one aspect, the present invention relates to a composition as discussed herein, wherein one or more functional domains associated with a Cas9 enzyme are transcriptional repression domains. In one aspect, the present invention relates to a composition as discussed herein, wherein the transcriptional repression domain is a KRAB domain. In one aspect, the present invention relates to a composition as discussed herein, wherein the transcriptional repression domain is a NuE domain, an NcoR domain, a SID domain, or a SID4X domain. In one aspect, the present invention relates to a composition as discussed herein, wherein at least one of the one or more functional domains associated with the adapter protein is characterized by one or more activities comprising a methylase activity, a demethylase activity, a transcriptional activation activity, a transcriptional repression activity, a transcript release factor activity, a histone modification activity, a DNA integration activity, an RNA cleavage activity, a DNA cleavage activity, or a nucleic acid binding activity. In one aspect, the present invention relates to a composition as discussed herein, wherein one or more functional domains associated with a Cas9 enzyme are characterized by one or more activities comprising methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, DNA integration activity, RNA cleavage activity, DNA cleavage activity, nucleic acid binding activity, or molecular switch activity, or chemical inducibility, or light inducibility. In one aspect, the present invention relates to a composition as discussed herein, wherein the DNA cleavage activity is mediated by a Fok1 nuclease. In one aspect, the present invention relates to a composition as discussed herein, wherein the one or more functional domains are attached to a Cas9 enzyme such that upon binding to a gRNA and a target, the functional domain is in a spatial orientation that allows the functional domain to function in its intended function; or optionally wherein one or more functional domains are attached to a Cas9 enzyme via a linker, optionally a GlySer linker. In one aspect, the present invention relates to a composition as discussed herein, wherein the gRNA is modified such that upon binding of the gRNA to the adaptor protein and subsequent binding to the Cas9 enzyme and the target, the functional domain is in a spatial orientation that allows the functional domain to function with its intended function. In one aspect, the present invention relates to a composition as discussed herein, wherein one or more functional domains associated with the Cas9 enzyme are attached to the RuvC domain of Cas9. In one aspect, the present invention relates to a composition as discussed herein, wherein the direct repeat of the guide RNA is modified by insertion of different RNA sequence(s). In one aspect, the present invention relates to a composition as discussed herein, wherein the insert of a different RNA sequence(s) that binds to one or more adapter proteins is an aptamer sequence. In one aspect, the present invention relates to a composition as discussed herein, wherein the aptamer sequence is two or more aptamer sequences specific for the same adapter protein. In one aspect, the present invention relates to a composition as discussed herein, wherein the aptamer sequence is two or more aptamer sequences specific for different adapter proteins. In one aspect, the present invention relates to a composition as discussed herein, wherein the adapter protein comprises MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, ϕCb5, ϕCb8r, ϕCb12r, ϕCb23r, 7s, PRR1. Therefore, in particular embodiments, the aptamer is selected from a binding protein that specifically binds any of the adapter proteins listed above. In one aspect, the present invention relates to a composition as discussed herein, wherein the cell is a eukaryotic cell. In one aspect, the present invention relates to a composition as discussed herein, wherein the eukaryotic cell is a mammalian cell, a plant cell, or a yeast cell, wherein the mammalian cell is optionally a mouse cell. In one aspect, the present invention relates to a composition as discussed herein, wherein the mammalian cell is a human cell. In one aspect, the present invention relates to a composition as discussed herein, wherein the first adapter protein associates with a p65 domain and the second adapter protein associates with an HSF1 domain. In one aspect, the present invention relates to a composition as discussed herein, wherein the composition comprises a CRISPR-Cas complex having at least three functional domains, at least one of which associates with a Cas9 enzyme and at least two of which associate with a gRNA.
В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе выше композиции, где имеется более чем одна gRNA, и gRNA нацеливаются на разные последовательности, посредством чего при использовании композиции происходит мультиплексирование. В одном аспекте настоящее изобретение относится к композиции, где имеется более чем одна gRNA, модифицированная путем вставки отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается(связываются) с одним или несколькими адаптерными белками.In one aspect, the present invention relates to a composition as discussed herein above, wherein there is more than one gRNA, and the gRNAs target different sequences, whereby multiplexing occurs when the composition is used. In one aspect, the present invention relates to a composition, wherein there is more than one gRNA modified by insertion of different RNA sequence(s) that bind(s) to one or more adaptor proteins.
В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где один или несколько адаптерных белков, ассоциированных с одним или несколькими функциональными доменами, присутствуют и связываются с отличной(отличными) последовательностью(последовательностями) РНК, вставленной(вставленными) в направляющую РНК.In one aspect, the present invention relates to a composition discussed herein, wherein one or more adaptor proteins associated with one or more functional domains are present and bind to a different RNA sequence(s) inserted into a guide RNA.
В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где целевая последовательность(последовательности) является(являются) некодирующей(некодирующими) или регуляторной(регуляторными) последовательностью(последовательностями). Регуляторные последовательности могут представлять собой последовательность(последовательности) промотора, энхансера или сайленсера.In one aspect, the present invention relates to a composition as discussed herein, wherein the target sequence(s) is(are) non-coding or regulatory sequence(s). The regulatory sequence(s) may be a promoter, enhancer, or silencer sequence(s).
В одном аспекте настоящее изобретение относится к обсуждаемой в данном документе композиции, где направляющую РНК модифицируют так, чтобы она содержала по меньшей мере одну некодирующую функциональную петлю, например, где по меньшей мере одна некодирующая функциональная петля является репрессорной; например, где по меньшей мере одна некодирующая функциональная петля содержит Alu.In one aspect, the present invention relates to a composition discussed herein, wherein the guide RNA is modified to comprise at least one non-coding functional loop, for example, wherein the at least one non-coding functional loop is repressor; for example, wherein the at least one non-coding functional loop comprises Alu.
В одном аспекте настоящее изобретение относится к способу преобразования в локусе генома, предусматривающему введение хозяину или экспрессию у хозяина in vivo одной или нескольких композиций, обсуждаемых в данном документе. В одном аспекте настоящее изобретение относится к обсуждаемому в данном документе способу, при котором преобразование в локусе генома включает в себя воздействие на активацию гена, ингибирование гена или расщепление в локусе.In one aspect, the present invention relates to a method of transformation at a genomic locus comprising administering to a host or expressing in vivo in a host one or more of the compositions discussed herein. In one aspect, the present invention relates to a method discussed herein, wherein transformation at a genomic locus comprises affecting gene activation, gene inhibition, or cleavage at the locus.
В одном аспекте настоящее изобретение относится к обсуждаемому в данном документе способу, при котором хозяином является эукариотическая клетка. В одном аспекте настоящее изобретение относится к обсуждаемому в данном документе способу, при котором хозяином является клетка млекопитающих, необязательно клетка мыши, или растительная клетка, или дрожжевая клетка. В одном аспекте настоящее изобретение относится к обсуждаемому в данном документе способу, при котором хозяином является эукариотический организм, отличный человека. В одном аспекте настоящее изобретение относится к обсуждаемому в данном документе способу, при котором эукариотическим организмом, отличным от человека, является отличное от человека млекопитающее. В одном аспекте настоящее изобретение относится к обсуждаемому в данном документе способу, при котором отличным от человека млекопитающим является мышь.In one aspect, the present invention relates to a method as discussed herein, wherein the host is a eukaryotic cell. In one aspect, the present invention relates to a method as discussed herein, wherein the host is a mammalian cell, optionally a mouse cell or a plant cell or a yeast cell. In one aspect, the present invention relates to a method as discussed herein, wherein the host is a non-human eukaryotic organism. In one aspect, the present invention relates to a method as discussed herein, wherein the non-human eukaryotic organism is a non-human mammal. In one aspect, the present invention relates to a method as discussed herein, wherein the non-human mammal is a mouse.
В одном аспекте настоящее изобретение относится к способу модификации представляющего интерес локуса генома с изменением экспрессии гена в клетке путем введения в клетку или экспрессии в клетке композиции, обсуждаемой в данном документе. В одном аспекте настоящее изобретение относится к обсуждаемому в данном документе способу, предусматривающему доставку композиции или молекулы(молекул) нуклеиновой кислоты, кодирующей(кодирующих) ее, где указанная(указанные) молекула(молекулы) нуклеиновой кислоты функционально связана(связаны) с регуляторной(регуляторными) последовательностью(последовательностями) и экспрессируется(экспрессируются) in vivo. В одном аспекте настоящее изобретение относится к обсуждаемому в данном документе способу, где экспрессия in vivo осуществляется с помощью лентивируса, аденовируса, или AAV.In one aspect, the present invention relates to a method for modifying a genomic locus of interest to alter gene expression in a cell by introducing into the cell or expressing in a cell a composition discussed herein. In one aspect, the present invention relates to a method discussed herein comprising delivering a composition or a nucleic acid molecule(s) encoding the same, wherein said nucleic acid molecule(s) is(are) operably linked to a regulatory sequence(s) and is(are) expressed in vivo. In one aspect, the present invention relates to a method discussed herein, wherein the in vivo expression is accomplished by a lentivirus, an adenovirus, or an AAV.
В одном аспекте настоящее изобретение относится к линии клеток млекопитающих из клеток, обсуждаемых в данном документе, где линией клеток необязательно является линия клеток человека или линия клеток мыши. В одном аспекте настоящее изобретение относится к трансгенной модели млекопитающего, необязательно мыши, где модель была трансформирована обсуждаемой в данном документе композицией или является потомством указанного трансформанта.In one aspect, the present invention relates to a mammalian cell line of the cells discussed herein, wherein the cell line is optionally a human cell line or a mouse cell line. In one aspect, the present invention relates to a transgenic mammalian model, optionally a mouse, wherein the model has been transformed with the composition discussed herein or is a progeny of said transformant.
В одном аспекте настоящее изобретение относится к молекуле(молекулам) нуклеиновой кислоты, кодирующей(кодирующим) направляющую РНК, или комплекс CRISPR-Cas на основе Cas9, или композицию, обсуждаемую в данном документе. В одном аспекте настоящее изобретение относится к вектору, содержащему молекулу нуклеиновой кислоты, кодирующую направляющую РНК (gRNA), содержащую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, где прямой повтор в gRNA модифицирован путем вставки отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается (связываются) с двумя или более адаптерными белками, и где каждый адаптерный белок ассоциируется с одним или несколькими функциональными доменами; или где gRNA модифицирована так, что она имеет по меньшей мере одну некодирующую функциональную петлю. В одном аспекте настоящее изобретение относится к вектору(векторам), содержащему(содержащим) молекулу(молекулы) нуклеиновой кислоты, кодирующую(кодирующие) не встречающуюся в природе или сконструированную композицию комплекса CRISPR-Cas, содержащую gRNA, обсуждаемую в данном документе, и фермент Cas9, где необязательно фермент Cas9 содержит по меньшей мере одну мутацию так, что фермент Cas9 имеет не более чем 5% нуклеазной активности фермента Cas9, не имеющего по меньшей мере одной мутации, и необязательно один или несколько содержат по меньшей мере одну или несколько последовательностей ядерной локализации. В одном аспекте вектор может дополнительно содержать регуляторный(регуляторные) элемент(элементы), функционирующий (функционирующие) в эукариотической клетке, функционально связанный(связанные) с молекулой нуклеиновой кислоты, кодирующей направляющую РНК (gRNA), и/или с молекулой нуклеиновой кислоты, кодирующей фермент Cas9, и/или необязательно с последовательностью(последовательностями) ядерной локализации.In one aspect, the present invention relates to a nucleic acid molecule(s) encoding a guide RNA or a Cas9-based CRISPR-Cas complex or composition as discussed herein. In one aspect, the present invention relates to a vector comprising a nucleic acid molecule encoding a guide RNA (gRNA) comprising a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell, wherein a direct repeat in the gRNA is modified by inserting different RNA sequence(s) that bind(s) to two or more adaptor proteins, and wherein each adaptor protein is associated with one or more functional domains; or wherein the gRNA is modified such that it has at least one non-coding functional loop. In one aspect, the present invention relates to a vector(s) comprising a nucleic acid molecule(s) encoding a non-naturally occurring or engineered composition of a CRISPR-Cas complex comprising a gRNA discussed herein and a Cas9 enzyme, wherein optionally the Cas9 enzyme comprises at least one mutation such that the Cas9 enzyme has no more than 5% of the nuclease activity of a Cas9 enzyme lacking the at least one mutation, and optionally one or more comprise at least one or more nuclear localization sequences. In one aspect, the vector may further comprise a regulatory element(s) that functions in a eukaryotic cell, operably linked to a nucleic acid molecule encoding a guide RNA (gRNA) and/or a nucleic acid molecule encoding a Cas9 enzyme, and/or optionally to a nuclear localization sequence(s).
В одном аспекте настоящее изобретение относится к набору, содержащему один или несколько компонентов, описанных в данном документе выше. В некоторых вариантах осуществления набор содержит векторную систему, обсуждаемую выше, и инструкции по применению набора.In one aspect, the present invention relates to a kit comprising one or more components described herein above. In some embodiments, the kit comprises a vector system discussed above and instructions for using the kit.
В одном аспекте настоящее изобретение относится к способу скрининга на предмет мутации приобретения функции (GOF) или потери функции (LOF) или для скрининга некодирующих РНК или потенциальных регуляторных областей (например, энхансеров, репрессоров), содержащий линию клеток, обсуждаемую в данном документе, или клетки модели, обсуждаемой в данном документе, содержащие или экспрессирующие Cas9, и введения композиции, обсуждаемой в данном документе, в клетки клеточной линии или модель, с включением тем самым в gRNA либо активатора, либо репрессора, и мониторинга на предмет GOF или LOF, соответственно, в отношении тех клеток, в которых введенная gRNA включает в себя активатор, или в отношении тех клеток, в которых введенная gRNA включает в себя репрессор. Скрининг в соответствии с настоящим изобретением называют тестом SAM.In one aspect, the present invention relates to a method for screening for a gain-of-function (GOF) or loss-of-function (LOF) mutation, or for screening non-coding RNAs or potential regulatory regions (e.g., enhancers, repressors), comprising a cell line as discussed herein or cells of a model as discussed herein that contain or express Cas9, and administering a composition as discussed herein to cells of the cell line or model, thereby incorporating either an activator or a repressor into the gRNA, and monitoring for GOF or LOF, respectively, in those cells in which the administered gRNA comprises the activator or in those cells in which the administered gRNA comprises the repressor. The screening according to the present invention is referred to as a SAM test.
В одном аспекте настоящее изобретение относится к комплексу CRISPR-Cas на основе Cas9, содержащему фермент Cas9 и направляющую РНК (gRNA), где фермент Cas9 содержит по меньшей мере одну мутацию так, что фермент Cas9 имеет не более чем 5% нуклеазной активности фермента Cas9, не имеющего по меньшей мере одной мутации, и необязательно по меньшей мере одну или несколько последовательностей ядерной локализации; где направляющая РНК (gRNA) содержит направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке; и где gRNA модифицирована путем вставки отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается(связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциируется с двумя или более функциональными доменами, или где gRNA модифицирована так, что она имеет по меньшей мере одну некодирующую функциональную петлю; или фермент Cas9 ассоциируется с одним или несколькими функциональными доменами, а gRNA модифицирована путем вставки отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается(связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциируется с двумя или более функциональными доменами, или где gRNA модифицирована так, что она имеет по меньшей мере одну некодирующую функциональную петлю.In one aspect, the present invention relates to a Cas9-based CRISPR-Cas complex comprising a Cas9 enzyme and a guide RNA (gRNA), wherein the Cas9 enzyme comprises at least one mutation such that the Cas9 enzyme has no more than 5% of the nuclease activity of a Cas9 enzyme lacking the at least one mutation, and optionally at least one or more nuclear localization sequences; wherein the guide RNA (gRNA) comprises a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell; and wherein the gRNA is modified by inserting different RNA sequence(s) that binds to one or more adaptor proteins, and wherein the adaptor protein is associated with two or more functional domains, or wherein the gRNA is modified such that it has at least one non-coding functional loop; or the Cas9 enzyme is associated with one or more functional domains and the gRNA is modified by inserting a different RNA sequence(s) that binds to one or more adaptor proteins, and where the adaptor protein is associated with two or more functional domains, or where the gRNA is modified such that it has at least one non-coding functional loop.
В одном аспекте настоящее изобретение относится к полногеномной библиотеке, содержащей множество направляющих РНК (gRNA) Cas9, содержащих направляющие последовательности, каждая из которых способна гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, и тем самым библиотека способна нацеливаться на множество целевых последовательностей во множестве локусов генома в популяции эукариотических клеток, где каждая gRNA модифицирована путем вставки отличной(отличных) последовательности (последовательностей) РНК, которая(которые) связывается(связываются) с одним или несколькими либо двумя или более адаптерными белками, и где адаптерный белок ассоциируется с одним или несколькими функциональными доменами; или где gRNA модифицирована так, что она имеет по меньшей мере одну некодирующую функциональную петлю. И при наличии более одного функционального домена функциональные домены могут быть одинаковыми или разными, например, два одинаковых или два разных активатора или репрессора. В одном аспекте настоящее изобретение относится к библиотеке не встречающейся(не встречающихся) в природе или сконструированной(сконструированных) композиции(композиций) с комплексом CRISPR-Cas, содержащей(содержащим) gRNA в соответствии с настоящим изобретением и фермент Cas9, где необязательно фермент Cas9 содержит по меньшей мере одну мутацию так, что фермент Cas9 имеет не более чем 5% нуклеазной активности фермента Cas9, не имеющего по меньшей мере одной мутации, и необязательно одна или несколько содержат по меньшей мере одну или несколько последовательностей ядерной локализации. В одном аспекте настоящее изобретение относится к gRNA или к комплексу(комплексам) CRISPR-Cas на основе Cas9 в соответствии с настоящим изобретением, в том числе к не встречающиеся в природе или сконструированной композиции, содержащей один, или два, или больше адаптерных белков, где каждый белок ассоциируется с одним или несколькими функциональными доменами, и где адаптерный белок связывается с отличной(отличными) последовательностью (последовательностями) РНК, вставленной(вставленными) по меньшей мере в одну петлю gRNA.In one aspect, the present invention relates to a genome-wide library comprising a plurality of Cas9 guide RNAs (gRNAs) comprising guide sequences each of which is capable of hybridizing to a target sequence at a genomic locus of interest in a cell, and thereby the library is capable of targeting a plurality of target sequences at a plurality of genomic loci in a population of eukaryotic cells, wherein each gRNA is modified by inserting a different RNA sequence(s) that binds to one or more or two or more adaptor proteins, and wherein the adaptor protein is associated with one or more functional domains; or wherein the gRNA is modified such that it has at least one non-coding functional loop. And where there is more than one functional domain, the functional domains may be the same or different, such as two same or two different activators or repressors. In one aspect, the present invention relates to a library of non-naturally occurring or engineered composition(s) with a CRISPR-Cas complex comprising a gRNA according to the present invention and a Cas9 enzyme, wherein optionally the Cas9 enzyme comprises at least one mutation such that the Cas9 enzyme has no more than 5% of the nuclease activity of a Cas9 enzyme lacking the at least one mutation, and optionally one or more comprise at least one or more nuclear localization sequences. In one aspect, the present invention relates to a gRNA or Cas9-based CRISPR-Cas complex(es) according to the present invention, including a non-naturally occurring or engineered composition comprising one or two or more adaptor proteins, wherein each protein is associated with one or more functional domains, and wherein the adaptor protein binds to distinct RNA sequence(s) inserted into at least one loop of the gRNA.
В одном аспекте настоящее изобретение относится к библиотеке не встречающихся в природе или сконструированных композиций, каждая из которых содержит направляющую РНК (gRNA) Cas9 CRISPR, содержащую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, фермент Cas9, содержащий по меньшей мере одну или несколько последовательностей ядерной локализации, где фермент Cas9 содержит по меньшей мере одну мутацию так, что фермент Cas9 имеет не более чем 5% нуклеазной активности фермента Cas9, не имеющего по меньшей мере одной мутации, где по меньшей мере одна петля в gRNA модифицирована путем вставки отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается (связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциируется с одним или несколькими функциональными доменами, где композиция содержит один или несколько либо два или более адаптерных белка, где каждый белок ассоциируется с одним или несколькими функциональными доменами, и где gRNA содержат полногеномную библиотеку, содержащую множество направляющих РНК (gRNA) Cas9. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где фермент Cas9 обладает сниженной нуклеазной активностью по меньшей мере на 97% или 100% по сравнению с ферментом Cas9, не имеющим по меньшей мере одной мутации. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где фермент Cas9 содержит две или более мутаций. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где фермент Cas9 содержит две или более мутаций. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где фермент Cas9 ассоциируется с одним или несколькими функциональными доменами. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один, или два, или больше функциональных доменов, ассоциированных с адаптерным белком, являются гетерологичным функциональным доменом. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются гетерологичным функциональным доменом. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где адаптерный белок является белком слияния, содержащим функциональных домен. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где gRNA не является модифицированной путем вставки отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается (связываются) с двумя или более адаптерными белками. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один, или два, или более функциональных доменов, ассоциированных с адаптерным белком, представляют собой домен активации транскрипции. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один, или два, или более функциональных доменов, ассоциированных с ферментом Cas9, представляют собой домен активации транскрипции. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один, или два, или более функциональных доменов, ассоциированных с адаптерным белком, представляют собой домен активации транскрипции, содержащий VP64, p65, MyoD1 или HSF1. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются доменом активации транскрипции, содержащим VP64, p65, MyoD1 или HSF1. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один, или два, или более функциональных доменов, ассоциированных с адаптерным белком, представляют собой домен репрессии транскрипции. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются доменом репрессии транскрипции. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где домен репрессии транскрипции представляет собой домен KRAB. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где домен репрессии транскрипции представляет собой домен SID или домен SID4X. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где по меньшей мере один, или два, или более функциональных доменов, ассоциированных с адаптерным белком, характеризуются одной или несколькими видами активности, предусматривающими метилазную активность, деметилазную активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность расщепления РНК, активность расщепления ДНК или активность связывания нуклеиновой кислоты. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, характеризуются одной или несколькими видами активности, предусматривающими метилазную активность, деметилазную активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность расщепления РНК, активность расщепления ДНК, активность связывания нуклеиновой кислоты или активность молекулярного переключателя или химическую индуцируемость, или световую индуцируемость. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где активность расщепления ДНК обусловлена нуклеазой Fok1. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один или несколько функциональных доменов присоединяются к ферменту Cas9 так, что при связывании с gRNA и мишенью функциональный домен находится в пространственной ориентации, позволяющей функциональному домену функционировать с присущей ему функцией. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где gRNA модифицируется так, что после связывания gRNA с адаптерным белком и дальнейшего связывания с ферментом Cas9 и мишенью функциональный домен находится в пространственной ориентации, позволяющей функциональному домену функционировать с присущей ему функцией. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются присоединенными к N-концу фермента Cas9. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один или несколько функциональных доменов, ассоциированных с ферментом Cas9, являются присоединенными к RuvC белка FnCas9 или любому ортологу, соответствующему этим доменам. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где прямой повтор в gRNA модифицирован путем вставки отличной(отличных) последовательности(последовательностей) РНК. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где вставка отличной(отличных) последовательности(последовательностей) РНК, которая связывается с одним или несколькими адаптерными белками, представляет собой аптамерную последовательность. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где аптамерная последовательность представляет собой две или более аптамерных последовательностей, специфичных в отношении одного и того же адаптерного белка. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где аптамерная последовательность представляет собой две или более аптамерных последовательностей, специфичных в отношении другого адаптерного белка. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где адаптерный белок включает в себя MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, фCb5, фCb8r, фCb12r, фCb23r, 7s, PRR1. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где клеточная популяция клеток является популяцией эукариотических клеток. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где эукариотическая клетка является клеткой млекопитающих, растительной клеткой или дрожжевой клеткой. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, де клеткой млекопитающих является клетка человека. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где популяция клеток является популяцией эмбриональных стволовых (ES) клеток. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где целевой последовательностью в локусе генома является некодирующая последовательность. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где функция гена одного или нескольких продуктов генов изменяется путем указанного нацеливания; или где в отношении функции гена наблюдается мутация приобретения функции; или где в отношении функции гена наблюдается изменение функции; или где в отношении функции гена наблюдается снижение функции; или где тест является тестом на предмет некодирующих РНК или потенциальных регуляторных областей (например, энхансеров, репрессоров). В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где указанное нацеливание приводит к нокауту функции гена. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где нацеливание охватывает приблизительно 100 или больше последовательностей. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где нацеливание охватывает приблизительно 1000 или больше последовательностей. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где нацеливание охватывает приблизительно 20000 или больше последовательностей. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где нацеливание охватывает весь геном. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где нацеливание охватывает панель целевых последовательностей, сфокусированных на соответствующем или желательном пути. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где путь является иммунным путем. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где путь является путем деления клетки. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где изменение функции гена предусматривает введение в каждую клетку в популяции клеток векторной системы из одного или нескольких векторов, содержащих сконструированную, не встречающуюся в природе систему CRISPR-Cas на основе Cas9, содержащую I. белок Cas9 и II. один или несколько типов направляющих РНК Cas9, где компоненты I и II могут находиться на одном и том же или на разных векторах системы, вводящей компоненты I и II в каждую клетку, где направляющая последовательность нацеливается на уникальный ген в каждой клетке, где белок Cas9 функционально связан с регуляторным элементом, где при транскрибировании направляющая РНК, содержащая направляющую последовательность, управляет специфичным к последовательности связыванием системы CRISPR-Cas на основе Cas9 с целевой последовательностью в локусах генома уникального гена с индуцированием расщепления локуса генома белком Cas9 и подтверждением разных мутаций во множестве уникальных генов в каждой клетке популяции клеток с образованием тем самым библиотеки мутантных клеток. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где один или несколько векторов являются плазмидными векторами. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где регуляторным элементом является индуцируемый промотор. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где индуцируемым промотором является доксициклиновый индуцируемый промотор. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где подтверждение разных мутаций осуществляется путем полноэкзомного секвенирования. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где достигается мутация в 100 или более уникальных генах. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где достигается мутация в 1000 или более уникальных генах. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где достигается мутация в 20000 или более уникальных генах. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где мутация достигается во всем геноме. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где изменение функции гена достигается во множестве уникальных генов, которые функционируют при определенном физиологическом пути или состоянии. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где путем или состоянием является иммунный путь или состояние. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где путем или состоянием является путь или состояние деления клетки. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где первый адаптерный белок ассоциируется с доменом p65, а второй адаптерный белок ассоциируется с доменом HSF1. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где каждый комплекс CRISPR-Cas на основе Cas9 имеет по меньшей мере три функциональных домена, по меньшей мере один из которых ассоциируется с ферментом Cas9 и по меньшей мере два из которых ассоциируются с gRNA. В одном аспекте настоящее изобретение относится к библиотеке, обсуждаемой в данном документе, где изменением в функции гена является нокаутная мутация. In one aspect, the present invention provides a library of non-naturally occurring or engineered compositions, each comprising a Cas9 CRISPR guide RNA (gRNA) comprising a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell, a Cas9 enzyme comprising at least one or more nuclear localization sequences, wherein the Cas9 enzyme comprises at least one mutation such that the Cas9 enzyme has no more than 5% of the nuclease activity of a Cas9 enzyme lacking the at least one mutation, wherein at least one loop in the gRNA is modified by insertion of different RNA sequence(s) that bind(s) to one or more adaptor proteins, and wherein the adaptor protein is associated with one or more functional domains, wherein the composition comprises one or more or two or more adaptor proteins, wherein each protein is associated with one or more functional domains, and wherein the gRNAs comprise a genome-wide library, comprising a plurality of Cas9 guide RNAs (gRNAs). In one aspect, the present invention relates to a library as discussed herein, wherein the Cas9 enzyme has a reduced nuclease activity of at least 97% or 100% compared to a Cas9 enzyme lacking at least one mutation. In one aspect, the present invention relates to a library as discussed herein, wherein the Cas9 enzyme comprises two or more mutations. In one aspect, the present invention relates to a library as discussed herein, wherein the Cas9 enzyme comprises two or more mutations. In one aspect, the present invention relates to a library as discussed herein, wherein the Cas9 enzyme is associated with one or more functional domains. In one aspect, the present invention relates to a library as discussed herein, wherein one or two or more functional domains associated with the adaptor protein are a heterologous functional domain. In one aspect, the present invention relates to a library as discussed herein, wherein one or more functional domains associated with a Cas9 enzyme are a heterologous functional domain. In one aspect, the present invention relates to a library as discussed herein, wherein the adapter protein is a fusion protein comprising a functional domain. In one aspect, the present invention relates to a library as discussed herein, wherein the gRNA is not modified by insertion of different RNA sequence(s) that bind(s) to two or more adapter proteins. In one aspect, the present invention relates to a library as discussed herein, wherein one or two or more functional domains associated with an adapter protein are a transcriptional activation domain. In one aspect, the present invention relates to a library as discussed herein, wherein one or two or more functional domains associated with a Cas9 enzyme are a transcriptional activation domain. In one aspect, the present invention relates to a library as discussed herein, wherein one or two or more functional domains associated with an adapter protein are a transcriptional activation domain comprising VP64, p65, MyoD1, or HSF1. In one aspect, the present invention relates to a library as discussed herein, wherein one or more functional domains associated with a Cas9 enzyme are a transcriptional activation domain comprising VP64, p65, MyoD1, or HSF1. In one aspect, the present invention relates to a library as discussed herein, wherein one or two or more functional domains associated with an adapter protein are a transcriptional repression domain. In one aspect, the present invention relates to a library as discussed herein, wherein one or more functional domains associated with a Cas9 enzyme are a transcriptional repression domain. In one aspect, the present invention relates to a library as discussed herein, wherein the transcriptional repression domain is a KRAB domain. In one aspect, the present invention relates to a library as discussed herein, wherein the transcriptional repression domain is a SID domain or a SID4X domain. In one aspect, the present invention relates to a library as discussed herein, wherein at least one or two or more functional domains associated with an adapter protein are characterized by one or more activities comprising methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, RNA cleavage activity, DNA cleavage activity, or nucleic acid binding activity. In one aspect, the present invention relates to a library as discussed herein, wherein one or more functional domains associated with a Cas9 enzyme are characterized by one or more activities comprising methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, RNA cleavage activity, DNA cleavage activity, nucleic acid binding activity, or molecular switch activity, or chemical inducibility or light inducibility. In one aspect, the present invention relates to a library as discussed herein, wherein the DNA cleavage activity is mediated by a Fok1 nuclease. In one aspect, the present invention relates to a library as discussed herein, wherein one or more functional domains are linked to a Cas9 enzyme such that upon binding to a gRNA and a target, the functional domain is in a spatial orientation that allows the functional domain to function in its intended function. In one aspect, the present invention relates to a library as discussed herein, wherein the gRNA is modified such that upon binding of the gRNA to an adaptor protein and subsequent binding to a Cas9 enzyme and a target, the functional domain is in a spatial orientation that allows the functional domain to function in its intended function. In one aspect, the present invention relates to a library as discussed herein, wherein one or more functional domains associated with a Cas9 enzyme are fused to the N-terminus of a Cas9 enzyme. In one aspect, the present invention relates to a library as discussed herein, wherein one or more functional domains associated with a Cas9 enzyme are fused to RuvC of a FnCas9 protein or any ortholog corresponding to these domains. In one aspect, the present invention relates to a library as discussed herein, wherein a direct repeat in a gRNA is modified by insertion of different RNA sequence(s). In one aspect, the present invention relates to a library as discussed herein, wherein the insert of a different RNA sequence(s) that binds to one or more adapter proteins is an aptamer sequence. In one aspect, the present invention relates to a library as discussed herein, wherein the aptamer sequence is two or more aptamer sequences specific for the same adapter protein. In one aspect, the present invention relates to a library as discussed herein, wherein the aptamer sequence is two or more aptamer sequences specific for a different adapter protein. In one aspect, the present invention relates to a library as discussed herein, wherein the adapter protein comprises MS2, PP7, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, φCb5, φCb8r, φCb12r, φCb23r, 7s, PRR1. In one aspect, the present invention relates to a library as discussed herein, wherein the cellular population of cells is a population of eukaryotic cells. In one aspect, the present invention relates to a library as discussed herein, wherein the eukaryotic cell is a mammalian cell, a plant cell, or a yeast cell. In one aspect, the present invention relates to a library as discussed herein, wherein the mammalian cell is a human cell. In one aspect, the present invention relates to a library as discussed herein, wherein the population of cells is a population of embryonic stem (ES) cells. In one aspect, the present invention relates to a library as discussed herein, wherein the target sequence at a genomic locus is a non-coding sequence. In one aspect, the present invention relates to a library as discussed herein, wherein the gene function of one or more gene products is altered by said targeting; or wherein a gain-of-function mutation is observed with respect to the gene function; or wherein a change in function is observed with respect to the gene function; or wherein a loss of function is observed with respect to the gene function; or wherein the assay is a assay for non-coding RNAs or potential regulatory regions (e.g., enhancers, repressors). In one aspect, the present invention relates to a library as discussed herein, wherein said targeting results in a knockout of gene function. In one aspect, the present invention relates to a library as discussed herein, wherein the targeting spans about 100 or more sequences. In one aspect, the present invention relates to a library as discussed herein, wherein the targeting spans about 1,000 or more sequences. In one aspect, the present invention relates to a library as discussed herein, wherein the targeting spans about 20,000 or more sequences. In one aspect, the present invention relates to a library as discussed herein, wherein the targeting spans the entire genome. In one aspect, the present invention relates to a library as discussed herein, wherein the targeting spans a panel of target sequences focused on a relevant or desired pathway. In one aspect, the present invention relates to a library as discussed herein, wherein the pathway is an immune pathway. In one aspect, the present invention relates to a library as discussed herein, wherein the pathway is a cell division pathway. In one aspect, the present invention relates to a library as discussed herein, wherein altering gene function comprises introducing into each cell in a population of cells a vector system of one or more vectors comprising an engineered, non-naturally occurring Cas9-based CRISPR-Cas system comprising I. a Cas9 protein and II. one or more types of Cas9 guide RNAs, wherein components I and II may be on the same or on different vectors of the system introducing components I and II into each cell, wherein the guide sequence targets a unique gene in each cell, wherein the Cas9 protein is operably linked to a regulatory element, wherein when transcribed, the guide RNA comprising the guide sequence directs sequence-specific binding of the Cas9-based CRISPR-Cas system to a target sequence in genomic loci of a unique gene to induce cleavage of the genomic locus by the Cas9 protein and confirming different mutations in a plurality of unique genes in each cell of the population of cells, thereby generating a library of mutant cells. In one aspect, the present invention relates to a library as discussed herein, wherein one or more vectors are plasmid vectors. In one aspect, the present invention relates to a library as discussed herein, wherein the regulatory element is an inducible promoter. In one aspect, the present invention relates to a library as discussed herein, wherein the inducible promoter is a doxycycline inducible promoter. In one aspect, the present invention relates to a library as discussed herein, wherein confirmation of various mutations is accomplished by whole exome sequencing. In one aspect, the present invention relates to a library as discussed herein, wherein mutation is achieved in 100 or more unique genes. In one aspect, the present invention relates to a library as discussed herein, wherein mutation is achieved in 1,000 or more unique genes. In one aspect, the present invention relates to a library as discussed herein, wherein mutation is achieved in 20,000 or more unique genes. In one aspect, the present invention relates to a library as discussed herein, wherein mutation is achieved throughout the genome. In one aspect, the present invention relates to a library as discussed herein, wherein alteration of gene function is achieved in a plurality of unique genes that function in a particular physiological pathway or condition. In one aspect, the present invention relates to a library as discussed herein, wherein the pathway or condition is an immune pathway or condition. In one aspect, the present invention relates to a library as discussed herein, wherein the pathway or condition is a cell division pathway or condition. In one aspect, the present invention relates to a library as discussed herein, wherein the first adapter protein associates with a p65 domain and the second adapter protein associates with an HSF1 domain. In one aspect, the present invention relates to a library as discussed herein, wherein each Cas9-based CRISPR-Cas complex has at least three functional domains, at least one of which associates with a Cas9 enzyme and at least two of which associate with a gRNA. In one aspect, the present invention relates to a library as discussed herein, wherein the change in gene function is a knockout mutation.
В одном аспекте настоящее изобретение относится к способу функционального скрининга генов в геноме в пуле клеток ex vivo или in vivo, предусматривающему введение или экспрессию библиотеки, содержащей несколько направляющих РНК системы CRISPR-Cas на основе Cas9 (gRNA), и где скрининг дополнительно предусматривает применение фермента Cas9, где комплекс CRISPR является модифицированным, чтобы содержать гетерологичный функциональный домен. В одном аспекте настоящего изобретения предусмотрен способ скрининга генома, включающий введение хозяину библиотеки или ее экспрессию у хозяина in vivo. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, дополнительно включающий активатор, вводимый хозяину или экспрессируемый у хозяина. В одном аспекте настоящее изобретение относится к способу, обсуждаемому в данном документе, где активатор присоединяется к ферменту Cas9. В одном аспекте настоящее изобретение относится к способу, обсуждаемому в данном документе, где активатор прикреплен к N-концу или C-концу фермента Cas9. В одном аспекте настоящее изобретение относится к способу, обсуждаемому в данном документе, где активатор присоединяется к прямому повтору в gRNA Cas9 CRISPR. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, дополнительно включающий репрессор, вводимый хозяину или экспрессируемый у хозяина. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где скрининг предусматривает воздействие на активацию гена, ингибирование гена или расщепление в локусе, и выявление указанного. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где хозяином является эукариотическая клетка. В одном аспекте настоящее изобретение относится к способу, обсуждаемому в данном документе, где хозяином является клетка млекопитающих, дрожжевая клетка или растительная клетка. В одном аспекте настоящее изобретение относится к способу, обсуждаемому в данном документе, где хозяином является эукариотический организм, отличный от человека. В одном аспекте настоящее изобретение относится к способу, обсуждаемому в данном документе, где эукариотическим организмом, отличным от человека, является отличное от человека млекопитающее. В одном аспекте настоящее изобретение относится к способу, обсуждаемому в данном документе, где отличным от человека млекопитающим является мышь. В одном аспекте настоящее изобретение относится к способу, обсуждаемому в данном документе, предусматривающему доставку комплексов CRISPR-Cas на основе Cas9, или их компонента(компонентов), или молекулы(молекул) нуклеиновой кислоты, кодирующей их, где указанная(указанные) молекула(молекулы) нуклеиновой кислоты функционально связана(связаны) с регуляторной(регуляторными) последовательностью (последовательностями) и экспрессируется(экспрессируются) in vivo. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где экспрессия in vivo осуществляется с помощью лентивируса, аденовируса или AAV. В одном аспекте настоящего изобретения предусмотрен способ, обсуждаемый в данном документе, где доставка осуществляется с помощью частицы, наночастицы, липида или пептида, проникающих в клетку (CPP).In one aspect, the present invention relates to a method for functionally screening genes in a genome in a cell pool ex vivo or in vivo comprising administering or expressing a library comprising multiple Cas9-based CRISPR-Cas guide RNAs (gRNAs), and wherein the screening further comprises using a Cas9 enzyme, wherein the CRISPR complex is modified to comprise a heterologous functional domain. In one aspect, the present invention relates to a method for screening a genome comprising administering a library to a host or expressing it in a host in vivo. In one aspect, the present invention relates to a method as discussed herein further comprising an activator administered to the host or expressed in the host. In one aspect, the present invention relates to a method as discussed herein, wherein the activator is attached to a Cas9 enzyme. In one aspect, the present invention relates to a method as discussed herein, wherein the activator is attached to the N-terminus or the C-terminus of the Cas9 enzyme. In one aspect, the present invention provides a method as discussed herein, wherein an activator is attached to a direct repeat in a Cas9 CRISPR gRNA. In one aspect, the present invention provides a method as discussed herein, further comprising a repressor introduced into the host or expressed in the host. In one aspect, the present invention provides a method as discussed herein, wherein screening comprises targeting and detecting gene activation, gene inhibition, or cleavage at a locus. In one aspect, the present invention provides a method as discussed herein, wherein the host is a eukaryotic cell. In one aspect, the present invention provides a method as discussed herein, wherein the host is a mammalian cell, a yeast cell, or a plant cell. In one aspect, the present invention provides a method as discussed herein, wherein the host is a eukaryotic organism other than a human. In one aspect, the present invention relates to a method as discussed herein, wherein the non-human eukaryotic organism is a non-human mammal. In one aspect, the present invention relates to a method as discussed herein, wherein the non-human mammal is a mouse. In one aspect, the present invention relates to a method as discussed herein comprising delivering Cas9-based CRISPR-Cas complexes, or component(s) thereof, or nucleic acid molecule(s) encoding the same, wherein said nucleic acid molecule(s) is(are) operably linked to regulatory sequence(s) and is(are) expressed in vivo. In one aspect, the present invention relates to a method as discussed herein, wherein the in vivo expression is accomplished by a lentivirus, an adenovirus, or an AAV. In one aspect of the present invention, there is provided a method as discussed herein, wherein delivery is via a cell penetrating particle, nanoparticle, lipid or peptide (CPP).
В одном аспекте настоящее изобретение относится к паре комплексов CRISPR-Cas на основе Cas9, при этом каждый из них содержит направляющую РНК Cas9 (gRNA), предусматривающую направляющую последовательность, способную гибридизироваться с целевой последовательностью в представляющем интерес локусе генома в клетке, где указанная gRNA является модифицированной путем вставки отличной(отличных) последовательности(последовательностей) РНК, которая(которые) связывается (связываются) с одним или несколькими адаптерными белками, и где адаптерный белок ассоциируется с одним или несколькими функциональными доменами, где каждая gRNA из каждого CRISPR-Cas на основе Cas9 содержит функциональный домен, характеризующийся активностью расщепления ДНК. В одном аспекте настоящее изобретение относится к парным комплексам CRISPR-Cas на основе Cas9, обсуждаемым в данном документе, где активность расщепления ДНК обусловлена нуклеазой Fok1.In one aspect, the present invention relates to a pair of Cas9-based CRISPR-Cas complexes, each comprising a Cas9 guide RNA (gRNA) comprising a guide sequence capable of hybridizing to a target sequence at a genomic locus of interest in a cell, wherein the gRNA is modified by insertion of different RNA sequence(s) that bind(s) to one or more adaptor proteins, and wherein the adaptor protein is associated with one or more functional domains, wherein each gRNA of each Cas9-based CRISPR-Cas comprises a functional domain characterized by DNA cleavage activity. In one aspect, the present invention relates to the paired Cas9-based CRISPR-Cas complexes discussed herein, wherein the DNA cleavage activity is mediated by the Fok1 nuclease.
В конкретных вариантах осуществления в способах и композициях в данном документе применяется нуклеотидная последовательность, кодирующая белок Cas9, который является кодон-оптимизированным для экспрессии в эукариотической клетке. В предпочтительном варианте осуществления эукариотическая клетка является клеткой млекопитающих, а в более предпочтительном варианте осуществления клетка млекопитающих является человеческой клеткой, дрожжевой клеткой или растительной клеткой. Альтернативно эукариотическая клетка является растительной клеткой. В дополнительном варианте осуществления настоящего изобретения экспрессия продукта гена является сниженной.In particular embodiments, the methods and compositions herein employ a nucleotide sequence encoding a Cas9 protein that is codon optimized for expression in a eukaryotic cell. In a preferred embodiment, the eukaryotic cell is a mammalian cell, and in a more preferred embodiment, the mammalian cell is a human cell, a yeast cell, or a plant cell. Alternatively, the eukaryotic cell is a plant cell. In a further embodiment of the present invention, expression of the gene product is reduced.
В некоторых вариантах осуществления способов и композиций, представленных в данном документе, фермент Cas9 получен из Acidaminococcus sp. BV3L6, бактерии Lachnospiraceae MA2020 или Francisella tularensis 1 Novicida Cas9 и может включать в себя мутированный Cas9, полученный из этих организмов. Фермент может быть гомологом или ортологом Cas9.In some embodiments of the methods and compositions provided herein, the Cas9 enzyme is obtained from Acidaminococcus sp. BV3L6, Lachnospiraceae MA2020 bacteria, or Francisella tularensis 1 Novicida Cas9 and may include a mutated Cas9 obtained from these organisms. The enzyme may be a homolog or ortholog of Cas9.
В одном аспекте, настоящее изобретение относится к способу создания модельной эукариотической клетки, содержащей ген с модифицированной экспрессией. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) введение одного или нескольких векторов, описываемых в данном документе выше, в эукариотическую клетку и (b) обеспечение связывания комплекса CRISPR с целевым полинуклеотидом так, что происходит модификация генного локуса с получением тем самым модельной эукариотической клетки, содержащей модифицированный локус гена.In one aspect, the present invention relates to a method for creating a model eukaryotic cell comprising a gene with modified expression. In some embodiments, the gene responsible for the development of a disease is any gene associated with an increased risk of having or developing a disease. In some embodiments, the method comprises (a) introducing one or more vectors described herein above into a eukaryotic cell and (b) causing a CRISPR complex to bind to a target polynucleotide such that the gene locus is modified, thereby producing a model eukaryotic cell comprising the modified gene locus.
В одном аспекте настоящего изобретения предусмотрен способ разработки биологически активного средства, которое модулирует событие передачи сигнала в клетке, ассоциированное с геном, ответственным за развитие заболевания. В некоторых вариантах осуществления ген, ответственный за развитие заболевания, представляет собой любой ген, ассоциированный с повышением риска наличия или развития заболевания. В некоторых вариантах осуществления способ включает (a) приведение тестируемого соединения в контакт с модельной клеткой по любому из описанных выше вариантов осуществления; и (b) обнаружение изменения считываемого показания, что указывает на снижение или возрастание события передачи сигнала в клетке, ассоциированного с указанной мутацией в указанном гене, ответственном за развитие заболевания, с получением тем самым указанного биологически активного средства, которое модулирует указанное событие передачи сигнала в клетке, ассоциированное с указанным геном, ответственным за развитие заболевания.In one aspect of the present invention, there is provided a method for developing a biologically active agent that modulates a cellular signaling event associated with a disease-promoting gene. In some embodiments, the disease-promoting gene is any gene associated with an increased risk of having or developing a disease. In some embodiments, the method comprises (a) contacting a test compound with a model cell according to any of the embodiments described above; and (b) detecting a change in a readout that indicates a decrease or increase in a cellular signaling event associated with said mutation in said disease-promoting gene, thereby obtaining said biologically active agent that modulates said cellular signaling event associated with said disease-promoting gene.
Настоящее изобретение охватывает оптимизированные функциональные системы фермента CRISPR-Cas на основе Cas9, особенно в комбинации с модифицированными направляющими в соответствии с настоящим изобретением, а также, если фермент Cas9 также ассоциирован с функциональным доменом. В частности, фермент Cas9 содержит одну или несколько мутаций, которые превращают его в связывающий ДНК белок, к которому могут быть добавлены, или приложены, или вставлены, или присоединены функциональные домены, проявляющие представляющую интерес функцию. В определенных вариантах осуществления фермент Cas9 содержит одну или несколько мутаций, и/или одна или несколько мутаций находятся в домене RuvC1 фермента Cas9 или представляют собой мутацию, иным образом обсуждаемую в данном документе. В некоторых вариантах осуществления фермент Cas9 имеет одну или несколько мутаций в каталитическом домене, где при транскрипции направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, и где фермент дополнительно содержит функциональный домен. В некоторых вариантах осуществления предпочтительной является мутация в E1006 в соответствии с белком FnCas9.The present invention encompasses optimized functional Cas9-based CRISPR-Cas enzyme systems, especially in combination with modified guides according to the present invention, and also if the Cas9 enzyme is also associated with a functional domain. In particular, the Cas9 enzyme comprises one or more mutations that convert it into a DNA binding protein to which functional domains exhibiting a function of interest can be added or attached or inserted or linked. In certain embodiments, the Cas9 enzyme comprises one or more mutations, and/or the one or more mutations are in the RuvC1 domain of the Cas9 enzyme or are a mutation otherwise discussed herein. In some embodiments, the Cas9 enzyme has one or more mutations in the catalytic domain, wherein upon transcription, the guide sequence directs sequence-specific binding of the CRISPR complex to the target sequence, and wherein the enzyme further comprises a functional domain. In some embodiments, a mutation in E1006 corresponding to the FnCas9 protein is preferred.
Информация о структуре, представленная в данном документе, обеспечивает детальное изучение взаимодействия направляющей РНК с целевой ДНК и ферментом Cas9, предоставляя возможность конструирования или изменения структуры направляющей РНК для оптимизации функциональности всей системы CRISPR-Cas на основе Cas9. Например, петли в направляющей РНК могут быть увеличены без перекрывания с белком Cas9 путем вставки адаптерных белков, которые могут связываться с РНК. Такие адаптерные белки могут дополнительно рекрутировать эффекторные белки или продукты слияния, которые содержат один или несколько функциональных доменов.The structural information presented herein provides a detailed study of the interaction of the guide RNA with the target DNA and the Cas9 enzyme, providing the possibility of designing or modifying the structure of the guide RNA to optimize the functionality of the overall Cas9-based CRISPR-Cas system. For example, loops in the guide RNA can be enlarged without overlapping with the Cas9 protein by inserting adaptor proteins that can bind to the RNA. Such adaptor proteins can further recruit effector proteins or fusion products that contain one or more functional domains.
В некоторых предпочтительных вариантах осуществления функциональный домен представляет собой домен активации транскрипции, предпочтительно VP64. В некоторых вариантах осуществления функциональный домен представляет собой домен репрессии транскрипции, предпочтительно KRAB. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой SID или конкатемеры SID (например, SID4X). В некоторых вариантах осуществления функциональный домен представляет собой домен эпигенетического модифицирования, так что обеспечивается фермент эпигенетического модифицирования. В некоторых вариантах осуществления функциональный домен представляет собой домен активации, который может представлять собой домен активации P65.In some preferred embodiments, the functional domain is a transcriptional activation domain, preferably VP64. In some embodiments, the functional domain is a transcriptional repression domain, preferably KRAB. In some embodiments, the transcriptional repression domain is SID or SID concatemers (e.g., SID4X). In some embodiments, the functional domain is an epigenetic modification domain, such that an epigenetic modification enzyme is provided. In some embodiments, the functional domain is an activation domain, which may be a P65 activation domain.
Один аспект настоящего изобретения заключается в том, что вышеупомянутые элементы содержатся в одной композиции или содержатся в отдельных композициях. Эти композиции преимущественно могут быть применимы в отношении хозяина для индуцирования функционального эффекта на уровне генома.One aspect of the present invention is that the above-mentioned elements are contained in a single composition or are contained in separate compositions. These compositions can advantageously be applied to a host to induce a functional effect at the genome level.
В целом, направляющую РНК модифицируют таким путем, который обеспечивает специфические сайты связывания (например, аптамеры) для адаптерных белков, содержащих один или несколько функциональных доменов (например, посредством образования слитого белка) для связывания. Модифицированную направляющую РНК модифицируют так, что как только направляющая РНК формирует комплекс CRISPR (т.е. фермент Cas9 связывается с направляющей РНК и мишенью), адаптерные белки связываются, и функциональный домен в адаптерном белке располагается в пространственной ориентации, которая является предпочтительной для эффективности присущей функции. Например, если функциональный домен представляет собой активатор транскрипции (например, VP64 или p65), то активатор транскрипции размещается в пространственной ориентации, которая позволяет ему влиять на транскрипцию мишени. Подобным образом, репрессор транскрипции будет размещаться преимущественно, чтобы воздействовать на транскрипцию мишени, а нуклеаза (например, Fok1) будет размещаться преимущественно для расщепления или частичного расщепления мишени.In general, the guide RNA is modified in a manner that provides specific binding sites (e.g., aptamers) for adaptor proteins containing one or more functional domains (e.g., through formation of a fusion protein) to bind. The modified guide RNA is modified such that once the guide RNA forms a CRISPR complex (i.e., the Cas9 enzyme binds to the guide RNA and the target), the adaptor proteins associate and the functional domain in the adaptor protein is positioned in a spatial orientation that is favorable for the efficiency of the intrinsic function. For example, if the functional domain is a transcriptional activator (e.g., VP64 or p65), the transcriptional activator is positioned in a spatial orientation that allows it to influence the transcription of the target. Similarly, a transcriptional repressor will be positioned preferentially to affect transcription of the target, and a nuclease (e.g., Fok1) will be positioned preferentially to cleave or partially cleave the target.
Специалисту в данной области будет понятно, что модификации для направляющей РНК, которые обеспечивают связывание адаптор + функциональный домен, но не обеспечивают надлежащее размещение адаптор + функциональный домен (например, из-за стерического несоответствия в трехмерной структуре комплекса CRISPR), являются модификациями, которые не подразумеваются. Одна или несколько модифицированных направляющих РНК могут быть модифицированы путем введения отличной(отличных) последовательности(последовательностей) РНК на 5'-конце прямого повтора, в прямой повтор или на 3'-конце направляющей последовательности.It will be appreciated by one skilled in the art that modifications to the guide RNA that allow binding of the adaptor + functional domain but do not allow proper placement of the adaptor + functional domain (e.g., due to steric hindrance in the three-dimensional structure of the CRISPR complex) are modifications that are not intended. One or more modified guide RNAs may be modified by introducing different RNA sequence(s) at the 5' end of the direct repeat, in the direct repeat, or at the 3' end of the guide sequence.
Как объясняется в данном документе, функциональные домены могут представлять собой, например, один или несколько доменов из группы, состоящей из доменов с метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, активностью расщепления РНК, активностью расщепления ДНК, активностью связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). В некоторых случаях предпочтительно, чтобы дополнительно обеспечивался по меньшей мере один NLS. В некоторых случаях предпочтительно положение NLS на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными.As explained herein, the functional domains may be, for example, one or more domains from the group consisting of domains with methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, RNA cleavage activity, DNA cleavage activity, nucleic acid binding activity, and molecular switches (e.g., light-inducible). In some cases, it is preferable that at least one NLS is additionally provided. In some cases, the position of the NLS at the N-terminus is preferable. When more than one functional domain is included, the functional domains may be the same or different.
Направляющая РНК может быть разработана с включением в себя нескольких связывающих сайтов распознавания (например, аптамеров), специфичных в отношении одного и того же или разных адаптерных белков. Направляющая РНК фермента Cas9 характеризуется тем, что, как правило, она состоит из 37-43 нуклеотидов и тем, что она содержит только одну "петлю-на-стебле". Направляющая РНК может быть разработана со связыванием с промоторным участком -1000 - +1 нуклеиновых кислот выше сайта начала транскрипции (т.е. TSS), предпочтительно -200 нуклеиновых кислот. Такое размещение улучшает функциональные домены, которые влияют на активацию гена (например, активаторы транскрипции) или ингибирование гена (например, репрессоры транскрипции). Модифицированной направляющей РНК может быть одна или несколько модифицированных направляющих РНК, нацеленных на один или несколько целевых локусов (например, по меньшей мере 1 направляющая РНК, по меньшей мере 2 направляющих РНК, по меньшей мере 5 направляющих РНК, по меньшей мере 10 направляющих РНК, по меньшей мере 20 направляющих РНК, по меньшей мере 30 направляющих РНК, по меньшей мере 50 направляющих РНК), содержащихся в композиции.The guide RNA can be designed to contain multiple binding recognition sites (e.g., aptamers) specific for the same or different adaptor proteins. The Cas9 guide RNA is characterized by being typically 37-43 nucleotides long and by containing only one stem-loop. The guide RNA can be designed to bind to the promoter region -1000 to +1 nucleic acids upstream of the transcription start site (i.e., TSS), preferably -200 nucleic acids. This placement favors functional domains that affect gene activation (e.g., transcriptional activators) or gene inhibition (e.g., transcriptional repressors). The modified guide RNA may be one or more modified guide RNAs targeting one or more target loci (e.g., at least 1 guide RNA, at least 2 guide RNAs, at least 5 guide RNAs, at least 10 guide RNAs, at least 20 guide RNAs, at least 30 guide RNAs, at least 50 guide RNAs) contained in the composition.
Кроме того, фермент Cas9 со сниженной нуклеазной активностью является наиболее эффективным при инактивировании нуклеазной активности (например, инактивация нуклеазы по меньшей мере на 70%, по меньшей мере на 80%, по меньшей мере на 90%, по меньшей мере на 95%, по меньшей мере на 97% или на 100% по сравнению с ферментом дикого типа; или, другими словами, фермент Cas9 обладает преимущественно приблизительно 0% нуклеазной активности немутантного или дикого типа фермента Cas9 или не более чем приблизительно 3%, или приблизительно 5%, или приблизительно 10% нуклеазной активности немутированного или дикого типа фермента Cas9). Это возможно путем введения мутаций в нуклеазные домены RuvC FnCas9 и ее ортологов. Например, используются мутации в остатке, выбранном из группы, состоящей из D917A, E1006A, E1028A, D1227A, D1255A или N1257, как в FnCas9, и более предпочтительно вводятся одна или несколько мутаций, выбранных из группы, состоящей из местоположений D917A, E1006A, E1028A, D1227A, D1255A, N1257A, D917A, E1006A, E1028A, D1227A, D1255A и N1257 в FnCas9 или соответствующем ортологе. В конкретных вариантах осуществления мутациями являются D917A с E1006A в FnCas9.In addition, the Cas9 enzyme with reduced nuclease activity is most efficient at inactivating nuclease activity (e.g., at least 70%, at least 80%, at least 90%, at least 95%, at least 97%, or 100% nuclease inactivation compared to the wild-type enzyme; or, in other words, the Cas9 enzyme has substantially about 0% of the nuclease activity of the wild-type or unmutated Cas9 enzyme or no more than about 3%, or about 5%, or about 10% of the nuclease activity of the wild-type or unmutated Cas9 enzyme). This is possible by introducing mutations into the nuclease domains of RuvC FnCas9 and its orthologs. For example, mutations are used at a residue selected from the group consisting of D917A, E1006A, E1028A, D1227A, D1255A or N1257, as in FnCas9, and more preferably one or more mutations are introduced selected from the group consisting of locations D917A, E1006A, E1028A, D1227A, D1255A, N1257A, D917A, E1006A, E1028A, D1227A, D1255A and N1257 in FnCas9 or a corresponding ortholog. In specific embodiments, the mutations are D917A with E1006A in FnCas9.
Инактивированный фермент Cas9 может быть ассоциирован (например, посредством образования слитого белка) с одним или несколькими функциональными доменами, подобными, например, описываемому в данном документе, для модифицированных направляющей РНК адаптерных белков, в том числе, например, с одним или несколькими доменами из группы, состоящей из доменов с метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, активностью расщепления РНК, активностью расщепления ДНК, активностью связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). Предпочтительными доменами являются Fok1, VP64, P65, HSF1, MyoD1. В случае обеспечения Fok1 предпочтительным является то, что несколько функциональных доменов Fok1 обеспечены для функционального димера и что направляющие РНК предназначены для обеспечения надлежащего интервала для функционального использования (Fok1), как конкретно описано в Tsai et al. Nature Biotechnology, Vol. 32, Number 6, June 2014). В адаптерном белке можно использовать известные линкеры для прикрепления таких функциональных доменов. В некоторых случаях предпочтительно, чтобы дополнительно обеспечивался по меньшей мере один NLS. В некоторых случаях предпочтительно положение NLS на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными.The inactivated Cas9 enzyme may be associated (e.g., by forming a fusion protein) with one or more functional domains, such as those described herein for modified guide RNA adaptor proteins, including, for example, one or more domains from the group consisting of domains with methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, RNA cleavage activity, DNA cleavage activity, nucleic acid binding activity, and molecular switches (e.g., light-inducible). Preferred domains are Fok1, VP64, P65, HSF1, MyoD1. In the case of providing Fok1, it is preferred that several functional domains of Fok1 are provided for a functional dimer and that the guide RNAs are designed to provide an appropriate interval for the functional use (of Fok1, as specifically described in Tsai et al. Nature Biotechnology, Vol. 32, Number 6, June 2014). Known linkers can be used in the adapter protein to attach such functional domains. In some cases, it is preferred that at least one NLS is additionally provided. In some cases, the position of the NLS at the N-terminus is preferred. When more than one functional domain is included, the functional domains can be the same or different.
В целом, размещение одного или нескольких функциональных доменом в инактивированном ферменте Cas9 обеспечивает корректную пространственную ориентацию функционального домена для воздействия на мишень с присущим функциональным эффектом. Например, если функциональный домен представляет собой активатор транскрипции (например, VP64 или p65), то активатор транскрипции размещается в пространственной ориентации, которая позволяет ему влиять на транскрипцию мишени. Подобным образом, репрессор транскрипции преимущественно будет размещаться для влияния на транскрипцию мишени, а нуклеаза (например, Fok1) преимущественно будет размещаться для расщепления или частичного расщепления мишени. Могут быть предусмотрены положения, отличные от N-/C-конца фермента Cas9.In general, the placement of one or more functional domains in an inactivated Cas9 enzyme ensures the correct spatial orientation of the functional domain to act on the target with the intended functional effect. For example, if the functional domain is a transcriptional activator (e.g., VP64 or p65), the transcriptional activator is placed in a spatial orientation that allows it to affect transcription of the target. Similarly, a transcriptional repressor will be preferentially positioned to affect transcription of the target, and a nuclease (e.g., Fok1) will be preferentially positioned to cleave or partially cleave the target. Positions other than the N-/C-terminus of the Cas9 enzyme may be envisaged.
Адаптерным белком может быть какой-либо из ряда белков, который связывается с аптамером или сайтом распознавания, введенным в модифицированную направляющую РНК, и который обеспечивает надлежащее размещение одного или нескольких функциональных доменов, как только направляющая РНК была встроена в комплекс CRISPR, для воздействия на мишень с присущей функцией. Как подробно объясняется в настоящей заявке, они могут представлять собой белки оболочки, предпочтительно белки оболочки бактериофагов. Функциональные домены, ассоциированные с такими адаптерными белками (например, в форме слитого белка), могут включать, например, один или несколько доменов из группы, состоящей из доменов с метилазной активностью, деметилазной активностью, активностью в отношении активации транскрипции, активностью в отношении репрессии транскрипции, активностью фактора освобождения транскрипта, активностью в отношении модификации гистонов, активностью расщепления РНК, активностью расщепления ДНК, активностью связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). Предпочтительными доменами являются Fok1, VP64, P65, HSF1, MyoD1. В случае, если функциональный домен представляет собой активатор транскрипции или репрессор транскрипции, преимущественным является обеспечение дополнительно по меньшей мере NLS и предпочтительно на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными. В адаптерном белке можно использовать известные линкеры для прикрепления таких функциональных доменов.The adaptor protein may be any of a number of proteins that bind to an aptamer or recognition site introduced into a modified guide RNA and that ensures the proper placement of one or more functional domains, once the guide RNA has been inserted into the CRISPR complex, to affect the target with the inherent function. As explained in detail in the present application, they may be coat proteins, preferably bacteriophage coat proteins. The functional domains associated with such adaptor proteins (e.g., in the form of a fusion protein) may include, for example, one or more domains from the group consisting of domains with methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, RNA cleavage activity, DNA cleavage activity, nucleic acid binding activity, and molecular switches (e.g., light-inducible). Preferred domains are Fok1, VP64, P65, HSF1, MyoD1. In case the functional domain is a transcription activator or transcription repressor, it is advantageous to additionally provide at least an NLS and preferably at the N-terminus. When including more than one functional domain, the functional domains can be the same or different. Known linkers can be used in the adapter protein to attach such functional domains.
Таким образом, модифицированная направляющая РНК, инактивированный фермент Cas9 (с функциональными доменами или без таковых) и связывающий белок с одним или несколькими функциональными доменами могут по отдельности содержаться в композиции и их можно вводить хозяину по отдельности или совместно. Альтернативно эти компоненты могут обеспечиваться в одной композиции для введения хозяину. Введение в хозяина может осуществляться с помощью вирусных векторов, известных специалисту или описываемых в данном документе для доставки хозяину (например, лентивирусного вектора, аденовирусного вектора, вектора на основе AAV). Как объясняется в данном документе, применение различных маркеров отбора (например, для отбора лентивирусной gRNA) и различной концентрации gRNA (например, в зависимости от того, применяются ли множественные gRNA) может быть предпочтительным для индуцирования улучшенного эффекта.Thus, the modified guide RNA, the inactivated Cas9 enzyme (with or without functional domains) and the binding protein with one or more functional domains may be separately contained in a composition and may be administered to the host separately or together. Alternatively, these components may be provided in a single composition for administration to the host. Administration to the host may be accomplished using viral vectors known to the skilled artisan or described herein for delivery to the host (e.g., a lentiviral vector, an adenoviral vector, an AAV-based vector). As explained herein, the use of different selection markers (e.g., for lentiviral gRNA selection) and different gRNA concentrations (e.g., depending on whether multiple gRNAs are used) may be advantageous to induce an improved effect.
Исходя из этой концепции для индукции преобразования в локусе генома подходят несколько вариантов, включая расщепление ДНК, активацию гена или дезактивацию гена. С применением предусмотренных композиций специалист в данной области сможет осуществить эффективное и специфическое нацеливание на один или множественные локусы с помощью одинаковых или различных функциональных доменов для индукции одного или нескольких преобразований в локусе генома. Композиции можно применять в целом ряде способов скрининга библиотек в клетках и функционального моделирования in vivo (например, активации генов lincRNA и идентификации функций; моделирования мутации с приобретением функции; моделирования мутации с потерей функции; применения композиций в соответствии с настоящим изобретением для создания линий клеток и трансгенных животных в целях оптимизации и скрининга).Based on this concept, several options are suitable for inducing a transformation at a genomic locus, including DNA cleavage, gene activation, or gene inactivation. Using the provided compositions, one skilled in the art will be able to efficiently and specifically target one or multiple loci using the same or different functional domains to induce one or more transformations at a genomic locus. The compositions can be used in a variety of methods for screening libraries in cells and functional modeling in vivo (e.g., lincRNA gene activation and function identification; gain-of-function mutation modeling; loss-of-function mutation modeling; use of the compositions of the present invention to generate cell lines and transgenic animals for optimization and screening purposes).
Настоящее изобретение охватывает применение композиций в соответствии с настоящим изобретением для создания и применения условных или индуцируемых трансгенных по CRISPR клетки/животных. (См., например, Platt et al., Cell (2014), http://dx.doi.org/10.1016/j.cell.2014.09.014, или патентные публикации PCT, цитируемые в данном документе, такие как WO 2014/093622 (PCT/US2013/074667), которые не считаются уровнем техники настоящих изобретения или заявки). Например, целевая клетка содержит зависимый от условия или индуцируемый фермент Cas9 CRISPR (например, в форме зависимых от Cre конструкций) и/или зависимый от условий или индуцируемый адаптерный белок, и при экспрессии вектора, введенного в целевую клетку, вектор экспрессирует то, что индуцирует или обеспечивает условие для экспрессии фермента Cas9 и/или экспрессии адаптера в целевой клетке. За счет применения идей и композиций по настоящему изобретению с известным способом создания комплекса CRISPR индуцируемые преобразования генома, на которые воздействуют функциональные домены, также являются аспектом настоящего изобретения. Одним из примеров этого является создание трансгенного животного с нокином CRISPR/зависимой от условий экспрессией (например, мыши, содержащей, например, кассету Lox-Stop-polyA-Lox(LSL)) и последующую доставку одной или нескольких композиций, обеспечивающих одну или несколько модифицированных направляющих РНК (например, -200 нуклеотидов до TSS в представляющем интерес целевом гене для целей активации гена), описываемых в данном документе (например, модифицированных направляющих РНК с одним или несколькими аптамерами, распознаваемыми белками оболочки, например, MS2), одного или несколько адаптерных белков, описываемых в данном документе, (MS2-связывающий белок, связанный с одним или несколькими VP64), и средств для индуцирования животного с зависимой от условий экспрессией (например, рекомбиназы Cre для обеспечения индуцируемой экспрессии Cas9). Альтернативно адаптерный белок может быть обеспечен как условный или индуцируемый элемент с условным или индуцируемым ферментом Cas9 для обеспечения эффективной модели для скрининга, которая преимущественно требует только минимальной разработки и введения специфических gRNA для широкого диапазона применений.The present invention encompasses the use of the compositions of the present invention for the generation and use of conditional or inducible CRISPR transgenic cells/animals. (See, e.g., Platt et al., Cell (2014), http://dx.doi.org/10.1016/j.cell.2014.09.014, or the PCT patent publications cited therein, such as WO 2014/093622 (PCT/US2013/074667), which are not considered prior art to the present invention or application.) For example, the target cell comprises a conditionally dependent or inducible Cas9 CRISPR enzyme (e.g., in the form of Cre-dependent constructs) and/or a conditionally dependent or inducible adapter protein, and when the vector is expressed in the target cell, the vector expresses something that induces or provides a condition for the expression of the Cas9 enzyme and/or the expression of the adapter in the target cell. By using the ideas and compositions of the present invention with a known method for creating a CRISPR complex, inducible genome transformations that are affected by the functional domains are also an aspect of the present invention. One example of this is the generation of a CRISPR knockin/conditionally expressing transgenic animal (e.g., a mouse containing, for example, a Lox-Stop-polyA-Lox (LSL) cassette) and subsequent delivery of one or more compositions providing one or more modified guide RNAs (e.g., -200 nucleotides to the TSS in a target gene of interest for gene activation purposes) described herein (e.g., modified guide RNAs with one or more aptamers recognized by coat proteins, such as MS2), one or more adaptor proteins described herein (MS2 binding protein linked to one or more VP64), and means for inducing the animal to have conditionally expressing (e.g., Cre recombinase to provide inducible expression of Cas9). Alternatively, the adaptor protein can be provided as a conditional or inducible element with a conditional or inducible Cas9 enzyme to provide an efficient screening model that advantageously requires only minimal development and introduction of specific gRNAs for a wide range of applications.
Деактивированный/инактивированный белок CasDeactivated/inactivated Cas protein
Если белок Cas9 обладает нуклеазной активностью, то белок Cas9 может быть модифицирован с наличием сниженной нуклеазной активности, например, с инактивацией нуклеазы по меньшей мере на 70%, по меньшей мере на 80%, по меньшей мере на 90%, по меньшей мере на 95%, по меньшей мере на 97% или на 100% по сравнению с ферментом дикого типа; или, другими словами, фермент Cas9 обладает преимущественно приблизительно 0% нуклеазной активности немутированного или дикого типа фермента Cas9 или фермента CRISPR или не более чем приблизительно 3%, или приблизительно 5%, или приблизительно 10% нуклеазной активности немутированного или дикого типа фермента Cas9, например, немутированного или дикого типа фермента Cas9 или фермента CRISPR S. pyogenes. Это возможно путем введения мутаций в нуклеазные домены Cas9 и ее ортологов.If the Cas9 protein has nuclease activity, the Cas9 protein may be modified to have reduced nuclease activity, such as at least 70%, at least 80%, at least 90%, at least 95%, at least 97%, or 100% nuclease inactivation compared to the wild-type enzyme; or, in other words, the Cas9 enzyme has substantially about 0% of the nuclease activity of the unmutated or wild-type Cas9 enzyme or CRISPR enzyme, or no more than about 3%, or about 5%, or about 10% of the nuclease activity of the unmutated or wild-type Cas9 enzyme, such as the unmutated or wild-type Cas9 enzyme or CRISPR enzyme of S. pyogenes. This is possible by introducing mutations into the nuclease domains of Cas9 and its orthologs.
Инактивированный фермент Cas9 CRISPR может быть ассоциированным (например, посредством образования слитого белка) с одним или несколькими функциональными доменами, в том числе, например, с одним или несколькими доменами из группы, содержащей, состоящей в основном из, или состоящей из метилазной активности, деметилазной активности, активности в отношении активации транскрипции, активности репрессии транскрипции, активности фактора освобождения транскрипта, активности модификации гистонов, активности расщепления РНК, активности расщепления ДНК, активности связывания нуклеиновой кислоты и молекулярных переключателей (например, индуцируемых светом). Предпочтительными доменами являются Fok1, VP64, P65, HSF1, MyoD1. В случае обеспечения Fok1 предпочтительным является то, что несколько функциональных доменов Fok1 обеспечены для функционального димера и что sgRNA предназначены для обеспечения надлежащего интервала для функционального использования (Fok1), как конкретно описано в Tsai et al. Nature Biotechnology, Vol. 32, Number 6, June 2014). В адаптерном белке можно использовать известные линкеры для прикрепления таких функциональных доменов. В некоторых случаях предпочтительно, чтобы дополнительно обеспечивался по меньшей мере один NLS. В некоторых случаях предпочтительно положение NLS на N-конце. При включении более чем одного функционального домена функциональные домены могут быть одинаковыми или разными.The inactivated Cas9 CRISPR enzyme may be associated (e.g., by forming a fusion protein) with one or more functional domains, including, for example, one or more domains from the group comprising, consisting essentially of, or consisting of methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, RNA cleavage activity, DNA cleavage activity, nucleic acid binding activity, and molecular switches (e.g., light-inducible). Preferred domains are Fok1, VP64, P65, HSF1, MyoD1. In the case of providing Fok1, it is preferred that several functional domains of Fok1 are provided for a functional dimer and that the sgRNAs are designed to provide an appropriate spacing for functional use (Fok1), as specifically described in Tsai et al. Nature Biotechnology, Vol. 32, Number 6, June 2014). Known linkers can be used in the adapter protein to attach such functional domains. In some cases, it is preferable that at least one NLS is additionally provided. In some cases, the position of the NLS at the N-terminus is preferable. When including more than one functional domain, the functional domains can be the same or different.
В целом, размещение одного или нескольких функциональных доменом в инактивированном ферменте Cas9 обеспечивает корректную пространственную ориентацию функционального домена для воздействия на мишень с присущим функциональным эффектом. Например, если функциональный домен представляет собой активатор транскрипции (например, VP64 или p65), то активатор транскрипции размещается в пространственной ориентации, которая позволяет ему влиять на транскрипцию мишени. Подобным образом, репрессор транскрипции будет размещаться преимущественно, чтобы воздействовать на транскрипцию мишени, а нуклеаза (например, Fok1) будет размещаться преимущественно для расщепления или частичного расщепления мишени. Могут быть предусмотрены положения, отличные от N-/C-конца фермента CRISPR.In general, the placement of one or more functional domains in an inactivated Cas9 enzyme ensures the correct spatial orientation of the functional domain to act on the target with the intended functional effect. For example, if the functional domain is a transcriptional activator (e.g., VP64 or p65), the transcriptional activator is placed in a spatial orientation that allows it to affect transcription of the target. Similarly, a transcriptional repressor will be preferentially placed to affect transcription of the target, and a nuclease (e.g., Fok1) will be preferentially placed to cleave or partially cleave the target. Positions other than the N-/C-terminus of the CRISPR enzyme may be envisaged.
В одном варианте осуществления Cas9 может содержать одну или несколько мутаций (и, следовательно, молекула(молекулы) нуклеиновой кислоты, кодирующая(кодирующие) его, может(могут) иметь мутацию(мутации)). Мутации могут быть искусственно введенными мутациями и могут включать в себя без ограничения одну или несколько мутаций в каталитическом домене. Примеры каталитических доменов в отношении фермента Cas9 могут включать в себя без ограничения домены RuvC I, RuvC II, RuvC III и HNH.In one embodiment, Cas9 may comprise one or more mutations (and therefore the nucleic acid molecule(s) encoding it may have mutation(s)). The mutations may be artificially introduced mutations and may include, but are not limited to, one or more mutations in the catalytic domain. Examples of catalytic domains with respect to the Cas9 enzyme may include, but are not limited to, the RuvC I, RuvC II, RuvC III, and HNH domains.
В одном варианте осуществления Cas9 может содержать одну или несколько мутаций. Мутации могут быть искусственно введенными мутациями и могут включать в себя без ограничения одну или несколько мутаций в каталитическом домене для обеспечения никазы, например. Примеры каталитических доменов в отношении фермента Cas могут включать в себя без ограничения домены RuvC I, RuvC II, RuvC III и HNH.In one embodiment, Cas9 may contain one or more mutations. The mutations may be artificially introduced mutations and may include, but are not limited to, one or more mutations in the catalytic domain to provide a nickase, for example. Examples of catalytic domains for the Cas enzyme may include, but are not limited to, the RuvC I, RuvC II, RuvC III, and HNH domains.
В одном варианте осуществления Cas9 можно применять в качестве генерического связывающегося с нуклеиновой кислотой белка при слиянии или при функциональном связывании с функциональным доменом. Иллюстративные функциональные домены могут включать без ограничения инициатор трансляции, активатор трансляции, репрессор трансляции, нуклеазы, в частности, рибонуклеазы, сплайсосому, гранулы, индуцируемый/контролируемый светом домен или химически индуцируемый/контролируемый домен.In one embodiment, Cas9 can be used as a generic nucleic acid binding protein in fusion or in operative association with a functional domain. Exemplary functional domains can include, but are not limited to, a translation initiator, a translation activator, a translation repressor, nucleases, in particular ribonucleases, a spliceosome, granules, a light-inducible/controlled domain, or a chemically inducible/controlled domain.
В некоторых вариантах осуществления немодифицированный эффекторный белок для нацеливания на нуклеиновую кислоту может характеризоваться активностью расщепления. В некоторых вариантах осуществления эффекторный белок для нацеливания на РНК может управлять расщеплением одной или обеих нитей нуклеиновой кислоты (ДНК или РНК) в определенном положении целевой последовательностью или вблизи нее, как, например, в пределах целевой последовательности и/или в последовательности, комплементарной целевой последовательности, или в последовательностях, ассоциированных с целевой последовательностью. В некоторых вариантах осуществления, эффекторный белок для нацеливания на Cas9 может управлять расщеплением одной или обеих нитей ДНК или РНК в пределах приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 или более пар оснований от первого или последнего нуклеотида целевой последовательности. В некоторых вариантах осуществления расщепление может быть "тупым", т.е. образующим "тупые" концы. В некоторых вариантах осуществления расщепление может быть ступенчатым, т.е. образующим липкие концы. В некоторых вариантах осуществления расщепление может представлять собой ступенчатый разрыв с "липким" 5'-концом, например, с "липким" 5'-концом из 1-5 нуклеотидов. В некоторых вариантах осуществления расщепление может представлять собой ступенчатый разрыв с "липким" 3'-концом, например, с "липким" 3'-концом из 1-5 нуклеотидов. В некоторых вариантах осуществления вектор кодирует нацеливающийся на нуклеиновую кислоту белок Cas, который может быть мутированным по отношению к соответствующему ферменту дикого типа, так что у мутантного нацеливающегося на нуклеиновую кислоту белка Cas отсутствует способность расщеплять одну или обе нити ДНК или РНК целевого полинуклеотида, содержащего целевую последовательность. В качестве дополнительного примера два или более каталитических доменов Cas (RuvC I, RuvC II и RuvC III или домен HNH) можно подвергать мутациям с получением мутированного Cas, у которого практически полностью отсутствует активность расщепления РНК. Описываемые в данном документе соответствующие каталитические домены эффекторного белка Cas9 также могут быть мутированы с получением мутированного Cas9, не обладающего полной активностью расщепления ДНК или обладающего, по сути, пониженной активностью расщепления ДНК. В некоторых вариантах осуществления нацеливающийся на нуклеиновую кислоту эффекторный белок можно считать, по сути, не обладающим полной активностью расщепления РНК, если активность расщепления РНК у мутированного фермента составляет не более чем приблизительно 25%, 10%, 5%, 1%, 0,1%, 0,01% или меньше от активности расщепления нуклеиновой кислоты немутированной формы фермента; примером может служить случай, когда активность расщепления ДНК у мутированной формы отсутствует или несущественна по сравнению с немутированной формой. Эффекторный белок может быть идентифицирован относительно общего класса ферментов, обладающих гомологией с самой большой нуклеазой с несколькими нуклеазными доменами системы CRISPR II типа. Наиболее предпочтительно, эффекторные белок является белком II типа, таким как Cas9. Под происходящим заявители подразумевают, что в основе происходящего фермента главным образом лежит фермент дикого типа в том смысле, что он характеризуется высокой степенью гомологии последовательности с этим ферментом, но он был некоторым образом подвергнут мутации (модифицирован), как известно из уровня техники или описано в данном документе.In some embodiments, an unmodified nucleic acid targeting effector protein may have a cleavage activity. In some embodiments, an RNA targeting effector protein may direct the cleavage of one or both strands of a nucleic acid (DNA or RNA) at a specific position by or near a target sequence, such as within the target sequence and/or in a sequence complementary to the target sequence or in sequences associated with the target sequence. In some embodiments, a Cas9 targeting effector protein may direct the cleavage of one or both strands of DNA or RNA within about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 or more base pairs of the first or last nucleotide of the target sequence. In some embodiments, the cleavage may be "blunt", i.e., forming "blunt" ends. In some embodiments, the cleavage may be staggered, i.e., forming sticky ends. In some embodiments, the cleavage may be a staggered break with a 5' sticky end, such as a 1-5 nucleotide 5' sticky end. In some embodiments, the cleavage may be a staggered break with a 3' sticky end, such as a 1-5 nucleotide 3' sticky end. In some embodiments, the vector encodes a nucleic acid targeting Cas protein that may be mutated relative to the corresponding wild-type enzyme such that the mutant nucleic acid targeting Cas protein lacks the ability to cleave one or both strands of DNA or RNA of a target polynucleotide containing a target sequence. As a further example, two or more catalytic domains of Cas (RuvC I, RuvC II, and RuvC III, or the HNH domain) can be mutated to produce a mutated Cas that lacks substantially all RNA cleavage activity. The corresponding catalytic domains of the Cas9 effector protein described herein can also be mutated to produce a mutated Cas9 that lacks full DNA cleavage activity or has substantially reduced DNA cleavage activity. In some embodiments, a nucleic acid targeting effector protein can be considered to lack substantially all RNA cleavage activity if the RNA cleavage activity of the mutated enzyme is no more than about 25%, 10%, 5%, 1%, 0.1%, 0.01%, or less of the nucleic acid cleavage activity of the unmutated form of the enzyme; an example would be where the DNA cleavage activity of the mutated form is absent or insignificant compared to the unmutated form. The effector protein can be identified relative to a general class of enzymes that have homology to the largest multiple nuclease domain nuclease of the Type II CRISPR system. Most preferably, the effector protein is a Type II protein such as Cas9. By "derived" the applicants mean that the derived enzyme is essentially based on the wild-type enzyme in the sense that it has a high degree of sequence homology to that enzyme, but has been mutated (modified) in some manner as known in the art or described herein.
Опять-таки, следует учитывать, что термины Cas, и фермент CRISPR, и белок CRISPR, и белок Cas, как правило, используют взаимозаменяемо, и при всех упоминаниях в данном документе они относятся по аналогии к новым эффекторным белкам CRISPR, далее описываемым в настоящей заявке, если иное не очевидно, например, конкретным упоминанием Cas9. Как упоминается выше, многие из порядков нумерации остатков, используемых в данном документе, относятся к эффекторному белку из локуса CRISPR II типа. Однако следует учитывать, что настоящее изобретение включает намного больше эффекторных белков из других видов микроорганизмов.Again, it should be appreciated that the terms Cas and CRISPR enzyme and CRISPR protein and Cas protein are generally used interchangeably and, in all references herein, refer by analogy to the novel CRISPR effector proteins further described in the present application, unless otherwise obvious, such as by specific reference to Cas9. As mentioned above, many of the residue numbering orders used herein refer to the effector protein from the type II CRISPR locus. However, it should be appreciated that the present invention includes many more effector proteins from other microbial species.
Перечень организмов в качестве возможного источника белка CasList of organisms as a possible source of Cas protein
Белок Cas может включать в себя белок Cas из организма рода, включающего в себя Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium или Corynebacter.The Cas protein may include a Cas protein from an organism of the genus Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, or Corynebacter.
Белок Cas9 может включать в себя белок Cas9 из организма рода, включающего в себя Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium или Corynebacter.The Cas9 protein may include a Cas9 protein from an organism of the genus Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, or Corynebacter.
Предпочтительные примеры включают в себя S. pyogenes, S. aureus.Preferred examples include S. pyogenes, S. aureus.
В одном варианте осуществления белок Cas9 может быть ортологом из организма рода, включающего в себя без ограничения Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus, Nitratifractor, Mycoplasma и Campylobacter. Виды организма такого рода могут быть иными, обсуждаемыми в данном документе.In one embodiment, the Cas9 protein may be an ortholog from an organism of a genus including, but not limited to, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus, Nitratifractor, Mycoplasma, and Campylobacter. The species of such organism may be other than those discussed herein.
Некоторые способы идентификации ортологов ферментов системы CRISPR-Cas могут предусматривать идентификацию tracr-последовательностей в представляющих интерес геномах. Идентификация tracr-последовательностей может заключаться в следующих стадиях: поиска прямых повторов или парных tracr-последовательностей в базе данных для идентификации участка CRISPR, содержащего фермент CRISPR; поиска гомологичных последовательностей в участке CRISPR, фланкирующем фермент CRISPR как в смысловом, так и в антисмысловом направлениях; поиска терминаторов транскрипции и вторичных структур; идентификации какой-либо последовательности, которая не является прямым повтором или парной tracr-последовательностью, но обладает более чем 50% идентичностью в отношении прямого повтора или парной tracr-последовательности, в качестве потенциальной tracr-последовательности; получения потенциальной tracr-последовательности и анализа на предмет ассоциированных с ней последовательностей терминатора транскрипции.Some methods for identifying orthologs of CRISPR-Cas enzymes may involve identifying tracr sequences in the genomes of interest. Identifying tracr sequences may involve the following steps: searching a database for direct repeats or tracr mate sequences to identify the CRISPR region containing the CRISPR enzyme; searching for homologous sequences in the CRISPR region flanking the CRISPR enzyme in both the sense and antisense directions; searching for transcription terminators and secondary structures; identifying any sequence that is not a direct repeat or tracr mate sequence but has greater than 50% identity to a direct repeat or tracr mate sequence as a potential tracr sequence; obtaining a potential tracr sequence and analyzing it for associated transcription terminator sequences.
Следует учитывать, что любое из функциональных свойств, описанных в данном документе, может быть сконструировано в ферментах CRISPR от других ортологов, в том числе химерных ферментов, содержащих фрагменты из нескольких ортологов. Примеры таких ортологов описываются в других разделах настоящего документа. Таким образом, химерные ферменты может включать в себя фрагменты ортологов фермента CRISPR из организма, который включает в себя без ограничения Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus, Nitratifractor, Mycoplasma и Campylobacter. Химерный фермент может содержать первый фрагмент и второй фрагмент, и при этом фрагментами могут быть ортологи фермента CRISPR из организмов родов, упоминаемых в данном документе, или из видов, упоминаемых в данном документе; преимущественно фрагменты являются фрагментами ортологов фермента CRISPR из различных видов.It should be appreciated that any of the functional properties described herein may be engineered into CRISPR enzymes from other orthologs, including chimeric enzymes comprising fragments from multiple orthologs. Examples of such orthologs are described elsewhere in this document. Thus, chimeric enzymes may include fragments of orthologs of a CRISPR enzyme from an organism that includes, but is not limited to, Corynebacter, Sutterella, Legionella, Treponema, Filifactor, Eubacterium, Streptococcus, Lactobacillus, Mycoplasma, Bacteroides, Flaviivola, Flavobacterium, Sphaerochaeta, Azospirillum, Gluconacetobacter, Neisseria, Roseburia, Parvibaculum, Staphylococcus, Nitratifractor, Mycoplasma, and Campylobacter. The chimeric enzyme may comprise a first fragment and a second fragment, and wherein the fragments may be orthologs of a CRISPR enzyme from organisms of the genera referred to herein or from species referred to herein; preferably, the fragments are fragments of orthologs of a CRISPR enzyme from different species.
Для сведения к минимуму токсичности и нецелевого эффекта будет важной регуляция концентрации доставляемых мРНК фермента CRISPR и направляющей РНК. Оптимальные концентрации мРНК фермента CRISPR и направляющей РНК можно определить путем тестирования различных концентраций в клеточной или животной модели и применения глубокого секвенирования для анализа степени модификации в возможных нецелевых локусах генома. Например, для направляющей последовательности, нацеливающейся на 5'-GAGTCCGAGCAGAAGAAGAA-3' в гене EMX1 генома человека, можно применять глубокое секвенирование для определения уровня модификации в следующих двух нецелевых локусах: 1: 5'-GAGTCCTAGCAGGAGAAGAA-3' и 2: 5'-GAGTCTAAGCAGAAGAAGAA-3'. Для доставки in vivo следует выбрать концентрацию, дающую наиболее высокий уровень целевой модификации при сведении к минимуму уровня нецелевой модификации.To minimize toxicity and off-target effects, regulation of the concentration of CRISPR enzyme mRNA and guide RNA delivered will be important. Optimal concentrations of CRISPR enzyme mRNA and guide RNA can be determined by testing different concentrations in a cell or animal model and using deep sequencing to analyze the degree of modification at potential off-target loci in the genome. For example, for a guide sequence targeting 5'-GAGTCCGAGCAGAAGAAGAA-3' in the EMX1 gene of the human genome, deep sequencing can be used to determine the level of modification at the following two off-target loci: 1: 5'-GAGTCCTAGCAGGAGAAGAA-3' and 2: 5'-GAGTCTAAGCAGAAGAAGAA-3'. For in vivo delivery, the concentration that results in the highest level of on-target modification while minimizing the level of off-target modification should be selected.
Доставка: варианты для ДНК/РНК, или ДНК/ДНК, или РНК/РНК, или белок/РНКDelivery: options for DNA/RNA, or DNA/DNA, or RNA/RNA, or protein/RNA
В некоторых вариантах осуществления компоненты системы CRISPR могут быть доставлены в различной форме, такой как комбинации ДНК/РНК, или РНК/РНК, или белок/РНК. Например, Cas9 может быть доставлен в виде кодирующего ДНК полинуклеотида, или кодирующего РНК полинуклеотида, или в виде белка. Направляющая может быть доставлена в виде кодирующего ДНК полинуклеотида или РНК. Предусматриваются все возможные комбинации, в том числе смешанные формы доставки.In some embodiments, the components of the CRISPR system may be delivered in various forms, such as DNA/RNA, or RNA/RNA, or protein/RNA combinations. For example, Cas9 may be delivered as a DNA-encoding polynucleotide, or an RNA-encoding polynucleotide, or as a protein. The guide may be delivered as a DNA-encoding polynucleotide or RNA. All possible combinations are contemplated, including mixed forms of delivery.
В некоторых вариантах осуществления предусматриваются все такие комбинации (ДНК/РНК, или ДНК/ДНК, или РНК/РНК, или белок/РНК).In some embodiments, all such combinations (DNA/RNA, or DNA/DNA, or RNA/RNA, or protein/RNA) are provided.
В определенном варианте осуществления, если Cas9 доставляют в форме белка, то можно предварительно собрать его с одной или несколькими направляющими.In a particular embodiment, if Cas9 is delivered in protein form, it may be pre-assembled with one or more guides.
Доставка: нанококоныDelivery: nanocones
Кроме того, система CRISPR может быть доставлена с использованием нанококонов, например, как описывается у Sun W et al., Cocoon-like self-degradable DNA nanoclew for anticancer drug delivery., J Am Chem Soc. 2014 Oct 22;136(42):14722-5. doi: 10.1021/ja5088024. Epub 2014 Oct 13. ; или у Sun W et al, Self-Assembled DNA Nanoclews for the Efficient Delivery of CRISPR-Cas9 for Genome Editing., Angew Chem Int Ed Engl. 2015 Oct 5;54(41):12029-33. doi: 10.1002/anie.201506030. Epub 2015 Aug 27.In addition, the CRISPR system can be delivered using nanococoons, such as described in Sun W et al., Cocoon-like self-degradable DNA nanoclew for anticancer drug delivery., J Am Chem Soc. 2014 Oct 22;136(42):14722-5. doi: 10.1021/ja5088024. Epub 2014 Oct 13. ; or in Sun W et al, Self-Assembled DNA Nanoclews for the Efficient Delivery of CRISPR-Cas9 for Genome Editing., Angew Chem Int Ed Engl. 2015 Oct 5;54(41):12029-33. doi: 10.1002/anie.201506030. Epub 2015 Aug 27.
Доставка - GalNAcDelivery - GalNAc
Компоненты комплекса CRISPR могут быть доставлены с помощью конъюгации или ассоциации с транспортными фрагментами (адаптированными, например, из подходов, раскрытых в патентах США №№ 8106022; 8313772, включенных в данный документ посредством ссылки). Стратегии доставки нуклеиновой кислоты, например, можно применять для улучшения доставки направляющей РНК, или информационных РНК, или кодирующих ДНК, кодирующих компоненты комплекса CRISPR, в том числе белка CRISPR. Например, РНК могут включать модифицированные нуклеотиды РНК для улучшения стабильности, понижения иммуностимуляции и/или улучшения специфичности (см. Deleavey, Glen F. et al., 2012, Chemistry & Biology , Volume 19 , Issue 8 , 937 - 954; Zalipsky, 1995, Advanced Drug Delivery Reviews 16: 157-182; Caliceti and Veronese, 2003, Advanced Drug Delivery Reviews 55: 1261-1277). Были описаны различные конструкции, которые можно применять для модификации нуклеиновых кислот, таких как gRNA, для более эффективной доставки, например, обратимые нейтрализующие заряд модификации фосфотриэфирного скелета, которые могут быть адаптированы для модификации gRNA так, что они будут более гидрофобными и неанионными, с улучшением тем самым попадания в клетку (Meade BR et al., 2014, Nature Biotechnology 32,1256-1261). В следующих альтернативных вариантах осуществления выбранные мотивы РНК могут быть применимы для опосредования клеточной трансфекции (Magalhães M., et al., Molecular Therapy (2012); 20 3, 616-624). Подобным образом, аптамеры могут быть адаптированы для доставки компонентов комплекса CRISPR, например, с помощью добавления аптамеров к gRNA (Tan W. et al., 2011, Trends in Biotechnology, December 2011, Vol. 29, No. 12).The components of the CRISPR complex can be delivered by conjugation or association with transport moieties (adapted, for example, from the approaches disclosed in U.S. Patent Nos. 8,106,022; 8,313,772, incorporated herein by reference). Nucleic acid delivery strategies, for example, can be used to improve the delivery of guide RNA, or messenger RNA, or coding DNA encoding components of the CRISPR complex, including the CRISPR protein. For example, RNAs may include modified RNA nucleotides to improve stability, reduce immunostimulation, and/or improve specificity (see Deleavey, Glen F. et al., 2012, Chemistry & Biology , Volume 19 , Issue 8 , 937 - 954; Zalipsky, 1995, Advanced Drug Delivery Reviews 16: 157-182; Caliceti and Veronese, 2003, Advanced Drug Delivery Reviews 55: 1261-1277). Various constructs have been described that can be used to modify nucleic acids such as gRNA for more efficient delivery, such as reversible charge neutralizing modifications of the phosphotriester backbone that can be adapted to modify gRNA to be more hydrophobic and non-anionic, thereby improving cellular uptake (Meade BR et al., 2014, Nature Biotechnology 32, 1256-1261). In further alternative embodiments, selected RNA motifs can be used to mediate cellular transfection (Magalhães M., et al., Molecular Therapy (2012); 20 3, 616-624). Similarly, aptamers can be adapted to deliver components of the CRISPR complex, for example by adding aptamers to gRNA (Tan W. et al., 2011, Trends in Biotechnology, December 2011, Vol. 29, No. 12).
В некоторых вариантах осуществления конъюгацию трехразветвленного N-ацетилгалактозамина (GalNAc) с олигонуклеотидными компонентами можно применять для улучшения доставки, например, доставки для отбора типов клеток, например, гепатоцитов (см., WO2014118272, включенную в данный документ посредством ссылки; Nair, JK et al., 2014, Journal of the American Chemical Society 136 (49), 16958-16961). Это можно рассматривать как частицу на основе сахара, и дополнительные подробности о других системах доставки в виде частиц и/или составах приведены в данном документе в соответствующем разделе. Поэтому GalNAc можно рассматривать как частицу в том же смысле, что и другие частицы, описываемые в данном документе, так что общие применения и другие соображения, например, доставка указанных частиц, также применимы к частицам GalNAc. Стратегия конъюгации из жидкой фазы, например, может быть использована для присоединения кластеров трехразветвленных GalNAc (молекулярная масса ~2000), активированных как PFP (пентафторфенильные) сложные эфиры, к 5′-гексиламино-модифицированным олигонуклеотидам (5′-HA ASO, молекулярная масса ~8000 Да; ∅stergaard et al., Bioconjugate Chem., 2015, 26 (8), pp 1451-1455). Подобным образом, были описаны поли(акрилатные) полимеры для доставки нуклеиновой кислоты in vivo (см. WO2013158141, включенную в данный документ посредством ссылки). В следующих альтернативных вариантах осуществления предварительное смешивание наночастиц CRISPR (или белковых комплексов) со встречающимися в природе сывороточными белками можно применять для улучшения доставки (Akinc A et al, 2010, Molecular Therapy vol. 18 no. 7, 1357-1364).In some embodiments, conjugation of tri-branched N-acetylgalactosamine (GalNAc) to oligonucleotide components can be used to improve delivery, such as delivery for selection of cell types, such as hepatocytes (see, WO2014118272, incorporated herein by reference; Nair, JK et al., 2014, Journal of the American Chemical Society 136 (49), 16958-16961). This can be considered a sugar-based particle, and further details on other particulate delivery systems and/or formulations are provided in the relevant section herein. Therefore, GalNAc can be considered a particle in the same sense as the other particles described herein, such that the general applications and other considerations, such as delivery of said particles, also apply to GalNAc particles. A liquid phase conjugation strategy, for example, can be used to attach tri-branched GalNAc clusters (MW ~2000), activated as PFP (pentafluorophenyl) esters, to 5′-hexylamino-modified oligonucleotides (5′-HA ASO, MW ~8000 Da; ∅stergaard et al., Bioconjugate Chem., 2015, 26 (8), pp 1451-1455). Similarly, poly(acrylate) polymers have been described for in vivo nucleic acid delivery (see WO2013158141, incorporated herein by reference). In further alternative embodiments, pre-mixing of CRISPR nanoparticles (or protein complexes) with naturally occurring whey proteins can be used to improve delivery (Akinc A et al, 2010, Molecular Therapy vol. 18 no. 7, 1357-1364).
Доступны методики скрининга для идентификации доставленных энхансеров, например, с помощью скрининга химических библиотек (Gilleron J. et al., 2015, Nucl. Acids Res. 43 (16): 7984-8001). Также были описаны подходы для оценивания эффективности средств доставки, таких как липидные наночастицы, которые могут быть использованы для идентификации эффективных носителей доставки для компонентов CRISPR (см. Sahay G. et al., 2013, Nature Biotechnology 31, 653-658).Screening methodologies are available to identify delivered enhancers, such as by screening chemical libraries (Gilleron J. et al., 2015, Nucl. Acids Res. 43 (16): 7984-8001). Approaches to assess the efficiency of delivery vehicles, such as lipid nanoparticles, have also been described, which can be used to identify efficient delivery vehicles for CRISPR components (see Sahay G. et al., 2013, Nature Biotechnology 31, 653-658).
В некоторых вариантах осуществления доставка компонентов белка CRISPR может быть облегчена добавлением функциональных пептидов к белку, таких как пептиды, которые изменяют гидрофобность белка, например, для улучшения функциональности in vivo. Белковые компоненты комплекса CRISPR, подобным образом, могут быть модифицированы для облегчения последующих химических реакций. Например, к белку могут быть добавлены аминокислоты, которые имеют группу, подвергаемую клик-химии (Nikić I. et al., 2015, Nature Protocols 10,780-791). В вариантах осуществления такого рода клик-химическая группа затем может быть использована в широком ряде альтернативных структур, например, поли(этиленгликоль) для стабильности, проникающие в клетку пептиды, аптамеры РНК, липиды или углеводы, такие как GalNAc. В качестве дополнительных альтернатив, белковый компонент комплекса CRISPR может быть модифицирован для адаптации белка для попадания в клетку (см. Svensen et al., 2012, Trends in Pharmacological Sciences, Vol. 33, No. 4), например, путем добавления проникающих в клетку пептидов к белку (см. Kauffman, W. Berkeley et al., 2015, Trends in Biochemical Sciences, Volume 40, Issue 12 , 749 - 764; Koren and Torchilin, 2012, Trends in Molecular Medicine, Vol. 18, No. 7). В следующих альтернативных вариантах осуществления пациенты или субъекты могут предварительно получать соединения или составы, которые облегчают последующую доставку компонентов комплекса CRISPR.In some embodiments, delivery of CRISPR protein components can be facilitated by adding functional peptides to the protein, such as peptides that alter the hydrophobicity of the protein, such as to improve in vivo functionality. Protein components of the CRISPR complex can similarly be modified to facilitate subsequent chemical reactions. For example, amino acids that have a group susceptible to click chemistry can be added to the protein (Nikić I. et al., 2015, Nature Protocols 10,780-791). In embodiments, such a click chemistry group can then be used in a wide variety of alternative structures, such as poly(ethylene glycol) for stability, cell penetrating peptides, RNA aptamers, lipids, or carbohydrates such as GalNAc. As further alternatives, the protein component of the CRISPR complex can be modified to tailor the protein for cell entry (see Svensen et al., 2012, Trends in Pharmacological Sciences, Vol. 33, No. 4), such as by adding cell-penetrating peptides to the protein (see Kauffman, W. Berkeley et al., 2015, Trends in Biochemical Sciences, Volume 40, Issue 12, 749-764; Koren and Torchilin, 2012, Trends in Molecular Medicine, Vol. 18, No. 7). In further alternative embodiments, patients or subjects can be pre-treated with compounds or formulations that facilitate subsequent delivery of the CRISPR complex components.
Индуцируемые системыInduced systems
В некоторых вариантах осуществления фермент CRISPR может образовывать компонент индуцируемой системы. Индуцируемая природа системы будет обеспечивать возможность пространственно-временного контроля редактирования генов или экспрессии генов с использованием определенной формы энергии. Форма энергии может включать, но без ограничения, электромагнитное излучение, звуковую энергию, химическую энергию и тепловую энергию. Примеры индуцируемой системы включают индуцируемые тетрациклином промоторы (Tet-On или Tet-Off), двухгибридные системы активации транскрипции с использованием малых молекул (FKBP, ABA и т.д.) или индуцируемые светом системы (фитохром, домены LOV или криптохром). В одном варианте осуществления фермент CRISPR может быть частью индуцируемого светом транскрипционного эффектора (LITE) для управления изменениями транскрипционной активности специфичным к последовательности образом. Компоненты индуцируемой светом системы могут включать фермент CRISPR, чувствительный к свету гетеродимер цитохрома (например, из Arabidopsis thaliana) и домен активации/репрессии транскрипции. Дополнительные примеры индуцируемых ДНК-связывающих белков и способы их применения представлены в US 61/736465, US 61/721283 и WO 2014/018423, которые включены в данный документ посредством ссылки во всей полноте.In some embodiments, the CRISPR enzyme may form a component of an inducible system. The inducible nature of the system will allow for spatiotemporal control of gene editing or gene expression using a form of energy. The form of energy may include, but is not limited to, electromagnetic radiation, sound energy, chemical energy, and thermal energy. Examples of an inducible system include tetracycline-inducible promoters (Tet-On or Tet-Off), small molecule two-hybrid transcriptional activation systems (FKBP, ABA, etc.), or light-inducible systems (phytochrome, LOV, or cryptochrome domains). In one embodiment, the CRISPR enzyme may be part of a light-inducible transcriptional effector (LITE) to drive changes in transcriptional activity in a sequence-specific manner. Components of a light-inducible system may include a CRISPR enzyme, a light-sensitive cytochrome heterodimer (e.g., from Arabidopsis thaliana), and a transcriptional activation/repression domain. Additional examples of inducible DNA binding proteins and methods of using them are provided in US 61/736,465, US 61/721,283 and WO 2014/018423, which are incorporated herein by reference in their entireties.
Самоинактивирующиеся системыSelf-inactivating systems
Как только все копии гена в геноме клетки подвергли редактированию, дальнейшая экспрессия CRISRP/Cas9 в такой клетке более не требуется. В действительности, поддержание экспрессии было бы нежелательным в случае нецелевых эффектов в сайтах генома, не предназначенных для редактирования и т.д. Таким образом, целесообразной была бы ограниченная во времени экспрессия. Индуцируемая экспрессия предоставляет одно решение проблемы, но помимо нее заявители сконструировали самоинактивирующуюся систему CRISPR-Cas9, которая основана на применении некодирующей направляющей целевой последовательности в самом векторе, несущем CRISPR. Таким образом, после того как экспрессия началась, система CRISPR будет вызывать собственное разрушение, но перед тем как разрушение завершится, у нее будет достаточно времени для редактирования геномных копий целевого гена (для чего, с точки зрения нормальной точечной мутации в диплоидной клетке, потребуется не более двух редактирований). Вкратце, самоинактивирующаяся система CRISPR-Cas включает в себя дополнительную РНК (т. e. направляющую РНК), которая нацеливает кодирующую последовательность для самого фермента CRISPR или которая нацеливает одну или несколько некодирующих направляющих целевых последовательностей, комплементарных уникальным последовательностям, присутствующим в одной или нескольких из следующих:Once all copies of a gene in a cell's genome have been edited, further CRISRP/Cas9 expression in that cell is no longer required. Indeed, maintaining expression would be undesirable in the event of off-target effects at sites in the genome not intended for editing, etc. Thus, time-limited expression would be desirable. Inducible expression provides one solution to this problem, but the applicants have also constructed a self-inactivating CRISPR-Cas9 system that relies on the use of a non-coding targeting guide sequence in the CRISPR vector itself. Thus, once expression has begun, the CRISPR system will cause its own destruction, but before the destruction is complete, it will have enough time to edit the genomic copies of the target gene (which, in terms of a normal point mutation in a diploid cell, would require no more than two edits). Briefly, the self-inactivating CRISPR-Cas system includes an additional RNA (i.e., a guide RNA) that targets a coding sequence for the CRISPR enzyme itself or that targets one or more non-coding guide target sequences complementary to unique sequences present in one or more of the following:
(a) в промоторе, управляющем экспрессией элементов некодирующей РНК,(a) in the promoter that controls the expression of non-coding RNA elements,
(b) в промоторе, управляющем экспрессией гена Cas9,(b) in the promoter driving the expression of the Cas9 gene,
(c) в последовательности в 100 п. о. инициирующего трансляцию стартового ATG-кодона в кодирующей последовательности Cas9,(c) in the 100 bp sequence of the translation initiation start codon ATG in the Cas9 coding sequence,
(d) в инвертированном концевом повторе (iTR) вирусного вектора для доставки, например, в геноме AAV.(d) in the inverted terminal repeat (iTR) of a viral delivery vector, such as in the AAV genome.
Более того, такую РНК можно доставлять посредством вектора, например, отдельного вектора или того же вектора, который кодирует комплекс CRISPR. Когда введение осуществляют с помощью отдельного вектора, то РНК CRISPR, которая целенаправленно воздействует на экспрессию Cas, можно вводить последовательно или одновременно. При последовательном введении РНК CRISPR, которая целенаправленно воздействует на экспрессию Cas, можно доставлять после РНК CRISPR, которая предназначена, например, для редактирования генов или рекомбинации генов. Данный период может быть периодом, исчисляемым в минутах (например, 5 минут, 10 минут, 20 минут, 30 минут, 45 минут, 60 минут). Данный период может быть периодом, исчисляемым в часах (например, 2 часа, 4 часа, 6 часов, 8 часов, 12 часов, 24 часа). Данный период может быть периодом, исчисляемым в днях (например, 2 дня, 3 дня, 4 дня, 7 дней). Данный период может быть периодом, исчисляемым в неделях (например, 2 недели, 3 недели, 4 недели). Данный период может быть периодом, исчисляемым в месяцах (например, 2 месяца, 4 месяца, 8 месяцев, 12 месяцев). Данный период может быть периодом, исчисляемым в годах (например, 2 года, 3 года, 4 года). Таким путем, фермент Cas связывается с первой gRNA/chiRNA, способной гибридизироваться с первой мишенью, такой как представляющие интерес локус или локусы генома, и выполняет функцию (функции), требующиеся для системы CRISPR-Cas (например, редактирование генов); и впоследствии фермент Cas может затем ассоциироваться со второй gRNA/chiRNA, способной гибридизироваться с последовательностью, содержащей по меньшей мере часть кассеты Cas или CRISPR. Если gRNA/chiRNA целенаправленно воздействуют на последовательности, кодирующие экспрессию белка Cas, фермент блокируется, а система становится самоинактивирующейся. Аналогичным образом, РНК CRISPR, которая целенаправленно воздействует на экспрессию Cas, введенного посредством, например, липосомы, липофекции, частиц, микровезикул, что объясняется в данном документе, можно вводить последовательно или одновременно. Проще говоря, самоинактивацию можно применять для инактивации одой или нескольких направляющих РНК, используемых для целенаправленного воздействия одной или нескольких мишеней.Moreover, such RNA can be delivered via a vector, such as a separate vector or the same vector that encodes the CRISPR complex. When administered via a separate vector, the CRISPR RNA that targets Cas expression can be administered sequentially or simultaneously. When administered sequentially, the CRISPR RNA that targets Cas expression can be delivered after the CRISPR RNA that is intended, for example, for gene editing or gene recombination. The period can be a period measured in minutes (e.g., 5 minutes, 10 minutes, 20 minutes, 30 minutes, 45 minutes, 60 minutes). The period can be a period measured in hours (e.g., 2 hours, 4 hours, 6 hours, 8 hours, 12 hours, 24 hours). The period can be a period measured in days (e.g., 2 days, 3 days, 4 days, 7 days). The period may be a period measured in weeks (e.g., 2 weeks, 3 weeks, 4 weeks). The period may be a period measured in months (e.g., 2 months, 4 months, 8 months, 12 months). The period may be a period measured in years (e.g., 2 years, 3 years, 4 years). In this way, the Cas enzyme binds to a first gRNA/chiRNA capable of hybridizing to a first target, such as a genomic locus or loci of interest, and performs the function(s) required for the CRISPR-Cas system (e.g., gene editing); and subsequently, the Cas enzyme may then associate with a second gRNA/chiRNA capable of hybridizing to a sequence containing at least a portion of the Cas or CRISPR cassette. If the gRNA/chiRNA is targeted to sequences encoding the expression of the Cas protein, the enzyme is blocked and the system becomes self-inactivating. Similarly, CRISPR RNA that targets the expression of Cas delivered via, for example, liposome, lipofection, particles, microvesicles, as explained in this paper, can be delivered sequentially or simultaneously. In simple terms, self-inactivation can be used to inactivate one or more guide RNAs used to target one or more targets.
В ряде аспектов обеспечивается одиночная gRNA, которая способна гибридизироваться с последовательностью, расположенной ниже стартового кодона фермента CRISPR, при этом после определенного периода времени происходит потеря экспрессии фермента CRISPR. В ряде аспектов обеспечиваются одна или несколько gRNA, которые способны гибридизироваться с одной или несколькими кодирующими или некодирующими участками полинуклеотида, кодирующего систему CRISPR-Cas, при этом после определенного периода времени происходит инактивация одной или нескольких, или в ряде случаев, всех систем CRISPR-Cas. В ряде аспектов системы и не ограничиваясь теорией клетка может содержать множество комплексов CRISPR-Cas, где первое подмножество комплексов CRISPR содержит первую chiRNA, способную целенаправленно воздействовать на подлежащие редактированию локус или локусы генома, а второе подмножество комплексов CRISPR содержит по меньшей мере одну вторую chiRNA, способную целенаправленно воздействовать на полинуклеотид, кодирующий систему CRISPR-Cas, где первое подмножество комплексов CRISPR-Cas опосредует редактирование целевых локуса или локусов генома, а второе подмножество комплексов CRISPR впоследствии инактивирует систему CRISPR-Cas, инактивируя тем самым в дальнейшем экспрессию CRISPR-Cas в клетке.In some aspects, a single gRNA is provided that is capable of hybridizing to a sequence downstream of a start codon of a CRISPR enzyme, wherein after a certain period of time, there is a loss of expression of the CRISPR enzyme. In some aspects, one or more gRNAs are provided that are capable of hybridizing to one or more coding or non-coding regions of a polynucleotide encoding a CRISPR-Cas system, wherein after a certain period of time, there is inactivation of one or more, or in some cases, all, of the CRISPR-Cas systems. In some aspects of the system and without being limited by theory, a cell can comprise a plurality of CRISPR-Cas complexes, wherein a first subset of the CRISPR complexes comprises a first chiRNA capable of targeting a locus or loci of the genome to be edited, and a second subset of the CRISPR complexes comprises at least one second chiRNA capable of targeting a polynucleotide encoding a CRISPR-Cas system, wherein the first subset of the CRISPR-Cas complexes mediate editing of the target locus or loci of the genome, and the second subset of the CRISPR complexes subsequently inactivate the CRISPR-Cas system, thereby further inactivating CRISPR-Cas expression in the cell.
Таким образом, настоящее изобретение относится к системе CRISPR-Cas, содержащей один или несколько векторов для доставки в эукариотическую клетку, где вектор(векторы) кодирует(кодируют): (i) фермент CRISPR; (ii) первую направляющую РНК, способную гибридизироваться с целевой последовательностью в клетке; (iii) вторую направляющую РНК, способную гибридизироваться с одной или несколькими целевыми последовательностями в векторе, который кодирует фермент CRISPR; (iv) по меньшей мере одну парную tracr-последовательность и (v) по меньшей мере одну tracr-последовательность. В первом и втором комплексах можно использовать одинаковые tracr и парную tracr, отличающиеся при этом лишь по направляющей последовательности, где при экспрессии в клетке первая направляющая РНК управляет специфическим к последовательности связыванием первого комплекса CRISPR с последовательностью в клетке; вторая направляющая РНК управляет специфическим к последовательности связыванием второго комплекса CRISPR с целевой последовательностью в векторе, который кодирует фермент CRISPR; при этом комплексы CRISPR содержат (a) парную tracr-последовательность, гибридизированную с tracr-последовательностью, а (b) фермент CRISPR связан с направляющей РНК таким образом, чтобы направляющая РНК могла гибридизироваться со своей целевой последовательностью; а второй комплекс CRISPR инактивирует систему CRISPR-Cas для предупреждения дальнейшей экспрессии клеткой фермента CRISPR.Thus, the present invention relates to a CRISPR-Cas system comprising one or more vectors for delivery into a eukaryotic cell, wherein the vector(s) encode(s): (i) a CRISPR enzyme; (ii) a first guide RNA capable of hybridizing to a target sequence in the cell; (iii) a second guide RNA capable of hybridizing to one or more target sequences in a vector that encodes the CRISPR enzyme; (iv) at least one tracr mate sequence; and (v) at least one tracr sequence. The first and second complexes may use the same tracr and tracr mate, differing only in the guide sequence, wherein, upon expression in the cell, the first guide RNA directs sequence-specific binding of the first CRISPR complex to a sequence in the cell; the second guide RNA directs sequence-specific binding of the second CRISPR complex to a target sequence in the vector that encodes the CRISPR enzyme; wherein the CRISPR complexes comprise (a) a tracr mate sequence hybridized to a tracr sequence, and (b) a CRISPR enzyme associated with a guide RNA such that the guide RNA can hybridize to its target sequence; and a second CRISPR complex inactivates the CRISPR-Cas system to prevent further expression of the CRISPR enzyme by the cell.
Дополнительные характеристики вектора(векторов), закодированных ферментов, направляющих последовательностей и т.д. раскрыты в других разделах данного документа. К примеру, одна или обе направляющие последовательности могут быть частью последовательности chiRNA, которая обеспечивает направляющую, парную tracr- и tracr- последовательности в единой РНК с тем, чтобы такая система могла кодировать (i) фермент CRISPR; (ii) первую chiRNA, содержащую последовательность, способную гибридизироваться с первой целевой последовательностью в клетке, первой парной tracr-последовательностью и первой tracr-последовательностью; (iii) вторую направляющую РНК, способную гибридизироваться с вектором, который кодирует фермент CRISPR, вторую парную tracr-последовательность и вторую tracr-последовательность. Проще говоря, фермент может включать в себя одну или несколько NLS и т.д.Additional characteristics of the vector(s), encoded enzymes, guide sequences, etc. are disclosed elsewhere in this document. For example, one or both guide sequences may be part of a chiRNA sequence that provides a guide, a tracr mate, and a tracr sequence in a single RNA such that such a system can encode (i) a CRISPR enzyme; (ii) a first chiRNA comprising a sequence capable of hybridizing to a first target sequence in a cell, a first tracr mate sequence, and a first tracr sequence; (iii) a second guide RNA capable of hybridizing to a vector that encodes a CRISPR enzyme, a second tracr mate sequence, and a second tracr sequence. In simple terms, the enzyme may include one or more NLSs, etc.
Разные кодирующие последовательности (фермент CRISPR, направляющие РНК, tracr и парную tracr) можно ввести в отдельный вектор или во множество векторов. К примеру, возможным является кодирование фермента в одном векторе, а последовательностей разных РНК в другом векторе, или кодирование фермента и одной chiRNA в одном векторе, а остальной chiRNA в другом векторе, или любая другая комбинация. В целом предпочтительной является система, использующая всего один или два разных вектора.The different coding sequences (CRISPR enzyme, guide RNAs, tracr, and tracr mate) can be introduced into a single vector or into multiple vectors. For example, it is possible to encode the enzyme in one vector and the different RNA sequences in another vector, or to encode the enzyme and one chiRNA in one vector and the remaining chiRNA in another vector, or any other combination. In general, a system using only one or two different vectors is preferred.
При использовании множества векторов возможной является их доставка в неравных количествах, а в идеальном варианте с избытком вектора, который кодирует первую направляющую РНК, связанную со второй направляющей РНК, способствуя тем самым задержке конечной инактивации системы CRISPR до момента прохождения редактирования генома.When using multiple vectors, it is possible to deliver them in unequal quantities, and ideally with an excess of vector that encodes the first guide RNA linked to the second guide RNA, thereby delaying the final inactivation of the CRISPR system until genome editing has occurred.
Первая направляющая РНК может целенаправленно воздействовать на любую представляющую интерес целевую последовательность в геноме, что описано в других частях в данном документе. Вторая направляющая РНК целенаправленно воздействует на любую последовательность в векторе, который кодирует фермент CRISPR Cas9, и тем самым инактивирует экспрессию фермента, обусловленную данным вектором. Таким образом, целевая последовательность в векторе должна быть способна к инактивации экспрессии. Подходящие целевые последовательности могут находиться, например, рядом с инициирующим трансляцию стартовым кодоном кодирующей последовательности Cas9 или в его пределах, в некодирующей последовательности в промоторе, управляющем экспрессией элементов некодирующей РНК, в пределах промотора, управляющего экспрессией гена Cas9, в пределах 100 п. о. инициирующего трансляцию стартового ATG-кодона в кодирующей последовательности Cas9 и/или в пределах инвертированного концевого повтора (iTR) вирусного вектора для доставки, например, в геноме AAV. Двухнитевой разрыв рядом с данным участком может индуцировать сдвиг рамки в кодирующей последовательности Cas9, вызывая потерю экспрессии белка. Альтернативой целевой последовательности для "самоинактивирующейся" направляющей РНК было бы нацеливание на редактирование/инактивацию регуляторных участков/ последовательностей, которые необходимы для экспрессии системы CRISPR-Cas9 или для стабильности вектора. К примеру, если нарушена структура промотора для кодирующей последовательности Cas9, тогда транскрипция будет подавляться или предупреждаться. Проще говоря, если вектор включает в себя последовательности, обеспечивающие репликацию, поддержание или стабильность, тогда можно целенаправленно воздействовать на эти последовательности. К примеру, в векторе на основе AAV приемлемая целевая последовательность находится в пределах iTR. Другими приемлемыми для нацеливания последовательностями могут быть промоторные последовательности, сайты полиаденилирования и т.д.The first guide RNA may target any target sequence of interest in the genome, as described elsewhere herein. The second guide RNA targets any sequence in a vector that encodes the CRISPR Cas9 enzyme, thereby inactivating expression of the enzyme driven by the vector. Thus, the target sequence in the vector should be capable of inactivating expression. Suitable target sequences may be, for example, adjacent to or within the translation initiation start codon of the Cas9 coding sequence, in a non-coding sequence in a promoter driving expression of non-coding RNA elements, within a promoter driving expression of the Cas9 gene, within 100 bp of the translation initiation ATG start codon in the Cas9 coding sequence, and/or within an inverted terminal repeat (iTR) of a viral delivery vector, such as in the AAV genome. A double-strand break near this site could induce a frameshift in the Cas9 coding sequence, causing loss of protein expression. An alternative target sequence for the "self-inactivating" guide RNA would be to target editing/inactivation of regulatory regions/sequences that are essential for expression of the CRISPR-Cas9 system or for vector stability. For example, if the promoter structure for the Cas9 coding sequence is disrupted, then transcription would be repressed or prevented. In simple terms, if the vector includes sequences that ensure replication, maintenance, or stability, then these sequences could be targeted. For example, in an AAV-based vector, a suitable target sequence is within the iTR. Other suitable targeting sequences could be promoter sequences, polyadenylation sites, etc.
Более того, если направляющие РНК экспрессируются в формате массива, тогда "самоинактивирующиеся" направляющие РНК, целенаправленно воздействующие одновременно на оба промотора, в результате приведут к вырезанию вставочных нуклеотидов в пределах экспрессионной конструкции CRISPR-Cas, вызывая фактически полную инактивацию. Проще говоря, вырезание вставочных нуклеотидов будет являться результатом целенаправленного воздействия направляющих РНК на оба ITR или одновременного целенаправленного воздействия на два или более компонентов CRISPR-Cas. Как поясняется в данном документе, самоинактивация в целом применима с системами CRISPR-Cas9 для обеспечения регуляции CRISPR-Cas9. Например, как поясняется в данном документе, самоинактивацию можно задействовать для CRISPR-опосредованной репарации мутаций, например, нарушений, обусловленных экспансией, как поясняется в данном документе. Результат такой самоинактивации заключается во временной активности CRISPR-опосредованной репарации.Moreover, if the guide RNAs are expressed in an array format, then "self-inactivating" guide RNAs that target both promoters simultaneously will result in excision of intervening nucleotides within the CRISPR-Cas expression construct, causing virtual complete inactivation. Simply put, excision of intervening nucleotides will result from targeting both ITRs with guide RNAs or from targeting two or more CRISPR-Cas components simultaneously. As explained in this paper, self-inactivation is generally applicable to CRISPR-Cas9 systems to mediate CRISPR-Cas9 regulation. For example, as explained in this paper, self-inactivation can be used for CRISPR-mediated repair of mutations, such as expansion-mediated disorders, as explained in this paper. The result of such self-inactivation is transient CRISPR-mediated repair activity.
Добавление не воздействующих целенаправленно нуклеотидов к 5'-концу (например, 1-10 нуклеотидов, предпочтительно 1-5 нуклеотидов) "самоинактивирующиейся" направляющей РНК можно использовать для задержки ее процессирования и/или изменения ее эффективности в качестве средства для обеспечения редактирования в целевом локусе генома перед выключением CRISPR-Cas9.The addition of non-targeting nucleotides to the 5' end (e.g., 1-10 nucleotides, preferably 1-5 nucleotides) of a "self-inactivating" guide RNA can be used to delay its processing and/or alter its efficiency as a means to ensure editing at a target genomic locus prior to CRISPR-Cas9 shutdown.
В одном аспекте самоинактивирующейся системы AAV-CRISPR-Cas9 плазмиды, которые совместно экспрессируют одну или несколько sgRNA, целенаправленно воздействующих на представляющие интерес последовательности в геноме (например, 1-2, 1-5, 1-10, 1 -15, 1-20, 1-30), можно создавать с "самоинактивирующимися" sgRNA, которые целенаправленно воздействуют на последовательность SpCas9 в сконструированном стартовом ATG-сайте или рядом с ним (например, в пределах 5 нуклеотидов, в пределах 15 нуклеотидов, в пределах 30 нуклеотидов, в пределах 50 нуклеотидов, в пределах 100 нуклеотидов). На регуляторную последовательность в участке промотора U6 также можно целенаправленно воздействовать с помощью sgRNA. U6-контролируемые sgRNA можно сконструировать в формате массива с тем, чтобы одновременно могло высвобождаться множество последовательностей sgRNA. При первичной доставке в целевые ткань/клетки (клетка слева) sgRNA начинают накапливаться, тогда как в ядре уровни Cas9 повышаются. Cas9 объединяется в комплексы со всеми sgRNA для опосредования редактирования генома и самоинактивации плазмид, несущих CRISPR-Cas9.In one aspect of the self-inactivating AAV-CRISPR-Cas9 system, plasmids that co-express one or more sgRNAs that target sequences of interest in the genome (e.g., 1-2, 1-5, 1-10, 1-15, 1-20, 1-30) can be engineered with "self-inactivating" sgRNAs that target a SpCas9 sequence at or near an engineered ATG start site (e.g., within 5 nucleotides, within 15 nucleotides, within 30 nucleotides, within 50 nucleotides, within 100 nucleotides). A regulatory sequence in the U6 promoter region can also be targeted by sgRNAs. U6-controlled sgRNAs can be engineered in an array format so that multiple sgRNA sequences can be released simultaneously. Upon initial delivery to target tissue/cells (left cell), sgRNAs begin to accumulate while Cas9 levels increase in the nucleus. Cas9 complexes with all sgRNAs to mediate genome editing and self-inactivation of CRISPR-Cas9-bearing plasmids.
Один аспект самоинактивирующейся системы CRISPR-Cas9 представляет собой экспрессию в отдельном формате или в формате тандемного массива от 1 до 4 или более разных направляющих последовательностей; например, до приблизительно 20 или приблизительно 30 направляющих последовательностей. Каждая отдельная самоинактивирующаяся направляющая последовательность может целенаправленно воздействовать на разные мишени. Такие последовательности могут процессироваться, например, из транскрипта одной химерной pol3. Можно применять промоторы рol3, такие как промоторы U6 или H1. Промоторы рol2 упомянуты во всем данном документе. Последовательности с инвертированными терминальными повторами (iTR) могут фланкировать промотор Pol3 - sgRNA - промотор Pol2 - Cas9.One aspect of the self-inactivating CRISPR-Cas9 system is the expression in a single or tandem array format of 1 to 4 or more different guide sequences; for example, up to about 20 or about 30 guide sequences. Each individual self-inactivating guide sequence can specifically target a different target. Such sequences can be processed, for example, from a single chimeric pol3 transcript. Pol3 promoters such as the U6 or H1 promoters can be used. Pol2 promoters are mentioned throughout this document. Inverted terminal repeat (iTR) sequences can flank the Pol3 promoter-sgRNA-Pol2 promoter-Cas9.
В одном аспекте химерный транскрипт в формате тандема представляет собой одну или несколько направляющих последовательностей, которые редактируют одну или несколько мишеней, тогда как одна или несколько самоинактивирующихся направляющих последовательностей инактивируют систему CRISPR/Cas9. Таким образом, например, описываемая система CRISPR-Cas9 для репарации нарушений, обусловленных экспансией, можно непосредственно объединять с самоинактивирующейся системой CRISPR-Cas9, описанной в данном документе. Такая система может, например, иметь две направляющие последовательности, направленные на целевой участок для репарации, а также по меньшей мере третью направляющую последовательность, управляющую самоинактивацией CRISPR-Cas9. Ссылаются на заявку с порядковым № PCT/US2014/069897 под названием "Композиции и способы применения систем CRISPR-Cas при связанных с нуклеотидными повторами нарушениях", опубликованную 12 декабря 2014 г. как WO/2015/089351.In one aspect, the chimeric transcript in tandem format comprises one or more guide sequences that edit one or more targets, while one or more self-inactivating guide sequences inactivate the CRISPR/Cas9 system. Thus, for example, the described CRISPR-Cas9 system for repairing expansion-related disorders can be directly combined with the self-inactivating CRISPR-Cas9 system described herein. Such a system can, for example, have two guide sequences directed to a target site for repair, as well as at least a third guide sequence that directs self-inactivation of CRISPR-Cas9. Reference is made to application Serial No. PCT/US2014/069897, entitled "Compositions and methods for using CRISPR-Cas systems in nucleotide repeat-associated disorders," published December 12, 2014 as WO/2015/089351.
НаборыSets
В одном аспекте настоящее изобретение относится к наборам, содержащим любой один или несколько из элементов, раскрытых в приведенных выше способах и композициях. Элементы могут быть предоставлены отдельно или в комбинациях и могут быть предоставлены в любом подходящем контейнере, как, например, ампуле, флаконе или пробирке. В некоторых вариантах осуществления набор включает инструкции на одном или нескольких языках, например на нескольких языках.In one aspect, the present invention relates to kits comprising any one or more of the elements disclosed in the above methods and compositions. The elements may be provided separately or in combinations and may be provided in any suitable container, such as an ampoule, vial or tube. In some embodiments, the kit includes instructions in one or more languages, such as multiple languages.
В некоторых вариантах осуществления набор содержит один или несколько реагентов для применения в способе, в котором используется один или несколько элементов, описанных в данном документе. Реагенты могут быть предоставлены в любом подходящем контейнере. Например, набор может предусматривать один или несколько реакционных буферов или буферов для хранения. Реагенты могут быть предоставлены в форме, которая применима в конкретном анализе, или в форме, которая предусматривает добавление одного или нескольких других компонентов перед применением (например, в форме концентрата или лиофилизированной форме). Буфер может быть любым буфером, в том числе без ограничения буфером с карбонатом натрия, буфером с бикарбонатом натрия, боратным буфером, Tris-буфером, буфером MOPS, буфером HEPES и их комбинациями. В некоторых вариантах осуществления буфер является щелочным. В некоторых вариантах осуществления буфер имеет значение pH от приблизительно 7 до приблизительно 10. В некоторых вариантах осуществления набор содержит один или несколько олигонуклеотидов, соответствующих направляющей последовательности, для встраивания в вектор, чтобы функционально связать направляющую последовательность и регуляторный элемент. В некоторых вариантах осуществления набор содержит матричный полинуклеотид для гомологичной рекомбинации. В некоторых вариантах осуществления набор содержит один или несколько векторов и/или один или несколько полинуклеотидов, описанных в данном документе. Преимущественно набор может предоставлять все элементы систем по настоящему изобретению.In some embodiments, the kit comprises one or more reagents for use in a method that uses one or more of the elements described herein. The reagents can be provided in any suitable container. For example, the kit can provide one or more reaction buffers or storage buffers. The reagents can be provided in a form that is useful in a particular assay or in a form that allows for the addition of one or more other components prior to use (e.g., in a concentrate form or a lyophilized form). The buffer can be any buffer, including but not limited to, a sodium carbonate buffer, a sodium bicarbonate buffer, a borate buffer, a Tris buffer, a MOPS buffer, a HEPES buffer, and combinations thereof. In some embodiments, the buffer is alkaline. In some embodiments, the buffer has a pH of about 7 to about 10. In some embodiments, the kit comprises one or more oligonucleotides corresponding to the guide sequence for insertion into the vector to operably link the guide sequence and the regulatory element. In some embodiments, the kit comprises a template polynucleotide for homologous recombination. In some embodiments, the kit comprises one or more vectors and/or one or more polynucleotides described herein. Advantageously, the kit may provide all elements of the systems of the present invention.
Системы нацеливания на нуклеиновую кислоту и способыNucleic acid targeting systems and methods
Термин "система нацеливания на нуклеиновую кислоту", где нуклеиновая кислота представляет собой ДНК или РНК, а в некоторых аспектах также может являться гибридами ДНК-РНК или их производными, в собирательном значении относится к транскриптам и другим элементам, вовлеченным в экспрессию или управляющим активностью генов, ассоциированных с нацеливающимся на ДНК или РНК CRISPR ("Cas"), которые могут включать в себя последовательности, кодирующие нацеливающийся на ДНК или РНК белок Cas и нацеливающуюся на ДНК или РНК направляющую РНК, содержащую последовательность РНК CRISPR (crRNA), и (в некоторых, но не во всех системах) последовательность трансактивирующей РНК системы CRISPR/Cas (tracrRNA), или другие последовательности и транскрипты из локуса нацеливающегося на ДНК или РНК CRISPR. Как правило, система нацеливания на РНК характеризуется элементами, которые способствуют образованию комплекса нацеливания на ДНК или РНК в сайте целевой последовательности ДНК или РНК. В контексте образования комплекса нацеливания на ДНК или РНК "целевая последовательность" относится к последовательности ДНК или РНК, по отношению к которой нацеливающаяся на ДНК или РНК направляющая РНК сконструирована так, чтобы обладать комплементарностью, при этом гибридизация между целевой последовательностью и нацеливающейся на РНК направляющей РНК способствует образованию комплекса нацеливания на РНК. В некоторых вариантах осуществления целевая последовательность расположена в ядре или цитоплазме клетки.The term "nucleic acid targeting system", wherein the nucleic acid is DNA or RNA, and in some aspects may also be DNA-RNA hybrids or derivatives thereof, collectively refers to transcripts and other elements involved in the expression of or control of the activity of genes associated with DNA- or RNA-targeting CRISPR ("Cas"), which may include sequences encoding a DNA- or RNA-targeting Cas protein and a DNA- or RNA-targeting guide RNA comprising a CRISPR RNA sequence (crRNA) and (in some, but not all systems) a CRISPR/Cas transactivating RNA sequence (tracrRNA), or other sequences and transcripts from a DNA- or RNA-targeting CRISPR locus. Typically, an RNA targeting system is characterized by elements that facilitate the formation of a DNA- or RNA-targeting complex at the site of a DNA or RNA target sequence. In the context of forming a DNA or RNA targeting complex, a "target sequence" refers to a DNA or RNA sequence to which a DNA or RNA targeting guide RNA is designed to be complementary, wherein hybridization between the target sequence and the RNA targeting guide RNA facilitates formation of the RNA targeting complex. In some embodiments, the target sequence is located in the nucleus or cytoplasm of a cell.
В одном аспекте настоящего изобретения новые нацеливающиеся на ДНК системы, также называемые нацеливающимся на ДНК CRISPR/нацеливающейся на ДНК системой Cas или CRISPR-Cas в соответствии с настоящей заявкой, основываются на идентифицированных белках Cas9, для которых не требуется получение индивидуализированных белков для целенаправленного воздействия на конкретные последовательности ДНК, но скорее один эффекторный белок или фермент может быть запрограммирован молекулой РНК для распознавания определенной мишени ДНК, другими словами, фермент может связываться с определенной мишенью ДНК с помощью указанной молекулы РНК. Аспекты настоящего изобретения, в частности, относятся к нацеливающимся на ДНК направляемым РНК системам CRISPR SpCas9.In one aspect of the present invention, novel DNA targeting systems, also referred to as DNA targeting CRISPR/DNA targeting Cas system or CRISPR-Cas according to the present application, are based on the identified Cas9 proteins, which do not require the production of individualized proteins to target specific DNA sequences, but rather one effector protein or enzyme can be programmed by an RNA molecule to recognize a specific DNA target, in other words, the enzyme can bind to a specific DNA target using said RNA molecule. Aspects of the present invention relate in particular to DNA targeting RNA-guided CRISPR SpCas9 systems.
В одном аспекте настоящего изобретения предусмотрены способы применения одного или нескольких элементов системы нацеливания на нуклеиновую кислоту. Комплекс нацеливания на нуклеиновую кислоту по настоящему изобретению обеспечивает эффективное средство для модифицирования целевой ДНК или РНК (одно- или двухнитевой, линейной или сверхспирализированной). Комплекс нацеливания на нуклеиновую кислоту по настоящему изобретению обладает широкой применимостью, включая модифицирование (например, осуществление делеции, встраивания, транслокации, инактивации, активации) целевой ДНК или РНК во множестве типов клеток. Как таковой комплекс нацеливания на нуклеиновую кислоту в соответствии с настоящим изобретением имеет широкий спектр применений, например, в генной терапии, скрининге лекарственных средств, диагностике и прогнозировании заболеваний. Типичный комплекс нацеливания на нуклеиновую кислоту содержит нацеливающийся на ДНК или РНК эффекторный белок, образующий комплекс с направляющей РНК, гибридизированной с целевой последовательностью в целевом представляющем интерес локусе.In one aspect, the present invention provides methods of using one or more elements of a nucleic acid targeting system. The nucleic acid targeting complex of the present invention provides an effective means for modifying a target DNA or RNA (single- or double-stranded, linear or supercoiled). The nucleic acid targeting complex of the present invention has a wide utility, including modifying (e.g., causing deletion, insertion, translocation, inactivation, activation) of a target DNA or RNA in a variety of cell types. As such, the nucleic acid targeting complex of the present invention has a wide range of applications, such as in gene therapy, drug screening, diagnosis and prognosis of diseases. A typical nucleic acid targeting complex comprises a DNA or RNA targeting effector protein complexed with a guide RNA hybridized to a target sequence at a target locus of interest.
Нацеливающиеся на нуклеиновую кислоту системы, векторные системы, векторы и композиции, описываемые в данном документе, можно применять в различных нацеливающихся на нуклеиновую кислоту применениях, изменяющем или модифицирующем синтезе генного продукта, такого как белок, расщеплении нуклеиновых кислот, редактировании нуклеиновых кислот, сплайсинге нуклеиновых кислот; обороте целевых нуклеиновых кислот, отслеживании целевых нуклеиновых кислот, выделении целевых нуклеиновых кислот, визуализации целевых нуклеиновых кислот и т.д.The nucleic acid targeting systems, vector systems, vectors and compositions described herein can be used in a variety of nucleic acid targeting applications, altering or modifying the synthesis of a gene product such as a protein, cleaving nucleic acids, editing nucleic acids, splicing nucleic acids; turnover of target nucleic acids, tracking of target nucleic acids, isolation of target nucleic acids, visualization of target nucleic acids, etc.
Аспекты настоящего изобретения также охватывают способы и варианты применения композиций и систем, описываемых в данном документе, в конструировании генома, например, для изменения или манипуляции с экспрессией одного или нескольких генов или одного или нескольких продуктов генов в прокариотических или эукариотических клетках in vitro, in vivo или ex vivo.Aspects of the present invention also encompass methods and uses of the compositions and systems described herein in genome engineering, such as to alter or manipulate the expression of one or more genes or one or more gene products in prokaryotic or eukaryotic cells in vitro, in vivo or ex vivo.
В одном варианте осуществления настоящее изобретение относится к способу расщепления целевой ДНК. Способ может включать модификацию целевой ДНК с использованием комплекса нацеливания на нуклеиновую кислоту, который связывается с целевой ДНК и осуществляет расщепление указанной целевой ДНК. В одном варианте осуществления комплекс нацеливания на нуклеиновую кислоту в соответствии с настоящим изобретением при введении в клетку может образовывать разрыв (например, одно- или двухнитевой разрыв) в последовательности РНК. Например, способ можно применять для расщепления РНК, ответственной за развитие заболевания, в клетке. Например, в клетку может быть введена экзогенная РНК-матрица, содержащая последовательность, подлежащую интеграции, фланкированную последовательностью, расположенной выше, и последовательностью, расположенной ниже. Последовательности, расположенные выше и ниже, характеризуются сходством последовательности с каждой стороной сайта интеграции в РНК. При необходимости донорной РНК может быть мРНК. Экзогенная РНК-матрица содержит последовательность, подлежащую интеграции (например, мутированную РНК). Последовательность, предназначенная для интеграции, может представлять собой последовательность, эндогенную или экзогенную по отношению к клетке. Примеры последовательности, подлежащей интеграции, включают в себя РНК, кодирующую белок, или некодирующую РНК (например, microRNA). Таким образом, последовательность, предназначенная для интеграции, может быть функционально связанной с соответствующей регуляторной последовательностью или соответствующими регуляторными последовательностями. Альтернативно последовательность, подлежащая интеграции, может обеспечивать регуляторную функцию. Последовательности, расположенные выше и ниже в экзогенной РНК-матрице, выбирают таким образом, чтобы способствовать рекомбинации между последовательностью РНК, представляющей интерес, и донорной РНК. Последовательность, расположенная выше, представляет собой последовательность РНК, которая обладает сходством последовательности с последовательностью РНК, расположенной выше подвергаемого нацеливанию сайта интеграции. Аналогично, последовательность, расположенная ниже, представляет собой последовательность РНК, которая обладает сходством последовательности с последовательностью РНК, расположенной ниже подвергаемого нацеливанию сайта интеграции. Последовательности, расположенные выше и ниже в экзогенной РНК-матрице, могут характеризоваться 75%, 80%, 85%, 90%, 95% или 100% идентичностью последовательности с подвергаемой нацеливанию последовательностью РНК. Предпочтительно, последовательности, расположенные выше и ниже в экзогенной РНК-матрице, характеризуются приблизительно 95%, 96%, 97%, 98%, 99% или 100% идентичностью последовательности с подвергаемой нацеливанию последовательностью РНК. В некоторых способах последовательности, расположенные выше и ниже в экзогенной РНК-матрице, характеризуются приблизительно 99% или 100% идентичностью последовательности с подвергаемой нацеливанию последовательностью РНК. Последовательность, расположенная выше или ниже, может содержать от приблизительно 20 п. о. до приблизительно 2500 п. о., например приблизительно 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400 или 2500 п. о. В некоторых способах иллюстративная последовательность, расположенная выше или ниже, имеет от приблизительно 200 п. о. до приблизительно 2000 п. о., от приблизительно 600 п. о. до приблизительно 1000 п. о. или, более конкретно, от приблизительно 700 п. о. до приблизительно 1000 п. о. В некоторых способах экзогенная РНК-матрица может дополнительно содержать маркер. Такой маркер может облегчать скрининг в отношении подвергаемых нацеливанию интеграций. Примеры подходящих маркеров включают сайты рестрикции, флуоресцентные белки или селектируемые маркеры. Экзогенную РНК-матрицу по настоящему изобретению можно сконструировать с применением методик рекомбинации (см., например, Sambrook et al., 2001, и Ausubel et al., 1996). В способе модифицирования целевой ДНК путем интеграции экзогенной ДНК-матрицы разрыв (например, двух- или однонитевой разрыв) вводят в последовательность ДНК с помощью нацеливающегося на нуклеиновую кислоту комплекса, осуществляют репарацию разрыва посредством гомологичной рекомбинации с участием экзогенной матричной ДНК так, что матрица интегрируется в целевую ДНК. Наличие двухнитевого разрыва обеспечивает интеграцию матрицы. В других вариантах осуществления настоящее изобретение относится к способу модификации экспрессии РНК в эукариотической клетке. Способ включает повышение или снижение экспрессии целевого полинуклеотида с помощью комплекса нацеливания на нуклеиновую кислоту, который связывается с кодирующей ДНК РНК (например, мРНК или пре-мРНК). В некоторых способах целевую ДНК можно инактивировать для осуществления модификации экспрессии в клетке. Например, после связывания нацеливающегося на ДНК комплекса с целевой последовательностью в клетке целевая ДНК инактивируется, вследствие чего последовательность не транскрибируется, при этом не вырабатывается кодируемый белок или последовательность не функционирует так, как последовательность дикого типа. Например, последовательность, кодирующая белок или микроРНК, может быть инактивирована, вследствие чего не образуется белок, или microRNA или транскрипт pre-microRNA. Целевой ДНК нацеливающегося на ДНК комплекса может быть любая ДНК, эндогенная или экзогенная по отношению к эукариотической клетке. Например, целевой ДНК может быть ДНК, находящаяся в ядре эукариотической клетки. Целевой ДНК может быть последовательность, кодирующая продукт гена (например, мРНК или пре-мРНК), кодирующая продукт гена (например, белок) или некодирующая последовательность (например, ncRNA, lncRNA, tRNA или rRNA). Примеры целевой ДНК включают в себя последовательность, ассоциированную с биохимическим путем передачи сигнала, например, ДНК, ассоциированную с биохимическим путем передачи сигнала. Примеры целевой ДНК включают в себя ассоциированную с заболеванием ДНК. "Ассоциированная с заболеванием" ДНК обозначает любую ДНК, которая обеспечивает продукты транскрипции на аномальном уровне или в аномальной форме в клетках, полученных из пораженных заболеванием тканей, по сравнению с тканями или клетками контроля без заболевания. Это может быть ДНК, транскрибированная с гена, который начинает экспрессироваться при аномально высоком уровне; это может быть ДНК, транскрибированная с гена, который начинает экспрессироваться при аномально низком уровне, где измененная экспрессия коррелирует с появлением и/или прогрессированием заболевания. Ассоциированная с заболеванием ДНК также означает ДНК, транскрибированную с гена, несущего мутацию(мутации) или генетическую вариацию, который является непосредственно ответственным или находится в неравновесном сцеплении с геном(ами), ответственным за этиологию заболевания. Транслированные продукты могут быть известны или неизвестны и могут присутствовать на нормальном или аномальном уровне. Целевой ДНК нацеливающегося на ДНК комплекса может быть любая ДНК, эндогенная или экзогенная по отношению к эукариотической клетке. Например, целевой ДНК может быть ДНК, находящаяся в ядре эукариотической клетки. Целевой ДНК может быть последовательность, кодирующая продукт гена (например, мРНК, пре-мРНК, белок), или некодирующая последовательность (например, ncRNA, lncRNA, tRNA или rRNA).In one embodiment, the present invention relates to a method of cleaving a target DNA. The method may comprise modifying the target DNA using a nucleic acid targeting complex that binds to the target DNA and cleaves the target DNA. In one embodiment, the nucleic acid targeting complex of the present invention, when introduced into a cell, may form a break (e.g., a single- or double-strand break) in an RNA sequence. For example, the method may be used to cleave a disease-causing RNA in a cell. For example, an exogenous RNA template comprising a sequence to be integrated flanked by an upstream sequence and a downstream sequence may be introduced into the cell. The upstream and downstream sequences are characterized by sequence similarity to each side of the integration site in the RNA. Optionally, the donor RNA may be mRNA. The exogenous RNA template comprises a sequence to be integrated (e.g., a mutated RNA). The sequence to be integrated may be a sequence endogenous or exogenous to the cell. Examples of a sequence to be integrated include a protein encoding RNA or a non-coding RNA (e.g., a microRNA). Thus, the sequence to be integrated may be operably linked to a corresponding regulatory sequence or sequences. Alternatively, the sequence to be integrated may provide a regulatory function. The upstream and downstream sequences of the exogenous RNA template are selected to promote recombination between the RNA sequence of interest and the donor RNA. An upstream sequence is an RNA sequence that shares sequence similarity with an RNA sequence upstream of the integration site to be targeted. Similarly, a downstream sequence is an RNA sequence that shares sequence similarity with an RNA sequence downstream of the integration site to be targeted. The upstream and downstream sequences of the exogenous RNA template may have 75%, 80%, 85%, 90%, 95%, or 100% sequence identity to the RNA sequence to be targeted. Preferably, the upstream and downstream sequences of the exogenous RNA template have about 95%, 96%, 97%, 98%, 99%, or 100% sequence identity to the RNA sequence to be targeted. In some methods, the upstream and downstream sequences of the exogenous RNA template have about 99% or 100% sequence identity to the RNA sequence to be targeted. The upstream or downstream sequence may comprise from about 20 bp to about 25 bp. to about 2,500 bp, such as about 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, or 2500 bp. In some methods, the exemplary upstream or downstream sequence is from about 200 bp to about 2,000 bp, from about 600 bp to about 1,000 bp, or more particularly from about 700 bp. to about 1000 bp. In some methods, the exogenous RNA template may further comprise a marker. Such a marker may facilitate screening for targetable integrations. Examples of suitable markers include restriction sites, fluorescent proteins, or selectable markers. The exogenous RNA template of the present invention can be constructed using recombination techniques (see, e.g., Sambrook et al., 2001, and Ausubel et al., 1996). In a method of modifying a target DNA by integrating an exogenous DNA template, a break (e.g., a double- or single-strand break) is introduced into the DNA sequence by a nucleic acid targeting complex, and the break is repaired by homologous recombination involving the exogenous template DNA such that the template integrates into the target DNA. The presence of the double-strand break ensures integration of the template. In other embodiments, the present invention relates to a method of modifying RNA expression in a eukaryotic cell. The method comprises increasing or decreasing the expression of a target polynucleotide using a nucleic acid targeting complex that binds to a DNA-encoding RNA (e.g., mRNA or pre-mRNA). In some methods, the target DNA can be inactivated to effect the modification of expression in the cell. For example, after the DNA targeting complex binds to a target sequence in the cell, the target DNA is inactivated such that the sequence is not transcribed, whereby the encoded protein is not produced, or the sequence does not function as a wild-type sequence. For example, a sequence encoding a protein or microRNA can be inactivated such that the protein or microRNA or pre-microRNA transcript is not produced. The target DNA of the DNA targeting complex can be any DNA, endogenous or exogenous to the eukaryotic cell. For example, the target DNA can be DNA located in the nucleus of the eukaryotic cell. The target DNA may be a sequence encoding a gene product (e.g., mRNA or pre-mRNA), encoding a gene product (e.g., a protein), or a non-coding sequence (e.g., ncRNA, lncRNA, tRNA, or rRNA). Examples of target DNA include a sequence associated with a biochemical signaling pathway, such as DNA associated with a biochemical signaling pathway. Examples of target DNA include disease-associated DNA. "Disease-associated" DNA refers to any DNA that provides transcription products at an abnormal level or in an abnormal form in cells derived from disease-affected tissues compared to disease-free control tissues or cells. This may be DNA transcribed from a gene that begins to be expressed at an abnormally high level; it may be DNA transcribed from a gene that begins to be expressed at an abnormally low level, where the altered expression correlates with the onset and/or progression of the disease. Disease-associated DNA also means DNA transcribed from a gene carrying a mutation(s) or genetic variation that is directly responsible for, or is in linkage disequilibrium with, the gene(s) responsible for the etiology of the disease. The translated products may be known or unknown and may be present at normal or abnormal levels. The target DNA of a DNA-targeting complex may be any DNA, endogenous or exogenous to the eukaryotic cell. For example, the target DNA may be DNA located in the nucleus of a eukaryotic cell. The target DNA may be a sequence encoding a gene product (e.g., mRNA, pre-mRNA, protein) or a non-coding sequence (e.g., ncRNA, lncRNA, tRNA, or rRNA).
В некоторых вариантах осуществления способ может включать обеспечение связывания комплекса нацеливания на нуклеиновую кислоту с целевой ДНК для осуществления расщепления указанной целевой ДНК, за счет чего обеспечивается модифицирование целевой ДНК, где комплекс нацеливания на нуклеиновую кислоту содержит эффекторный белок нацеливания на нуклеиновую кислоту в комплексе с направляющей РНК, гибридизированной с целевой последовательностью в пределах указанной целевой ДНК. В одном аспекте настоящее изобретение относится к способу модицификации экспрессии ДНК или РНК в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса нацеливания на нуклеиновую кислоту с ДНК так, что указанное связывание приводит к повышенной или сниженной экспрессии указанной ДНК; где комплекс нацеливания на нуклеиновую кислоту содержит эффекторный белок для нацеливания на нуклеиновую кислоту в комплексе с направляющей РНК. Аналогичные соображения и условия распространяются на способы модифицирования целевой ДНК, изложенные выше. Фактически, эти варианты отбора образцов, культивирования и повторного введения охватываются аспектами настоящего изобретения. В одном аспекте настоящее изобретение относится к способам модификации целевой ДНК в эукариотической клетке, что может происходить in vivo, ex vivo или in vitro. В некоторых вариантах осуществления способ включает отбор клетки или популяции клеток у человека или отличного от человека животного и модификацию клетки или клеток. Культивирование можно осуществлять на любой стадии ex vivo. Клетку или клетки можно даже повторно вводить отличному от человека животному или в растение. Что касается повторно вводимых клеток, особенно предпочтительно, чтобы эти клетки являлись стволовыми клетками.In some embodiments, the method may comprise causing a nucleic acid targeting complex to bind to a target DNA to effect cleavage of said target DNA, thereby modifying the target DNA, wherein the nucleic acid targeting complex comprises a nucleic acid targeting effector protein in complex with a guide RNA hybridized to a target sequence within said target DNA. In one aspect, the present invention relates to a method of modifying the expression of DNA or RNA in a eukaryotic cell. In some embodiments, the method comprises causing a nucleic acid targeting complex to bind to the DNA such that said binding results in increased or decreased expression of said DNA; wherein the nucleic acid targeting complex comprises a nucleic acid targeting effector protein in complex with a guide RNA. Similar considerations and conditions apply to the methods of modifying a target DNA set forth above. In fact, these sampling, culturing and reintroduction options are encompassed by aspects of the present invention. In one aspect, the present invention relates to methods for modifying target DNA in a eukaryotic cell, which may occur in vivo, ex vivo or in vitro. In some embodiments, the method comprises selecting a cell or a population of cells from a human or non-human animal and modifying the cell or cells. The culturing may be performed at any stage ex vivo. The cell or cells may even be reintroduced into a non-human animal or into a plant. With respect to the cells reintroduced, it is particularly preferred that the cells are stem cells.
Действительно, в любом аспекте настоящего изобретения комплекс нацеливания на нуклеиновую кислоту может содержать эффекторный белок для нацеливания на нуклеиновую кислоту в комплексе с направляющей РНК, гибридизированной с целевой последовательностью.Indeed, in any aspect of the present invention, the nucleic acid targeting complex may comprise a nucleic acid targeting effector protein in complex with a guide RNA hybridized to a target sequence.
Настоящее изобретение относится к конструированию и оптимизации систем, способов и композиций, используемых для контроля экспрессии гена, предусматривающих нацеливание на последовательность ДНК, которые относятся к системе нацеливания на нуклеиновую кислоту и ее компонентам. Преимущество способов по настоящему изобретению заключается в том, что система CRISPR сводит к минимуму или исключает нецелевое связывание и возникающие в результате этого побочные эффекты. Это достигается при использовании систем, предусматривающих наличие высокой степени специфичности к последовательности в отношении целевой ДНК.The present invention relates to the design and optimization of systems, methods and compositions used to control gene expression, providing for targeting a DNA sequence, which relate to a nucleic acid targeting system and its components. An advantage of the methods of the present invention is that the CRISPR system minimizes or eliminates off-target binding and the resulting side effects. This is achieved by using systems that provide for a high degree of sequence specificity with respect to the target DNA.
Что касается комплекса или системы нацеливания на нуклеиновую кислоту, предпочтительно, чтобы tracr-последовательность имела одну или несколько шпилек и имела длину 30 или более нуклеотидов, 40 или более нуклеотидов или 50 или более нуклеотидов; при этом последовательность crRNA имеет длину от 10 до 30 нуклеотидов, эффекторный белок для нацеливания на нуклеиновую кислоту представляет собой эффекторный белок Cas9 II типа.With respect to the nucleic acid targeting complex or system, it is preferable that the tracr sequence has one or more hairpins and has a length of 30 or more nucleotides, 40 or more nucleotides, or 50 or more nucleotides; wherein the crRNA sequence has a length of 10 to 30 nucleotides, the effector protein for targeting the nucleic acid is a type II Cas9 effector protein.
Редактирование и модификацияEditing and modification
В одном аспекте настоящее изобретение относится к способам применения одного или нескольких элементов системы CRISPR. Комплекс CRISPR по настоящему изобретению обеспечивает эффективные средства модифицирования целевого полинуклеотида. Комплекс CRISPR по настоящему изобретению обладает широкой применимостью, включая модифицирование (например, осуществление делеции, встраивания, транслокации, инактивации, активации) целевого полинуклеотида во множестве типов клеток. Комплекс CRISPR по настоящему изобретению как таковой имеет широкий спектр применений, например, в генной терапии, скрининге лекарственных средств, диагностике и прогнозировании заболеваний. Иллюстративный комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизированной с целевой последовательностью в целевом полинуклеотиде. В определенных вариантах осуществления последовательность прямого повтора связана с направляющей последовательностью.In one aspect, the present invention relates to methods of using one or more elements of a CRISPR system. The CRISPR complex of the present invention provides an efficient means for modifying a target polynucleotide. The CRISPR complex of the present invention has broad applicability, including modifying (e.g., causing deletion, insertion, translocation, inactivation, activation) of a target polynucleotide in a variety of cell types. As such, the CRISPR complex of the present invention has a wide range of applications, such as in gene therapy, drug screening, diagnosis and prognosis of diseases. An exemplary CRISPR complex comprises a CRISPR enzyme complexed with a guide sequence hybridized to a target sequence in a target polynucleotide. In certain embodiments, a direct repeat sequence is linked to the guide sequence.
Расщепление и репарация ДНКDNA cleavage and repair
Способ включает модификацию целевого полинуклеотида с применением комплекса CRISPR, который связывается с целевым полинуклеотидом и осуществляет расщепление указанного целевого полинуклеотида. Как правило, комплекс CRISPR по настоящему изобретению при введении в клетку создает разрыв (например, однонитевой или двухнитевой разрыв) в геномной последовательности. Например, способ можно применять для расщепления гена, ответственного за развитие заболевания, в клетке. Репарация разрыва, созданного комплексом CRISPR, может осуществляться посредством процесса репарации, например, путем склонного к ошибкам негомологичного соединения концов (NHEJ) или высокоточной репарации с участием гомологичной рекомбинации (HDR). В ходе данного процесса репарации в геномную последовательность может быть введен экзогенный матричный полинуклеотид. В некоторых способах процесс HDR используют для модификации геномной последовательности. Например, в клетку вводят экзогенный матричный полинуклеотид, содержащий последовательность, подлежащую интеграции, фланкированную последовательностью, расположенной выше, и последовательностью, расположенной ниже. Последовательности, расположенные выше и ниже, характеризуются сходством последовательности с каждой стороной сайта интеграции в хромосоме. При необходимости донорный полинуклеотид может представлять собой ДНК, например плазмидную ДНК, бактериальную искусственную хромосому (BAC), искусственную хромосому дрожжей (YAC), вирусный вектор, линейный фрагмент ДНК, ПЦР-фрагмент, "оголенную" нуклеиновую кислоту или нуклеиновую кислоту в комплексе со средством доставки, таким как липосома или полоксамер. Экзогенный матричный полинуклеотид содержит последовательность, подлежащую интеграции (например, мутированный ген). Последовательность, предназначенная для интеграции, может представлять собой последовательность, эндогенную или экзогенную по отношению к клетке. Примеры последовательности, подлежащей интеграции, включают полинуклеотиды, кодирующие белок или некодирующую РНК (например, microRNA). Таким образом, последовательность, предназначенная для интеграции, может быть функционально связанной с соответствующей регуляторной последовательностью или соответствующими регуляторными последовательностями. Альтернативно последовательность, подлежащая интеграции, может обеспечивать регуляторную функцию. Последовательности, расположенные выше и ниже в экзогенном матричном полинуклеотиде, выбирают таким образом, чтобы способствовать рекомбинации между хромосомной последовательностью, представляющей интерес, и донорным полинуклеотидом. Последовательность, расположенная выше, представляет собой последовательность нуклеиновой кислоты, которая обладает сходством последовательности с геномной последовательностью, расположенной выше подвергаемого нацеливанию сайта интеграции. Аналогично, последовательность, расположенная ниже, представляет собой последовательность нуклеиновой кислоты, которая обладает сходством последовательности с хромосомной последовательностью, расположенной ниже подвергаемого нацеливанию сайта интеграции. Последовательности, расположенные выше и ниже в экзогенном матричном полинуклеотиде, могут характеризоваться 75%, 80%, 85%, 90%, 95% или 100% идентичностью последовательности с подвергаемой нацеливанию геномной последовательностью. Последовательности, расположенные выше и ниже в экзогенном матричном полинуклеотиде, предпочтительно характеризуются 95%, 96%, 97%, 98%, 99% или 100% идентичностью последовательности с подвергаемой нацеливанию геномной последовательностью. В некоторых способах последовательности, расположенные выше и ниже в экзогенном матричном полинуклеотиде, характеризуются приблизительно 99% или 100% идентичностью последовательности с подвергаемой нацеливанию геномной последовательностью. Последовательность, расположенная выше или ниже, может содержать от приблизительно 20 п. о. до приблизительно 2500 п. о., например приблизительно 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400 или 2500 п. о. В некоторых способах иллюстративная последовательность, расположенная выше или ниже, имеет от приблизительно 200 п. о. до приблизительно 2000 п. о., от приблизительно 600 п. о. до приблизительно 1000 п. о. или, более конкретно, от приблизительно 700 п. о. до приблизительно 1000 п. о. В некоторых способах экзогенный матричный полинуклеотид может дополнительно содержать маркер. Такой маркер может облегчать скрининг в отношении подвергаемых нацеливанию интеграций. Примеры подходящих маркеров включают сайты рестрикции, флуоресцентные белки или селектируемые маркеры. Экзогенный матричный полинуклеотид согласно настоящему изобретению можно сконструировать с применением методик рекомбинантной ДНК (см., например, Sambrook et al., 2001 и Ausubel et al., 1996). В способе модифицирования целевого полинуклеотида посредством интеграции экзогенного матричного полинуклеотида в геномную последовательность вводят двухнитевой разрыв с помощью комплекса CRISPR, осуществляют репарацию разрыва посредством гомологичной рекомбинации с участием экзогенного матричного полинуклеотида, так что матрица интегрируется в геном. Наличие двухнитевого разрыва обеспечивает интеграцию матрицы. В других вариантах осуществления настоящее изобретение относится к способу модификации экспрессии полинуклеотида в эукариотической клетке. Способ включает повышение или снижение экспрессии целевого полинуклеотида с помощью комплекса CRISPR, который связывается с полинуклеотидом. В некоторых способах целевой полинуклеотид можно инактивировать для осуществления модификации экспрессии в клетке. Например, после связывания комплекса CRISPR с целевой последовательностью в клетке целевой полинуклеотид инактивируется, вследствие чего последовательность не транскрибируется, при этом не вырабатывается кодируемый белок или последовательность не функционирует так, как последовательность дикого типа. Например, последовательность, кодирующая белок или микроРНК, может быть инактивирована, вследствие чего не образуется белок, или microRNA или транскрипт pre-microRNA. В некоторых способах регуляторную последовательность можно инактивировать, так что она больше не функционирует в качестве регуляторной последовательности. Используемое в данном документе выражение "регуляторная последовательность" относится к любой последовательности нуклеиновой кислоты, которая оказывает влияние на транскрипцию, трансляцию или доступность последовательности нуклеиновой кислоты. Примеры регуляторной последовательности включают промотор, терминатор транскрипции и энхансер, которые являются регуляторными последовательностями. Целевым полинуклеотидом для комплекса CRISPR может быть любой полинуклеотид, эндогенный или экзогенный по отношению к эукариотической клетке. Например, целевой полинуклеотид может быть полинуклеотидом, находящимся в ядре эукариотической клетки. Целевой полинуклеотид может быть последовательностью, кодирующей продукт гена (к примеру, белок), или некодирующей последовательностью (к примеру, регуляторным полинуклеотидом или избыточной ДНК). Примеры целевых полинуклеотидов включают последовательность, ассоциированную с биохимическим путем передачи сигнала, к примеру, ген или полинуклеотид, ассоциированный с биохимическим путем передачи сигнала. Примеры целевых полинуклеотидов включают ассоциированный с заболеванием ген или полинуклеотид. "Ассоциированный с заболеванием" ген или полинуклеотид означает любой ген или полинуклеотид, который обеспечивает продукты транскрипции или трансляции на аномальном уровне или в аномальной форме в клетках, полученных из пораженных заболеванием тканей, по сравнению с тканями или клетками контроля без заболевания. Это может быть ген, который начинает экспрессироваться при аномально высоком уровне; это может быть ген, который начинает экспрессироваться при аномально низком уровне, где измененная экспрессия коррелирует с появлением и/или прогрессированием заболевания. Ассоциированный с заболеванием ген также означает ген, несущий мутацию(мутации) или генетическую вариацию, который непосредственно ответственен или находится в неравновесном сцеплении с геном(генами), ответственным(ответственными) за этиологию заболевания. Транскрибируемые или транслируемые продукты могут быть известными или неизвестными и могут присутствовать на нормальном или аномальном уровне. Целевым полинуклеотидом для комплекса CRISPR может быть любой полинуклеотид, эндогенный или экзогенный по отношению к эукариотической клетке. Например, целевой полинуклеотид может быть полинуклеотидом, находящимся в ядре эукариотической клетки. Целевой полинуклеотид может быть последовательностью, кодирующей продукт гена (к примеру, белок), или некодирующей последовательностью (к примеру, регуляторным полинуклеотидом или избыточной ДНК).The method includes modifying a target polynucleotide using a CRISPR complex that binds to the target polynucleotide and cleaves the target polynucleotide. Typically, the CRISPR complex of the present invention, when introduced into a cell, creates a break (e.g., a single-strand or double-strand break) in a genomic sequence. For example, the method can be used to cleave a gene responsible for the development of a disease in a cell. The break created by the CRISPR complex can be repaired by a repair process, such as error-prone non-homologous end joining (NHEJ) or high-fidelity repair involving homologous recombination (HDR). During this repair process, an exogenous template polynucleotide can be introduced into the genomic sequence. In some methods, the HDR process is used to modify the genomic sequence. For example, an exogenous template polynucleotide comprising a sequence to be integrated flanked by an upstream sequence and a downstream sequence is introduced into a cell. The upstream and downstream sequences are characterized by sequence similarity to each side of the integration site in the chromosome. If desired, the donor polynucleotide can be DNA, such as plasmid DNA, a bacterial artificial chromosome (BAC), a yeast artificial chromosome (YAC), a viral vector, a linear DNA fragment, a PCR fragment, a naked nucleic acid, or a nucleic acid complexed with a delivery vehicle such as a liposome or poloxamer. The exogenous template polynucleotide comprises a sequence to be integrated (e.g., a mutated gene). The sequence to be integrated can be a sequence endogenous or exogenous to the cell. Examples of a sequence to be integrated include polynucleotides encoding a protein or non-coding RNA (e.g., a microRNA). Thus, the sequence to be integrated may be operably linked to a corresponding regulatory sequence or sequences. Alternatively, the sequence to be integrated may provide a regulatory function. The upstream and downstream sequences in the exogenous template polynucleotide are selected to promote recombination between the chromosomal sequence of interest and the donor polynucleotide. The upstream sequence is a nucleic acid sequence that shares sequence similarity with a genomic sequence located upstream of the integration site to be targeted. Similarly, the downstream sequence is a nucleic acid sequence that shares sequence similarity with a chromosomal sequence located downstream of the integration site to be targeted. The upstream and downstream sequences of the exogenous template polynucleotide may have 75%, 80%, 85%, 90%, 95%, or 100% sequence identity to the genomic sequence to be targeted. The upstream and downstream sequences of the exogenous template polynucleotide preferably have 95%, 96%, 97%, 98%, 99%, or 100% sequence identity to the genomic sequence to be targeted. In some methods, the upstream and downstream sequences of the exogenous template polynucleotide have about 99% or 100% sequence identity to the genomic sequence to be targeted. The upstream or downstream sequence may comprise from about 20 bp to about 25 bp. to about 2,500 bp, such as about 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, or 2500 bp. In some methods, the exemplary upstream or downstream sequence is from about 200 bp to about 2,000 bp, from about 600 bp to about 1,000 bp, or more particularly from about 700 bp. to about 1000 bp. In some methods, the exogenous template polynucleotide may further comprise a marker. Such a marker may facilitate screening for targetable integrations. Examples of suitable markers include restriction sites, fluorescent proteins, or selectable markers. The exogenous template polynucleotide of the present invention can be constructed using recombinant DNA techniques (see, for example, Sambrook et al., 2001 and Ausubel et al., 1996). In a method for modifying a target polynucleotide by integrating an exogenous template polynucleotide into a genomic sequence, a double-strand break is introduced using a CRISPR complex, the break is repaired by homologous recombination involving the exogenous template polynucleotide, such that the template is integrated into the genome. The presence of the double-strand break ensures integration of the template. In other embodiments, the present invention relates to a method for modifying the expression of a polynucleotide in a eukaryotic cell. The method comprises increasing or decreasing the expression of a target polynucleotide using a CRISPR complex that binds to the polynucleotide. In some methods, the target polynucleotide may be inactivated to effect the modification of expression in the cell. For example, after the CRISPR complex binds to the target sequence in the cell, the target polynucleotide is inactivated such that the sequence is not transcribed, the encoded protein is not produced, or the sequence does not function as a wild-type sequence. For example, a sequence encoding a protein or microRNA may be inactivated such that the protein or microRNA or pre-microRNA transcript is not produced. In some methods, a regulatory sequence may be inactivated such that it no longer functions as a regulatory sequence. As used herein, the term "regulatory sequence" refers to any nucleic acid sequence that affects the transcription, translation, or accessibility of a nucleic acid sequence. Examples of a regulatory sequence include a promoter, a transcription terminator, and an enhancer, which are regulatory sequences. A target polynucleotide for a CRISPR complex can be any polynucleotide that is endogenous or exogenous to a eukaryotic cell. For example, a target polynucleotide can be a polynucleotide found in the nucleus of a eukaryotic cell. A target polynucleotide can be a sequence encoding a gene product (e.g., a protein) or a non-coding sequence (e.g., a regulatory polynucleotide or junk DNA). Examples of target polynucleotides include a sequence associated with a biochemical signaling pathway, such as a gene or polynucleotide associated with a biochemical signaling pathway. Examples of target polynucleotides include a disease-associated gene or polynucleotide. A "disease-associated" gene or polynucleotide means any gene or polynucleotide that provides transcription or translation products at an abnormal level or in an abnormal form in cells derived from diseased tissues compared to disease-free control tissues or cells. This may be a gene that begins to be expressed at an abnormally high level; it may be a gene that begins to be expressed at an abnormally low level, where the altered expression correlates with the onset and/or progression of a disease. A disease-associated gene also means a gene that carries a mutation(s) or genetic variation that is directly responsible for, or is in linkage disequilibrium with, the gene(s) responsible for the etiology of the disease. The transcribed or translated products may be known or unknown and may be present at normal or abnormal levels. The target polynucleotide for a CRISPR complex may be any polynucleotide, endogenous or exogenous to the eukaryotic cell. For example, the target polynucleotide may be a polynucleotide located in the nucleus of a eukaryotic cell. The target polynucleotide may be a sequence encoding a gene product (e.g., a protein) or a non-coding sequence (e.g., a regulatory polynucleotide or junk DNA).
Редактирование генов или изменение целевого локуса с помощью Cas9; HDR и матрицGene editing or target locus modification using Cas9; HDR and arrays
Двухнитевой разрыв или однонитевой разрыв в одной из нитей преимущественно должен находиться достаточно близко к целевому положению так, чтобы происходила коррекция. В одном варианте осуществления расстояние составляет не более 50, 100, 200, 300, 350 или 400 нуклеотидов. Без ограничения какой-либо теорией, полагают, что разрыв должен находиться достаточно близко к целевому положению, так чтобы разрыв находился в участке, который подвергается опосредованному экзонуклеазой удалению в ходе конечной резекции. Если расстояние между целевым положением и разрывом слишком большое, то мутация не может быть включена в конечную резекцию и, поэтому, не может быть исправлена, поскольку только последовательность матричной нуклеиновой кислоты может быть использована для коррекции последовательности в участке конечной резекции.The double-strand break or single-strand break in one of the strands should preferably be close enough to the target position so that correction occurs. In one embodiment, the distance is no more than 50, 100, 200, 300, 350, or 400 nucleotides. Without being limited by theory, it is believed that the break should be close enough to the target position so that the break is in a region that is subject to exonuclease-mediated removal during the final resection. If the distance between the target position and the break is too large, the mutation cannot be included in the final resection and therefore cannot be corrected, since only the template nucleic acid sequence can be used to correct the sequence at the final resection site.
В одном варианте осуществления, при котором направляющая РНК и молекула II типа, в частности Cas9 или его ортолог или гомолог, предпочтительно нуклеаза Cas9, индуцируют двухнитевой разрыв с целью индуцирования опосредованной HDR коррекции, сайт расщепления находится на расстоянии 0-200 п. о. (например, 0-175, 0-150, 0-125, 0-100, 0-75, 0-50, 0-25, 25-200, 25-175, 25-150, 25-125, 25-100, 25-75, 25-50, 50-200, 50-175, 50-150, 50-125, 50-100, 50-75, 75-200, 75-175, 75-150, 75-125, 75-100 п. о.) от целевого положения. В одном варианте осуществления сайт расщепления находится на расстоянии 0-100 п. о. (например, 0-75, 0-50, 0-25, 25-100, 25-75, 25-50, 50-100, 50-75 или 75-100 п. о.) от целевого положения. В дополнительном варианте осуществления две или более направляющих РНК, образующих комплекс с Cas9 или его ортологом или гомологом, можно применять для индуцирования мультиплексных разрывов для индуцирования опосредованной HDR коррекции.In one embodiment, wherein the guide RNA and a Type II molecule, in particular Cas9 or its ortholog or homolog, preferably Cas9 nuclease, induce a double-strand break to induce HDR-mediated correction, the cleavage site is 0-200 bp away. (e.g., 0-175, 0-150, 0-125, 0-100, 0-75, 0-50, 0-25, 25-200, 25-175, 25-150, 25-125, 25-100, 25-75, 25-50, 50-200, 50-175, 50-150, 50-125, 50-100, 50-75, 75-200, 75-175, 75-150, 75-125, 75-100 bp) from the target position. In one embodiment, the cleavage site is 0-100 bp away. (e.g., 0-75, 0-50, 0-25, 25-100, 25-75, 25-50, 50-100, 50-75, or 75-100 bp) from the target position. In a further embodiment, two or more guide RNAs complexed with Cas9 or an ortholog or homolog thereof can be used to induce multiplex breaks to induce HDR-mediated correction.
Гомологическое плечо должно протягиваться по меньшей мере до участка, в котором может произойти конечная резекция, например, чтобы позволить резецированному однонитевому "липкому" концу находить комплементарный участок в донорной матрице. Вся длина может быть ограничена параметрами, такими как размер плазмиды или пределы упаковки вируса. В одном варианте осуществления гомологическое плечо может не протягиваться до повторяющихся элементов. Типичная длина гомологического плеча составляет по меньшей мере 50, 100, 250, 500, 750 или 1000 нуклеотидов.The homology arm should extend at least to the site where the final resection can occur, for example, to allow the resected single-stranded "sticky" end to find a complementary site in the donor template. The overall length may be limited by parameters such as plasmid size or virus packaging limits. In one embodiment, the homology arm may not extend to the repeat elements. A typical homology arm length is at least 50, 100, 250, 500, 750, or 1000 nucleotides.
Целевое положение, как используется в данном документе, относится к сайту в целевой нуклеиновой кислоте или целевом гене (например, хромосоме), который модифицирован зависимым от Cas9 II типа, в частности Cas9 или его ортолога или гомолога, предпочтительно молекулы Cas9, процессом. Например, целевым положением может быть модифицированное расщепление молекулой Cas9 целевой нуклеиновой кислоты и модификация, направленная на матричную нуклеиновую кислоту, например, коррекция целевого положения. В одном варианте осуществления целевым положением может быть сайт между двумя нуклеотидами, например, смежными нуклеотидами, в целевой нуклеиновой кислоте, в который добавляют один или несколько нуклеотидов. Целевое положение может содержать один или несколько нуклеотидов, которые изменяются, например, корректируются, матричной нуклеиновой кислотой. В одном варианте осуществления целевое положение находится в целевой последовательности (например, в последовательности, с которой связывается направляющая РНК). В одном варианте осуществления целевое положение находится выше или ниже целевой последовательности (например, последовательности, с которой связывается направляющая РНК).A target position, as used herein, refers to a site in a target nucleic acid or a target gene (e.g., a chromosome) that is modified by a Cas9 type II dependent process, in particular Cas9 or an ortholog or homolog thereof, preferably a Cas9 molecule. For example, a target position can be a modified Cas9 molecule cleavage of a target nucleic acid and a modification directed to a template nucleic acid, such as a correction of a target position. In one embodiment, a target position can be a site between two nucleotides, such as adjacent nucleotides, in a target nucleic acid, to which one or more nucleotides are added. A target position can comprise one or more nucleotides that are altered, such as corrected, by a template nucleic acid. In one embodiment, a target position is in a target sequence (e.g., a sequence to which a guide RNA binds). In one embodiment, the target position is upstream or downstream of a target sequence (e.g., a sequence to which a guide RNA binds).
Матричная нуклеиновая кислота, как данный термин используется в данном документе, относится к последовательности нуклеиновой кислоты, которую можно применять в сочетании с молекулой II типа, в частности с Cas9 или его ортологом или гомологом, предпочтительно с молекулой Cas9 и молекулой направляющей РНК для изменения структуры целевого положения. В одном варианте осуществления целевую нуклеиновую кислоту модифицируют для обеспечения некоторой части или всей последовательности матричной нуклеиновой кислоты, как правило, в сайте(сайтах) расщепления или рядом с таковым(таковыми). В одном варианте осуществления матричная нуклеиновая кислота является однонитевой. В альтернативном варианте осуществления матричная нуклеиновая кислота является двухнитевой. В одном варианте осуществления матричной нуклеиновой кислотой является ДНК, например, двухнитевая ДНК. В альтернативном варианте осуществления матричная нуклеиновая кислота является однонитевой.A template nucleic acid, as used herein, refers to a nucleic acid sequence that can be used in combination with a Type II molecule, in particular Cas9 or an ortholog or homolog thereof, preferably a Cas9 molecule and a guide RNA molecule to alter the structure of a target location. In one embodiment, the target nucleic acid is modified to provide some or all of the template nucleic acid sequence, typically at or near the cleavage site(s). In one embodiment, the template nucleic acid is single-stranded. In an alternative embodiment, the template nucleic acid is double-stranded. In one embodiment, the template nucleic acid is DNA, such as double-stranded DNA. In an alternative embodiment, the template nucleic acid is single-stranded.
В одном варианте осуществления матричная нуклеиновая кислота изменяет структуру целевого положения путем участия в гомологичной рекомбинации. В одном варианте осуществления матричная нуклеиновая кислота изменяет последовательность целевого положения. В одном варианте осуществления матричная нуклеиновая кислота приводит к включению модифицированного или не встречающегося в природе основания в целевую нуклеиновую кислоту.In one embodiment, the template nucleic acid alters the structure of the target position by participating in homologous recombination. In one embodiment, the template nucleic acid alters the sequence of the target position. In one embodiment, the template nucleic acid results in the incorporation of a modified or non-naturally occurring base into the target nucleic acid.
Матричная последовательность может подвергаться опосредованной или катализируемой разрывом рекомбинации с целевой последовательностью. В одном варианте осуществления матричная нуклеиновая кислота может включать в себя последовательность, которая соответствует сайту в целевой последовательности, который расщепляется путем опосредованного Cas9 преобразования с расщеплением. В одном варианте осуществления матричная нуклеиновая кислота может включать в себя последовательность, которая соответствует как первому сайту в целевой последовательности, который расщепляется при первом опосредованном Cas9 событии, так и второму сайту в целевой последовательности, который расщепляется при втором опосредованном Cas9 событии.The template sequence may undergo cleavage-mediated or catalyzed recombination with the target sequence. In one embodiment, the template nucleic acid may include a sequence that corresponds to a site in the target sequence that is cleaved by Cas9-mediated cleavage conversion. In one embodiment, the template nucleic acid may include a sequence that corresponds to both a first site in the target sequence that is cleaved by a first Cas9-mediated event and a second site in the target sequence that is cleaved by a second Cas9-mediated event.
В определенных вариантах осуществления матричная нуклеиновая кислота может включать в себя последовательность, которая приводит к изменению в кодирующей последовательности транслируемой последовательности, например, последовательность, которая приводит к замене одной аминокислоты на другую в белковом продукте, например, с трансформированием мутантного аллеля в аллель дикого типа, с трансформированием аллеля дикого типа в мутантный аллелль, и/или к введению стоп-кодона, вставки аминокислотного остатка, делеции аминокислотного остатка или нонсенс-мутации. В определенных вариантах осуществления матричная нуклеиновая кислота может включать в себя последовательность, которая приводит к изменению в некодирующей последовательности, например, к изменению в экзоне или в 5'- или 3'-нетранслируемом или нетранскрибируемом участке. Такие изменения включают в себя изменение в контрольном элементе, например, в промоторе, энхансере, и изменение в цис-действующем или транс-действующем контрольном элементе.In certain embodiments, the template nucleic acid may include a sequence that results in a change in the coding sequence of the translated sequence, such as a sequence that results in a substitution of one amino acid for another in the protein product, such as a transformation of a mutant allele into a wild-type allele, a transformation of a wild-type allele into a mutant allele, and/or the introduction of a stop codon, an insertion of an amino acid residue, a deletion of an amino acid residue, or a nonsense mutation. In certain embodiments, the template nucleic acid may include a sequence that results in a change in a non-coding sequence, such as a change in an exon or in a 5' or 3' untranslated or untranscribed region. Such changes include a change in a control element, such as a promoter, an enhancer, and a change in a cis-acting or trans-acting control element.
Матричную нуклеиновую кислоту, обладающую гомологичностью с целевым положением в целевом гене, можно применять для изменения структуры целевой последовательности. Матричную последовательность можно применять для изменения нежелательной структуры, например, нежелательного или мутантного нуклеотида. Матричная нуклеиновая кислота может включать в себя последовательность, которая при интегрировании приводит к снижению активности положительного контрольного элемента; повышению активности положительного контрольного элемента; снижению активности отрицательного контрольного элемента; повышению активности негативного контрольного элемента; снижению экспрессии гена; повышению экспрессии гена; повышению устойчивости к нарушению или заболеванию; повышению устойчивости к проникновению вируса; исправлению мутации или изменению нежелательного аминокислотного остатка, обеспечению, усилению, отмене или снижению биологического свойства продукта гена, например, повышению ферментативной активности фермента, или усилению способности продукта гена взаимодействовать с другой молекулой.A template nucleic acid having homology to a target position in a target gene can be used to alter the structure of the target sequence. The template sequence can be used to alter an unwanted structure, such as an unwanted or mutant nucleotide. The template nucleic acid can include a sequence that when integrated results in a decrease in the activity of a positive control element; an increase in the activity of a positive control element; a decrease in the activity of a negative control element; an increase in the activity of a negative control element; a decrease in gene expression; an increase in gene expression; an increase in resistance to a disorder or disease; an increase in resistance to viral entry; a correction of a mutation or an alteration of an unwanted amino acid residue, provision, enhancement, abolition or reduction of a biological property of a gene product, such as an increase in the enzymatic activity of an enzyme, or an increase in the ability of the gene product to interact with another molecule.
Матричная нуклеиновая кислота может включать в себя последовательность, которая приводит к изменению в последовательности 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 или более нуклеотидов целевой последовательности. В одном варианте осуществления матричная нуклеиновая кислота может иметь длину 20 +/-10, 30 +/-10, 40 +/-10, 50 +/-10, 60 +/-10, 70 +/-10, 80 +/-10, 90 +/-10, 100 +/-10, 110 +/-10, 120 +/-10, 130 +/-10, 140 +/-10, 150 +/-10, 160 +/-10, 170 +/-10, 180 +/-10, 190 +/-10, 200 +/-10, 210 +/-10 или 220+/-10 нуклеотидов. В одном варианте осуществления матричная нуклеиновая кислота может иметь длину 30 +/-20, 40 +/-20, 50 +/-20, 60 +/-20, 70 +/-20, 80 +/-20, 90 +/-20, 100 +/-20, 110 +/-20, 120 +/-20, 130 +/-20, 140 +/-20, 150 +/-20, 160 +/-20, 170 +/-20, 180 +/-20, 190 +/-20, 200 +/-20, 210 +/-20 или 220 +/-20 нуклеотидов. В одном варианте осуществления матричная нуклеиновая кислота имеет длину 10-1000, 20-900, 30-800, 40-700, 50-600, 50-500, 50-400, 50-300, 50-200 или 50-100 нуклеотидов.The template nucleic acid may include a sequence that results in a change in the sequence of 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 or more nucleotides of the target sequence. In one embodiment, the template nucleic acid may have a length of 20 +/- 10, 30 +/- 10, 40 +/- 10, 50 +/- 10, 60 +/- 10, 70 +/- 10, 80 +/- 10, 90 +/- 10, 100 +/- 10, 110 +/- 10, 120 +/- 10, 130 +/- 10, 140 +/- 10, 150 +/- 10, 160 +/- 10, 170 +/- 10, 180 +/- 10, 190 +/- 10, 200 +/- 10, 210 +/- 10, or 220 +/- 10 nucleotides. In one embodiment, the template nucleic acid may have a length of 30 +/- 20, 40 +/- 20, 50 +/- 20, 60 +/- 20, 70 +/- 20, 80 +/- 20, 90 +/- 20, 100 +/- 20, 110 +/- 20, 120 +/- 20, 130 +/- 20, 140 +/- 20, 150 +/- 20, 160 +/- 20, 170 +/- 20, 180 +/- 20, 190 +/- 20, 200 +/- 20, 210 +/- 20, or 220 +/- 20 nucleotides. In one embodiment, the template nucleic acid has a length of 10-1000, 20-900, 30-800, 40-700, 50-600, 50-500, 50-400, 50-300, 50-200, or 50-100 nucleotides.
Матричная нуклеиновая кислота содержит следующие компоненты: [5'-гомологичное плечо]-[последовательность замены]-[3'-гомологичное плечо]. Гомологичные плечи обеспечивают рекомбинацию в хромосоме, замещая таким образом нежелательный элемент, например, мутацию или сигнатуру, последовательностью замены. В одном варианте осуществления гомологичные плечи фланкируют наиболее дистальные сайты расщепления. В варианте осуществления 3'-конец 5'-гомологичного плеча представляет собой положение рядом с 5'-концом последовательности замены. В одном варианте осуществления 5'-гомологичное плечо может протягиваться по меньшей мере на 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500 или 2000 нуклеотидов 5' от 5'-конца последовательности замены. В варианте осуществления 5'-конец 3'-гомологичного плеча представляет собой положение рядом с 3'-концом последовательностью замены. В варианте осуществления 3'-гомологичное плечо может протягиваться по меньшей мере на 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500 или 2000 нуклеотидов 3' от 3'-конца последовательности замены.The template nucleic acid comprises the following components: [5' homologous arm]-[substitution sequence]-[3' homologous arm]. The homologous arms mediate recombination in the chromosome, thereby replacing an undesired element, such as a mutation or signature, with a substitution sequence. In one embodiment, the homologous arms flank the most distal cleavage sites. In an embodiment, the 3' end of the 5' homologous arm is a position adjacent to the 5' end of the substitution sequence. In one embodiment, the 5' homologous arm may extend at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, or 2000 nucleotides 5' from the 5' end of the substitution sequence. In an embodiment, the 5' end of the 3' homologous arm is a position adjacent to the 3' end of the substitution sequence. In an embodiment, the 3' homologous arm may extend at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, or 2000 nucleotides 3' from the 3' end of the substitution sequence.
В определенных вариантах осуществления одно или оба гомологичных плеча могут быть укорочены, чтобы избежать включения некоторых повторяющихся элементов последовательности. Например, 5'-гомологичное плечо может быть укорочено, чтобы избежать повторяющегося элемента последовательности. В других вариантах осуществления 3'-гомологичное плечо может быть укорочено, чтобы избежать повторяющегося элемента последовательности. В некоторых вариантах осуществления оба 5'- и 3'-гомологичных плеча могут быть укорочены, чтобы избежать включения некоторых повторяющихся элементов последовательности.In certain embodiments, one or both homologous arms may be shortened to avoid the inclusion of certain repetitive sequence elements. For example, the 5' homologous arm may be shortened to avoid the repetitive sequence element. In other embodiments, the 3' homologous arm may be shortened to avoid the repetitive sequence element. In some embodiments, both the 5' and 3' homologous arms may be shortened to avoid the inclusion of certain repetitive sequence elements.
В определенных вариантах осуществления матричные нуклеиновые кислоты для коррекции мутации можно разработать для применения в качестве однонитевого олигонуклеотида. При использовании однонитевого олигонуклеотида длина 5'- и 3'-гомологичных плеч может варьировать до приблизительно 200 пар оснований (п. о.), например, может составлять по меньшей мере 25, 50, 75, 100, 125, 150, 175 или 200 п. о.In certain embodiments, mutation correction template nucleic acids can be designed for use as a single-stranded oligonucleotide. When using a single-stranded oligonucleotide, the length of the 5' and 3' homologous arms can vary up to about 200 base pairs (bp), such as at least 25, 50, 75, 100, 125, 150, 175, or 200 bp.
Репарация ДНК и NHEJDNA repair and NHEJ
В определенных вариантах осуществления индуцируемое нуклеазой негомологичное соединение концов (NHEJ) может быть использовано для целевых ген-специфических нокаутов. Индуцируемое нуклеазой NHEJ также может быть использовано для удаления (например, делеции) последовательности в представляющем интерес гене. Как правило, NHEJ репарирует двухнитевой разрыв в ДНК путем соединения двух концов вместе; однако, как правило, оригинальная последовательность восстанавливается, только если два совместимых конца, точно так же, как если бы они были образованы двухнитевым разрывом, лигированы в полной мере. Концы ДНК двухнитевого разрыва зачастую подвергаются ферментативному процессированию, что приводит к добавлению или удалению нуклеотидов на одной или обеих нитях перед повторным соединением концов. Это приводит в результате к наличию вставочных и/или делеционных (инсерционно-делеционных) мутаций в последовательности ДНК на сайте репарации путем NHEJ. Две третьих таких мутаций, как правило, изменяют рамку считывания и, поэтому, продуцируют нефункциональный белок. Кроме того, мутации, которые сохраняют рамку считывания, но которые вставляют или удаляют значительную часть последовательности, могут нарушать функциональность белка. Это зависит от локуса, поскольку мутации в критических функциональных доменах, вероятно, менее переносимы, чем мутации в некритических участках белка. Мутации по типу вставок/делеций, созданные NHEJ, непредсказуемы по своей природе; однако на данном сайте разрыва некоторые инсерционно-делеционные последовательности являются предпочтительными и чрезмерно представлены в популяции, вероятно, из-за небольших областей микрогомологии. Длины делеций могут широко варьировать; чаще всего в диапазоне 1-50 п. о., но они могут свободно превысить 50 п. о., например, они могут свободно достичь более чем приблизительно 100-200 п. о. Вставки, как правило, короче и зачастую включают в себя короткие повторы последовательностей, непосредственно окружающие сайт разрыва. Однако можно получить крупные вставки, и в этих случаях вставленная последовательность часто проходит к другим областям генома или к плазмидной ДНК, присутствующей в клетках.In certain embodiments, nuclease-induced non-homologous end joining (NHEJ) can be used to target gene-specific knockouts. Nuclease-induced NHEJ can also be used to remove (e.g., delete) a sequence in a gene of interest. Typically, NHEJ repairs a double-strand break in DNA by joining the two ends together; however, typically, the original sequence is restored only if the two compatible ends, just as if they were formed by the double-strand break, are completely ligated. The DNA ends of a double-strand break are often enzymatically processed, resulting in the addition or removal of nucleotides on one or both strands before the ends are rejoined. This results in the presence of insertion and/or deletion (insertional-deletion) mutations in the DNA sequence at the NHEJ repair site. Two-thirds of such mutations typically alter the reading frame and therefore produce a non-functional protein. Additionally, mutations that maintain the reading frame but that insert or delete a significant portion of sequence may disrupt protein functionality. This depends on the locus, since mutations in critical functional domains are likely to be less tolerated than mutations in non-critical regions of the protein. The insertion/deletion mutations created by NHEJ are unpredictable in nature; however, at a given breakpoint, some insertion/deletion sequences are favored and overrepresented in the population, likely due to small regions of microhomology. Deletion lengths can vary widely; most commonly in the range of 1-50 bp, but they can freely exceed 50 bp, for example, they can freely reach more than approximately 100-200 bp. Insertions are typically shorter and often involve short repeats of sequences immediately surrounding the breakpoint. However, large insertions can occur, and in these cases the inserted sequence often extends to other regions of the genome or to plasmid DNA present in the cells.
Поскольку NHEJ является мутагенным процессом, оно также может быть использовано для удаления небольших мотивов последовательностей, при условии, что не требуется образование определенной финальной последовательности. Если двухнитевой разрыв намечается рядом с короткой целевой последовательностью, то мутации по типу делеции, вызванные репарацией путем NHEJ, часто охватывают и, поэтому, удаляют нежелательные нуклеотиды. Для делеции более крупных сегментов ДНК введение двух двухнитевых разрывов, по одному с каждой стороны последовательности, может приводить к NHEJ между концами с удалением всей вставочной последовательности. Оба из этих подходов могут быть использованы для удаления определенных последовательностей ДНК; однако, допускающая ошибки природа NHEJ все равно может приводить к мутациям по типу вставок/делеций в сайте репарации.Because NHEJ is a mutagenic process, it can also be used to remove small sequence motifs, provided that formation of a specific final sequence is not required. If a double-strand break is targeted near a short target sequence, deletion mutations induced by NHEJ repair often span and therefore remove the unwanted nucleotides. For deletion of larger DNA segments, introduction of two double-strand breaks, one on either side of the sequence, can result in NHEJ between the ends, removing the entire insertion sequence. Both of these approaches can be used to remove specific DNA sequences; however, the error-prone nature of NHEJ can still result in insertion/deletion mutations at the repair site.
Как двухнитевую расщепляющую молекулу II типа, в частности, Cas9 или его ортолог или гомолог, предпочтительно молекулы Cas9, так и однонитевую или никазную молекулу II типа, в частности, Cas9 или его ортолог или гомолог, предпочтительно молекулы Cas9, можно применять в способах и композициях, описываемых в данном документе, для создания NHEJ-опосредованных вставок/делеций. NHEJ-опосредованные вставки/делеции, нацеленные на ген, например, кодирующий участок, например, ранний кодирующий участок представляющего интерес гена, могут быть использованы для нокаута (т.е. для устранения экспрессии) представляющего интерес гена. Например, ранний кодирующий участок представляющего интерес гена включает в себя последовательность сразу после сайта начала транскрипции, в первом экзоне кодирующей последовательности или в пределах 500 п. о. сайта начала транскрипции (например, менее 500, 450, 400, 350, 300, 250, 200, 150, 100 или 50 п. о.).Both a double-stranded type II cleavage molecule, in particular Cas9 or an ortholog or homolog thereof, preferably Cas9 molecules, and a single-stranded or type II nickase molecule, in particular Cas9 or an ortholog or homolog thereof, preferably Cas9 molecules, can be used in the methods and compositions described herein to create NHEJ-mediated insertions/deletions. NHEJ-mediated insertions/deletions targeting a gene, such as a coding region, such as an early coding region of a gene of interest, can be used to knock out (i.e., eliminate expression of) the gene of interest. For example, an early coding region of a gene of interest includes a sequence immediately after the transcription start site, in the first exon of the coding sequence, or within 500 bp. transcription start site (e.g., less than 500, 450, 400, 350, 300, 250, 200, 150, 100, or 50 bp).
В одном варианте осуществления, в котором направляющая РНК и молекула II типа, в частности, Cas9 или его ортолог или гомолог, предпочтительно нуклеаза Cas9, образует двухнитевой разрыв для индуцирования NHEJ-опосредованных вставок/делеций, направляющая РНК может быть сконфигурирована для размещения одного двухнитевого разрыва в непосредственной близости к нуклеотиду целевого положения. В одном варианте осуществления сайт расщепление может находиться в пределах 0-500 п. о. от целевого положения (например, менее 500, 400, 300, 200, 100, 50, 40, 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 или 1 п. о. от целевого положения).In one embodiment, wherein the guide RNA and the Type II molecule, in particular Cas9 or an ortholog or homolog thereof, preferably a Cas9 nuclease, forms a double-strand break to induce NHEJ-mediated insertions/deletions, the guide RNA may be configured to place one double-strand break in close proximity to the nucleotide of the target position. In one embodiment, the cleavage site may be within 0-500 bp of the target position (e.g., less than 500, 400, 300, 200, 100, 50, 40, 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, or 1 bp of the target position).
В одном варианте осуществления, в котором две направляющие РНК, образующие комплекс с молекулами II типа, в частности, Cas9 или его ортологом или гомологом, предпочтительно с никазами Cas9, индуцируют два однонитевых разрыва для индуцирования NHEJ-опосредованных вставок/делеций, две направляющих РНК могут быть сконфигурированы для размещения двух однонитевых разрывов для обеспечения репарации путем NHEJ нуклеотида целевого положения.In one embodiment, wherein two guide RNAs complexed with type II molecules, in particular Cas9 or its ortholog or homolog, preferably Cas9 nickases, induce two single-strand breaks to induce NHEJ-mediated insertions/deletions, the two guide RNAs may be configured to accommodate two single-strand breaks to ensure NHEJ repair of the target nucleotide.
Доставка функциональных эффекторовDelivery of functional effectors
В отличие от нокаута гена, опосредованного CRISPR-Cas, который окончательно устраняет экспрессию путем мутации гена на уровне ДНК, нокдаун с помощью CRISPR-Cas позволяет временно сократить экспрессию гена с использованием искусственных факторов транскрипции. Мутирующие ключевые остатки в обоих доменах расщепления ДНК белка Cas9 приводят к образованию кристаллически неактивного Cas9. Кристаллически неактивный Cas9 объединяется в комплекс с направляющей РНК и локализуется с последовательностью ДНК, определяемой этим нацеливающимся доменом направляющей РНК, однако, он не расщепляет целевую ДНК. Слияние неактивного белка Cas9 с эффекторным доменом, например, доменом подавления транскрипции, облегчает вовлечение эффектора на какой-либо сайт ДНК, определяемый направляющей РНК. В определенных вариантах осуществления Cas9 может быть слит с доменом транскрипционного подавления и вовлечен в промоторный участок гена. В частности, для подавления гена в данном документе предусматривается, что блокирование сайта связывания эндогенного фактора транскрипции будет способствовать подавлению экспрессии гена. В другом варианте осуществления неактивный Cas9 может быть слит с модифицирующим хроматин белком. Изменение состояния хроматина может приводить к пониженной экспрессии целевого гена.Unlike CRISPR-Cas-mediated gene knockout, which permanently abolishes expression by mutating the gene at the DNA level, CRISPR-Cas knockdown allows for a transient reduction in gene expression using artificial transcription factors. Mutating key residues in both DNA cleavage domains of the Cas9 protein results in the formation of a crystal-inactive Cas9. The crystal-inactive Cas9 complexes with a guide RNA and localizes to a DNA sequence defined by the targeting domain of the guide RNA, but does not cleave the target DNA. Fusion of the inactive Cas9 protein to an effector domain, such as a transcriptional silencing domain, facilitates recruitment of the effector to a DNA site defined by the guide RNA. In certain embodiments, Cas9 may be fused to a transcriptional silencing domain and recruited to a promoter region of a gene. In particular, for gene silencing, it is envisaged herein that blocking the binding site of an endogenous transcription factor will promote gene expression silencing. In another embodiment, an inactive Cas9 may be fused to a chromatin modifying protein. The alteration of the chromatin state may result in decreased expression of the target gene.
В одном варианте осуществления молекула направляющей РНК может быть нацелена на известные отвечающие за транскрипцию элементы (например, промоторы, энхансеры и т.д.), известные расположенные выше активирующие последовательности и/или последовательности с неизвестной или известной функцией, которые, как предполагается, способны контролировать экспрессию целевой ДНК.In one embodiment, a guide RNA molecule may target known transcriptional responsive elements (e.g., promoters, enhancers, etc.), known upstream activating sequences, and/or sequences of unknown or known function that are believed to be capable of controlling the expression of the target DNA.
В некоторых способах целевой полинуклеотид можно инактивировать для осуществления модификации экспрессии в клетке. Например, после связывания комплекса CRISPR с целевой последовательностью в клетке целевой полинуклеотид инактивируется, вследствие чего последовательность не транскрибируется, при этом не вырабатывается кодируемый белок или последовательность не функционирует так, как последовательность дикого типа. Например, последовательность, кодирующая белок или microRNA, может быть инактивирована, вследствие чего белок не образуется.In some methods, the target polynucleotide may be inactivated to modify expression in the cell. For example, after the CRISPR complex binds to the target sequence in the cell, the target polynucleotide is inactivated so that the sequence is not transcribed, the encoded protein is not produced, or the sequence does not function as the wild-type sequence. For example, a sequence encoding a protein or microRNA may be inactivated so that the protein is not produced.
В определенных вариантах осуществления фермент CRISPR содержит одну или несколько мутаций, выбранных из группы, состоящей из D917A, E1006A и D1225A, и/или одна или несколько мутаций находятся в домене RuvC фермента CRISPR или представляют собой другую мутацию, обсуждаемую в данном документе. В некоторых вариантах осуществления фермент CRISPR имеет одну или несколько мутаций в каталитическом домене, где при транскрипции последовательность прямого повтора формирует одну "петлю-на-стебле", а направляющая последовательность управляет специфичным к последовательности связыванием комплекса CRISPR с целевой последовательностью, и где фермент дополнительно содержит функциональный домен. В некоторых вариантах осуществления функциональный домен представляет собой домен активации транскрипции, предпочтительно VP64. В некоторых вариантах осуществления функциональный домен представляет собой домен репрессии транскрипции, предпочтительно KRAB. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой SID или конкатемеры SID (например, SID4X). В некоторых вариантах осуществления функциональный домен представляет собой домен эпигенетического модифицирования, так что обеспечивается фермент эпигенетического модифицирования. В некоторых вариантах осуществления функциональный домен представляет собой домен активации, который может представлять собой домен активации P65.In certain embodiments, the CRISPR enzyme comprises one or more mutations selected from the group consisting of D917A, E1006A, and D1225A, and/or the one or more mutations are in the RuvC domain of the CRISPR enzyme or are another mutation discussed herein. In some embodiments, the CRISPR enzyme has one or more mutations in the catalytic domain, wherein upon transcription, the direct repeat sequence forms a single stem-loop and the guide sequence directs sequence-specific binding of the CRISPR complex to a target sequence, and wherein the enzyme further comprises a functional domain. In some embodiments, the functional domain is a transcriptional activation domain, preferably VP64. In some embodiments, the functional domain is a transcriptional repression domain, preferably KRAB. In some embodiments, the transcriptional repression domain is a SID or concatemers of SIDs (e.g., SID4X). In some embodiments, the functional domain is an epigenetic modification domain, such that an epigenetic modification enzyme is provided. In some embodiments, the functional domain is an activation domain, which may be a P65 activation domain.
Функциональные эффекторы (домены)Functional effectors (domains)
Редактирование генов может быть выполнено с помощью Cas9 в соответствии с настоящим изобретением. Cas9 может быть инактивирован и слит с одним или несколькими функциональными доменами (эффекторами).Gene editing can be performed using Cas9 according to the present invention. Cas9 can be inactivated and fused to one or more functional domains (effectors).
В некоторых вариантах осуществления функциональный домен может быть выбран из группы, состоящей из домена транспозазы, домена интегразы, домена рекомбиназы, домена резольвазы, домена инвертазы, домена протеазы, домена ДНК-метилтрансферазы, домена ДНК-гидроксилметилазы, домена ДНК-деметилазы, домена гистонацетилазы, домена гистондеацетилазы, нуклеазного домена, репрессорного домена, активаторного домена, доменов сигнала ядерной локализации, домена регуляторного белка транскрипции (или вовлечения транскрипционного комплекса), ассоциированного с активностью клеточного поглощения домена, домена связывания нуклеиновой кислоты, домена представления антитела, модифицирующих гистоны ферментов, рекрутера модифицирующих гистоны ферментов; ингибитора модифицирующих гистоны ферментов, гистонметилтрансферазы, гистондеметилазы, гистонкиназы, гистонфосфатазы, гистонрибозилазы, гистондерибозилазы, гистонубиквитиназы, гистондеубиквитиназы, гистонбиотиназы и протеазы гистонового хвоста.In some embodiments, the functional domain may be selected from the group consisting of a transposase domain, an integrase domain, a recombinase domain, a resolvase domain, an invertase domain, a protease domain, a DNA methyltransferase domain, a DNA hydroxylmethylase domain, a DNA demethylase domain, a histone acetylase domain, a histone deacetylase domain, a nuclease domain, a repressor domain, an activator domain, nuclear localization signal domains, a transcription regulatory protein (or transcription recruitment complex) domain, a cellular uptake activity-associated domain, a nucleic acid binding domain, an antibody presentation domain, a histone modifying enzyme, a histone modifying enzyme recruiter; inhibitor of histone modifying enzymes, histone methyltransferase, histone demethylase, histone kinase, histone phosphatase, histone ribosylase, histone deribosylase, histone ubiquitinase, histone deubiquitinase, histone biotinase and histone tail protease.
В некоторых предпочтительных вариантах осуществления функциональный домен представляет собой домен активации транскрипции, предпочтительно VP64. В некоторых вариантах осуществления функциональный домен представляет собой домен репрессии транскрипции, предпочтительно KRAB. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой SID или конкатемеры SID (например, SID4X). В некоторых вариантах осуществления функциональный домен представляет собой домен эпигенетического модифицирования, так что обеспечивается фермент эпигенетического модифицирования. В некоторых вариантах осуществления функциональный домен представляет собой домен активации, который может представлять собой домен активации P65.In some preferred embodiments, the functional domain is a transcriptional activation domain, preferably VP64. In some embodiments, the functional domain is a transcriptional repression domain, preferably KRAB. In some embodiments, the transcriptional repression domain is SID or SID concatemers (e.g., SID4X). In some embodiments, the functional domain is an epigenetic modification domain, such that an epigenetic modification enzyme is provided. In some embodiments, the functional domain is an activation domain, which may be a P65 activation domain.
Нацеливание на ген в неделящихся клетках (нейронах и мышечных)Targeting a gene in non-dividing cells (neurons and muscle)
Неделящиеся (особенно неделящиеся, полностью дифференцированные) типы клеток, в том числе мышечных клеток и особенно нейронов, представляют проблемы для нацеливания на ген или конструирование генома, например, поскольку гомологичная рекомбинация (HR), как правило, подавляется в фазе G1 клеточного цикла. Однако, исследуя механизмы контроля клетками нормальных систем репарации, Orthwein et al. сообщили о ранее неизвестном переключателе, который держит HR "выключенной" в неделящихся клетках, и они разработали стратегию включения этого переключателя. Orthwein et al. (лаборатория Daniel Durocher при Mount Sinai Hospital в Оттаве, Канада, в Nature 16142, опубликованном онлайн 9 декабря 2015 г.) показали, что подавление HR может быть отменено и нацеливание на ген успешно осуществлено в клетках как почки (293T), так и остеосаркомы (U2OS). Как известно, опухолевые супрессоры BRCA1, PALB2 и BRAC2 обеспечивают репарацию DSB ДНК с помощью HR. Они выяснили, что образование комплекса BRCA1 с PALB2-BRAC2 регулируется убиквитиновым сайтом в PALB2, например, действием на сайт убиквитинлигазой E3. Такая убиквитинлигаза E3 состоит из KEAP1 (взаимодействующего с PALB2 белка) в комплексе с циллином-3 (CUL3)-RBX1. Убиквитинилирование PALB2 подавляет его взаимодействие с BRCA1 и нейтрализуется деубиквитилазой USP11, которая сама находится под контролем клеточного цикла. Восстановление взаимодействия BRCA1-PALB2 в комбинации с активацией резекции конца ДНК является достаточным для индуцирования гомологичной рекомбинации в G1, как измерено рядом способов, в том числе анализом основанного на CRISPR-Cas9 нацеливания на ген, направленным на USP11 или KEAP1 (экспрессированные из вектора pX459). Однако, если взаимодействие BRCA1-PALB2 восстанавливалось в перенесших резекцию клетках G1 с использованием либо истощения KEAP1, либо экспрессии мутанта PALB2-KR, выявляли достоверное увеличение числа событий нацеливания на ген.Non-dividing (especially non-dividing, fully differentiated) cell types, including muscle cells and especially neurons, present challenges for gene targeting or genome engineering, for example, because homologous recombination (HR) is typically downregulated in the G1 phase of the cell cycle. However, by investigating how cells control normal repair systems, Orthwein et al. reported a previously unknown switch that keeps HR “off” in non-dividing cells, and they developed a strategy to turn on this switch. Orthwein et al. (Daniel Durocher lab at Mount Sinai Hospital in Ottawa, Canada, in Nature 16142, published online December 9, 2015) showed that HR downregulation could be reversed and gene targeting successful in both kidney (293T) and osteosarcoma (U2OS) cells. Tumor suppressors BRCA1, PALB2, and BRAC2 are known to repair DNA DSBs via HR. They found that the formation of the BRCA1 complex with PALB2-BRAC2 is regulated by a ubiquitin site in PALB2, for example, by the action of an E3 ubiquitin ligase on the site. This E3 ubiquitin ligase consists of KEAP1 (a PALB2-interacting protein) in a complex with cillin-3 (CUL3)-RBX1. Ubiquitination of PALB2 inhibits its interaction with BRCA1 and is neutralized by deubiquitylase USP11, which itself is under cell cycle control. Restoration of the BRCA1-PALB2 interaction in combination with activation of DNA end resection is sufficient to induce homologous recombination in G1, as measured by a number of methods, including a CRISPR-Cas9-based gene targeting assay targeting USP11 or KEAP1 (expressed from the pX459 vector). However, when the BRCA1-PALB2 interaction was restored in G1-resected cells using either KEAP1 depletion or PALB2-KR mutant expression, a significant increase in gene targeting events was detected.
Таким образом, реактивация HR в клетках, особенно в неделящихся, полностью дифференцированных типах клеток, в том числе в мышечных клетках и особенно нейронах, является предпочтительной в некоторых вариантах осуществления. В некоторых вариантах осуществления обеспечение взаимодействия BRCA1-PALB2 является предпочтительным в некоторых вариантах осуществления. В некоторых вариантах осуществления целевой клеткой является неделящаяся клетка. В некоторых вариантах осуществления целевой клеткой является нейрон или мышечная клетка. В некоторых вариантах осуществления на целевую клетку нацеливаются in vivo. В некоторых вариантах осуществления клетка находится в G1, и HR подавляется.Thus, reactivation of HR in cells, especially non-dividing, fully differentiated cell types, including muscle cells and especially neurons, is preferred in some embodiments. In some embodiments, providing BRCA1-PALB2 interaction is preferred in some embodiments. In some embodiments, the target cell is a non-dividing cell. In some embodiments, the target cell is a neuron or a muscle cell. In some embodiments, the target cell is targeted in vivo. In some embodiments, the cell is in G1 and HR is suppressed.
В некоторых вариантах осуществления предпочтительным является применение истощения KEAP1, например, ингибирование активности экспрессии KEAP1. Истощение KEAP1 может быть достигнуто посредством siRNA, например, как показано у Orthwein et al. В качестве альтернативы, предпочтительной является экспрессия мутанта PALB2-KR (не имеющего все восемь остатков Lys в домене взаимодействия с BRCA1) либо в комбинации с истощением KEAP1, либо отдельно.In some embodiments, it is preferred to use KEAP1 depletion, such as inhibition of KEAP1 expression activity. KEAP1 depletion can be achieved via siRNA, such as shown in Orthwein et al. Alternatively, it is preferred to express a PALB2-KR mutant (lacking all eight Lys residues in the BRCA1 interaction domain), either in combination with KEAP1 depletion or alone.
PALB2-KR взаимодействует с BRCA1 не зависимо от положения в клеточном цикле. Таким образом, обеспечение или восстановление взаимодействия BRCA1-PALB2, особенно в клетках G1, является предпочтительным в некоторых вариантах осуществления, особенно, если целевые клетки являются неделящимися, или если удаление и возвращение (ex vivo нацеливания на ген) являются проблематичными, например, в нейронных или мышечных клетках. siRNA KEAP1 является предпочтительной и доступной от ThermoFischer.PALB2-KR interacts with BRCA1 regardless of position in the cell cycle. Thus, ensuring or restoring the BRCA1-PALB2 interaction, especially in G1 cells, is advantageous in some embodiments, especially if the target cells are non-dividing or if removal and recapitulation (ex vivo gene targeting) is problematic, such as in neuronal or muscle cells. KEAP1 siRNA is preferred and is available from ThermoFischer.
В некоторых вариантах осуществления комплекс BRCA1-PALB2 может быть доставлен в клетку G1, в виде либо белкового комплекса, слитого белка, полинуклеотидов, кодирующих BRCA1 и PALB2, либо полинуклеотидов, кодирующих слитый белок BRCA1-PALB2. Такие полинуклеотиды могут находиться под контролем подходящего промотора, например, и доставляться, как описывается в данном документе, либо одновременно и необязательно в одних и тех же векторе или векторной системе в виде белка CRISPR, либо отдельно. Другие возможности обеспечения HR в неделящихся, полностью дифференцированных типах клеток, в том числе в мышечных клетках и особенно нейронах, могут включать в себя непосредственную доставку PALB2 (с использованием Cas9, слитого с аффинной молекулой для PALB2) и/или непосредственную доставку BRCA2 (с использованием Cas9, слитого с аффинной молекулой для BRCA2).In some embodiments, the BRCA1-PALB2 complex can be delivered to a G1 cell, either as a protein complex, a fusion protein, polynucleotides encoding BRCA1 and PALB2, or polynucleotides encoding a BRCA1-PALB2 fusion protein. Such polynucleotides can be under the control of a suitable promoter, for example, and delivered as described herein, either simultaneously and optionally in the same vector or vector system, as a CRISPR protein, or separately. Other options for providing HR in non-dividing, fully differentiated cell types, including muscle cells and especially neurons, can include direct delivery of PALB2 (using Cas9 fused to an affinity molecule for PALB2) and/or direct delivery of BRCA2 (using Cas9 fused to an affinity molecule for BRCA2).
В некоторых вариантах осуществления деубиквитилирование PALB2 может быть обеспечено, например, усиленной экспрессией или активностью деубиквитилазы USP11. Таким образом, в некоторых вариантах осуществления предусматривается, что может быть обеспечена конструкция для обеспечения или активации экспрессии или активности деубиквитилазы USP11.In some embodiments, deubiquitylation of PALB2 can be achieved, for example, by enhanced expression or activity of USP11 deubiquitylase. Thus, in some embodiments, it is envisaged that a construct can be provided to achieve or activate expression or activity of USP11 deubiquitylase.
Нокдаун CRL4 также может быть использован для того, чтобы сделать KEAP1 неактивным или уменьшить его активность. Например, можно использовать siRNA CRL4. Альтернативно MLN4924 (ингибитор всего CRL) также может быть использованы для инактивации KEAP1.Knockdown of CRL4 can also be used to make KEAP1 inactive or reduce its activity. For example, CRL4 siRNA can be used. Alternatively, MLN4924 (an inhibitor of all CRL) can also be used to inactivate KEAP1.
Особенно предпочтительным является то, что также обеспечивается нокаут 53BP, поскольку предположили, что это необходимо для активации HDR (показано у Orthwein et al). Нокаут 53BP также может быть достигнут с помощью siRNA.It is particularly advantageous that 53BP knockout is also achieved, as it has been suggested that this is necessary for HDR activation (shown in Orthwein et al). 53BP knockout can also be achieved by siRNA.
Активирующая резекция ДНК (создающая "липкие" 3'-концы на любой стороне двухнитевого разрыва ДНК) также важна для активации HR при G1. Это осуществляли путем доставки ORF гена CtIP (или SAE2) с мутацией (T847E), что имитирует активирующее фосфорилирование. Заявители утверждают, что эту потребность можно обойти путем использования двойных никаз Cas9 для введения "липких" 3'-концов (Hsu et al.). Следовательно, такое применение двойных никаз Cas9 для введения "липких" 3'-концов является предпочтительным в нацеливании на неделящиеся, полностью дифференцированные типы клеток, в том числе мышечные клетки и особенно нейроны.Activating DNA resection (creating 3' sticky ends on either side of a DNA double-strand break) is also essential for HR activation in G1. This was accomplished by delivering the CtIP (or SAE2) gene ORF with a mutation (T847E) that mimics activating phosphorylation. The authors claim that this requirement can be circumvented by using dual Cas9 nickases to introduce 3' sticky ends (Hsu et al.). Therefore, this use of dual Cas9 nickases to introduce 3' sticky ends is advantageous in targeting non-dividing, fully differentiated cell types, including muscle cells and especially neurons.
В одном варианте осуществления настоящее изобретение относится к способу расщепления целевого полинуклеотида. Способ включает применение комплекса CRISPR, который связывается с целевым полинуклеотидом и осуществляет расщепление указанного целевого полинуклеотида. Как правило, комплекс CRISPR по настоящему изобретению при введении в клетку создает разрыв (например, однонитевой или двухнитевой разрыв) в геномной последовательности. Например, способ можно применять для расщепления гена, ответственного за развитие заболевания, в клетке.In one embodiment, the present invention relates to a method for cleaving a target polynucleotide. The method includes using a CRISPR complex that binds to a target polynucleotide and cleaves said target polynucleotide. Typically, the CRISPR complex of the present invention, when introduced into a cell, creates a break (e.g., a single-strand break or a double-strand break) in a genomic sequence. For example, the method can be used to cleave a disease-causing gene in a cell.
Репарация разрыва, созданного комплексом CRISPR, может осуществляться посредством процесса репарации, например, путем склонного к ошибкам негомологичного соединения концов (NHEJ) или высокоточной репарации с участием гомологичной рекомбинации (HDR). В ходе данного процесса репарации в геномную последовательность может быть введен экзогенный матричный полинуклеотид. В некоторых способах процесс HDR используют для модификации геномной последовательности. Например, в клетку вводят экзогенный матричный полинуклеотид, содержащий последовательность, подлежащую интеграции, фланкированную последовательностью, расположенной выше, и последовательностью, расположенной ниже. Последовательности, расположенные выше и ниже, характеризуются сходством последовательности с каждой стороной сайта интеграции в хромосоме.The break created by the CRISPR complex can be repaired by a repair process such as error-prone non-homologous end joining (NHEJ) or high-fidelity repair involving homologous recombination (HDR). During this repair process, an exogenous template polynucleotide can be introduced into the genomic sequence. In some methods, the HDR process is used to modify the genomic sequence. For example, an exogenous template polynucleotide is introduced into the cell that contains the sequence to be integrated, flanked by an upstream sequence and a downstream sequence. The upstream and downstream sequences are characterized by sequence similarity to each side of the integration site in the chromosome.
При необходимости донорный полинуклеотид может представлять собой ДНК, например плазмидную ДНК, бактериальную искусственную хромосому (BAC), искусственную хромосому дрожжей (YAC), вирусный вектор, линейный фрагмент ДНК, ПЦР-фрагмент, "оголенную" нуклеиновую кислоту или нуклеиновую кислоту в комплексе со средством доставки, таким как липосома или полоксамер.If desired, the donor polynucleotide may be DNA, such as plasmid DNA, bacterial artificial chromosome (BAC), yeast artificial chromosome (YAC), viral vector, linear DNA fragment, PCR fragment, naked nucleic acid, or nucleic acid complexed with a delivery vehicle such as a liposome or poloxamer.
Экзогенный матричный полинуклеотид содержит последовательность, подлежащую интеграции (например, мутированный ген). Последовательность, предназначенная для интеграции, может представлять собой последовательность, эндогенную или экзогенную по отношению к клетке. Примеры последовательности, подлежащей интеграции, включают полинуклеотиды, кодирующие белок или некодирующую РНК (например, microRNA). Таким образом, последовательность, предназначенная для интеграции, может быть функционально связанной с соответствующей регуляторной последовательностью или соответствующими регуляторными последовательностями. Альтернативно последовательность, подлежащая интеграции, может обеспечивать регуляторную функцию.The exogenous template polynucleotide comprises a sequence to be integrated (e.g., a mutated gene). The sequence to be integrated may be a sequence endogenous or exogenous to the cell. Examples of a sequence to be integrated include polynucleotides encoding a protein or non-coding RNA (e.g., microRNA). Thus, the sequence to be integrated may be operably linked to a corresponding regulatory sequence or corresponding regulatory sequences. Alternatively, the sequence to be integrated may provide a regulatory function.
Последовательности, расположенные выше и ниже в экзогенном матричном полинуклеотиде, выбирают таким образом, чтобы способствовать рекомбинации между хромосомной последовательностью, представляющей интерес, и донорным полинуклеотидом. Последовательность, расположенная выше, представляет собой последовательность нуклеиновой кислоты, которая обладает сходством последовательности с геномной последовательностью, расположенной выше подвергаемого нацеливанию сайта интеграции. Аналогично, последовательность, расположенная ниже, представляет собой последовательность нуклеиновой кислоты, которая обладает сходством последовательности с хромосомной последовательностью, расположенной ниже подвергаемого нацеливанию сайта интеграции. Последовательности, расположенные выше и ниже в экзогенном матричном полинуклеотиде, могут характеризоваться 75%, 80%, 85%, 90%, 95% или 100% идентичностью последовательности с подвергаемой нацеливанию геномной последовательностью. Последовательности, расположенные выше и ниже в экзогенном матричном полинуклеотиде, предпочтительно характеризуются 95%, 96%, 97%, 98%, 99% или 100% идентичностью последовательности с подвергаемой нацеливанию геномной последовательностью. В некоторых способах последовательности, расположенные выше и ниже в экзогенном матричном полинуклеотиде, характеризуются приблизительно 99% или 100% идентичностью последовательности с подвергаемой нацеливанию геномной последовательностью.The upstream and downstream sequences of the exogenous template polynucleotide are selected to promote recombination between the chromosomal sequence of interest and the donor polynucleotide. The upstream sequence is a nucleic acid sequence that has sequence similarity to a genomic sequence located upstream of the integration site to be targeted. Similarly, the downstream sequence is a nucleic acid sequence that has sequence similarity to a chromosomal sequence located downstream of the integration site to be targeted. The upstream and downstream sequences of the exogenous template polynucleotide may have 75%, 80%, 85%, 90%, 95%, or 100% sequence identity to the genomic sequence to be targeted. The upstream and downstream sequences of the exogenous template polynucleotide preferably have 95%, 96%, 97%, 98%, 99%, or 100% sequence identity to the genomic sequence being targeted. In some methods, the upstream and downstream sequences of the exogenous template polynucleotide have approximately 99% or 100% sequence identity to the genomic sequence being targeted.
Последовательность, расположенная выше или ниже, может содержать от приблизительно 20 п. о. до приблизительно 2500 п. о., например приблизительно 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400 или 2500 п. о. В некоторых способах иллюстративная последовательность, расположенная выше или ниже, имеет от приблизительно 200 п. о. до приблизительно 2000 п. о., от приблизительно 600 п. о. до приблизительно 1000 п. о. или, более конкретно, от приблизительно 700 п. о. до приблизительно 1000 п. о.The upstream or downstream sequence may be from about 20 bp to about 2500 bp, such as about 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, or 2500 bp. In some methods, an exemplary upstream or downstream sequence is from about 200 bp to about 2000 bp, from about 600 bp to about 1000 bp, or from about 1000 bp to about 1000 bp. or, more specifically, from about 700 bp to about 1000 bp.
В некоторых способах экзогенный матричный полинуклеотид может дополнительно содержать маркер. Такой маркер может облегчать скрининг в отношении подвергаемых нацеливанию интеграций. Примеры подходящих маркеров включают сайты рестрикции, флуоресцентные белки или селектируемые маркеры. Экзогенный матричный полинуклеотид согласно настоящему изобретению можно сконструировать с применением методик рекомбинантной ДНК (см., например, Sambrook et al., 2001 и Ausubel et al., 1996).In some methods, the exogenous template polynucleotide may further comprise a marker. Such a marker may facilitate screening for targetable integrations. Examples of suitable markers include restriction sites, fluorescent proteins, or selectable markers. The exogenous template polynucleotide of the present invention may be constructed using recombinant DNA techniques (see, e.g., Sambrook et al., 2001 and Ausubel et al., 1996).
В иллюстративном способе модифицирования целевого полинуклеотида посредством интеграции экзогенного матричного полинуклеотида в геномную последовательность вводят двухнитевой разрыв с помощью комплекса CRISPR, осуществляют репарацию разрыва посредством гомологичной рекомбинации с участием экзогенного матричного полинуклеотида, так что матрица интегрируется в геном. Наличие двухнитевого разрыва обеспечивает интеграцию матрицы.In an exemplary method for modifying a target polynucleotide by integrating an exogenous template polynucleotide into a genomic sequence, a double-strand break is introduced using a CRISPR complex, the break is repaired by homologous recombination involving the exogenous template polynucleotide, so that the template is integrated into the genome. The presence of the double-strand break ensures the integration of the template.
В других вариантах осуществления настоящее изобретение относится к способу модификации экспрессии полинуклеотида в эукариотической клетке. Способ включает повышение или снижение экспрессии целевого полинуклеотида с помощью комплекса CRISPR, который связывается с полинуклеотидом.In other embodiments, the present invention relates to a method for modifying the expression of a polynucleotide in a eukaryotic cell. The method comprises increasing or decreasing the expression of a target polynucleotide using a CRISPR complex that binds to the polynucleotide.
В некоторых способах целевой полинуклеотид можно инактивировать для осуществления модификации экспрессии в клетке. Например, после связывания комплекса CRISPR с целевой последовательностью в клетке целевой полинуклеотид инактивируется, вследствие чего последовательность не транскрибируется, при этом не вырабатывается кодируемый белок или последовательность не функционирует так, как последовательность дикого типа. Например, последовательность, кодирующая белок или microRNA, может быть инактивирована, вследствие чего белок не образуется.In some methods, the target polynucleotide may be inactivated to modify expression in the cell. For example, after the CRISPR complex binds to the target sequence in the cell, the target polynucleotide is inactivated so that the sequence is not transcribed, the encoded protein is not produced, or the sequence does not function as the wild-type sequence. For example, a sequence encoding a protein or microRNA may be inactivated so that the protein is not produced.
В некоторых способах регуляторную последовательность можно инактивировать, так что она больше не функционирует в качестве регуляторной последовательности. Используемое в данном документе выражение "регуляторная последовательность" относится к любой последовательности нуклеиновой кислоты, которая оказывает влияние на транскрипцию, трансляцию или доступность последовательности нуклеиновой кислоты. Примеры регуляторной последовательности включают промотор, терминатор транскрипции и энхансер, которые являются регуляторными последовательностями. Инактивированная целевая последовательность может содержать мутацию по типу делеции (т.е. делецию одного или нескольких нуклеотидов), мутацию по типу вставки (т.е. вставку одного или нескольких нуклеотидов) или нонсенс-мутацию (т.е. замену одного нуклеотида на другой нуклеотид, так что вводится стоп-кодон). В некоторых способах инактивация целевой последовательности приводит в результате к "нокауту" целевой последовательности.In some methods, a regulatory sequence can be inactivated such that it no longer functions as a regulatory sequence. As used herein, the term "regulatory sequence" refers to any nucleic acid sequence that affects the transcription, translation, or accessibility of a nucleic acid sequence. Examples of a regulatory sequence include a promoter, a transcription terminator, and an enhancer, which are regulatory sequences. The inactivated target sequence may comprise a deletion mutation (i.e., a deletion of one or more nucleotides), an insertion mutation (i.e., an insertion of one or more nucleotides), or a nonsense mutation (i.e., a substitution of one nucleotide for another nucleotide such that a stop codon is introduced). In some methods, inactivation of a target sequence results in a "knockout" of the target sequence.
Иллюстративные способы применения системы CRISPR CasIllustrative applications of the CRISPR Cas system
Настоящее изобретение относится к не встречающейся в природе или сконструированной композиции, или одному или нескольким полинуклеотидам, кодирующим компоненты указанной композиции, или вектору или системам доставки, содержащим один или несколько полинуклеотидов, кодирующих компоненты указанной композиции, для применения при модификации целевой клетки in vivo, ex vivo или in vitro, и они могут быть выполнены с помощью способа, который изменяет клетку таким образом, что после модификации потомство или клеточная линия клетки, модифицированной с помощью CRISPR, сохраняет измененный фенотип. Модифицированные клетки и потомство могут быть частью многоклеточного организма, такого как растение или животное, с применением ex vivo или in vivo системы CRISPR по отношению к желаемым типам клеток. Изобретение CRISPR может представлять собой терапевтический способ лечения. Терапевтический способ лечения может включать редактирование гена или генома или генную терапию.The present invention relates to a non-naturally occurring or engineered composition, or one or more polynucleotides encoding components of said composition, or a vector or delivery systems comprising one or more polynucleotides encoding components of said composition, for use in modifying a target cell in vivo, ex vivo or in vitro, and they can be made using a method that alters the cell such that after modification, the progeny or cell line of the cell modified by CRISPR retains the altered phenotype. The modified cells and progeny can be part of a multicellular organism, such as a plant or animal, using the CRISPR system ex vivo or in vivo with respect to the desired cell types. The CRISPR invention can be a therapeutic method of treatment. The therapeutic method of treatment can include gene or genome editing or gene therapy.
Модификация мишени с помощью системы или комплекса CRISPR-CasModification of a target using the CRISPR-Cas system or complex
В одном аспекте настоящее изобретение относится к способам модификации целевого полинуклеотида в эукариотической клетке, что может происходить in vivo, ex vivo или in vitro. В некоторых вариантах осуществления способ включает отбор клетки или популяции клеток у человека или отличного от человека животного и модификацию клетки или клеток. Культивирование можно осуществлять на любой стадии ex vivo. Клетку или клетки можно даже повторно вводить отличному от человека животному или в растение. Что касается повторно вводимых клеток, особенно предпочтительно, чтобы эти клетки являлись стволовыми клетками.In one aspect, the present invention relates to methods for modifying a target polynucleotide in a eukaryotic cell, which may occur in vivo, ex vivo or in vitro. In some embodiments, the method comprises selecting a cell or a population of cells from a human or non-human animal and modifying the cell or cells. The culturing may be performed at any stage ex vivo. The cell or cells may even be reintroduced into a non-human animal or into a plant. With respect to the cells reintroduced, it is particularly preferred that these cells are stem cells.
В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида, за счет чего обеспечивается модифицирование целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, которая гибридизируется или способна к гибридизации с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью.In some embodiments, the method includes providing binding of a CRISPR complex to a target polynucleotide to effect cleavage of said target polynucleotide, thereby providing modification of the target polynucleotide, wherein the CRISPR complex comprises a CRISPR enzyme complexed with a guide sequence that hybridizes or is capable of hybridizing with a target sequence in said target polynucleotide, wherein said guide sequence is associated with a mate tracr sequence that, in turn, hybridizes with the tracr sequence.
В одном аспекте настоящего изобретения предусмотрен способ модифицирования экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с полинуклеотидом так, что указанное связывание приводит к повышенной или пониженной экспрессии указанного полинуклеотида; где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, которая гибридизируется или способна к гибридизации с целевой последовательностью в указанном полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью. Аналогичные факторы и условия распространяются на способы модификации целевого полинуклеотида, изложенные выше. Фактически, эти варианты отбора образцов, культивирования и повторного введения охватываются аспектами настоящего изобретения.In one aspect of the present invention, there is provided a method for modifying the expression of a polynucleotide in a eukaryotic cell. In some embodiments, the method comprises causing a CRISPR complex to bind to the polynucleotide such that said binding results in increased or decreased expression of said polynucleotide; wherein the CRISPR complex comprises a CRISPR enzyme complexed with a guide sequence that hybridizes or is capable of hybridizing to a target sequence in said polynucleotide, wherein said guide sequence is linked to a tracr mate sequence that in turn hybridizes to the tracr sequence. Similar factors and conditions apply to the methods for modifying a target polynucleotide set forth above. Indeed, these sampling, culturing, and reintroduction options are encompassed by aspects of the present invention.
Действительно, в любом аспекте настоящего изобретения комплекс CRISPR может содержать фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизируеющейся или способной к гибридизации с целевой последовательностью, где указанная направляющая последовательность может быть связана с парной tracr-последовательностью, которая, в свою очередь, может гибридизироваться с tracr-последовательностью. Аналогичные факторы и условия распространяются на способы модификации целевого полинуклеотида, изложенные выше.Indeed, in any aspect of the present invention, the CRISPR complex may comprise a CRISPR enzyme complexed with a guide sequence that hybridizes or is capable of hybridizing to a target sequence, wherein said guide sequence may be associated with a mate tracr sequence that in turn can hybridize to the tracr sequence. Similar factors and conditions apply to the methods for modifying a target polynucleotide set forth above.
Таким образом, в любом из не встречающихся в природе ферментов CRISPR, описанных в данном документе, содержится по меньшей мере одна модификация, и тем самым фермент характеризуется определенными улучшенными свойствами. В частности, любой из ферментов способен образовывать комплекс CRISPR с направляющей РНК. При образовании такого комплекса направляющая РНК способна связываться с целевой полинуклеотидной последовательностью, и фермент способен модифицировать целевой локус. Кроме того, фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом.Thus, each of the non-naturally occurring CRISPR enzymes described herein comprises at least one modification, and thus the enzyme is characterized by certain improved properties. In particular, each of the enzymes is capable of forming a CRISPR complex with a guide RNA. When such a complex is formed, the guide RNA is capable of binding to a target polynucleotide sequence, and the enzyme is capable of modifying the target locus. In addition, the enzyme in the CRISPR complex is characterized by a reduced ability to modify one or more off-target loci compared to the unmodified enzyme.
Кроме того, модифицированные ферменты CRISPR, описанные в данном документе, охватывают ферменты, где в комплексе CRISPR фермент характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом. Такая функция может быть предусмотрена отдельно или предусмотрена в сочетании с вышеописанной функцией сниженной способности модифицировать один или несколько нецелевых локусов. Любые такие ферменты могут быть предусмотрены с одной из дополнительных модификаций фермента CRISPR, как описано в данном документе, например, в сочетании с активностью, обеспечиваемой одним или несколькими ассоциированными гетерологичными функциональными доменами, любыми дополнительными мутациями с целью снижения нуклеазной активности и т.п.In addition, the modified CRISPR enzymes described herein include enzymes wherein in a CRISPR complex the enzyme is characterized by an increased ability to modify one or more target loci compared to an unmodified enzyme. Such functionality may be provided alone or provided in combination with the above-described functionality of reduced ability to modify one or more off-target loci. Any such enzymes may be provided with one of the additional modifications of the CRISPR enzyme as described herein, such as in combination with the activity provided by one or more associated heterologous functional domains, any additional mutations to reduce nuclease activity, etc.
В предпочтительных вариантах осуществления настоящего изобретения предусмотрен модифицированный фермент CRISPR со сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом и повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом. В сочетании с дополнительными модификациями фермента можно достичь существенно повышенной специфичности. Например, предусмотрена комбинация таких предпочтительных вариантов осуществления с одной или несколькими дополнительными мутациями, где одна или несколько дополнительных мутаций находятся в одном или нескольких каталитически активных доменах. Такие дополнительные каталитические мутации могут придавать функциональные свойства никаз, как описано подробно в других частях данного документа. В таких ферментах повышенная специфичность может быть достигнута за счет повышенной специфичности с точки зрения ферментативной активности.In preferred embodiments of the present invention, a modified CRISPR enzyme is provided with a reduced ability to modify one or more off-target loci compared to an unmodified enzyme and an increased ability to modify one or more target loci compared to an unmodified enzyme. In combination with additional modifications of the enzyme, significantly increased specificity can be achieved. For example, a combination of such preferred embodiments with one or more additional mutations is provided, wherein the one or more additional mutations are in one or more catalytically active domains. Such additional catalytic mutations can confer nickase functionality, as described in detail elsewhere herein. In such enzymes, increased specificity can be achieved by increased specificity in terms of enzymatic activity.
Модификации для снижения нецелевых эффектов и/или повышения целевых эффектов, как описано выше, могут быть выполнены с аминокислотными остатками, расположенными в положительно заряженной области/бороздке, находящейся между доменами RuvC-III и HNH. Предполагается, что любой из функциональных эффектов, описанных выше, может быть достигнут с помощью модификации аминокислот в вышеупомянутой бороздке, однако также с помощью модификации аминокислот вблизи бороздки или за ее пределами.Modifications to reduce off-target effects and/or enhance on-target effects as described above can be performed on amino acid residues located in the positively charged region/groove located between the RuvC-III and HNH domains. It is expected that any of the functional effects described above can be achieved by modifying amino acids in the aforementioned groove, but also by modifying amino acids near or outside the groove.
Дополнительные функциональные свойства, которые могут быть сконструированы в модифицированных ферментах CRISPR, как описано в данном документе, могут включать следующее. 1. Модифицированные ферменты CRISPR, которые нарушают взаимодействие ДНК и белка без нарушения третичной или вторичной структуры белков. Это включает остатки, которые контактируют с любой частью дуплекса РНК:ДНК. 2. Модифицированные ферменты CRISPR, которые ослабляют взаимодействия между белками, удерживающими Cas9 в конформации, необходимой для разрезания нуклеазами в ответ на связывание с ДНК (целевые или нецелевые). Например: модификация, которая незначительно ингибирует, но по-прежнему обеспечивает конформацию нуклеазы домена HNH (располагается в поддающемся разрезанию фосфате). 3. Модифицированные ферменты CRISPR, которые усиливают взаимодействия между белками, удерживающими Cas9 в конформации, ингибирующей активность в ответ на связывание с ДНК (целевые или нецелевые). Например: модификация, которая стабилизирует домен HNH в конформации за пределами поддающегося разрезанию фосфата. Любое такое дополнительное функциональное усиление может быть предусмотрено в комбинации с любой другой модификацией фермента CRISPR, как описано подробно в других местах данного документа.Additional functional properties that can be engineered into modified CRISPR enzymes as described herein may include the following. 1. Modified CRISPR enzymes that disrupt DNA-protein interactions without disrupting the tertiary or secondary structure of the proteins. This includes residues that contact any part of the RNA:DNA duplex. 2. Modified CRISPR enzymes that weaken interactions between proteins that hold Cas9 in a conformation required for nuclease cleavage in response to DNA binding (on-target or off-target). For example, a modification that slightly inhibits but still allows the nuclease conformation of the HNH domain (located at the cleavable phosphate). 3. Modified CRISPR enzymes that strengthen interactions between proteins that hold Cas9 in a conformation that inhibits activity in response to DNA binding (on-target or off-target). For example: a modification that stabilizes the HNH domain in a conformation beyond the scissile phosphate. Any such additional functional enhancement may be provided in combination with any other modification of the CRISPR enzyme, as described in detail elsewhere in this document.
Любые из описанных в данном документе улучшенных функциональных свойств могут быть выполнены по отношению к любому ферменту CRISPR, такому как фермент Cas9. Ферменты Cas9, описанные в данном документе, получают из ферментов Cas9 от S. pyogenes и S. aureus. Однако предполагается, что любое из функциональных свойств, описанных в данном документе, может быть сконструировано в ферментах Cas9 от других ортологов, в том числе химерных ферментов, содержащих фрагменты из нескольких ортологов. Примеры таких ортологов можно найти, например, на фигурах 8 и 9, описываемых в данном документе.Any of the improved functional properties described herein may be performed with respect to any CRISPR enzyme, such as a Cas9 enzyme. The Cas9 enzymes described herein are derived from the Cas9 enzymes from S. pyogenes and S. aureus. However, it is contemplated that any of the functional properties described herein may be engineered into Cas9 enzymes from other orthologs, including chimeric enzymes containing fragments from multiple orthologs. Examples of such orthologs can be found, for example, in Figures 8 and 9 described herein.
В настоящем изобретении нуклеиновые кислоты используются для связывания целевых последовательностей ДНК. Это является преимущественным, поскольку получать нуклеиновые кислоты намного легче и дешевле, чем белки, и специфичность может варьировать в зависимости от длины фрагмента, если необходима гомология. Например, не требуется сложное 3-D определение положений многочисленных доменов. Термин "полинуклеотид", "нуклеотид", "нуклеотидная последовательность", "нуклеиновая кислота" и "олигонуклеотид" используют взаимозаменяемо. Они обозначают полимерную форму нуклеотидов любой длины, как дезоксирибонуклеотидов, так и рибонуклеотидов или их аналогов. Полинуклеотиды могут обладать любой пространственной структурой и могут выполнять любую функцию, известную или неизвестную. Неограничивающими примерами полинуклеотидов являются следующие: кодирующие или некодирующие участки гена или фрагмента гена, локусы(локус), определенные(ый) в результате анализа сцепления, экзоны, интроны, матричная РНК (мРНК), транспортная РНК, рибосомная РНК, короткая интерферирующая РНК (siRNA), короткая шпилечная РНК (shRNA), микроРНК (miRNA), рибозимы, кДНК, рекомбинантные полинуклеотиды, разветвленные полинуклеотиды, плазмиды, векторы, выделенные ДНК любой последовательности, выделенные РНК любой последовательности, нуклеиновые кислоты-зонды и праймеры. Термин также охватывает структуры, подобные нуклеиновым кислотам с синтетическими каркасами, см., например, Eckstein, 1991; Baserga et al., 1992; Milligan, 1993; WO 97/03211; WO 96/39154; Mata, 1997; Strauss-Soukup, 1997 и Samstag, 1996. Полинуклеотид может содержать один или несколько модифицированных нуклеотидов, как, например, метилированные нуклеотиды и аналоги нуклеотидов. При наличии, модификации в нуклеотидную структуру могут быть внесены до или после сборки полимера. Последовательность нуклеотидов может прерываться отличными от нуклеотидов компонентами. Полинуклеотид можно дополнительно модифицировать после полимеризации, как, например, путем соединения с компонентом для мечения. Используемый в данном документе термин "дикий тип" является термином из данной области, понятным специалисту в данной области, и означает типичную форму организма, штамма, гена или характеристики, которая встречаются в природе в отличие от мутантных или вариантных форм. "Дикий тип" представляет основу. Используемый в данном документе термин "вариант" следует понимать как означающее проявление качеств, которые характеризуются паттерном, который отличается от встречающегося в природе. Выражение "не встречающийся в природе" или "сконструированный" используют взаимозаменяемо, и оно указывает на вмешательство человека. Выражения, в тех случаях, когда они касаются молекул нуклеиновых кислот или полипептидов, означают, что молекула нуклеиновой кислоты или полипептид по меньшей мере практически не содержат по меньшей мере один иной компонент, с которым они естественным образом связаны в природе и встречаются в природе. "Комплементарность" означает способность нуклеиновой кислоты образовывать водородную(ые) связь(и) с другой последовательностью нуклеиновой кислоты с помощью либо традиционного образования пар по Уотсону-Крику, либо других нетрадиционных типов. Процент комплементарности показывает процентную долю остатков в молекуле нуклеиновой кислоты, которые могут образовывать водородные связи (к примеру, образование пар по Уотсону-Крику) со второй последовательностью нуклеиновой кислоты (к примеру, при этом 5, 6, 7, 8, 9, 10 из 10 будут на 50%, 60%, 70%, 80%, 90% и 100% комплементарны). "Точная комплементарность" означает, что все непрерывные остатки последовательности нуклеиновой кислоты будут связаны водородными связями с таким же количеством непрерывных остатков во второй последовательности нуклеиновой кислоты. Используемое в данном документе выражение "практически комплементарный" означает степень комплементарности, которая составляет по меньшей мере 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% или 100% в пределах участка из 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 или более нуклеотидов, или относится к двум нуклеиновым кислотам, которые гибридизируются при жестких условиях. Используемое в данном документе выражение"жесткие условия" в отношении гибридизации означают условия, при которых нуклеиновая кислота с комплементарностью к целевой последовательности преимущественно гибридизируется с целевой последовательностью и практически не гибридизируется с не подвергаемыми нацеливанию последовательностями. Жесткие условия, как правило, являются зависимыми от последовательности и изменяются в зависимости от ряда факторов. В целом, чем длиннее последовательность, тем выше температура, при которой последовательность специфично гибридизируется со своей целевой последовательностью. Неограничивающие примеры жестких условий описаны подробно в Tijssen (1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, N.Y. Если предполагается полинуклеотидная последовательность, то также предусматриваются комплементарные или частично комплементарные последовательности. Эти последовательности предпочтительно способны гибридизироваться с эталонной последовательностью при условиях высокой жесткости. Как правило, для доведения скорости гибридизации до максимума, выбирают условия гибридизации относительно низкой жесткости: температура на приблизительно 20-25°C ниже температуры точки плавления (Tm). Tm представляет собой температуру, при которой 50% специфичной целевой последовательности гибридизируется с точно комплементарным зондом в растворе при определенной ионной силе и pH. Как правило, если требуется по меньшей мере приблизительно 85% нуклеотидная комплементарность гибридизированных последовательностей, выбирают очень жесткие условия отмывки с температурой на приблизительно 5-15°C ниже, чем Tm. Если требуется по меньшей мере приблизительно 70% нуклеотидная комплементарность гибридизированных последовательностей, выбирают умеренно жесткие условия отмывки с температурой на приблизительно 15-30°C ниже, чем Tm. Высоко пермиссивные (очень низкой жесткости) условия отмывки могут характеризоваться наименьшей температурой на 50°C ниже Tm, что допускает высокий уровень несовпадений между гибридизированными последовательностями. Специалисты в данной области поймут, что другие физические и химические параметры на стадиях гибридизации и отмывки также можно изменять для того, чтобы повлиять на получаемый в результате выявляемый сигнал гибридизации исходя из конкретного уровня гомологии между целевой последовательностью и последовательностью зонда. Предпочтительные условия высокой жесткости предусматривают инкубацию в 50% формамиде, 5×SSC и 1% SDS при 42°C, или инкубацию при 5×SSC и 1% SDS при 65°C с отмывкой в 0,2×SSC и 0,1% SDS при 65°C. "Гибридизация" относится к реакции, в которой один или несколько полинуклеотидов вступают в реакцию с образованием комплекса, который стабилизирован посредством образования водородных связей между основаниями остатков нуклеотидов. Образование водородных связей может происходить по принципу образования пар по Уотсону-Крику, Хугстиновского связывания или посредством любого другого специфичного к последовательности способа. Комплекс может содержать две нити, образующие дуплексную структуру, три или более нитей, образующих многонитевой комплекс, одиночную самогибридизирующуюся нить или любую их комбинацию. Реакция гибридизации может представлять собой стадию в более обширном способе, такую как начальная стадия ПЦР или расщепление полинуклеотида с помощью фермента. Последовательность, способную к гибридизации с данной последовательностью, называют "комплементарной последовательностью" для данной последовательности. Используемый в данном документе термин "локус генома" или "локус" (форма множественного числа локусы) представляет собой конкретное положение гена или последовательности ДНК на хромосоме. "Ген" относится к фрагментам ДНК или РНК, которые кодируют цепь полипептида или РНК, которые играют функциональную роль в организме, и, следовательно, он представляет собой молекулярную единицу наследственности в живых организмах. Для цели настоящего изобретения может считаться, что гены содержат участки, которые регулируют образование продукта гена, независимо от того являются ли регуляторные последовательности смежными с кодирующими и/или транскрибируемыми последовательностями или нет. Соответственно, ген содержит, но без обязательного ограничения, промоторные последовательности, терминаторы, регуляторные последовательности трансляции, например, сайты связывания рибосомы и сайты внутренней посадки рибосомы, энхансеры, сайленсеры, инсуляторы, граничные элементы, точки начала репликации, сайты прикрепления к матриксу и регуляторные участки локуса. Используемый в данном документе термин "экспрессия локуса генома" или "экспрессия гена" относится к процессу, в ходе которого информация гена используется в синтезе функционального продукта гена. Продукты экспрессии генов часто представляют собой белки, но у генов, не кодирующих белки, например генов rRNA или генов tRNA, продукт представляет собой функциональную РНК. Процесс экспрессии генов используется всеми известными живыми организмами - эукариотами (в том числе многоклеточными организмами), прокариотами (бактериями и археями) и вирусами для образования функциональных продуктов, необходимых для выживания. Как используется в данном документе, "экспрессия" гена или нуклеиновой кислоты охватывает не только экспрессию генов в клетках, но также транскрипцию и трансляцию нуклеиновой(нуклеиновых) кислоты(кислот) в системах клонирования и в любом другом контексте. Используемый в данном документе термин "экспрессия" также означает процесс, посредством которого полинуклеотид транскрибируется с ДНК-матрицы (как, например, с образованием мРНК или другого РНК-транскрипта), и/или процесс, с помощью которого транскрибированная мРНК далее транслируется с образованием пептидов, полипептидов или белков. Транскрипты и закодированные полипептиды можно в совокупности называть "продуктом гена". Если полинуклеотид получен из геномной ДНК, то экспрессия может включать сплайсинг мРНК в эукариотической клетке. Термины "полипептид", "пептид" и "белок" используются в данном документе взаимозаменяемо для обозначения полимеров из аминокислот любой длины. Полимер может быть линейным или разветвленным, он может содержать модифицированные аминокислоты, и его структура может прерываться отличными от аминокислот компонентами. Термины также охватывают полимер из аминокислот, который был модифицирован; например, образованием дисульфидных связей, гликозилированием, липидизацией, ацетилированием, фосфорилированием или любой другой манипуляцией, как, например, соединением с компонентом для мечения. Используемое в данном документе выражение "аминокислота" включает природные и/или отличные от природных или синтетические аминокислоты, в том числе глицин и как D-, так и L-оптические изомеры, и аналоги аминокислот, и пептидомиметики. Используемое в данном документе выражение "домен" или "белковый домен" относится к части последовательности белка, которая может существовать и функционировать независимо от остальной части белковой цепи. Как описано в аспектах согласно настоящему изобретению, идентичность последовательности относится к гомологии последовательности. Сравнения гомологии можно проводить на глаз или, что делается чаще, с помощью легко доступных программ для сравнения последовательностей. с помощью этих коммерчески доступных компьютерных программ можно рассчитывать процент (%) гомологии между двумя или более последовательностями, а также можно рассчитывать идентичность последовательности между двумя или более аминокислотными последовательностями или последовательностями нуклеиновых кислот. В некоторых предпочтительных вариантах осуществления участок кэпирования dTALE, описанный в данном документе, имеет последовательности, по меньшей мере на 95% идентичные или обладающие идентичностью с участком кэпирования аминокислотных последовательностей, представленных в данном документе. Значения гомологии последовательности можно получить с помощью любой из ряда компьютерных программ, известных из уровня техники, например, BLAST или FASTA и т.д. Подходящей компьютерной программой для осуществления такого выравнивания является пакет программ GCG Wisconsin Bestfit (Университет Висконсина, США; Devereux et al., 1984, Nucleic Acids Research 12:387). Примеры другого программного обеспечения, с помощью которого можно осуществлять сравнения последовательностей, включают без ограничения пакет программ BLAST (см. Ausubel et al., 1999 ibid - Chapter 18), FASTA (Atschul et al., 1990, J. Mol. Biol., 403-410) и пакет программ GENEWORKS в качестве средств для сравнения. Как в BLAST, так и в FASTA доступны оффлайн- и онлайн-поиск (см. Ausubel et al., 1999 ibid, pages 7-58 - 7-60). Однако, предпочтительным является использование программы GCG Bestfit. Процентное значение (%) гомологии последовательности можно рассчитывать для непрерывных последовательностей, т.е. одну последовательность выравнивают с другой последовательностью и каждую аминокислоту или нуклеотид в одной последовательности непосредственно сравнивают с соответствующей аминокислотой или нуклеотидом в другой последовательности, один остаток за один раз. Это называется выравниванием "без гэпов". Как правило, такие выравнивания без гэпов осуществляют только для относительно малого числа остатков. Несмотря на то, что этот способ является очень простым и последовательным, при его применении не учитывается то, что, например, в паре последовательностей, которые в остальном являются идентичными, одна вставка или делеция может привести к тому, что следующие за ней аминокислотные остатки не будут учитываться при выравнивании, что, таким образом, потенциально приводит в результате к значительному уменьшению % гомологии при осуществлении глобального выравнивания. Следовательно, большинство способов сравнения последовательностей разработаны для получения оптимальных выравниваний, в которых учитываются возможные вставки и делеции без наложения чрезмерного штрафа на общую гомологию или балл идентичности. Это достигается путем вставки "гэпов" в выравнивание последовательностей в попытке доведения до максимума локальной гомологии или идентичности. Однако в этих более сложных способах назначаются "штрафы за внесения гэпа" для каждого гэпа, который встречается при выравнивании, таким образом, для одинакового количества идентичных аминокислот выравнивание последовательностей с наименьшим возможным количеством гэпов, что отражает более высокую степень родства между двумя сравниваемыми последовательностями, может привести в результате к более высокому баллу, чем выравнивание с большим количеством гэпов. Как правило, используют "значения аффинного штрафа за внесение гэпа для родственных последовательностей", с использованием которых начисляют относительно высокое значение за существование гэпа и меньший штраф за каждый последующий остаток в гэпе. Это наиболее часто используемая система оценки гэпов. Конечно, высокие штрафы за внесение гэпа могут привести к оптимизированным выравниваниям с меньшим количеством гэпов. В большинстве программ выравнивания допускается изменение штрафов за внесение гэпа. Однако предпочтительно использовать значения по умолчанию при использовании такого программного обеспечения для сравнений последовательностей. Например, при использовании пакета программ GCG Wisconsin Bestfit штраф за внесение гэпа по умолчанию для аминокислотных последовательностей составляет -12 для гэпа и -4 за каждый остаток его продолжения. Для расчета максимального % гомологии, следовательно, изначально требуется получение оптимального выравнивания с учетом штрафов за внесение гэпа. Подходящая компьютерная программа для осуществления такого выравнивания представляет собой пакет программ GCG Wisconsin Bestfit (Devereux et al., 1984 Nuc. Acids Research 12 p387). Примеры другого программного обеспечения, с помощью которого можно осуществлять сравнения последовательностей, включают без ограничения пакет программ BLAST (cм. Ausubel et al., 1999 Short Protocols in Molecular Biology, 4th Ed. - Chapter 18), FASTA (Altschul et al., 1990 J. Mol. Biol. 403-410) и пакет программ GENEWORKS в качестве инструментов для сравнения. Как в BLAST, так и в FASTA доступны оффлайн- и онлайн-поиск (см. Ausubel et al., 1999, Short Protocols in Molecular Biology, pages 7-58 - 7-60). Однако для некоторых задач предпочтительно использовать программу GCG Bestfit. Новый инструмент под названием BLAST 2 Sequences также доступен для сравнения белковых и нуклеотидных последовательностей (см. FEMS Microbiol Lett. 1999 174(2): 247-50; FEMS Microbiol Lett. 1999 177(1): 187-8 и веб-сайт Национального центра биотехнологической информации на веб-сайте Национальных институтов здравоохранения). Несмотря на то, что конечный % гомологии можно измерять в единицах идентичности, способ выравнивания сам по себе, как правило, не основывается на сравнении пар по типу "все или ничего". Вместо этого, как правило, используется матрица замен со шкалой сходства, с использованием которой назначаются баллы для каждого попарного сравнения на основании химического сходства или эволюционного расстояния. Примером такой матрицы, используемой чаще всего, является матрица BLOSUM62 - матрица по умолчанию для набора программ BLAST. В программах GCG Wisconsin, как правило, используются либо общедоступные значения по умолчанию, либо специальные таблицы сравнения символов, если предоставляются (дополнительные подробности см. в руководстве пользователя). Для некоторых задач предпочтительным является применение общедоступных значений по умолчанию для пакета программ GCG или, в случае другого программного обеспечения, матрицы по умолчанию, например BLOSUM62. Альтернативно процентные значения гомологии можно рассчитывать с использованием функции множественного выравнивания в DNASIS™ (Hitachi Software) с применением алгоритма, аналогичного CLUSTAL (Higgins DG & Sharp PM (1988), Gene 73(1), 237-244). После того, как программное обеспечение предоставит оптимальное выравнивание, возможно рассчитать % гомологии, предпочтительно % идентичности последовательности. Программное обеспечение, как правило, осуществляет это в ходе сравнения последовательностей и выдает численный результат. Последовательности также могут иметь делеции, вставки или замены аминокислотных остатков, которые приводят к молчащему изменению и приводят в результате к функционально эквивалентному веществу. Преднамеренные аминокислотные замены могут быть сделаны исходя из сходства свойств аминокислот (например, полярность, заряд, растворимость, гидрофобность, гидрофильность и/или амфипатическая природа остатков) и, следовательно, они являются применимыми для того, чтобы сгруппировать аминокислоты в функциональные группы. Аминокислоты можно сгруппировать исходя из свойств только их боковых цепей. Однако, также более полезно включить данные о мутациях. Группы аминокислот, полученные таким образом, вероятно, будут консервативными по структурным причинам. Эти группы могут быть описаны в форме диаграммы Венна (Livingstone C.D. and Barton G.J. (1993) "Protein sequence alignments: a strategy for the hierarchical analysis of residue conservation" Comput. Appl. Biosci. 9: 745-756) (Taylor W.R. (1986) "The classification of amino acid conservation" J. Theor. Biol. 119; 205-218). Консервативные замены могут быть сделаны, например, в соответствии с таблицей, представленной ниже, в которой описывается общепринятая группировка аминокислот в форме диаграммы Венна. In the present invention, nucleic acids are used to bind target DNA sequences. This is advantageous because nucleic acids are much easier and cheaper to produce than proteins, and the specificity can vary with fragment length if homology is desired. For example, complex 3-D determination of the positions of multiple domains is not required. The terms "polynucleotide", "nucleotide", "nucleotide sequence", "nucleic acid" and "oligonucleotide" are used interchangeably. They denote a polymeric form of nucleotides of any length, both deoxyribonucleotides and ribonucleotides or their analogs. Polynucleotides can have any spatial structure and can perform any function, known or unknown. Non-limiting examples of polynucleotides are: coding or non-coding regions of a gene or gene fragment, loci(s) determined by linkage analysis, exons, introns, messenger RNA (mRNA), transfer RNA, ribosomal RNA, short interfering RNA (siRNA), short hairpin RNA (shRNA), microRNA (miRNA), ribozymes, cDNAs, recombinant polynucleotides, branched polynucleotides, plasmids, vectors, isolated DNA of any sequence, isolated RNA of any sequence, nucleic acid probes and primers. The term also encompasses nucleic acid-like structures with synthetic backbones, see, for example, Eckstein, 1991; Baserga et al., 1992; Milligan, 1993; WO 97/03211; WO 96/39154; Mata, 1997; Strauss-Soukup, 1997 and Samstag, 1996. A polynucleotide may contain one or more modified nucleotides, such as methylated nucleotides and nucleotide analogs. If present, modifications to the nucleotide structure may be introduced before or after assembly of the polymer. The nucleotide sequence may be interrupted by components other than nucleotides. The polynucleotide may be further modified after polymerization, such as by coupling with a labeling component. As used herein, the term "wild type" is a term of art understood by one skilled in the art and means the typical form of an organism, strain, gene or characteristic that occurs in nature, as distinguished from mutant or variant forms. "Wild type" represents the backbone. As used herein, the term "variant" is to be understood to mean the expression of properties that are characterized by a pattern that differs from that found in nature. The expressions "non-naturally occurring" and "engineered" are used interchangeably and indicate human intervention. The expressions, when applied to nucleic acid molecules or polypeptides, mean that the nucleic acid molecule or polypeptide is at least substantially free of at least one other component with which it is naturally associated and found in nature. "Complementarity" means the ability of a nucleic acid to form hydrogen bond(s) with another nucleic acid sequence, either by conventional Watson-Crick pairing or other non-conventional types. Percent complementarity indicates the percentage of residues in a nucleic acid molecule that can form hydrogen bonds (e.g., Watson-Crick pairing) with a second nucleic acid sequence (e.g., 5, 6, 7, 8, 9, 10 out of 10 would be 50%, 60%, 70%, 80%, 90%, and 100% complementary). "Perfect complementarity" means that all contiguous residues in the nucleic acid sequence will hydrogen bond with the same number of contiguous residues in the second nucleic acid sequence. As used herein, the term "substantially complementary" means a degree of complementarity that is at least 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, or 100% within a region of 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 or more nucleotides, or refers to two nucleic acids that hybridize under stringent conditions. As used herein, the term "stringent conditions" in relation to hybridization means conditions under which a nucleic acid with complementarity to a target sequence preferentially hybridizes to the target sequence and substantially does not hybridize to non-targeted sequences. Stringent conditions are generally sequence dependent and vary depending on a number of factors. In general, the longer the sequence, the higher the temperature at which the sequence specifically hybridizes to its target sequence. Non-limiting examples of stringent conditions are described in detail in Tijssen (1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, NY If a polynucleotide sequence is envisaged, complementary or partially complementary sequences are also envisaged. These sequences are preferably capable of hybridizing to the reference sequence under conditions of high stringency. Typically, to maximize the hybridization rate, hybridization conditions of relatively low stringency are selected: a temperature of approximately 20-25°C below the melting point temperature ( Tm ). Tm is the temperature at which 50% of a specific target sequence hybridizes to a perfectly complementary probe in solution at a given ionic strength and pH. Typically, if at least about 85% nucleotide complementarity of the hybridized sequences is desired, very stringent wash conditions are selected with a temperature of approximately 5-15°C lower than Tm . If at least about 70% nucleotide complementarity of the hybridized sequences is desired, moderately stringent wash conditions are selected with a temperature of approximately 15-30°C lower than Tm . Highly permissive (very low stringency) wash conditions may have a lowest temperature of 50°C below Tm , which allows a high level of mismatches between the hybridized sequences. Those skilled in the art will appreciate that other physical and chemical parameters during the hybridization and wash steps may also be varied to influence the resulting detectable hybridization signal based on the particular level of homology between the target and probe sequences. Preferred high stringency conditions include incubation in 50% formamide, 5x SSC, and 1% SDS at 42°C, or incubation in 5x SSC and 1% SDS at 65°C with a wash of 0.2x SSC and 0.1% SDS at 65°C. "Hybridization" refers to a reaction in which one or more polynucleotides react to form a complex that is stabilized by hydrogen bonding between the bases of the nucleotide residues. Hydrogen bonding may occur via Watson-Crick base pairing, Hoogsteen bonding, or any other sequence-specific method. The complex may comprise two strands forming a duplex structure, three or more strands forming a multistrand complex, a single self-hybridizing strand, or any combination thereof. The hybridization reaction may be a step in a larger process, such as the initial step of PCR or the cleavage of a polynucleotide by an enzyme. A sequence capable of hybridizing to a given sequence is called a "complementary sequence" for the sequence. As used herein, the term "genomic locus" or "locus" (plural loci) is a specific position of a gene or DNA sequence on a chromosome. "Gene" refers to fragments of DNA or RNA that encode a polypeptide chain or RNA that plays a functional role in an organism, and therefore it is the molecular unit of heredity in living organisms. For the purpose of the present invention, genes may be considered to contain regions that regulate the formation of a gene product, whether the regulatory sequences are adjacent to coding and/or transcribed sequences or not. Accordingly, a gene includes, but is not necessarily limited to, promoter sequences, terminators, translational regulatory sequences, such as ribosome binding sites and internal ribosome entry sites, enhancers, silencers, insulators, boundary elements, origins of replication, matrix attachment sites, and locus regulatory regions. As used herein, the term "expression of a genomic locus" or "gene expression" refers to the process by which the information of a gene is used in the synthesis of a functional gene product. Gene expression products are often proteins, but for non-protein-coding genes, such as rRNA genes or tRNA genes, the product is functional RNA. The process of gene expression is used by all known living organisms - eukaryotes (including multicellular organisms), prokaryotes (bacteria and archaea), and viruses - to produce functional products necessary for survival. As used herein, "expression" of a gene or nucleic acid encompasses not only the expression of genes in cells, but also the transcription and translation of nucleic acid(s) in cloning systems and in any other context. As used herein, the term "expression" also refers to the process by which a polynucleotide is transcribed from a DNA template (such as to form an mRNA or other RNA transcript) and/or the process by which transcribed mRNA is further translated to form peptides, polypeptides, or proteins. The transcripts and encoded polypeptides may be referred to collectively as the "gene product." If the polynucleotide is derived from genomic DNA, expression may involve splicing of mRNA in a eukaryotic cell. The terms "polypeptide,""peptide," and "protein" are used interchangeably herein to refer to polymers of amino acids of any length. The polymer may be linear or branched, it may contain modified amino acids, and its structure may be interrupted by non-amino acid components. The terms also encompass a polymer of amino acids that has been modified; for example, by disulfide bonding, glycosylation, lipidation, acetylation, phosphorylation, or any other manipulation such as coupling to a labeling component. As used herein, the term "amino acid" includes natural and/or non-natural or synthetic amino acids, including glycine and both D- and L-optical isomers, and amino acid analogs and peptidomimetics. As used herein, the term "domain" or "protein domain" refers to a portion of a protein sequence that can exist and function independently of the rest of the protein chain. As described in aspects of the present invention, sequence identity refers to sequence homology. Homology comparisons can be made by eye or, more commonly, using readily available sequence comparison programs. These commercially available computer programs can calculate the percentage (%) homology between two or more sequences, and can also calculate the sequence identity between two or more amino acid sequences or nucleic acid sequences. In some preferred embodiments, the dTALE capping region described herein has sequences that are at least 95% identical or have sequence identity to the capping region of the amino acid sequences provided herein. Sequence homology values can be obtained using any of a number of computer programs known in the art, such as BLAST or FASTA, etc. A suitable computer program for performing such alignments is the GCG Wisconsin Bestfit package (University of Wisconsin, USA; Devereux et al., 1984, Nucleic Acids Research 12:387). Examples of other software that can perform sequence comparisons include, but are not limited to, the BLAST package (see Ausubel et al., 1999 ibid - Chapter 18), FASTA (Atschul et al., 1990, J. Mol. Biol., 403-410), and the GENEWORKS package as comparison tools. Offline and online searching is available in both BLAST and FASTA (see Ausubel et al., 1999 ibid, pages 7-58 - 7-60). However, the use of the GCG Bestfit program is preferred. Percentage (%) sequence homology can be calculated for contiguous sequences, i.e. one sequence is aligned with another sequence and each amino acid or nucleotide in one sequence is directly compared with the corresponding amino acid or nucleotide in the other sequence, one residue at a time. This is called a "gapless" alignment. Typically, such gapless alignments are performed for only a relatively small number of residues. Although this method is very simple and consistent, it does not take into account the fact that, for example, in a pair of otherwise identical sequences, a single insertion or deletion may cause the following amino acid residues to be ignored in the alignment, thus potentially resulting in a significant decrease in % homology when the global alignment is performed. Consequently, most sequence comparison methods are designed to produce optimal alignments that account for possible insertions and deletions without unduly penalizing the overall homology or identity score. This is achieved by inserting "gaps" into the sequence alignment in an attempt to maximize local homology or identity. However, these more sophisticated methods assign "gap penalties" to each gap that occurs in the alignment, so that for the same number of identical amino acids, an alignment of sequences with the smallest possible number of gaps, reflecting a higher degree of relatedness between the two sequences being compared, may result in a higher score than an alignment with a larger number of gaps. Typically, "affine gap penalty values for related sequences" are used, which assign a relatively high value for the existence of a gap and a smaller penalty for each subsequent residue in the gap. This is the most commonly used gap scoring system. Of course, high gap penalties can lead to optimized alignments with fewer gaps. Most alignment programs allow the gap penalties to be changed. However, it is preferable to use the default values when using such software for sequence comparisons. For example, when using the GCG Wisconsin Bestfit software package, the default gap penalty for amino acid sequences is -12 for a gap and -4 for each residue beyond it. Calculating the maximum % homology therefore initially requires obtaining an optimal alignment that takes the gap penalties into account. A suitable computer program for performing such an alignment is the GCG Wisconsin Bestfit software package (Devereux et al., 1984 Nuc. Acids Research 12 p387). Examples of other software that can perform sequence comparisons include, but are not limited to, the BLAST package (see Ausubel et al., 1999 Short Protocols in Molecular Biology, 4th Ed. - Chapter 18), FASTA (Altschul et al., 1990 J. Mol. Biol. 403-410), and the GENEWORKS software package as comparison tools. Both BLAST and FASTA provide offline and online searching (see Ausubel et al., 1999, Short Protocols in Molecular Biology, pages 7-58 - 7-60). However, for some tasks the GCG Bestfit program is preferred. A new tool called BLAST 2 Sequences is also available for comparing protein and nucleotide sequences (see FEMS Microbiol Lett. 1999 174(2): 247-50; FEMS Microbiol Lett. 1999 177(1): 187-8 and the National Center for Biotechnology Information web site at the National Institutes of Health web site). Although the final % homology can be measured in units of identity, the alignment method itself is generally not based on an all-or-none comparison of pairs. Instead, a similarity-scoring substitution matrix is typically used, assigning scores to each pairwise comparison based on chemical similarity or evolutionary distance. An example of such a matrix most commonly used is the BLOSUM62 matrix, the default matrix for the BLAST suite of programs. The GCG Wisconsin programs typically use either publicly available defaults or custom character comparison tables if provided (see the user manual for details). For some purposes, it is preferable to use the publicly available defaults for the GCG suite of programs or, in the case of other software, a default matrix such as BLOSUM62. Alternatively, percent homology can be calculated using the multiple alignment function in DNASIS™ (Hitachi Software) using an algorithm similar to CLUSTAL (Higgins DG & Sharp PM (1988) Gene 73(1), 237–244). Once the software has provided an optimal alignment, it is possible to calculate % homology, preferably % sequence identity. The software typically does this by comparing the sequences and provides a numerical result. Sequences may also have deletions, insertions or substitutions of amino acid residues that result in a silent change and result in a functionally equivalent substance. Intentional amino acid substitutions may be made based on similarities in amino acid properties (e.g. polarity, charge, solubility, hydrophobicity, hydrophilicity and/or amphipathic nature of the residues) and are therefore useful for grouping amino acids into functional groups. Amino acids can be grouped based on the properties of their side chains only. However, it is also more useful to include mutation data. The amino acid groups obtained in this way are likely to be conserved for structural reasons. These groups can be described in the form of a Venn diagram (Livingstone CD and Barton GJ (1993) "Protein sequence alignments: a strategy for the hierarchical analysis of residue conservation" Comput. Appl. Biosci. 9: 745-756) (Taylor WR (1986) "The classification of amino acid conservation" J. Theor. Biol. 119; 205-218). Conservative substitutions can be made, for example, according to the table below, which describes the generally accepted grouping of amino acids in the form of a Venn diagram.
Варианты осуществления согласно настоящему изобретению охватывают последовательности (как полинуклеотидные, так и полипептидные), которые могут содержать гомологичную замену (используемые в данном документе как замена, так и замещение означают обмен существующего аминокислотного остатка или нуклеотида на альтернативный остаток или нуклеотид), которая может происходить, т.е., в случае аминокислот, замену на аналогичную, например, основной на основную, кислой на кислую, полярной на полярную и т.д. Также может происходить негомологичная замена, т.е. остатка из одного класса на остаток из другого или, в альтернативном случае, связанная с включением аминокислот, отличных от природных, например, орнитина (далее в данном документе называемого Z), орнитиндиаминомасляной кислоты (далее в данном документе называемой B), норлейцинорнитина (далее в данном документе называемого O), пиридилаланина, тиенилаланина, нафтилаланина и фенилглицина. Вариантные аминокислотные последовательности могут содержать подходящие спейсерные группы, которые могут быть вставлены между любыми двумя аминокислотными остатками последовательности, в том числе алкильные группы, например, метильную, этильную или пропильную группы, в дополнение к аминокислотным спейсерам, таким как глициновые или β-аланиновые остатки. Другая форма вариации, которая включает присутствие одного или нескольких аминокислотных остатков в пептоидной форме, может быть хорошо понятна специалистам в данной области. Для того, чтобы избежать неопределенности, "пептоидная форма" используется для обозначения вариантных аминокислотных остатков, где замещающая группа для α-углерода расположена на атоме азота остатка, а не на α-углероде. Способы получения пептидов в пептоидной форме известны из уровня техники, например, Simon RJ et al., PNAS (1992) 89(20), 9367-9371 и Horwell DC, Trends Biotechnol. (1995) 13(4), 132-134.Embodiments of the present invention encompass sequences (both polynucleotide and polypeptide) that may comprise a homologous substitution (as used herein, both substitution and replacement mean the exchange of an existing amino acid residue or nucleotide for an alternative residue or nucleotide), which may occur, i.e., in the case of amino acids, a like-for-like substitution, such as basic for basic, acidic for acidic, polar for polar, etc. Non-homologous substitution may also occur, i.e., a residue from one class for a residue from another, or, alternatively, involving the inclusion of amino acids other than naturally occurring, such as ornithine (hereinafter referred to as Z), ornithinediaminobutyric acid (hereinafter referred to as B), norleucineornithine (hereinafter referred to as O), pyridylalanine, thienylalanine, naphthylalanine, and phenylglycine. Variant amino acid sequences may contain suitable spacer groups that can be inserted between any two amino acid residues of the sequence, including alkyl groups, for example, methyl, ethyl or propyl groups, in addition to amino acid spacers such as glycine or β-alanine residues. Another form of variation, which involves the presence of one or more amino acid residues in peptoid form, may be well understood by those skilled in the art. For the avoidance of doubt, "peptoid form" is used to refer to variant amino acid residues wherein the substituent group for the α-carbon is located on the nitrogen atom of the residue rather than on the α-carbon. Methods for producing peptides in peptoid form are known in the art, for example, Simon RJ et al., PNAS (1992) 89(20), 9367-9371 and Horwell DC, Trends Biotechnol. (1995) 13(4), 132-134.
Моделирование гомологии. Соответствующие остатки в других ортологах Cas9 можно идентифицировать с помощью способов Zhang et al., 2012 (Nature; 490(7421): 556-60) и Chen et al., 2015 (PLoS Comput Biol; 11(5): e1004248)-компьютерного способа взаимодействия белок-белок (PPI) для прогнозирования взаимодействий, опосредованных границами домен-мотив. PrePPI (прогнозируемое PPI), структура на основе способа прогнозирования PPI, объединяет структурные доказательства с неструктурными доказательствами с использованием концепции байесовой статистики. Способ включает взятие пары белков и применение структурного выравнивания с целью выявления структурных элементов, которые соответствуют либо по своим экспериментально определенным структурам, либо по гомологичным моделям. Структурное выравнивание дополнительно используют для выявления как расположенных вблизи, так и удаленных структурных соседствующих элементов посредством общих и локальных геометрических связей. Во всех случаях, когда два соседствующих элемента из структурных элементов образуют комплекс, описанный в Protein Data Bank, он определяет матрицу для моделирования взаимодействия между двумя исследуемыми белками. Модели комплекса создают с помощью накладывания структур элементов на их соответствующий структурный соседствующий элемент в матрице. Этот подход дополнительно описан в Dey et al., 2013 (Prot Sci; 22: 359-66).Homology modeling. Corresponding residues in other Cas9 orthologs can be identified using the methods of Zhang et al., 2012 (Nature; 490(7421): 556–60) and Chen et al., 2015 (PLoS Comput Biol; 11(5): e1004248)—the protein–protein interaction (PPI) computational method for predicting interactions mediated by domain–motif boundaries. PrePPI (predicted PPI), a framework based on the PPI prediction method, combines structural evidence with non-structural evidence using the concept of Bayesian statistics. The method involves taking a pair of proteins and applying a structural alignment to identify structural elements that match either their experimentally determined structures or homology models. Structural alignment is further used to identify both nearby and distant structural neighbors through global and local geometric relationships. Whenever two neighboring structural elements form a complex described in the Protein Data Bank, it defines a matrix for modeling the interaction between the two proteins of interest. Models of the complex are created by superimposing the element structures onto their corresponding structural neighbor in the matrix. This approach is further described in Dey et al., 2013 (Prot Sci; 22: 359-66).
Для целей настоящего изобретения амплификация означает любой способ с использованием праймера и полимеразы, способной обеспечивать репликацию целевой последовательности с достаточной точностью. Амплификацию можно осуществлять с помощью природных или рекомбинантных ДНК-полимераз, таких как TaqGold™, ДНК-полимераза T7, фрагмент Кленова ДНК-полимеразы E. coli и обратная транскриптаза. Предпочтительным способом амплификации является ПЦР.For the purposes of the present invention, amplification means any method using a primer and a polymerase capable of replicating the target sequence with sufficient fidelity. Amplification can be accomplished using natural or recombinant DNA polymerases, such as TaqGold™, T7 DNA polymerase, the Klenow fragment of E. coli DNA polymerase, and reverse transcriptase. The preferred amplification method is PCR.
В определенных аспектах настоящее изобретение охватывает векторы. Как используется в данном документе, "вектор" представляет собой инструмент, который позволяет или облегчает перенос объекта из одной среды в другую. Он представляет собой репликон, такой как плазмида, фаг или космида, в который может быть встроен другой сегмент ДНК для осуществления таким образом репликации встроенного сегмента. Как правило, вектор способен к репликации, если ассоциирован с соответствующими элементами контроля. В целом, термин "вектор" относится к молекуле нуклеиновой кислоты, способной переносить другую нуклеиновую кислоту, с которой она связана. Векторы включают без ограничения молекулы нуклеиновой кислоты, которые являются однонитевыми, двухнитевыми или частично двухнитевыми; молекулы нуклеиновой кислоты, которые содержат один или несколько свободных концов, не содержат свободных концов (например, кольцевые); молекулы нуклеиновой кислоты, которые содержат ДНК, РНК или и ту, и другую; и другие разновидности полинуклеотидов, известные из уровня техники. Одним типом вектора является "плазмида", которая означает кольцевую петлю двухнитевой ДНК, в которую можно встраивать дополнительные сегменты ДНК, как, например, с помощью стандартных методик молекулярного клонирования. Другим типом вектора является вирусный вектор, где полученные из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (например, ретровирусы, ретровирусы с дефектной системой репликации, аденовирусы, аденовирусы с дефектной системой репликации и аденоассоциированные вирусы (AAV)). Вирусные векторы также включают полинуклеотиды, переносимые вирусом для трансфекции в клетку-хозяина. Определенные векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы с бактериальной точкой начала репликации и эписомные векторы для млекопитающих). Другие векторы (например, векторы для млекопитающих, отличные от эписомных) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и, таким образом, реплицируются вместе с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы в данном документе обозначены как "векторы экспрессии". Общепринятые пригодные для методик рекомбинантной ДНК векторы экспрессии часто находятся в форме плазмид.In certain aspects, the present invention encompasses vectors. As used herein, a "vector" is a vehicle that enables or facilitates the transfer of an entity from one environment to another. It is a replicon, such as a plasmid, phage, or cosmid, into which another segment of DNA can be inserted to thereby effect replication of the inserted segment. Typically, a vector is capable of replication if associated with appropriate control elements. In general, the term "vector" refers to a nucleic acid molecule capable of transferring another nucleic acid to which it has been linked. Vectors include, but are not limited to, nucleic acid molecules that are single-stranded, double-stranded, or partially double-stranded; nucleic acid molecules that contain one or more free ends, no free ends (e.g., circular); nucleic acid molecules that contain DNA, RNA, or both; and other varieties of polynucleotides known in the art. One type of vector is a "plasmid," which refers to a circular loop of double-stranded DNA into which additional DNA segments can be inserted, such as by standard molecular cloning techniques. Another type of vector is a viral vector, where virally derived DNA or RNA sequences are present in the vector for packaging into the virus (e.g., retroviruses, replication-defective retroviruses, adenoviruses, replication-defective adenoviruses, and adeno-associated viruses (AAV)). Viral vectors also include polynucleotides carried by the virus for transfection into a host cell. Certain vectors are capable of autonomous replication within the host cell into which they are introduced (e.g., bacterial vectors with a bacterial origin of replication and mammalian episomal vectors). Other vectors (e.g., mammalian vectors other than episomal vectors) integrate into the host cell genome upon introduction into the host cell and are thus replicated along with the host genome. Moreover, certain vectors are capable of directing the expression of genes to which they are functionally linked. Such vectors are referred to herein as "expression vectors". Common expression vectors suitable for recombinant DNA techniques are often in the form of plasmids.
Рекомбинантные векторы экспрессии могут содержать нуклеиновую кислоту по настоящему изобретению в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается применять для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии предполагается, что выражение "функционально связанный" обозначает то, что представляющая интерес нуклеотидная последовательность связана с регуляторным(регуляторными) элементом(элементами), так что обеспечивается возможность экспрессии нуклеотидной последовательности (например, в системе транскрипции/трансляции in vitro или в клетке-хозяине при введении вектора в клетку-хозяина). Что касается способов рекомбинации и клонирования, следует упомянуть заявку на патент США № 10/815730, опубликованную 2 сентября 2004 г. как US 2004-0171156 A1, содержание которой включено в данный документ посредством ссылки в полном объеме.Recombinant expression vectors may comprise a nucleic acid of the present invention in a form suitable for expression of the nucleic acid in a host cell, which means that the recombinant expression vectors comprise one or more regulatory elements, which may be selected taking into account the host cells that are intended to be used for expression, which are operably linked to the nucleic acid sequence that is intended to be expressed. In the context of a recombinant expression vector, the term "operably linked" is intended to mean that the nucleotide sequence of interest is linked to the regulatory element(s) such that expression of the nucleotide sequence is allowed (e.g. in an in vitro transcription/translation system or in a host cell upon introduction of the vector into the host cell). With respect to recombination and cloning methods, reference should be made to U.S. Patent Application No. 10/815,730, published September 2, 2004 as US 2004-0171156 A1, the contents of which are incorporated herein by reference in their entirety.
Аспекты настоящего изобретения относятся к бицистронным векторам для химерной РНК и модифицированным или мутированным ферментам CRISPR (например Cas9). Бицистронные векторы экспрессии для химерной РНК и модифицированные или мутированные ферменты CRISPR являются предпочтительными. В целом и в частности, в данном варианте осуществления модифицированные или мутированные ферменты CRISPR предпочтительно управляются промотором CBh. Химерная РНК предпочтительно может управляться промотором Pol III, таким как промотор U6. Оптимальным является их сочетание. Химерная направляющая РНК, как правило, состоит из направляющей последовательности (Ns) из 20 п.о., которая может быть соединена с tracr-последовательностью (проходящей от первого "U" в нижней нити к концу транскрипта). В разных указанных положениях tracr-последовательность может быть усечена. Направляющие и tracr-последовательности разделены парной tracr-последовательностью, которая может представлять собой GUUUUAGAGCUA. За ней может следовать показанная последовательность петли GAAA. Обе из них являются предпочтительными примерами. Авторы настоящего изобретения продемонстрировали Cas9-опосредованные вставки/делеции в локусах EMX1 и PVALB человека с помощью анализов с использованием нуклеазы SURVEYOR. ChiRNA показаны путем обозначения их "+n", а crRNA относится к гибридной РНК, в которой направляющие и tracr-последовательности экспрессируются в виде отдельных транскриптов. По всей данной заявке химерная РНК также может называться одиночной направляющей или синтетической направляющей РНК (sgRNA). Петля предпочтительно представляет собой GAAA, но не ограничивается этой последовательностью, или действительно ее длина составляет только 4 п.о. Действительно, предпочтительные петлеобразующие последовательности для использования в "шпилечных" структурах имеют длину четыре нуклеотида и наиболее предпочтительно имеют последовательность GAAA. Однако можно применять более длинные или более короткие последовательности петли, а также альтернативные последовательности. Последовательности предпочтительно включают нуклеотидный триплет (например, AAA) и дополнительный нуклеотид (например, C или G). Примеры петлеобразующих последовательностей включают CAAA и AAAG. При осуществлении на практике любых способов, раскрытых в данном документе, подходящий вектор можно вводить в клетку или эмбрион посредством одного или нескольких способов, известных из уровня техники, в том числе без ограничения микроинъекции, электропорации, сонопорации, баллистической трансфекции, трансфекции, опосредованной фосфатом кальция, трансфекции с помощью катионных липидных частиц, липосомной трансфекции, трансфекции с помощью дендримеров, трансфекции посредством теплового шока, трансфекции посредством нуклеофекции, магнитофекции, липофекции, импалефекции, оптической трансфекции, поглощения нуклеиновых кислот, стимулируемого проприетарным средством, и доставки с помощью липосом, иммунолипосом, виросом или искусственных вирионов. В некоторых способах вектор вводят в эмбрион посредством микроинъекции. Можно осуществлять микроинъекцию вектора или векторов в ядро или цитоплазму эмбриона. В некоторых способах вектор или векторы можно вводить в клетку посредством нуклеофекции.Aspects of the present invention relate to bicistronic vectors for chimeric RNA and modified or mutated CRISPR enzymes (e.g. Cas9). Bicistronic expression vectors for chimeric RNA and modified or mutated CRISPR enzymes are preferred. In general and in particular, in this embodiment, the modified or mutated CRISPR enzymes are preferably driven by the CBh promoter. The chimeric RNA may preferably be driven by a Pol III promoter, such as the U6 promoter. Optimally, a combination of both. The chimeric guide RNA typically consists of a 20 bp guide sequence (Ns), which may be linked to a tracr sequence (extending from the first "U" in the downstream strand to the end of the transcript). The tracr sequence may be truncated at various specified positions. The guide and tracr sequences are separated by a tracr pair sequence, which may be GUUUUAGAGCUA. It may be followed by the shown GAAA loop sequence. Both of these are preferred examples. The present inventors have demonstrated Cas9-mediated insertions/deletions at the human EMX1 and PVALB loci using SURVEYOR nuclease assays. ChiRNAs are shown by their "+n" designation, and crRNA refers to a hybrid RNA in which the guide and tracr sequences are expressed as separate transcripts. Throughout this application, the chimeric RNA may also be referred to as a single guide or synthetic guide RNA (sgRNA). The loop is preferably GAAA, but is not limited to this sequence, or indeed only 4 bp in length. Indeed, preferred loop-forming sequences for use in hairpin structures are four nucleotides long, and most preferably have the sequence GAAA. However, longer or shorter loop sequences, as well as alternative sequences, may be used. The sequences preferably include a nucleotide triplet (e.g., AAA) and an additional nucleotide (e.g., C or G). Examples of loop-forming sequences include CAAA and AAAG. In practicing any of the methods disclosed herein, a suitable vector can be introduced into a cell or embryo via one or more methods known in the art, including, but not limited to, microinjection, electroporation, sonoporation, ballistic transfection, calcium phosphate-mediated transfection, cationic lipid particle transfection, liposome transfection, dendrimer transfection, heat shock transfection, nucleofection transfection, magnetofection, lipofection, impalefection, optical transfection, proprietary agent-stimulated nucleic acid uptake, and liposome, immunoliposome, virosome, or artificial virion delivery. In some methods, the vector is introduced into the embryo via microinjection. The vector or vectors can be microinjected into the nucleus or cytoplasm of the embryo. In some methods, the vector or vectors can be introduced into the cell by nucleofection.
Термин "регуляторный элемент" предназначен для охвата промоторов, энхансеров, сайтов внутренней посадки рибосомы (IRES) и других контролирующих экспрессию элементов (к примеру, сигналы терминации транскрипции, такие как сигналы полиаденилирования и поли-U-последовательности). Такие регуляторные элементы описаны, например, в Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Регуляторные элементы включают такие элементы, которые управляют конститутивной экспрессией нуклеотидной последовательности во многих типах клеток-хозяев, и такие элементы, которые управляют экспрессией нуклеотидной последовательности только в определенных клетках-хозяевах (например, тканеспецифичные регуляторные последовательности). Тканеспецифичный промотор может управлять экспрессией преимущественно в представляющей интерес целевой ткани, такой как мышца, нейрон, кость, кожа, кровь, конкретных органах (к примеру, печени, поджелудочной железе) или определенных типах клеток (к примеру, лимфоцитах). Регуляторные элементы также могут управлять экспрессией зависимым от времени образом, как, например, зависимым от клеточного цикла или зависимым от стадии развития образом, который также может быть или может не быть тканеспецифичным или специфичным к типу клеток. В некоторых вариантах осуществления вектор содержит один или несколько промоторов pol III (к примеру, 1, 2, 3, 4, 5 или более промоторов pol III), один или несколько промоторов pol II (к примеру, 1, 2, 3, 4, 5 или более промоторов pol II), один или несколько промоторов pol I (к примеру, 1, 2, 3, 4, 5 или более промоторов pol I) или их комбинации. Примеры промоторов pol III включают без ограничения промоторы U6 и H1. Примеры промоторов pol II включают без ограничения ретровирусный промотор LTR вируса саркомы Рауса (RSV) (необязательно с энхансером RSV), промотор цитомегаловируса (CMV) (необязательно с энхансером CMV) [см., например, Boshart et al, Cell, 41:521-530 (1985)], промотор SV40, промотор гена дигидрофолатредуктазы, промотор гена β-актина, промотор гена глицерофосфаткиназы (PGK) и промотор EF1α. Также термином "регуляторный элемент" охватываются энхансерные элементы, такие как энхансеры WPRE; CMV; сегмент R-U5' в LTR из HTLV-I (Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988); энхансер SV40; а также интронная последовательность между экзонами 2 и 3 гена β-глобина кролика (Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981). Специалистам в данной области техники будет понятно, что конфигурация вектора экспрессии может зависеть от таких факторов, как выбор клетки-хозяина, подлежащей трансформации, требуемый уровень экспрессии и т.п. Вектор можно вводить в клетки-хозяева с получением, таким образом, транскриптов, белков или пептидов, в том числе слитых белков или пептидов, кодируемых нуклеиновыми кислотами, которые описаны в данном документе (например, транскриптов коротких палиндромных повторов, регулярно расположенных группами (CRISPR), белков, ферментов, их мутантных форм, их слитых белков и т.п.). По отношению к регуляторным последовательностям следует упомянуть заявку на патент США № 10/491026, содержание которой включено в данный документ посредством ссылки в полном объеме. По отношению к промоторам следует упомянуть PCT-публикацию WO 2011/028929 и заявку на патент США № 12/511940, содержание которых включено в данный документ посредством ссылки во их полноте.The term "regulatory element" is intended to encompass promoters, enhancers, internal ribosome entry sites (IRES), and other expression control elements (e.g., transcription termination signals such as polyadenylation signals and poly-U sequences). Such regulatory elements are described, for example, in Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Regulatory elements include those that direct constitutive expression of a nucleotide sequence in many types of host cells and those that direct expression of a nucleotide sequence only in certain host cells (e.g., tissue-specific regulatory sequences). A tissue-specific promoter may direct expression preferentially in a target tissue of interest, such as muscle, neuron, bone, skin, blood, specific organs (e.g., liver, pancreas), or specific cell types (e.g., lymphocytes). Regulatory elements may also direct expression in a time-dependent manner, such as in a cell cycle-dependent or developmental stage-dependent manner, which may or may not also be tissue-specific or cell type-specific. In some embodiments, the vector comprises one or more pol III promoters (e.g., 1, 2, 3, 4, 5 or more pol III promoters), one or more pol II promoters (e.g., 1, 2, 3, 4, 5 or more pol II promoters), one or more pol I promoters (e.g., 1, 2, 3, 4, 5 or more pol I promoters), or combinations thereof. Examples of pol III promoters include, but are not limited to, the U6 and H1 promoters. Examples of pol II promoters include, but are not limited to, the retroviral Rous sarcoma virus (RSV) LTR promoter (optionally with the RSV enhancer), the cytomegalovirus (CMV) promoter (optionally with the CMV enhancer) [see, e.g., Boshart et al, Cell, 41:521-530 (1985)], the SV40 promoter, the dihydrofolate reductase gene promoter, the β-actin gene promoter, the glycerophosphate kinase (PGK) gene promoter, and the EF1α promoter. Also encompassed by the term "regulatory element" are enhancer elements such as the WPRE; CMV; the R-U5' segment of the LTR of HTLV-I (Mol. Cell. Biol., Vol. 8(1), pp. 466-472, 1988); the SV40 enhancer; and the intronic sequence between exons 2 and 3 of the rabbit β-globin gene (Proc. Natl. Acad. Sci. USA., Vol. 78(3), pp. 1527-31, 1981). Those skilled in the art will appreciate that the configuration of the expression vector may depend on factors such as the choice of host cell to be transformed, the desired expression level, etc. The vector can be introduced into host cells to thereby produce transcripts, proteins or peptides, including fusion proteins or peptides, encoded by nucleic acids described herein (e.g., clustered regularly interspaced short palindromic repeats (CRISPR) transcripts, proteins, enzymes, mutant forms thereof, fusion proteins thereof, etc.). With respect to regulatory sequences, reference is made to U.S. Patent Application No. 10/491,026, the contents of which are incorporated herein by reference in their entirety. With respect to promoters, reference is made to PCT Publication WO 2011/028929 and U.S. Patent Application No. 12/511,940, the contents of which are incorporated herein by reference in their entireties.
Векторы могут быть разработаны для экспрессии транскриптов CRISPR (к примеру, транскриптов нуклеиновых кислот, белков или ферментов) в прокариотических или эукариотических клетках. Например, транскрипты CRISPR могут экспрессироваться в бактериальных клетках, например, Escherichia coli, клетках насекомых (с использованием бакуловирусных векторов экспрессии), клетках дрожжей или клетках млекопитающих. Подходящие клетки-хозяева дополнительно рассматриваются в Goeddel, GENE экспрессия TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Альтернативно рекомбинантный вектор экспрессии может транскрибироваться и транслироваться in vitro, например, с помощью регуляторных последовательностей промотора T7 и полимеразы T7.Vectors can be designed to express CRISPR transcripts (e.g., nucleic acid, protein, or enzyme transcripts) in prokaryotic or eukaryotic cells. For example, CRISPR transcripts can be expressed in bacterial cells such as Escherichia coli, insect cells (using baculovirus expression vectors), yeast cells, or mammalian cells. Suitable host cells are further discussed in Goeddel, GENE expression TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Alternatively, the recombinant expression vector can be transcribed and translated in vitro, for example, using the regulatory sequences of the T7 promoter and T7 polymerase.
Векторы можно вводить и размножать в прокариоте или прокариотической клетке. В некоторых вариантах осуществления прокариота используют для амплификации копий вектора, который предполагается вводить в эукариотическую клетку, или в качестве промежуточного вектора при получении вектора, который предполагается вводить в эукариотическую клетку (к примеру, путем амплификации плазмиды как части системы упаковки вирусного вектора). В некоторых вариантах осуществления прокариота используют для амплификации копий вектора и экспрессии одной или нескольких нуклеиновых кислот, как, например, для обеспечения источника одного или нескольких белков для доставки в клетку-хозяина или организм-хозяина. Экспрессию белков в прокариотах наиболее часто осуществляют в Escherichia coli с помощью векторов, содержащих конститутивные или индуцируемые промоторы, управляющие экспрессией либо слитых белков, либо белков, отличных от слитых белков. В слитых векторах добавляют некоторое количество аминокислот к белку, закодированному в них, как, например, к амино-концу рекомбинантного белка. Такие слитые векторы могут служить для одной или нескольких целей, как, например: (i) для повышения экспрессии рекомбинантного белка; (ii) для повышения растворимости рекомбинантного белка и (iii) для содействия очистке рекомбинантного белка путем функционирования в качестве лиганда при аффинной очистке. Часто в слитые векторы экспрессии сайт протеолитического расщепления вводят в место соединения слитого фрагмента и рекомбинантного белка для облегчения отделения рекомбинантного белка от слитого фрагмента после очистки слитого белка. Такие ферменты и их когнатные распознающие последовательности включают фактор Xa, тромбин и энтерокиназу. Иллюстративные слитые векторы экспрессии включают pGEX (Pharmacia Biotech Inc; Smith and Johnson, 1988. Gene 67: 31-40), pMAL (New England Biolabs, Беверли, Массачусетс) и pRIT5 (Pharmacia, Пискатауэй, Нью-Джерси), в которых соответственно глутатион-S-трансфераза (GST), мальтоза-связывающий белок E или белок A слиты с целевым рекомбинантным белком. Примеры подходящих индуцируемых не являющихся слитыми векторов экспрессии для E. coli включают pTrc (Amrann et al., (1988) Gene 69:301-315) и pET 11d (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89). В некоторых вариантах осуществления вектор является дрожжевым вектором экспрессии. Примеры векторов для экспрессии в дрожжах Saccharomyces cerivisae включают pYepSec1 (Baldari, et al., 1987. EMBO J. 6: 229-234), pMFa (Kuijan and Herskowitz, 1982. Cell 30: 933-943), pJRY88 (Schultz et al., 1987. Gene 54: 113-123), pYES2 (Invitrogen Corporation, Сан-Диего, Калифорния) и picZ (InVitrogen Corp, Сан-Диего, Калифорния). В некоторых вариантах осуществления вектор управляет экспрессией белка в клетках насекомых с помощью бакуловирусных векторов экспрессии. Бакуловирусные векторы, доступные для экспрессии белков в культивируемых клетках насекомых (к примеру, клетках SF9), включают группу pAc (Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165) и группу pVL (Lucklow and Summers, 1989. Virology 170: 31-39).Vectors can be introduced and propagated in a prokaryote or a prokaryotic cell. In some embodiments, the prokaryote is used to amplify copies of a vector that is to be introduced into a eukaryotic cell, or as an intermediate vector in the preparation of a vector that is to be introduced into a eukaryotic cell (e.g., by amplifying a plasmid as part of a viral vector packaging system). In some embodiments, the prokaryote is used to amplify copies of a vector and express one or more nucleic acids, such as to provide a source of one or more proteins for delivery to a host cell or host organism. Expression of proteins in prokaryotes is most often accomplished in Escherichia coli using vectors containing constitutive or inducible promoters that direct the expression of either fusion proteins or proteins other than fusion proteins. Fusion vectors add a number of amino acids to the protein encoded therein, such as to the amino terminus of a recombinant protein. Such fusion vectors may serve one or more purposes, such as: (i) to enhance expression of the recombinant protein; (ii) to enhance the solubility of the recombinant protein; and (iii) to aid in purification of the recombinant protein by functioning as a ligand in affinity purification. Often, a proteolytic cleavage site is introduced into fusion expression vectors at the junction of the fusion fragment and the recombinant protein to facilitate separation of the recombinant protein from the fusion fragment after purification of the fusion protein. Such enzymes and their cognate recognition sequences include factor Xa, thrombin, and enterokinase. Illustrative fusion expression vectors include pGEX (Pharmacia Biotech Inc; Smith and Johnson, 1988. Gene 67:31-40), pMAL (New England Biolabs, Beverly, MA), and pRIT5 (Pharmacia, Piscataway, NJ), in which glutathione S-transferase (GST), maltose-binding protein E, or protein A, respectively, are fused to the target recombinant protein. Examples of suitable inducible non-fusion expression vectors for E. coli include pTrc (Amrann et al., (1988) Gene 69:301-315) and pET 11d (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89). In some embodiments, the vector is a yeast expression vector. Examples of vectors for expression in the yeast Saccharomyces cerivisae include pYepSec1 (Baldari, et al., 1987. EMBO J. 6: 229-234), pMFa (Kuijan and Herskowitz, 1982. Cell 30: 933-943), pJRY88 (Schultz et al., 1987. Gene 54: 113-123), pYES2 (Invitrogen Corporation, San Diego, CA), and picZ (InVitrogen Corp, San Diego, CA). In some embodiments, the vector directs protein expression in insect cells using baculovirus expression vectors. Baculovirus vectors available for expression of proteins in cultured insect cells (e.g., SF9 cells) include the pAc group (Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165) and the pVL group (Lucklow and Summers, 1989. Virology 170: 31-39).
В некоторых вариантах осуществления вектор способен управлять экспрессией одной или нескольких последовательностей в клетках млекопитающих с помощью вектора экспрессии для млекопитающих. Примеры векторов экспрессии для млекопитающих включают pCDM8 (Seed, 1987. Nature 329: 840) и pMT2PC (Kaufman, et al., 1987. EMBO J. 6: 187-195). При использовании в клетках млекопитающих функции контроля вектора экспрессии, как правило, обеспечиваются одним или несколькими регуляторными элементами. Например, широко используемые промоторы получают из вируса полиомы, аденовируса 2, цитомегаловируса, обезьяньего вируса 40 и других, раскрытых в данном документе и известных из уровня техники. Что касается других подходящих систем экспрессии как для прокариотических, так и для эукариотических клеток, см., к примеру, главы 16 и 17 в Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989.In some embodiments, the vector is capable of directing the expression of one or more sequences in mammalian cells using a mammalian expression vector. Examples of mammalian expression vectors include pCDM8 (Seed, 1987. Nature 329:840) and pMT2PC (Kaufman, et al., 1987. EMBO J. 6:187-195). When used in mammalian cells, the control functions of the expression vector are typically provided by one or more regulatory elements. For example, commonly used promoters are derived from polyoma virus, adenovirus 2, cytomegalovirus, simian virus 40, and others disclosed herein and known in the art. For other suitable expression systems for both prokaryotic and eukaryotic cells, see, for example, Chapters 16 and 17 of Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989.
В некоторых вариантах осуществления рекомбинантные векторы экспрессии для млекопитающих способны управлять экспрессией нуклеиновой кислоты преимущественно в определенном типе клеток (к примеру, тканеспецифичные регуляторные элементы используют для экспрессии нуклеиновой кислоты). Тканеспецифичные регуляторные элементы известны из уровня техники. Неограничивающие примеры подходящих тканеспецифичных промоторов включают промотор гена альбумина (специфичный к печени; Pinkert, et al., 1987. Genes Dev. 1: 268-277), специфичные к лимфоидной ткани промоторы (Calame and Eaton, 1988. Adv. Immunol. 43: 235-275), в частности, промоторы рецепторов T-клеток (Winoto and Baltimore, 1989. EMBO J. 8: 729-733) и иммуноглобулины (Baneiji, et al., 1983. Cell 33: 729-740; Queen and Baltimore, 1983. Cell 33: 741-748), нейрон-специфичные промоторы (к примеру, промотор гена нейрофиламента; Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477), специфичные к клеткам поджелудочной железы промоторы (Edlund, et al., 1985. Science 230: 912-916) и специфичные к клеткам молочной железы промоторы (к примеру, промотор молочной сыворотки; патент США № 4873316 и публикация европейской заявки № 264166). Регулируемые стадией развития промоторы также охвачены, к примеру, промоторы генов hox мыши (Kessel and Gruss, 1990. Science 249: 374-379) и промотор гена α-фетопротеина (Campes and Tilghman, 1989. Genes Dev. 3: 537-546). Что касается этих прокариотических и эукариотических векторов, следует упомянуть патент США № 6750059, содержание которого включено в данный документ посредством ссылки во всей его полноте. Другие варианты осуществления по настоящему изобретению могут относиться к вирусным векторам, которые упоминаются в заявке на патент США № 13/092085, содержание которой включено в данный документ посредством ссылки во всей ее полноте. Тканеспецифичные регуляторные элементы известны из уровня техники и, в связи с этим, следует упомянуть патент США № 7776321, содержание которого включено в данный документ посредством ссылки во всей его полноте. В некоторых вариантах осуществления регуляторный элемент является функционально связанным с одним или несколькими элементами системы CRISPR так, чтобы управлять экспрессией одного или нескольких элементов системы CRISPR. В целом, CRISPR (короткие палиндромные повторы, регулярно расположенные группами), также известные как SPIDR (прерываемые спейсерами прямые повторы), составляют семейство локусов ДНК, которые, как правило, специфичны для определенного вида бактерий. Локус CRISPR включает определенный класс чередующихся коротких повторов последовательностей (SSR), которые были обнаружены у E. coli (Ishino et al., J. Bacteriol., 169:5429-5433 [1987]; и Nakata et al., J. Bacteriol., 171:3553-3556 [1989]), и ассоциированные гены. Подобные чередующиеся SSR были идентифицированы у Haloferax mediterranei, Streptococcus pyogenes, Anabaena и Mycobacterium tuberculosis (см. Groenen et al., Mol. Microbiol., 10:1057-1065 [1993]; Hoe et al., Emerg. Infect. Dis., 5:254-263 [1999]; Masepohl et al., Biochim. Biophys. Acta 1307:26-30 [1996]; и Mojica et al., Mol. Microbiol., 17:85-93 [1995]). Локусы CRISPR, как правило, отличаются от других SSR по структуре повторов, которые были названы короткими повторами с регулярными интервалами (SRSR) (Janssen et al., OMICS J. Integ. Biol., 6:23-33 [2002]; и Mojica et al., Mol. Microbiol., 36:244-246 [2000]). В целом, повторы являются короткими элементами, которые встречаются группами, которые регулярно разделены уникальными вставочными последовательностями с практически постоянной длинной (Mojica et al., [2000], выше). Несмотря на то, что последовательности повторов высоко консервативны между штаммами, некоторое количество чередующихся повторов и последовательностей спейсерных участков, как правило, отличаются от штамма к штамму (van Embden et al., J. Bacteriol., 182:2393-2401 [2000]). Локусы CRISPR идентифицировали у более чем 40 прокариотов (см., например, Jansen et al., Mol. Microbiol., 43:1565-1575 [2002]; и Mojica et al., [2005]), в том числе без ограничения Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus, Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium, Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella, Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pasteurella, Photobacterium, Salmonella, Xanthomonas, Yersinia, Treponema и Thermotoga.In some embodiments, recombinant mammalian expression vectors are capable of directing expression of a nucleic acid preferentially in a particular cell type (e.g., tissue-specific regulatory elements are used to express the nucleic acid). Tissue-specific regulatory elements are known in the art. Non-limiting examples of suitable tissue-specific promoters include the albumin gene promoter (liver-specific; Pinkert, et al., 1987. Genes Dev. 1: 268-277), lymphoid tissue-specific promoters (Calame and Eaton, 1988. Adv. Immunol. 43: 235-275), particularly the T-cell receptor promoters (Winoto and Baltimore, 1989. EMBO J. 8: 729-733) and immunoglobulins (Baneiji, et al., 1983. Cell 33: 729-740; Queen and Baltimore, 1983. Cell 33: 741-748), neuron-specific promoters (e.g., the neurofilament gene promoter; Byrne and Ruddle, 1989). Proc. Natl. Acad. Sci. USA 86: 5473-5477), pancreatic cell-specific promoters (Edlund, et al., 1985. Science 230: 912-916), and mammary cell-specific promoters (e.g., the whey promoter; U.S. Patent No. 4,873,316 and European Patent Application Publication No. 264,166). Developmental stage-regulated promoters are also included, e.g., the mouse hox gene promoters (Kessel and Gruss, 1990. Science 249: 374-379) and the alpha-fetoprotein gene promoter (Campes and Tilghman, 1989. Genes Dev. 3: 537-546). With respect to these prokaryotic and eukaryotic vectors, reference should be made to U.S. Patent No. 6,750,059, the contents of which are incorporated herein by reference in their entirety. Other embodiments of the present invention may relate to viral vectors, which are mentioned in U.S. Patent Application Ser. No. 13/092,085, the contents of which are incorporated herein by reference in their entirety. Tissue-specific regulatory elements are known in the art and, in this regard, reference should be made to U.S. Patent No. 7,776,321, the contents of which are incorporated herein by reference in their entirety. In some embodiments, the regulatory element is operably linked to one or more elements of the CRISPR system so as to direct the expression of one or more elements of the CRISPR system. In general, CRISPR (clustered regularly interspaced short palindromic repeats), also known as SPIDR (spacer-interrupted direct repeats), constitute a family of DNA loci that are typically specific to a particular bacterial species. The CRISPR locus includes a particular class of interspersed short sequence repeats (SSRs) that were discovered in E. coli (Ishino et al., J. Bacteriol., 169:5429–5433 [1987]; and Nakata et al., J. Bacteriol., 171:3553–3556 [1989]) and associated genes. Similar alternating SSRs have been identified in Haloferax mediterranei, Streptococcus pyogenes, Anabaena, and Mycobacterium tuberculosis (see Groenen et al., Mol. Microbiol., 10:1057–1065 [1993]; Hoe et al., Emerg. Infect. Dis., 5:254–263 [1999]; Masepohl et al., Biochim. Biophys. Acta 1307:26–30 [1996]; and Mojica et al., Mol. Microbiol., 17:85–93 [1995]). CRISPR loci are typically distinguished from other SSRs by the structure of repeats, which have been termed regularly interspaced short repeats (SRSRs) (Janssen et al., OMICS J. Integ. Biol., 6:23–33 [2002]; and Mojica et al., Mol. Microbiol., 36:244–246 [2000]). In general, repeats are short elements that occur in groups that are regularly separated by unique intervening sequences of nearly constant length (Mojica et al., [2000], supra). Although the repeat sequences are highly conserved between strains, a number of interspersed repeats and spacer region sequences typically differ between strains (van Embden et al., J. Bacteriol., 182:2393–2401 [2000]). CRISPR loci have been identified in over 40 prokaryotes (see, e.g., Jansen et al., Mol. Microbiol., 43:1565–1575 [2002]; and Mojica et al., [2005]), including but not limited to Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus, Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium, Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella, Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pasteurella, Photobacterium, Salmonella, Xanthomonas, Yersinia, Treponema and Thermotoga.
В некоторых вариантах осуществления фермент CRISPR является частью слитого белка, содержащего один или несколько доменов гетерологичного белка (к примеру, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более доменов в дополнение к ферменту CRISPR). Слитый белок, содержащий фермент CRISPR, может содержать любую дополнительную последовательность белка и необязательно линкерную последовательность между любыми двумя доменами. Примеры белковых доменов, которые могут быть слиты с ферментом CRISPR, включают без ограничения эпитопные метки, последовательности из генов-репортеров и белковые домены с одной или несколькими из следующих видов активности: метилазная активность, деметилазная активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность расщепления РНК и активность связывания нуклеиновой кислоты. Неограничивающие примеры эпитопных меток включают гистидиновые (His) метки, V5-метки, FLAG-метки, метки гемагглютинина вируса гриппа (HA), Myc-метки, VSV-G-метки и тиоредоксиновые (Trx) метки. Примеры генов-репортеров включают без ограничения глутатион-S-трансферазу (GST), пероксидазу хрена (HRP), хлорамфеникол-ацетилтрансферазу (CAT), бета-галактозидазу, бета-глюкуронидазу, люциферазу, зеленый флуоресцентный белок (GFP), HcRed, DsRed, голубой флуоресцентный белок (CFP), желтый флуоресцентный белок (YFP) и автофлуоресцирующие белки, в том числе синий флуоресцентный белок (BFP). Фермент CRISPR может быть слит с последовательностью гена, кодирующей белок или фрагмент белка, которые связываются с молекулами ДНК или связываются с другими клеточными молекулами, в том числе без ограничения связывающий мальтозу белок (MBP), S-метка, продукты слияния Lex A и ДНК-связывающего домена (DBD), продукты слияния GAL4 и ДНК-связывающего домена и продукты слияния белка BP16 вируса простого герпеса (HSV). Дополнительные домены, которые могут образовывать часть слитого белка, содержащего фермент CRISPR, описаны в US20110059502, включенном в данный документ с помощью ссылки. В некоторых вариантах осуществления меченый фермент CRISPR используют для идентификации расположения целевой последовательности.In some embodiments, the CRISPR enzyme is part of a fusion protein comprising one or more domains of a heterologous protein (e.g., about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more domains in addition to the CRISPR enzyme). The fusion protein comprising the CRISPR enzyme may comprise any additional protein sequence and, optionally, a linker sequence between any two domains. Examples of protein domains that may be fused to the CRISPR enzyme include, but are not limited to, epitope tags, sequences from reporter genes, and protein domains with one or more of the following activities: methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, RNA cleavage activity, and nucleic acid binding activity. Non-limiting examples of epitope tags include histidine (His) tags, V5 tags, FLAG tags, influenza hemagglutinin (HA) tags, Myc tags, VSV-G tags, and thioredoxin (Trx) tags. Examples of reporter genes include, but are not limited to, glutathione S-transferase (GST), horseradish peroxidase (HRP), chloramphenicol acetyltransferase (CAT), beta-galactosidase, beta-glucuronidase, luciferase, green fluorescent protein (GFP), HcRed, DsRed, cyan fluorescent protein (CFP), yellow fluorescent protein (YFP), and autofluorescent proteins including blue fluorescent protein (BFP). The CRISPR enzyme may be fused to a gene sequence encoding a protein or protein fragment that binds to DNA molecules or binds to other cellular molecules, including, but not limited to, maltose binding protein (MBP), S-tag, Lex A DNA-binding domain (DBD) fusions, GAL4 DNA-binding domain fusions, and herpes simplex virus (HSV) BP16 fusions. Additional domains that may form part of a fusion protein comprising a CRISPR enzyme are described in US20110059502, incorporated herein by reference. In some embodiments, a labeled CRISPR enzyme is used to identify the location of a target sequence.
Практическое осуществление настоящего изобретения предусматривает, если не указано иное, традиционные методики иммунологии, биохимии, химии, молекулярной биологии, микробиологии, клеточной биологии, геномики и технологию рекомбинантной ДНК, которые находятся в пределах квалификации специалиста в данной области. См. Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. eds., (1987)); серия METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL и ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987)).The practice of the present invention will employ, unless otherwise indicated, conventional techniques of immunology, biochemistry, chemistry, molecular biology, microbiology, cell biology, genomics, and recombinant DNA technology, all of which are within the skill of the art. See Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. eds., (1987)); METHODS IN ENZYMOLOGY series (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL and ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987)).
Модели генетических и эпигенетический условийModels of genetic and epigenetic conditions
Способ по настоящему изобретению можно применять для создания растения, животного или клетки, которые можно использовать в качестве модели заболевания. Используемое в данном документе выражение "заболевание" относится к заболеванию, нарушению или симптому у субъекта. Например, способ по настоящему изобретению можно применять для создания животного или клетки, которые содержат модификацию одной или нескольких последовательностей нуклеиновой кислоты, ассоциированных с заболеванием, или растения, животного или клетки, в которых изменены экспрессии одной или нескольких последовательностей нуклеиновой кислоты, ассоциированных с заболеванием. Такая последовательность нуклеиновой кислоты может кодировать последовательность белка, ассоциированного с заболеванием, или может представлять собой регуляторную последовательность, ассоциированную с заболеванием. Соответственно, подразумевается, что в вариантах осуществления настоящего изобретения растение, субъект, пациент, организм или клетка могут относиться к субъекту, отличному от человека, пациенту, организму или клетке. Таким образом, настоящее изобретение относится к растению, животному или клетке, полученным с помощью способа по настоящему изобретению, или их потомству. Потомство может представлять собой клон полученного растения или животного, или его можно получить с помощью полового размножения посредством скрещивания с другими индивидами того же вида для придания дополнительных желаемых признаков их потомкам. Клетка может находиться in vivo или ex vivo в случае многоклеточных организмов, в частности, животных или растений. В случае, если клетка находится в культуре, можно получить линию клеток при выполнении соответствующих условий культивирования, и предпочтительно, если клетка соответствующим образом приспособлена для этой цели (например, стволовая клетка). Также предусматриваются линии бактериальных клеток, полученные согласно настоящему изобретению. Следовательно, также предусматриваются линии клеток.The method of the present invention can be used to create a plant, animal or cell that can be used as a model of a disease. As used herein, the term "disease" refers to a disease, disorder or symptom in a subject. For example, the method of the present invention can be used to create an animal or cell that contains a modification of one or more nucleic acid sequences associated with a disease, or a plant, animal or cell in which the expression of one or more nucleic acid sequences associated with a disease is altered. Such a nucleic acid sequence can encode a protein sequence associated with a disease, or can be a regulatory sequence associated with a disease. Accordingly, it is understood that in embodiments of the present invention, the plant, subject, patient, organism or cell can be a non-human subject, patient, organism or cell. Accordingly, the present invention relates to a plant, animal or cell produced by the method of the present invention, or a progeny thereof. The progeny may be a clone of the obtained plant or animal, or it may be obtained by sexual reproduction by crossing with other individuals of the same species to impart additional desired characteristics to their offspring. The cell may be in vivo or ex vivo in the case of multicellular organisms, in particular animals or plants. In the case of a cell in culture, a cell line may be obtained by performing appropriate culture conditions, and preferably if the cell is suitably adapted for this purpose (e.g. a stem cell). Also contemplated are bacterial cell lines obtained according to the present invention. Therefore, cell lines are also contemplated.
В некоторых способах модель заболевания можно использовать для изучения влияния мутаций на животное или клетку и развитие и/или прогрессирование заболевания с применением показателей, обычно используемых при изучении заболевания. Альтернативно такая модель заболевания является применимой для изучения влияния фармацевтически активного соединения на заболевание.In some methods, the disease model can be used to study the effect of mutations on an animal or cell and the development and/or progression of the disease using measures commonly used in disease studies. Alternatively, such a disease model is useful for studying the effect of a pharmaceutically active compound on a disease.
В некоторых способах модель заболевания можно использовать для оценки эффективности потенциальной стратегии генной терапии. Таким образом, ассоциированные с заболеванием ген или полинуклеотид можно модифицировать, так что развитие и/или прогрессирование заболевания замедляется или уменьшается. В частности, способ включает модификацию ассоциированных с заболеванием гена или полинуклеотида, так что продуцируется измененный белок, и в результате у животного или клетки наблюдается измененный ответ. Соответственно, в некоторых способах генетически модифицированное животное можно сравнивать с животным, предрасположенным к развитию заболевания, так что можно оценить эффект осуществления генной терапии.In some methods, a disease model can be used to evaluate the effectiveness of a potential gene therapy strategy. Thus, a disease-associated gene or polynucleotide can be modified so that the development and/or progression of the disease is slowed or reduced. In particular, the method includes modifying a disease-associated gene or polynucleotide so that an altered protein is produced and, as a result, an altered response is observed in the animal or cell. Accordingly, in some methods, a genetically modified animal can be compared with an animal predisposed to developing a disease so that the effect of performing gene therapy can be assessed.
В другом варианте осуществления настоящее изобретение относится к способу получения биологически активного средства, которое модулирует процесс передачи сигнала в клетке, ассоциированный с геном, ответственным за развитие заболевания. Способ предусматривает приведение тестового соединения в контакт с клеткой, содержащей один или несколько векторов, которые управляют экспрессией одного или нескольких из: фермента CRISPR, направляющей последовательности, связанной с парной tracr-последовательностью и tracr-последовательностью; и обнаружение изменения при считывании, которое свидетельствует об уменьшении или усилении процесса передачи сигнала в клетке, ассоциированного, например, с мутацией в гене, ответственном за развитие заболевания, который содержится в клетке.In another embodiment, the present invention relates to a method for producing a biologically active agent that modulates a signaling process in a cell associated with a gene responsible for the development of a disease. The method involves contacting a test compound with a cell containing one or more vectors that direct the expression of one or more of: a CRISPR enzyme, a guide sequence associated with a tracr pair sequence and a tracr sequence; and detecting a change in reading that indicates a decrease or increase in the signaling process in the cell associated, for example, with a mutation in a gene responsible for the development of a disease contained in the cell.
Клеточную модель или животную модель можно сконструировать в сочетании со способом по настоящему изобретению для скрининга изменения клеточной функции. Такую модель можно применять для исследования влияния геномной последовательности, модифицированной с помощью комплекса CRISPR по настоящему изобретению, на представляющую интерес клеточную функцию. Например, модель клеточной функции можно применять для исследования воздействия модифицированной геномной последовательности на внутриклеточную передачу сигнала или внеклеточную передачу сигнала. Альтернативно модель клеточной функции можно применять для исследования воздействий модифицированной геномной последовательности на сенсорную чувствительность. В некоторых таких моделях одна или несколько геномных последовательностей, ассоциированных с биохимическим путем передачи сигнала, в модели является модифицированной.A cellular model or an animal model can be constructed in combination with the method of the present invention to screen for a change in cellular function. Such a model can be used to study the effect of a genomic sequence modified by a CRISPR complex of the present invention on a cellular function of interest. For example, a cellular function model can be used to study the effect of a modified genomic sequence on intracellular signaling or extracellular signaling. Alternatively, a cellular function model can be used to study the effects of a modified genomic sequence on sensory sensitivity. In some such models, one or more genomic sequences associated with a biochemical signaling pathway in the model are modified.
Специально было исследовано несколько моделей заболеваний. Они включают гены CHD8, KATNAL2 и SCN2A, связанные с риском развития аутизма de novo, и ген UBE3A, связанный с синдромным аутизмом (синдром Ангельмана). Эти гены и полученные в результате модели аутизма, разумеется, являются предпочтительными, но служат для того, чтобы продемонстрировать широкую применимость настоящего изобретения по отношению к генам и соответствующим моделям.Several disease models were specifically examined. These include the genes CHD8, KATNAL2, and SCN2A, which are associated with risk for de novo autism, and the gene UBE3A, which is associated with syndromic autism (Angelman syndrome). These genes and the resulting autism models are, of course, preferred, but serve to demonstrate the broad applicability of the present invention to genes and corresponding models.
Измененную экспрессию одной или нескольких геномных последовательностей, ассоциированных с биохимическим путем передачи сигнала, можно определять с помощью анализа различия по уровням мРНК соответствующих генов между тестируемой модельной клеткой и контрольной клеткой, если их приводят в контакт с кандидатным средством. Альтернативно различную экспрессию последовательностей, ассоциированных с биохимическим путем передачи сигнала, определяют посредством выявления различия по уровню кодируемого полипептида или продукта гена.Altered expression of one or more genomic sequences associated with a biochemical signaling pathway can be determined by analyzing the difference in mRNA levels of the corresponding genes between a test model cell and a control cell when they are contacted with a candidate agent. Alternatively, differential expression of sequences associated with a biochemical signaling pathway is determined by detecting a difference in the level of the encoded polypeptide or gene product.
Для анализа индуцированного определенным средством изменения уровня мРНК-транскриптов или соответствующих полинуклеотидов, нуклеиновую кислоту, которая содержится в образце, вначале экстрагируют в соответствии со стандартными способами из уровня техники. Например, матричную РНК можно выделять с применением различных литических ферментов или химических растворов в соответствии с процедурами, изложенными в Sambrook et al. (1989), или экстрагировать с помощью смол, связывающих нуклеиновые кислоты, в соответствии с прилагаемыми инструкциями, предоставленными производителями. Содержащуюся в экстрагированном образце нуклеиновой кислоты мРНК затем выявляют с помощью методик амплификации или традиционных гибридизационных анализов (например, анализа с помощью нозерн-блоттинга) в соответствии со способами, широко известными из уровня техники или основанными на способах, проиллюстрированных в данном документе.To analyze the change in the level of mRNA transcripts or corresponding polynucleotides induced by a certain agent, the nucleic acid contained in the sample is first extracted according to standard methods in the art. For example, messenger RNA can be isolated using various lytic enzymes or chemical solutions according to the procedures outlined in Sambrook et al. (1989), or extracted using nucleic acid binding resins according to the accompanying instructions provided by the manufacturers. The mRNA contained in the extracted nucleic acid sample is then detected using amplification techniques or conventional hybridization assays (e.g., Northern blot analysis) according to methods commonly known in the art or based on the methods illustrated herein.
Для целей настоящего изобретения амплификация означает любой способ с использованием праймера и полимеразы, способной обеспечивать репликацию целевой последовательности с достаточной точностью. Амплификацию можно осуществлять с помощью природных или рекомбинантных ДНК-полимераз, таких как TaqGold™, ДНК-полимераза T7, фрагмент Кленова ДНК-полимеразы E. coli и обратная транскриптаза. Предпочтительным способом амплификации является ПЦР. В частности, выделенную РНК можно подвергать анализу с обратной транскрипцией, который объединен с количественной полимеразной цепной реакцией (RT-PCR), для количественного определения уровня экспрессии последовательности, ассоциированной с биохимическим путем передачи сигнала.For the purposes of the present invention, amplification means any method using a primer and a polymerase capable of replicating the target sequence with sufficient fidelity. Amplification can be performed using natural or recombinant DNA polymerases such as TaqGold™, T7 DNA polymerase, Klenow fragment of E. coli DNA polymerase and reverse transcriptase. A preferred amplification method is PCR. In particular, the isolated RNA can be subjected to reverse transcription analysis, which is combined with quantitative polymerase chain reaction (RT-PCR), to quantify the expression level of a sequence associated with a biochemical signal transduction pathway.
Выявление уровня экспрессии генов можно осуществлять в анализе амплификации в режиме реального времени. В одном аспекте амплифицированные продукты можно непосредственно визуализировать с помощью флуоресцентных ДНК-связывающих средств, в том числе без ограничения ДНК-интеркаляторов и средств, связывающихся с бороздкой спирали ДНК. Поскольку количество интеркаляторов, включенных в двухнитевые молекулы ДНК, как правило, является пропорциональным количеству амплифицированных ДНК-продуктов, можно без труда определить количество амплифицированных продуктов путем количественного определения флуоресценции интеркалирующего красителя с применением традиционных оптических систем из уровня техники. ДНК-связывающий краситель, подходящий для этой задачи, охватывает SYBR зеленый, SYBR синий, DAPI, йодид пропидия, Hoeсhst, SYBR золотой, бромид этидия, акридины, профлавин, акридиновый оранжевый, акрифлавин, фторкумарин, эллиптицин, дауномицин, хлорохин, дистамицин D, хромомицин, хомидий, митрамицин, комплексы рутений-полипиридил, антрамицин и т.п.The detection of gene expression levels can be performed in a real-time amplification assay. In one aspect, the amplified products can be directly visualized using fluorescent DNA binding agents, including but not limited to DNA intercalators and DNA groove binding agents. Since the number of intercalators incorporated into double-stranded DNA molecules is generally proportional to the number of amplified DNA products, the amount of amplified products can be easily determined by quantifying the fluorescence of the intercalating dye using conventional optical systems from the prior art. DNA-binding dye suitable for this task includes SYBR green, SYBR blue, DAPI, propidium iodide, Hoechst, SYBR gold, ethidium bromide, acridines, proflavine, acridine orange, acriflavine, fluorocoumarin, ellipticine, daunomycin, chloroquine, distamycin D, chromomycin, homidium, mithramycin, ruthenium-polypyridyl complexes, anthramycin, etc.
В другом аспекте можно использовать другие флуоресцентные метки, например, зонды, специфичные по отношению к последовательности, в реакции амплификации для обеспечения выявления и количественного определения амплифицированных продуктов. Количественная амплификация с использованием зонда основана на специфичном по отношению к последовательности выявлении требуемого амплифицированного продукта. Используются флуоресцентные зонды, специфичные по отношению к мишени (например, зонды TaqMan®), что приводит в результате к увеличению специфичности и чувствительности. Способы осуществления количественной амплификации с использованием зонда являются общепринятыми в данной области и описаны в патенте США № 5210015.In another aspect, other fluorescent labels, such as sequence-specific probes, can be used in the amplification reaction to provide detection and quantification of the amplified products. Probe-based quantitative amplification relies on sequence-specific detection of the desired amplified product. Target-specific fluorescent probes (e.g., TaqMan® probes) are used, resulting in increased specificity and sensitivity. Methods for performing probe-based quantitative amplification are well known in the art and are described in U.S. Patent No. 5,210,015.
В еще одном аспекте можно осуществлять традиционные гибридизационные анализы с использованием гибридизационных зондов, которые характеризуются гомологией последовательности с последовательностями, ассоциированными с биохимическим путем передачи сигнала. Как правило, в реакции гибридизации зондам дают возможность образовать стабильные комплексы с последовательностями, ассоциированными с биохимическим путем передачи сигнала, которые содержатся в биологическом образце, полученном от исследуемого субъекта. Специалисту в данной области будет понятно, что если антисмысловая нуклеиновая кислота используется в качестве зонда, то целевые полинуклеотиды, представленные в образце, выбирают так, чтобы они были комплементарными последовательностям антисмысловых нуклеиновых кислот. Напротив, если нуклеотидный зонд является смысловой нуклеиновой кислотой, то целевой полинуклеотид выбирают так, чтобы он был комплементарным последовательностям смысловой нуклеиновой кислоты.In another aspect, conventional hybridization assays can be performed using hybridization probes that are characterized by sequence homology to sequences associated with a biochemical signaling pathway. Typically, in a hybridization reaction, the probes are allowed to form stable complexes with sequences associated with a biochemical signaling pathway contained in a biological sample obtained from a subject under study. One skilled in the art will appreciate that if an antisense nucleic acid is used as a probe, the target polynucleotides present in the sample are selected to be complementary to the antisense nucleic acid sequences. Conversely, if the nucleotide probe is a sense nucleic acid, the target polynucleotide is selected to be complementary to the sense nucleic acid sequences.
Гибридизацию можно осуществлять в условиях различной жесткости. Подходящие условия гибридизации для осуществления на практике настоящего изобретения являются такими, что обеспечивающее распознавание взаимодействие зонда с последовательностями, ассоциированными с биохимическим путем передачи сигнала, является как достаточно специфичным, так и достаточно стабильным. Условия, которые приводят к увеличению жесткости реакции гибридизации, хорошо известны из уровня техники и являются опубликованными. См., например (Sambrook, et al., (1989); Nonradioactive In Situ Hybridization Application Manual, Boehringer Mannheim, second edition). Гибридизационный анализ можно осуществлять с применением зондов, иммобилизованных на любой твердой подложке, в том числе без ограничения нитроцеллюлозной, стеклянной, кремниевой, и ряда ДНК-чипов. Предпочтительный гибридизационный анализ проводят на генных чипах высокой плотности, описанных в патенте США № 5445934.Hybridization can be performed under conditions of varying stringency. Suitable hybridization conditions for practicing the present invention are those such that the recognition interaction of the probe with sequences associated with the biochemical signaling pathway is both sufficiently specific and sufficiently stable. Conditions that increase the stringency of the hybridization reaction are well known in the art and are published. See, for example (Sambrook, et al., (1989); Nonradioactive In Situ Hybridization Application Manual, Boehringer Mannheim, second edition). Hybridization assays can be performed using probes immobilized on any solid support, including but not limited to nitrocellulose, glass, silicon, and a variety of DNA chips. A preferred hybridization assay is performed on the high-density gene chips described in U.S. Patent No. 5,445,934.
Для удобного выявления комплексов зонд-мишень, образованных в ходе гибридизационного анализа, осуществляют конъюгирование нуклеотидных зондов с детектируемой меткой. Детектируемые метки, подходящие для применения в настоящем изобретении, включают любую композицию, выявляемую с помощью фотохимических, биохимических, спектроскопических, иммунохимических, электрических, оптических или химических средств. Широкий спектр соответствующих детектируемых меток известен из уровня техники, причем он включает флуоресцентные или хемилюминесцентные метки, метки на основе радиоактивных изотопов, ферментные или другие лиганды. В предпочтительных вариантах осуществления, вероятно, предпочтительной будет флуоресцентная метка или ферментная метка, как, например, дигоксигенин, β-галактозидаза, уреаза, щелочная фосфатаза или пероксидаза, комплекс авидин/биотин.To conveniently detect probe-target complexes formed during the hybridization assay, the nucleotide probes are conjugated to a detectable label. Detectable labels suitable for use in the present invention include any composition detectable by photochemical, biochemical, spectroscopic, immunochemical, electrical, optical or chemical means. A wide range of suitable detectable labels are known in the art, including fluorescent or chemiluminescent labels, radioactive isotope labels, enzymatic or other ligands. In preferred embodiments, a fluorescent label or an enzymatic label, such as digoxigenin, β-galactosidase, urease, alkaline phosphatase or peroxidase, avidin/biotin complex, is likely to be preferred.
Способы выявления, применяемые для выявления или количественного определения интенсивности гибридизации, как правило, будут зависеть от метки, выбранной выше. Например, радиоактивные метки можно выявлять с использованием фотографической пленки или фосфовизуализатора. Флуоресцентные маркеры можно выявлять и количественно определять с использованием фотодетектора для выявления излучаемого света. Ферментные метки, как правило, выявляют посредством снабжения фермента субстратом и измерения количества продукта реакции, образованного при воздействии фермента на субстрат; и, наконец, колориметрические метки выявляют посредством простой визуализации цветной метки.The detection methods used to detect or quantify the intensity of hybridization will generally depend on the label selected above. For example, radioactive labels may be detected using photographic film or a phosphovisualizer. Fluorescent markers may be detected and quantified using a photodetector to detect the emitted light. Enzyme labels are typically detected by supplying the enzyme with a substrate and measuring the amount of reaction product formed upon exposure of the enzyme to the substrate; and finally, colorimetric labels are detected by simply visualizing the colored label.
Индуцированное определенным средством изменение экспрессии последовательностей, ассоциированных с биохимическим путем передачи сигнала, также можно определять посредством исследования соответствующих продуктов генов. Определение уровня белка, как правило, включает a) приведение белка, содержащегося в биологическом образце, в контакт со средством, которое специфично связывается с белком, ассоциированным с биохимическим путем передачи сигнала; и (b) идентификацию любого комплекса средство:белок, образованного таким образом. В одном аспекте данного варианта осуществления средство, которое специфически связывает белок, ассоциированный с биохимическим путем передачи сигнала, представляет собой антитело, предпочтительно, моноклональное антитело.An agent-induced change in the expression of sequences associated with a biochemical signaling pathway can also be determined by examining the corresponding gene products. Determining the level of a protein typically involves a) contacting a protein contained in a biological sample with an agent that specifically binds to a protein associated with a biochemical signaling pathway; and (b) identifying any agent:protein complex formed thereby. In one aspect of this embodiment, the agent that specifically binds a protein associated with a biochemical signaling pathway is an antibody, preferably a monoclonal antibody.
Реакцию осуществляют посредством приведения средства в контакт с образцом белков, ассоциированных с биохимическим путем передачи сигнала, полученным из тестируемых образцов, при условиях, которые обеспечивают возможность образования комплекса между средством и белками, ассоциированными с биохимическим путем передачи сигнала. Образование комплекса можно выявлять непосредственно или опосредованно в соответствии со стандартными процедурами из уровня техники. В способе непосредственного выявления средства снабжают детектируемой меткой и непрореагировавшие средства можно удалять от комплекса; количество оставшейся метки, таким образом, отражает количество образованного комплекса. Для такого способа предпочтительно выбирать метки, которые остаются прикрепленными к средствам даже при жестких условиях отмывки. Предпочтительно, чтобы метка не препятствовала реакции связывания. В альтернативном случае, для процедуры опосредованного выявления можно использовать средство, которое содержит метку, введенную либо химическим, либо ферментативным путем. Требуемая метка, как правило, не препятствует связыванию или стабильности полученного в результате комплекса средство:полипептид. Однако, метка, как правило, разработана так, чтобы она была доступной для эффективного связывания антителом и, следовательно, выработки детектируемого сигнала.The reaction is carried out by contacting the agent with a sample of proteins associated with the biochemical signal transduction pathway obtained from the test samples under conditions that allow the formation of a complex between the agent and the proteins associated with the biochemical signal transduction pathway. The formation of the complex can be detected directly or indirectly according to standard procedures in the art. In a direct detection method, the agents are provided with a detectable label and unreacted agents can be removed from the complex; the amount of remaining label thus reflects the amount of complex formed. For such a method, it is preferable to select labels that remain attached to the agents even under stringent washing conditions. Preferably, the label does not interfere with the binding reaction. Alternatively, for an indirect detection procedure, an agent can be used that contains a label introduced either chemically or enzymatically. The desired label, as a rule, does not interfere with the binding or stability of the resulting agent:polypeptide complex. However, the label is typically designed to be accessible for efficient binding by the antibody and hence the production of a detectable signal.
Широкий спектр меток, подходящих для выявления уровней белка, известен из уровня техники. Неограничивающие примеры включают радиоактивные изотопы, ферменты, коллоидные металлы, флуоресцентные соединения, биолюминесцентные соединения и хемилюминесцентные соединения.A wide range of labels suitable for detecting protein levels are known in the art. Non-limiting examples include radioactive isotopes, enzymes, colloidal metals, fluorescent compounds, bioluminescent compounds, and chemiluminescent compounds.
Количество комплексов средство:полипептид, образованных в ходе реакции связывания, можно количественно определять с помощью стандартных количественных анализов. Как проиллюстрировано выше, образование комплекса средство:полипептид можно измерить непосредственно по количеству метки, оставшейся в сайте связывания. В альтернативном случае белок ассоциированный с биохимическим путем передачи сигнала, исследуют в отношении его способности конкурировать с меченым аналогом за участки связывания на специфическом средстве. В этом конкурентном анализе количество захваченной метки является обратно пропорциональным количеству последовательностей белка, ассоциированного с биохимическим путем передачи сигнала, присутствующих в исследуемом образце.The amount of agent:polypeptide complexes formed during the binding reaction can be quantified using standard quantitative assays. As illustrated above, agent:polypeptide complex formation can be measured directly by the amount of label remaining at the binding site. Alternatively, the pathway-associated protein is assayed for its ability to compete with a labeled analogue for binding sites on a specific agent. In this competition assay, the amount of label captured is inversely proportional to the amount of pathway-associated protein sequences present in the sample being tested.
Ряд методик анализа белка, основанных на общих принципах, изложенных выше, доступен из уровня техники. Они включают без ограничения радиоиммунные анализы, ELISA (твердофазные ферментные иммунорадиометрические анализы), "сэндвич"-иммуноанализы, иммунорадиометрические анализы, иммуноанализы in situ (с применением, например, коллоидного золота, фермента или радиоизотопных меток), вестерн-блот анализ, иммунопреципитационные анализы, иммунофлуоресцентные анализы и SDS-PAGE.A number of protein analysis techniques based on the general principles outlined above are available in the art. These include, but are not limited to, radioimmunoassays, ELISA (enzyme linked immunoradiometric assays), sandwich immunoassays, immunoradiometric assays, in situ immunoassays (using, for example, colloidal gold, enzyme or radioisotope labels), Western blot analysis, immunoprecipitation assays, immunofluorescence assays and SDS-PAGE.
Антитела, которые обеспечивают специфичное распознавание или связываются с белками, ассоциированными с биохимическим путем передачи сигнала, являются предпочтительными для осуществления вышеупомянутых анализов белка. При необходимости можно использовать антитела, которые обеспечивают распознавание конкретного типа посттрансляционных модификаций (например, модификации, индуцируемые биохимическим путем передачи сигнала). Посттрансляционные модификации включают без ограничения гликозилирование, липидизацию, ацетилирование и фосфорилирование. Эти антитела можно приобрести у коммерческих поставщиков. Например, антитела к фосфотирозину, которые обеспечивают специфичное распознавание фосфорилированных по тирозину белков, доступны от ряда поставщиков, включая Invitrogen и Perkin Elmer. Антитела к фосфотирозину являются особенно применимыми при выявлении белков, которые различным образом фосфорилируются по их тирозиновым остаткам в ответ на стресс ER (эндоплазматического ретикулума). Такие белки включают без ограничения эукариотический фактор инициации трансляции 2 альфа (eIF-2α). Альтернативно эти антитела можно получить с помощью традиционных технологий получения поликлональных или моноклональных антител посредством иммунизации животного-хозяина или клетки, продуцирующей антитела, целевым белком, который характеризуется необходимой посттрансляционной модификацией.Antibodies that specifically recognize or bind to proteins associated with a biochemical signaling pathway are preferred for performing the above-mentioned protein assays. If desired, antibodies that recognize a specific type of post-translational modification (e.g., modifications induced by a biochemical signaling pathway) can be used. Post-translational modifications include, but are not limited to, glycosylation, lipidation, acetylation, and phosphorylation. These antibodies are available from commercial suppliers. For example, anti-phosphotyrosine antibodies, which specifically recognize tyrosine-phosphorylated proteins, are available from a number of suppliers, including Invitrogen and Perkin Elmer. Anti-phosphotyrosine antibodies are particularly useful in detecting proteins that are differentially phosphorylated on their tyrosine residues in response to ER (endoplasmic reticulum) stress. Such proteins include, but are not limited to, eukaryotic translation initiation factor 2 alpha (eIF-2α). Alternatively, these antibodies can be produced using conventional polyclonal or monoclonal antibody production technologies by immunizing a host animal or antibody-producing cell with a target protein that has undergone the desired post-translational modification.
При осуществлении заявленного способа на практике может быть необходимо определить профиль экспрессии белка, ассоциированного с биохимическим путем передачи сигнала, в различных тканях организма, в различных типах клеток и/или в различных субклеточных структурах. Данные исследования можно проводить с применением тканеспецифичных, специфичных к определенным клеткам или специфичных к определенным субклеточным структурам антител, способных связываться с белковыми маркерами, которые преимущественно экспрессируются в определенных тканях, типах клеток или субклеточных структурах.In the practical implementation of the claimed method, it may be necessary to determine the expression profile of a protein associated with a biochemical signal transduction pathway in various tissues of the body, in various cell types and/or in various subcellular structures. These studies can be carried out using tissue-specific, cell-specific or subcellular structure-specific antibodies capable of binding to protein markers that are predominantly expressed in certain tissues, cell types or subcellular structures.
Измененную экспрессию гена, ассоциированного с биохимическим путем передачи сигнала, также можно определять с помощью исследования изменения активности продукта гена по сравнению с контрольной клеткой. Анализ индуцированного определенным средством изменения активности белка, ассоциированного с биохимическим путем передачи сигнала, будет зависеть от биологической активности и/или исследуемого пути передачи сигнала. Например, если белок представляет собой киназу, изменение его способности фосфорилировать субстрат(субстраты) на последующих стадиях можно определять посредством ряда анализов, известных из уровня техники. Иллюстративные анализы включают без ограничения иммуноблоттинг и иммунопреципитацию с использованием антител, таких как антитела к фосфотирозину, которые обеспечивают распознавание фосфорилированных белков. Кроме того, активность киназы можно выявлять с помощью высокопроизводительных хемилюминесцентных анализов, как, например, анализов AlphaScreen™ (доступный от Perkin Elmer) и eTag™ (Chan-Hui, et al. (2003) Clinical Immunology 111: 162-174).Altered expression of a gene associated with a biochemical signaling pathway can also be determined by examining the change in activity of the gene product compared to a control cell. The assay for a specific agent-induced change in activity of a protein associated with a biochemical signaling pathway will depend on the biological activity and/or signaling pathway being examined. For example, if the protein is a kinase, a change in its ability to phosphorylate a substrate(s) at subsequent steps can be determined by a number of assays known in the art. Exemplary assays include, but are not limited to, immunoblotting and immunoprecipitation using antibodies, such as anti-phosphotyrosine antibodies, that recognize phosphorylated proteins. In addition, kinase activity can be detected using high-throughput chemiluminescent assays such as the AlphaScreen™ (available from Perkin Elmer) and eTag™ assays (Chan-Hui, et al. (2003) Clinical Immunology 111: 162-174).
Если белок, ассоциированный с биохимическим путем передачи сигнала, является частью сигнального каскада, который приводит к колебанию внутриклеточных условий pH, молекулы, чувствительные к pH, например, флуоресцентные pH-чувствительные красители, можно использовать в качестве репортерных молекул. В другом примере, если белок, ассоциированный с биохимическим путем передачи сигнала, представляет собой ионный канал, можно отслеживать колебания мембранного потенциала и/или внутриклеточной концентрации ионов. Ряд коммерческих наборов и высокопроизводительных устройств являются особенно подходящими для быстрого и надежного скрининга модуляторов ионных каналов. Иллюстративные инструменты включают FLIPRTM (Molecular Devices, Inc.) и VIPR (Aurora Biosciences). Эти инструменты способны обеспечивать одновременное выявление реакций в более чем 1000 лунках с образцом в микропланшете и обеспечивать измерение в реальном времени и функциональные данные в течение секунды или даже миллисекунды.If the protein associated with a biochemical signal transduction pathway is part of a signaling cascade that results in fluctuations in intracellular pH conditions, pH-sensitive molecules, such as fluorescent pH-sensitive dyes, can be used as reporter molecules. In another example, if the protein associated with a biochemical signal transduction pathway is an ion channel, fluctuations in membrane potential and/or intracellular ion concentration can be monitored. A number of commercial kits and high-throughput devices are particularly suitable for the rapid and reliable screening of ion channel modulators. Illustrative instruments include FLIPRTM (Molecular Devices, Inc.) and VIPR (Aurora Biosciences). These instruments are capable of simultaneously detecting reactions in more than 1000 sample wells in a microplate and providing real-time measurements and functional data within a second or even millisecond.
При осуществлении на практике любых способов, раскрытых в данном документе, подходящий вектор можно вводить в клетку или эмбрион посредством одного или нескольких способов, известных из уровня техники, в том числе без ограничения микроинъекции, электропорации, сонопорации, баллистической трансфекции, трансфекции, опосредованной фосфатом кальция, трансфекции с помощью катионных липидных частиц, липосомной трансфекции, трансфекции с помощью дендримеров, трансфекции посредством теплового шока, трансфекции посредством нуклеофекции, магнитофекции, липофекции, импалефекции, оптической трансфекции, поглощения нуклеиновых кислот, стимулируемого проприетарным средством, и доставки с помощью липосом, иммунолипосом, виросом или искусственных вирионов. В некоторых способах вектор вводят в эмбрион посредством микроинъекции. Можно осуществлять микроинъекцию вектора или векторов в ядро или цитоплазму эмбриона. В некоторых способах вектор или векторы можно вводить в клетку посредством нуклеофекции.In practicing any of the methods disclosed herein, a suitable vector may be introduced into a cell or embryo by one or more methods known in the art, including, but not limited to, microinjection, electroporation, sonoporation, ballistic transfection, calcium phosphate-mediated transfection, cationic lipid particle transfection, liposome transfection, dendrimer transfection, heat shock transfection, nucleofection transfection, magnetofection, lipofection, impalefection, optical transfection, proprietary agent-stimulated nucleic acid uptake, and liposome, immunoliposome, virosome, or artificial virion delivery. In some methods, the vector is introduced into the embryo by microinjection. The vector or vectors may be microinjected into the nucleus or cytoplasm of the embryo. In some methods, the vector or vectors can be introduced into the cell via nucleofection.
Целевой локус, целевой полинуклеотид; последовательность PAMTarget locus, target polynucleotide; PAM sequence
Целевым полинуклеотидом для комплекса CRISPR может быть любой полинуклеотид, эндогенный или экзогенный по отношению к эукариотической клетке. Например, целевой полинуклеотид может быть полинуклеотидом, находящимся в ядре эукариотической клетки. Целевой полинуклеотид может быть последовательностью, кодирующей продукт гена (к примеру, белок), или некодирующей последовательностью (к примеру, регуляторным полинуклеотидом или избыточной ДНК). Целью может быть контрольный элемент, или регуляторный элемент, или промотор, или энхансер, или сайленсер. В некоторых вариантах осуществления промотор может находиться в участке +200 п. о. или даже +1000 п. о. от TTS. В некоторых вариантах осуществления регуляторным участком может быть энхансер. Энхансер, как правило, занимает более чем +1000 п. о. от TTS. Более конкретно, экспрессия эукариотических кодирующих белок генов, как правило, регулируется посредством многочисленных цис-действующих участков контроля транскрипции. Некоторые контрольные элементы располагаются близко к сайту старта (промотор-проксимальные элементы), тогда как другие располагаются дальше (энхансеры и сайленсеры). Промоторы определяют сайт инициации транскрипция и управляют связыванием РНК-полимеразы II. Три типа промоторных последовательностей были идентифицированы ы эукариотической ДНК. TATA-бокс чаще всего преобладает в быстро транскрибируемых генах. Инициирующие промоторы редко встречаются в некоторых генах, а CpG-островки характерны для транскрибируемых генов. Промотор-проксимальные элементы встречаются в пределах ≈200 пар оснований сайта старта. Некоторые такие элементы, содержащие до ≈20 пар оснований, могут помогать регулировать конкретный ген. Энхансеры, которые составляют, как правило, ≈100-200 пар оснований в дину, содержат множество контрольных элементов по 8-20 п. о. Они могут быть размещены на расстоянии от 200 пар оснований до десятков тысяч пар оснований выше или ниже промотора, в интроне или ниже конечного экзона в гене.· Промотор-проксимальные элементы и энхансеры могут быть специфическими в отношении типа клеток, функционируя только в определенных типах дифференцированных клеток. Однако любая из этих областей может быть целевой последовательностью и охватываться концепцией того, что мишенью может быть контрольный элемент, или регуляторный элемент, или промотор, или энхансер, или сайленсер.A target polynucleotide for a CRISPR complex may be any polynucleotide that is endogenous or exogenous to a eukaryotic cell. For example, a target polynucleotide may be a polynucleotide located in the nucleus of a eukaryotic cell. A target polynucleotide may be a sequence encoding a gene product (e.g., a protein) or a non-coding sequence (e.g., a regulatory polynucleotide or junk DNA). The target may be a control element or a regulatory element or a promoter or an enhancer or a silencer. In some embodiments, a promoter may be located at +200 bp or even +1000 bp from a TTS. In some embodiments, a regulatory region may be an enhancer. An enhancer typically extends more than +1000 bp from a TTS. More specifically, expression of eukaryotic protein-coding genes is typically regulated by multiple cis-acting transcriptional control regions. Some control elements are located close to the start site (promoter-proximal elements), whereas others are located further away (enhancers and silencers). Promoters define the site of transcription initiation and direct the binding of RNA polymerase II. Three types of promoter sequences have been identified in eukaryotic DNA. The TATA box is most often prevalent in rapidly transcribed genes. Initiation promoters are rare in some genes, and CpG islands are characteristic of transcribed genes. Promoter-proximal elements occur within ≈200 bp of the start site. Some such elements, up to ≈20 bp long, may help regulate a particular gene. Enhancers, which are typically ≈100–200 bp long, contain multiple control elements of 8–20 bp. They may be located anywhere from 200 base pairs to tens of thousands of base pairs upstream or downstream of a promoter, in an intron, or downstream of a final exon in a gene. Promoter-proximal elements and enhancers may be cell-type specific, functioning only in certain types of differentiated cells. However, any of these regions may be a target sequence and are encompassed by the concept that a target may be a control element, or a regulatory element, or a promoter, or an enhancer, or a silencer.
Как правило, в контексте эндогенной системы нацеливания на нуклеиновую кислоту образование комплекса нацеливания на нуклеиновую кислоту (содержащего направляющую РНК, гибридизированную с целевой последовательностью и образующую комплекс с одним или несколькими эффекторными белками для нацеливания на нуклеиновую кислоту) приводит к расщеплению одной или обеих нитей ДНК или РНК в (например, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар оснований) целевой последовательности или рядом с ней. Используемый в данном документе термин "последовательность(последовательности), ассоциированная(ассоциированные) с представляющим интерес целевым локусом" относится к последовательностям рядом с окружающим пространством целевой последовательности (например, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или больше пар оснований от целевой последовательности, при этом целевая последовательность содержится в представляющем интерес целевом локусе).Typically, in the context of an endogenous nucleic acid targeting system, formation of a nucleic acid targeting complex (comprising a guide RNA hybridized to a target sequence and complexed with one or more nucleic acid targeting effector proteins) results in cleavage of one or both strands of DNA or RNA at or near (e.g., within 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 or more base pairs) the target sequence. As used herein, the term "sequence(s) associated with a target locus of interest" refers to sequences in the vicinity of the target sequence (e.g., within 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 or more base pairs of the target sequence, wherein the target sequence is contained within the target locus of interest).
Не вдаваясь в теорию полагают, что целевая последовательность должна быть ассоциирована с PAM (мотивом, смежным с протоспейсером); то есть короткой последовательностью, узнаваемой комплексом CRISPR. Точные требования к последовательности и к длине для PAM различаются в зависимости от используемого фермента CRISPR, но PAM обычно представляют собой последовательности длиной 2-5 пар оснований, расположенных рядом с протоспейсером (то есть целевой последовательностью). Примеры последовательностей PAM приводятся в разделе Примеры ниже, и специалист в данной области сможет идентифицировать дополнительные последовательности PAM для применения с данным ферментом CRISPR. Кроме того, конструирование взаимодействующего с PAM (PI) домена может обеспечить программирование специфичности в отношении PAM, улучшить точность распознавания целевого сайта и повысить универсальность платформы конструирования генома Cas, например, Cas9. Белки Cas, такие как белки Cas9, можно конструировать с изменением их специфичности в отношении PAM, например, как описывается у Kleinstiver BP et al. Engineered CRISPR-Cas9 nucleases with altered PAM specificities. Nature. 2015 Jul 23;523(7561):481-5. doi: 10.1038/nature14592. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида, за счет чего обеспечивается модифицирование целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизированной с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью. В одном аспекте настоящего изобретения предусмотрен способ модифицирования экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с полинуклеотидом, вследствие чего указанное связывание приводит к повышенной или пониженной экспрессии указанного полинуклеотида; где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизированной с целевой последовательностью в указанном полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью. Аналогичные факторы и условия распространяются на способы модификации целевого полинуклеотида, изложенные выше. Фактически, эти варианты отбора образцов, культивирования и повторного введения охватываются аспектами настоящего изобретения. В одном аспекте настоящее изобретение относится к способам модификации целевого полинуклеотида в эукариотической клетке, что может происходить in vivo, ex vivo или in vitro. В некоторых вариантах осуществления способ включает отбор клетки или популяции клеток у человека или отличного от человека животного и модификацию клетки или клеток. Культивирование можно осуществлять на любой стадии ex vivo. Клетку или клетки можно даже повторно вводить отличному от человека животному или в растение. Что касается повторно вводимых клеток, особенно предпочтительно, чтобы эти клетки являлись стволовыми клетками.Without being bound by theory, it is believed that the target sequence must be associated with a PAM (protospacer adjacent motif); i.e., a short sequence recognized by the CRISPR complex. The exact sequence and length requirements for a PAM vary depending on the CRISPR enzyme used, but PAMs are typically 2-5 bp long sequences located adjacent to the protospacer (i.e., the target sequence). Examples of PAM sequences are provided in the Examples section below, and one skilled in the art will be able to identify additional PAM sequences for use with a given CRISPR enzyme. In addition, engineering of a PAM interacting (PI) domain can provide programmability of PAM specificity, improve target site recognition accuracy, and increase the versatility of a Cas genome engineering platform such as Cas9. Cas proteins such as Cas9 proteins can be engineered to alter their PAM specificity, such as described by Kleinstiver BP et al. Engineered CRISPR-Cas9 nucleases with altered PAM specificities. Nature. 2015 Jul 23;523(7561):481-5. doi: 10.1038/nature14592. In some embodiments, the method comprises causing a CRISPR complex to bind to a target polynucleotide to cleave said target polynucleotide, thereby modifying the target polynucleotide, wherein the CRISPR complex comprises a CRISPR enzyme complexed with a guide sequence hybridized to a target sequence in said target polynucleotide, wherein said guide sequence is linked to a tracr mate sequence that in turn hybridizes to the tracr sequence. In one aspect, the present invention provides a method of modifying the expression of a polynucleotide in a eukaryotic cell. In some embodiments, the method comprises causing a CRISPR complex to bind to a polynucleotide, whereby said binding results in increased or decreased expression of said polynucleotide; wherein the CRISPR complex comprises a CRISPR enzyme complexed with a guide sequence hybridized to a target sequence in said polynucleotide, wherein said guide sequence is linked to a tracr mate sequence that in turn hybridizes to the tracr sequence. Similar factors and conditions apply to the methods of modifying a target polynucleotide set forth above. Indeed, these sampling, culturing, and reintroduction options are encompassed by aspects of the present invention. In one aspect, the present invention relates to methods of modifying a target polynucleotide in a eukaryotic cell, which may occur in vivo, ex vivo, or in vitro. In some embodiments, the method comprises selecting a cell or population of cells from a human or non-human animal and modifying the cell or cells. The culturing may be performed at any stage ex vivo. The cell or cells can even be reintroduced into a non-human animal or plant. As for the cells to be reintroduced, it is particularly preferred that these cells are stem cells.
Действительно, в любом аспекте настоящего изобретения комплекс CRISPR может содержать фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизированной с целевой последовательностью, где указанная направляющая последовательность может быть связана с парной tracr-последовательностью, которая, в свою очередь, может гибридизироваться с tracr-последовательностью.Indeed, in any aspect of the present invention, the CRISPR complex may comprise a CRISPR enzyme complexed with a guide sequence hybridized to a target sequence, wherein said guide sequence may be associated with a mate tracr sequence, which in turn may hybridize to the tracr sequence.
Настоящее изобретение относится к конструированию и оптимизации систем, способов и композиций, применяемых для контроля экспрессии генов, включающего целенаправленное воздействие на последовательность, такое как внесение изменений в геном или редактирование генов, связанное с системой CRISPR-Cas и ее компонентами. Ферментом Cas является Cas9. Преимущество способов по настоящему изобретению заключается в том, что система CRISPR сводит к минимуму или исключает нецелевое связывание и возникающие в результате этого побочные эффекты. Это достигается при использовании систем, предусматривающих наличие высокой степени специфичности к последовательности в отношении целевой ДНК.The present invention relates to the design and optimization of systems, methods and compositions used to control gene expression, including targeted sequence manipulation, such as genome modification or gene editing, associated with the CRISPR-Cas system and its components. The Cas enzyme is Cas9. An advantage of the methods of the present invention is that the CRISPR system minimizes or eliminates off-target binding and the resulting side effects. This is achieved by using systems that provide for a high degree of sequence specificity with respect to the target DNA.
Что касается комплекса или системы CRISPR-Cas, предпочтительно, чтобы tracr-последовательность имела одну или несколько шпилек и имела длину 30 или более нуклеотидов, 40 или более нуклеотидов или 50 или более нуклеотидов; при этом направляющая последовательность имеет длину от 10 до 30 нуклеотидов, а фермент CRISPR/Cas представляет собой фермент Cas9 II типа.With respect to the CRISPR-Cas complex or system, it is preferable that the tracr sequence has one or more hairpins and has a length of 30 or more nucleotides, 40 or more nucleotides, or 50 or more nucleotides; wherein the guide sequence has a length of 10 to 30 nucleotides, and the CRISPR/Cas enzyme is a Cas9 type II enzyme.
Целевой полинуклеотид для комплекса CRISPR может включать ряд ассоциированных с заболеваниями генов и полинуклеотидов, а также генов и полинуклеотидов, ассоциированных с биохимическими путями передачи сигнала, которые перечислены в предварительных заявках на патент США 61/736527 и 61/748427 с общей ссылкой BI-2011/008/WSGR, номер в реестре 44063-701.101, и BI-2011/008/WSGR, номер в реестре 44063-701.102, соответственно, обе озаглавленные "СИСТЕМЫ, СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ МАНИПУЛЯЦИИ С ПОСЛЕДОВАТЕЛЬНОСТЯМИ" (SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION), поданные 12 декабря 2012 г. и 2 января 2013 г. соответственно, каждое содержание из которых включено в данный документ с помощью ссылки во всей их полноте.The target polynucleotide for the CRISPR complex may include a number of disease-associated genes and polynucleotides, as well as genes and polynucleotides associated with biochemical signaling pathways, which are listed in U.S. Provisional Patent Applications 61/736,527 and 61/748,427, collectively referenced BI-2011/008/WSGR, Serial Number 44063-701.101, and BI-2011/008/WSGR, Serial Number 44063-701.102, respectively, both entitled "SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION," filed December 12, 2012 and January 2, 2013. accordingly, each of the contents of which is incorporated herein by reference in its entirety.
Примеры целевых полинуклеотидов включают последовательность, ассоциированную с биохимическим путем передачи сигнала, к примеру, ген или полинуклеотид, ассоциированный с биохимическим путем передачи сигнала. Примеры целевых полинуклеотидов включают ассоциированный с заболеванием ген или полинуклеотид. "Ассоциированный с заболеванием" ген или полинуклеотид означает любой ген или полинуклеотид, который обеспечивает продукты транскрипции или трансляции на аномальном уровне или в аномальной форме в клетках, полученных из пораженных заболеванием тканей, по сравнению с тканями или клетками контроля без заболевания. Это может быть ген, который начинает экспрессироваться при аномально высоком уровне; это может быть ген, который начинает экспрессироваться при аномально низком уровне, где измененная экспрессия коррелирует с появлением и/или прогрессированием заболевания. Ассоциированный с заболеванием ген также означает ген, несущий мутацию(мутации) или генетическую вариацию, который непосредственно ответственен или находится в неравновесном сцеплении с геном(генами), ответственным(ответственными) за этиологию заболевания. Транскрибируемые или транслируемые продукты могут быть известными или неизвестными и могут присутствовать на нормальном или аномальном уровне.Examples of target polynucleotides include a sequence associated with a biochemical signaling pathway, such as a gene or polynucleotide associated with a biochemical signaling pathway. Examples of target polynucleotides include a disease-associated gene or polynucleotide. A "disease-associated" gene or polynucleotide means any gene or polynucleotide that provides transcription or translation products at an abnormal level or in an abnormal form in cells derived from disease-affected tissues compared to disease-free control tissues or cells. This may be a gene that begins to be expressed at an abnormally high level; it may be a gene that begins to be expressed at an abnormally low level, where the altered expression correlates with the onset and/or progression of the disease. A disease-associated gene also means a gene that carries a mutation(s) or genetic variation that is directly responsible for, or is in linkage disequilibrium with, the gene(s) responsible for the etiology of the disease. The products being transcribed or translated may be known or unknown and may be present at normal or abnormal levels.
Скрининг полногеномного нокаутаGenome-wide knockout screening
Белки и системы CRISPR-Cas, описываемые в данном документе, могут быть использованы для выполнения эффективных и экономичных функциональных геномных тестов. Для таких тестов можно использовать полногеномные библиотеки CRISPR-Cas. Такие тесты и библиотеки могут обеспечить определение функции генов, вовлечение генов клеточных путей, и того, как какое-либо изменение в экспрессии гена может привести к определенному биологическому процессу. Преимущество настоящего изобретения заключается в том, что система CRISPR исключает нецелевое связывание и возникающие в результате этого побочные эффекты. Это достигается при использовании систем, предусматривающих наличие высокой степени специфичности к последовательности в отношении целевой ДНК.The CRISPR-Cas proteins and systems described herein can be used to perform functional genomic tests in an efficient and cost-effective manner. Whole genome CRISPR-Cas libraries can be used for such tests. Such tests and libraries can provide information on gene function, the involvement of genes in cellular pathways, and how any change in gene expression can lead to a particular biological process. An advantage of the present invention is that the CRISPR system eliminates off-target binding and the resulting side effects. This is achieved by using systems that provide a high degree of sequence specificity for the target DNA.
Полногеномная библиотека может содержать множество направляющих РНК системы CRISPR-Cas, описываемых в данном документе, содержащих направляющие последовательности, которые способны нацеливаться на множество целевых последовательностей во множестве локусов генома в популяции эукариотических клеток. Популяцией клеток может быть популяция эмбриональных стволовых (ES) клеток. Целевой последовательностью в локусе генома может быть некодирующая последовательность. Некодирующей последовательностью может быть интрон, регуляторная последовательность, сайт сплайсинга, 3'-UTR, 5'-UTR или сигнал полиаденилирования. Функция гена одного или нескольких продуктов генов может быть изменена указанным нацеливанием. Нацеливание может приводить к нокауту функции гена. Нацеливание на продукт гена может предусматривать более чем одну направляющую РНК. На продукт гена можно нацеливаться с помощью 2, 3, 4, 5, 6, 7, 8, 9 или 10 направляющих РНК, предпочтительно 3-4 на ген. Нецелевые модификации могут быть минимизированы (см., например, DNA targeting specificity of RNA-guided Cas9 nucleases. Hsu, P., Scott, D., Weinstein, J., Ran, FA., Konermann, S., Agarwala, V., Li, Y., Fine, E., Wu, X., Shalem, O., Cradick, TJ., Marraffini, LA., Bao, G., & Zhang, F. Nat Biotechnol doi:10.1038/nbt.2647 (2013)), включенную в данный документ посредством ссылки. Нацеливание может предусматривать приблизительно 100 или более последовательностей. Нацеливание может предусматривать приблизительно 1000 или более последовательностей. Нацеливание может предусматривать приблизительно 20 000 или более последовательностей. Нацеливание может предусматривать полный геном. Нацеливание может предусматривать панель целевых последовательностей, ориентированных на релевантном или желательном пути. Путь может быть иммунным путем. Путь может быть путем клеточного деления.A genome-wide library may comprise a plurality of CRISPR-Cas guide RNAs described herein comprising guide sequences that are capable of targeting a plurality of target sequences at a plurality of genomic loci in a population of eukaryotic cells. The population of cells may be a population of embryonic stem (ES) cells. The target sequence at a genomic locus may be a non-coding sequence. The non-coding sequence may be an intron, a regulatory sequence, a splice site, a 3' UTR, a 5' UTR, or a polyadenylation signal. The gene function of one or more gene products may be altered by the targeting. The targeting may result in a knockout of gene function. Targeting a gene product may involve more than one guide RNA. The gene product can be targeted with 2, 3, 4, 5, 6, 7, 8, 9 or 10 guide RNAs, preferably 3-4 per gene. Off-target modifications can be minimized (see, e.g., DNA targeting specificity of RNA-guided Cas9 nucleases. Hsu, P., Scott, D., Weinstein, J., Ran, FA., Konermann, S., Agarwala, V., Li, Y., Fine, E., Wu, X., Shalem, O., Cradick, TJ., Marraffini, LA., Bao, G., & Zhang, F. Nat Biotechnol doi:10.1038/nbt.2647 (2013)), incorporated herein by reference. Targeting can involve about 100 or more sequences. The targeting may involve approximately 1,000 or more sequences. The targeting may involve approximately 20,000 or more sequences. The targeting may involve the entire genome. The targeting may involve a panel of target sequences directed toward a relevant or desired pathway. The pathway may be an immune pathway. The pathway may be a cell division pathway.
Один аспект настоящего изобретения охватывает полногеномную библиотеку, которая может содержать множество направляющих РНК системы CRISPR-Cas, которое может содержать направляющие последовательности, способные нацеливаться на множество целевых последовательностей во множестве локусов генома, где указанное нацеливание приводит к нокауту функции гена. Эта библиотека потенциально может содержать направляющие РНК, которые нацеливаются на каждый без исключения ген в геноме организма.One aspect of the present invention encompasses a genome-wide library that may contain a plurality of CRISPR-Cas system guide RNAs that may contain guide sequences capable of targeting a plurality of target sequences at a plurality of genomic loci, wherein said targeting results in a knockout of gene function. This library may potentially contain guide RNAs that target each and every gene in the genome of an organism.
В некоторых вариантах осуществления по настоящему изобретению организм или субъект является эукариотом (в том числе млекопитающим, в том числе человеком), или эукариотическим организмом, отличным от человека, или отличным от человека животным, или отличным от человека млекопитающим. В некоторых вариантах осуществления организм или субъект является отличным от человека животным и может быть членистоногим, например, насекомым, или может быть нематодой. В некоторых способах по настоящему изобретению организм или субъект является растением. В некоторых способах по настоящему изобретению организм или субъект является млекопитающим или отличным от человека млекопитающим. Отличное от человека млекопитающее может быть, например, грызуном (предпочтительно мышью или крысой), копытным или приматом. В некоторых способах по настоящему изобретению организм или субъект является водорослью, в том числе микроводорослью, или является грибом.In some embodiments of the present invention, the organism or subject is a eukaryote (including a mammal, including a human), or a non-human eukaryotic organism, or a non-human animal, or a non-human mammal. In some embodiments, the organism or subject is a non-human animal and may be an arthropod, such as an insect, or may be a nematode. In some methods of the present invention, the organism or subject is a plant. In some methods of the present invention, the organism or subject is a mammal or a non-human mammal. The non-human mammal may be, for example, a rodent (preferably a mouse or rat), an ungulate, or a primate. In some methods of the present invention, the organism or subject is an alga, including a microalga, or is a fungus.
Нокаут функции гена может предусматривать введение в каждую клетку в популяции клеток векторной системы из одного или нескольких векторов, содержащих сконструированную, не встречающуюся в природе систему CRISPR-Cas, содержащую I. белок Cas и II. одну или несколько направляющих РНК, где компоненты I и II могут находиться на одном и том же или на разных векторах системы, вводящей компоненты I и II в каждую клетку, где направляющая последовательность нацеливается на уникальный ген в каждой клетке, где белок Cas функционально связан с регуляторным элементом, где при транскрибировании направляющая РНК, содержащая направляющую последовательность, управляет специфичным к последовательности связыванием системы Cas CRISPR-Cas с целевой последовательностью в локусах генома уникального гена с индуцированием расщепления локуса генома белком Cas и подтверждением разных нокаутных мутаций во множестве уникальных генов в каждой клетке популяция клеток с образованием тем самым библиотеки клеток с нокаутным геном. Настоящее изобретение предусматривает, что популяцией клеток является популяция эукариотических клеток, а в предпочтительном варианте осуществления популяцией клеток является популяция эмбриональных стволовых (ES) клеток.Knockout of gene function may comprise introducing into each cell in a population of cells a vector system of one or more vectors containing an engineered, non-naturally occurring CRISPR-Cas system comprising I. a Cas protein and II. one or more guide RNAs, wherein components I and II may be on the same or on different vectors of the system introducing components I and II into each cell, wherein the guide sequence targets a unique gene in each cell, wherein the Cas protein is operably linked to a regulatory element, wherein upon transcribing the guide RNA containing the guide sequence directs sequence-specific binding of the Cas CRISPR-Cas system to a target sequence at genomic loci of a unique gene to induce cleavage of the genomic locus by the Cas protein and confirming different knockout mutations in a plurality of unique genes in each cell of the population of cells, thereby forming a library of knockout gene cells. The present invention provides that the cell population is a population of eukaryotic cells, and in a preferred embodiment, the cell population is a population of embryonic stem (ES) cells.
Одним или несколькими векторами могут быть плазмидные векторы. Вектором может быть один вектор, содержащий Cas9, sgRNA и необязательно селекционный маркер в целевых клетках. Без углубления в теорию способность одновременно доставлять Cas9 и sgRNA с помощью одного вектора обеспечивает применение для любого представляющего интерес типа клеток, без необходимости сначала создавать линии клеток, которые экспрессируют Cas9. Регуляторным элементом может быть индуцируемый промотор. Индуцируемый промотор может представлять собой доксициклиновый индуцируемый промотор. В некоторых способах по настоящему изобретению экспрессия направляющей последовательности находится под контролем промотора T7 и управляется экспрессией полимеразы T7. Подтверждение различных нокаутных мутаций можно осуществлять полноэкзомным секвенированием. Нокаутная мутация может быть достигнута в 100 или больше уникальных генов. Нокаутная мутация может быть достигнута в 1000 или больше уникальных генов. Нокаутная мутация может быть достигнута в 20000 или больше уникальных генов. Нокаутная мутация может быть достигнута во всем геноме. Нокаут функции гена может быть достигнут во множестве уникальных генов, которые функционируют в конкретном физиологическом пути или состоянии. Путь или состояние может быть иммунным путем или состоянием. Путь или состояние может быть путем или состоянием клеточного деления.The one or more vectors may be plasmid vectors. The vector may be a single vector containing Cas9, sgRNA, and optionally a selectable marker in target cells. Without wishing to be bound by theory, the ability to simultaneously deliver Cas9 and sgRNA using a single vector allows for application to any cell type of interest without the need to first generate cell lines that express Cas9. The regulatory element may be an inducible promoter. The inducible promoter may be a doxycycline inducible promoter. In some methods of the present invention, expression of the guide sequence is under the control of a T7 promoter and is driven by expression of T7 polymerase. Confirmation of various knockout mutations can be accomplished by whole exome sequencing. A knockout mutation can be achieved in 100 or more unique genes. A knockout mutation can be achieved in 1,000 or more unique genes. A knockout mutation can be achieved in 20,000 or more unique genes. A knockout mutation can be achieved in an entire genome. A knockout of gene function can be achieved in multiple unique genes that function in a specific physiological pathway or condition. The pathway or condition can be an immune pathway or condition. The pathway or condition can be a cell division pathway or condition.
Настоящее изобретение также относится к набору, который содержит полногеномные библиотеки, упоминаемые в данном документе. Набор может содержать один контейнер, содержащий векторы или плазмиды, содержащие библиотеку в соответствии с настоящим изобретением. Набор также может содержать панель, предусматривающую отбор уникальных направляющих РНК системы CRISPR-Cas, содержащих направляющие последовательности из библиотеки в соответствии с настоящим изобретением, где отбор указывает на конкретное физиологическое состояние. Настоящее изобретение предусматривает то, что нацеливание составляет приблизительно 100 или больше последовательностей, приблизительно 1000 или больше последовательностей или приблизительно 20000 или больше последовательностей или весь геном. Кроме того, панель целевых последовательностей может быть ориентирована на релевантный или желаемый путь, такой как иммунный путь или клеточное деление.The present invention also relates to a kit that contains the whole genome libraries mentioned herein. The kit may comprise one container containing vectors or plasmids containing a library according to the present invention. The kit may also comprise a panel that provides for the selection of unique CRISPR-Cas guide RNAs containing guide sequences from a library according to the present invention, wherein the selection is indicative of a particular physiological condition. The present invention contemplates that the targeting is about 100 or more sequences, about 1000 or more sequences, or about 20,000 or more sequences, or the entire genome. In addition, the panel of target sequences may be oriented to a relevant or desired pathway, such as an immune pathway or cell division.
В дополнительном аспекте настоящего изобретения фермент Cas9 может содержать одну или несколько мутаций, и его можно применять в качестве стандартного ДНК-связывающего белка, слитого или не слитого с функциональным доменом. Мутации могут представлять собой мутации, введенные искусственным образом, или мутации приобретения или потери функции. Мутации могут включать без ограничения мутации в одном из каталитических доменов (D10 и H840) среди каталитических доменов RuvC и HNH соответственно. Были охарактеризованы дополнительные мутации. В одном аспекте настоящего изобретения функциональным доменом может быть домен активации транскрипции, которым может быть VP64. В других аспектах настоящего изобретения функциональным доменом может быть домен репрессии транскрипции, которым может быть KRAB или SID4X. Другие аспекты настоящего изобретения относятся к мутированному ферменту Cas9, слитому с доменами, которые включают без ограничения активатор транскрипции, репрессор транскрипции, рекомбиназу, транспозазу, фактор ремоделирования гистонов, деметилазу, ДНК-метилтрансферазу, криптохром, домен, индуцируемый/регулируемый светом, или домен, индуцируемый/регулируемый химическими веществами. Некоторые способы в соответствии с настоящим изобретением могут предусматривать индуцирование экспрессии целевых генов. В одном варианте осуществления индуцирование экспрессии путем нацеливания на множество целевых последовательностей во множестве локусов генома в популяции эукариотических клеток осуществляется путем применения функционального домена.In a further aspect of the present invention, the Cas9 enzyme may comprise one or more mutations and may be used as a standard DNA binding protein, fused or not fused to a functional domain. The mutations may be artificially introduced mutations or gain-of-function or loss-of-function mutations. The mutations may include, but are not limited to, mutations in one of the catalytic domains (D10 and H840) among the catalytic domains of RuvC and HNH, respectively. Additional mutations have been characterized. In one aspect of the present invention, the functional domain may be a transcriptional activation domain, which may be VP64. In other aspects of the present invention, the functional domain may be a transcriptional repression domain, which may be KRAB or SID4X. Other aspects of the present invention relate to a mutated Cas9 enzyme fused to domains that include, but are not limited to, a transcriptional activator, a transcriptional repressor, a recombinase, a transposase, a histone remodeling factor, a demethylase, a DNA methyltransferase, a cryptochrome, a light-inducible/regulated domain, or a chemical-inducible/regulated domain. Some methods according to the present invention may involve inducing expression of target genes. In one embodiment, inducing expression by targeting multiple target sequences at multiple loci in a population of eukaryotic cells is accomplished by using a functional domain.
При осуществлении настоящего изобретения полезно учитывать следующие ссылки:In carrying out the present invention, it is useful to consider the following references:
Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells. Shalem, O., Sanjana, NE., Hartenian, E., Shi, X., Scott, DA., Mikkelson, T., Heckl, D., Ebert, BL., Root, DE., Doench, JG., Zhang, F. Science Dec 12. (2013). [Epub ahead of print]; опубликовано в окончательной отредактированной форме как: Science. 2014 Jan 3; 343(6166): 84-87.Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells. Shalem, O., Sanjana, NE., Hartenian, E., Shi, X., Scott, DA., Mikkelson, T., Heckl, D., Ebert, BL., Root, DE., Doench, JG., Zhang, F. Science Dec 12. (2013). [Epub ahead of print]; published in final edited form as: Science. 2014 Jan 3; 343(6166): 84–87.
Shalem et al. описали новый способ исследования функций генов в полногеномном масштабе. Их исследования показали, что доставка библиотеки CRISPR-Cas9 для нокаута в масштабе генома (GeCKO), целенаправленно воздействующей на 18080 генов, с 64751 уникальной направляющей последовательностью обеспечивала скрининг путем как положительного, так и отрицательного отбора в клетках человека. Во-первых, авторы показали применение библиотеки GeCKO для идентификации генов, существенных для жизнеспособности клеток у раковых и плюрипотентных стволовых клеток. Далее, в модели меланомы, авторы провели скрининг генов, утрата функций которых вовлечена в устойчивость к вемурафенибу, терапевтическому средству, ингибирующему мутантную протеинкиназу BRAF. Их исследования показали, что кандидаты высшего ранга включали ранее подтвержденные гены NF1 и MED12, а также новые хиты NF2, CUL3, TADA2B и TADA1. Авторы наблюдали высокий уровень согласованности между независимыми направляющими РНК, осуществляющими нацеливание на один и тот же ген, и высоким показателем подтверждения хитов и, таким образом, продемонстрировали перспективность скрининга с помощью Cas9 в масштабе генома.Shalem et al. describe a new way to probe gene function at a genome-wide scale. Their studies showed that delivery of a genome-wide CRISPR-Cas9 knockout (GeCKO) library targeting 18,080 genes with 64,751 unique targeting sequences enabled screening by both positive and negative selection in human cells. First, the authors demonstrated the use of the GeCKO library to identify genes essential for cell survival in cancer and pluripotent stem cells. Next, in a melanoma model, the authors screened for genes whose loss of function is involved in resistance to vemurafenib, a therapeutic that inhibits mutant protein kinase BRAF. Their studies showed that the top-ranking candidates included previously validated genes NF1 and MED12, as well as novel hits NF2, CUL3, TADA2B, and TADA1. The authors observed a high level of concordance between independent guide RNAs targeting the same gene and a high hit confirmation rate, thus demonstrating the promise of Cas9-based genome-scale screening.
Также можно упомянуть в качестве ссылок заявку на патент США № US20140357530 и патентную публикацию PCT № WO2014093701, включенные тем самым в данный документ посредством ссылки.Also, reference may be made to US Patent Application No. US20140357530 and PCT Patent Publication No. WO2014093701, which are hereby incorporated by reference.
Функциональное изменение и скринингFunctional change and screening
В некоторых вариантах осуществления один или несколько функциональных доменов ассоциируются с ферментом CRISPR, например, ферментом Cas9 II типа.In some embodiments, one or more functional domains are associated with a CRISPR enzyme, such as a type II Cas9 enzyme.
В некоторых вариантах осуществления один или несколько функциональных доменов ассоциируются с адаптерным белком, например, как используется с модифицированными направляющими у Konnerman et al. (Nature 517, 583-588, 29 January 2015).In some embodiments, one or more functional domains are associated with an adaptor protein, such as used with the modified guides of Konnerman et al. (Nature 517, 583-588, 29 January 2015).
В некоторых вариантах осуществления один или несколько функциональных доменов ассоциируются с dead-sgRNA (dRNA). В некоторых вариантах осуществления комплекс dRNA с активным Cas9 управляет генной регуляцией с помощью функционального домена в одном генном локусе, тогда как sgRNA управляет расщеплением ДНК с помощью активного Сas9 в другом локусе, например, как у Dahlman et al., ‘Orthogonal gene control with a catalytically active Cas9 nuclease' (in press). В некоторых вариантах осуществления dRNA отбирают для обеспечения максимальной селективности регуляции для представляющего интерес генного локуса по сравнению с нецелевой регуляцией. В некоторых вариантах осуществления dRNA отбирают для обеспечения максимальной регуляции целевого гена и минимального целевого расщепления.In some embodiments, one or more functional domains are associated with a dead-sgRNA (dRNA). In some embodiments, a dRNA complex with active Cas9 directs gene regulation by the functional domain at one gene locus, while the sgRNA directs DNA cleavage by active Cas9 at another locus, e.g., as in Dahlman et al., 'Orthogonal gene control with a catalytically active Cas9 nuclease' (in press). In some embodiments, the dRNA is selected to provide maximum selectivity of regulation for a gene locus of interest over off-target regulation. In some embodiments, the dRNA is selected to provide maximum regulation of the target gene and minimal on-target cleavage.
Для целей следующего обсуждения эталоном функционального домена может быть функциональный домен, ассоциированный с ферментом CRISPR, или функциональный домен, ассоциированный с адаптерным белком.For the purposes of the following discussion, the reference functional domain may be the functional domain associated with a CRISPR enzyme or the functional domain associated with an adaptor protein.
При осуществлении настоящего изобретения петли в sgRNA могут быть увеличены без перекрывания с белком Cas9 путем вставки другой петли(петель) РНК или другой последовательности(последовательностей), которая(которые) может(могут) рекрутировать адаптерные белки, которые могут связываться с другой петлей(петлями) РНК или другой последовательностью(последовательностями). Адаптерные белки могут включать без ограничения комбинации ортогональный связывающий РНК белок/аптамер, которые встречаются во множестве белков оболочки бактериофагов. Перечень таких белков оболочки включает без ограничения Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, фCb5, фCb8r, фCb12r, фCb23r, 7s и PRR1. Такие адаптерные белки или ортогональные связывающие РНК белки могут дополнительно ректурировать эффекторные белки или продукты слияния, которые содержат один или несколько функциональных доменов. В некоторых вариантах осуществления функциональный домен может быть выбран из группы, состоящей из домена транспозазы, домена интегразы, домена рекомбиназы, домена резольвазы, домена инвертазы, домена протеазы, домена ДНК-метилтрансферазы, домена ДНК-гидроксилметилазы, домена ДНК-деметилазы, домена гистонацетилазы, домена гистондеацетилазы, нуклеазного домена, репрессорного домена, активаторного домена, доменов сигнала ядерной локализации, домена регуляторного белка транскрипции (или вовлечения транскрипционного комплекса), ассоциированного с активностью клеточного поглощения домена, домена связывания нуклеиновой кислоты, домена представления антитела, модифицирующих гистоны ферментов, рекрутера модифицирующих гистоны ферментов; ингибитора модифицирующих гистоны ферментов, гистонметилтрансферазы, гистондеметилазы, гистонкиназы, гистонфосфатазы, гистонрибозилазы, гистондерибозилазы, гистонубиквитиназы, гистондеубиквитиназы, гистонбиотиназы и протеазы гистонового хвоста. В некоторых предпочтительных вариантах осуществления функциональным доменом является домен активации транскрипции, такой как без ограничения VP64, p65, MyoD1, HSF1, RTA, SET7/9 или гистонацетилтрансфераза. В некоторых вариантах осуществления функциональный домен представляет собой домен репрессии транскрипции, предпочтительно KRAB. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой SID или конкатемеры SID (например, SID4X). В некоторых вариантах осуществления функциональный домен представляет собой домен эпигенетического модифицирования, так что обеспечивается фермент эпигенетического модифицирования. В некоторых вариантах осуществления функциональный домен представляет собой домен активации, который может представлять собой домен активации P65.In practicing the present invention, loops in sgRNA can be increased without overlapping with the Cas9 protein by inserting other RNA loop(s) or other sequence(s) that can recruit adaptor proteins that can bind to the other RNA loop(s) or other sequence(s). Adaptor proteins can include, but are not limited to, orthogonal RNA binding protein/aptamer combinations that are found in a variety of bacteriophage coat proteins. The list of such envelope proteins includes, but is not limited to, Qβ, F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, fCb5, fCb8r, fCb12r, fCb23r, 7s, and PRR1. Such adapter proteins or orthogonal RNA binding proteins may further recruit effector proteins or fusion products that contain one or more functional domains. In some embodiments, the functional domain may be selected from the group consisting of a transposase domain, an integrase domain, a recombinase domain, a resolvase domain, an invertase domain, a protease domain, a DNA methyltransferase domain, a DNA hydroxylmethylase domain, a DNA demethylase domain, a histone acetylase domain, a histone deacetylase domain, a nuclease domain, a repressor domain, an activator domain, nuclear localization signal domains, a transcription regulatory protein (or transcription recruitment complex) domain, a cellular uptake activity-associated domain, a nucleic acid binding domain, an antibody presentation domain, a histone modifying enzyme, a histone modifying enzyme recruiter; an inhibitor of histone modifying enzymes, histone methyltransferase, histone demethylase, histone kinase, histone phosphatase, histone ribosylase, histone deribosylase, histone ubiquitinase, histone deubiquitinase, histone biotinase and histone tail protease. In some preferred embodiments, the functional domain is a transcriptional activation domain, such as, but not limited to, VP64, p65, MyoD1, HSF1, RTA, SET7/9 or histone acetyltransferase. In some embodiments, the functional domain is a transcriptional repression domain, preferably KRAB. In some embodiments, the transcriptional repression domain is SID or concatemers of SID (e.g., SID4X). In some embodiments, the functional domain is an epigenetic modification domain, such that an epigenetic modification enzyme is provided. In some embodiments, the functional domain is an activation domain, which may be a P65 activation domain.
В некоторых вариантах осуществления один или несколько функциональных доменов представляют собой NLS (последовательность ядерной локализации) или NES (сигнал ядерного экспорта). В некоторых вариантах осуществления один или несколько функциональных доменов представляют собой домен активации транскрипции, который включает в себя VP64, p65, MyoD1, HSF1, RTA, SET7/9 и гистонацетилтрансферазу. Другие упоминания в данном документе доменов активации (или активатора) в отношении доменов, ассоциированных с ферментом CRISPR, включают в себя любой известный домен активации транскрипции и, в частности, VP64, p65, MyoD1, HSF1, RTA, SET7/9 или гистонацетилтрансферазу.In some embodiments, one or more functional domains are an NLS (nuclear localization sequence) or an NES (nuclear export signal). In some embodiments, one or more functional domains are a transcriptional activation domain that includes VP64, p65, MyoD1, HSF1, RTA, SET7/9, and histone acetyltransferase. Other references herein to activation (or activator) domains with respect to CRISPR enzyme associated domains include any known transcriptional activation domain, and in particular VP64, p65, MyoD1, HSF1, RTA, SET7/9, or histone acetyltransferase.
В некоторых вариантах осуществления один или несколько функциональных доменов представляют собой домен репрессии транскрипции. В некоторых вариантах осуществления домен репрессии транскрипции представляет собой домен KRAB. В определенных вариантах осуществления домен репрессии транскрипции представляет собой домен NuE, домен NcoR, домен SID или домен SID4X.In some embodiments, one or more functional domains are a transcriptional repression domain. In some embodiments, the transcriptional repression domain is a KRAB domain. In certain embodiments, the transcriptional repression domain is a NuE domain, a NcoR domain, a SID domain, or a SID4X domain.
В некоторых вариантах осуществления один или несколько функциональных доменов характеризуются одной или несколькими видами активности, предусматривающими метилазную активность, деметилазную активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность расщепления РНК, активность расщепления ДНК, активность интеграции ДНК или активность связывания нуклеиновой кислоты.In some embodiments, one or more functional domains are characterized by one or more activities comprising methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, RNA cleavage activity, DNA cleavage activity, DNA integration activity, or nucleic acid binding activity.
Домены, модифицирующие гистоны, также являются предпочтительными в некоторых вариантах осуществления. Иллюстративные домены, модифицирующие гистоны, обсуждаются ниже. Домены транспозазы, домены механизма HR (гомологичной рекомбинации), домены рекомбиназы и/или домены интегразы также являются предпочтительными в качестве функциональных доменов по настоящему изобретению. В некоторых вариантах осуществления активность интеграции ДНК имеют домены механизма HR, домены интегразы, домены рекомбиназы и/или домены транспозазы. Гистонацетилтрансфераза является предпочтительной в некоторых вариантах осуществления.Histone modifying domains are also preferred in some embodiments. Exemplary histone modifying domains are discussed below. Transposase domains, HR (homologous recombination) machinery domains, recombinase domains, and/or integrase domains are also preferred as functional domains of the present invention. In some embodiments, HR machinery domains, integrase domains, recombinase domains, and/or transposase domains have DNA integration activity. Histone acetyltransferase is preferred in some embodiments.
В определенных вариантах осуществления активность расщепления ДНК обусловлена нуклеазой. В некоторых вариантах осуществления нуклеаза содержит нуклеазу Fok1. См. "Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing", Shengdar Q. Tsai, Nicolas Wyvekens, Cyd Khayter, Jennifer A. Foden, Vishal Thapar, Deepak Reyon, Mathew J. Goodwin, Martin J. Aryee, J. Keith Joung Nature Biotechnology 32(6): 569-77 (2014) в отношении направляемых димерной РНК нуклеаз FokI, которые распознают продленные последовательности и могут редактировать эндогенные гены с высокой эффективностью в человеческих клетках.In certain embodiments, the DNA cleavage activity is mediated by a nuclease. In some embodiments, the nuclease comprises a Fok1 nuclease. See "Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing" by Shengdar Q. Tsai, Nicolas Wyvekens, Cyd Khayter, Jennifer A. Foden, Vishal Thapar, Deepak Reyon, Mathew J. Goodwin, Martin J. Aryee, J. Keith Joung Nature Biotechnology 32(6): 569-77 (2014) for dimeric RNA-guided FokI nucleases that recognize extended sequences and can edit endogenous genes with high efficiency in human cells.
В некоторых вариантах осуществления один или несколько функциональных доменов присоединяются к ферменту CRISPR так, что при связывании с sgRNA и целью функциональный домен находится в пространственной ориентации, позволяющей функциональному домену функционировать с присущей ему функцией.In some embodiments, one or more functional domains are attached to a CRISPR enzyme such that, upon binding to the sgRNA and the target, the functional domain is in a spatial orientation that allows the functional domain to function in its intended manner.
В некоторых вариантах осуществления один или несколько функциональных доменов присоединяются к адаптерному белку так, что при связывании фермента CRISPR с sgRNA и целью функциональный домен находится в пространственной ориентации, позволяющей функциональному домену функционировать с присущей ему функцией.In some embodiments, one or more functional domains are attached to an adaptor protein such that upon binding of the CRISPR enzyme to the sgRNA and target, the functional domain is in a spatial orientation that allows the functional domain to function in its intended manner.
В одном аспекте настоящее изобретение относится к композиции, обсуждаемой в данном документе, где один или несколько функциональных доменов присоединяются к ферменту CRISPR или адаптерному белку через линкер, необязательно линкер GlySer, как обсуждается в данном документе.In one aspect, the present invention provides a composition as discussed herein, wherein one or more functional domains are attached to a CRISPR enzyme or adapter protein via a linker, optionally a GlySer linker as discussed herein.
Эндогенная репрессия транскрипции зачастую опосредуется модифицирующими хроматин ферментами, такими как гистонметилтрансферазы (HMT) и деацетилазы (HDAC). Типичная гистоновые эффекторные домены известны, и иллюстративный перечень представлен ниже. В иллюстративной таблице упоминаются белки и функциональные усечения небольших размеров для облегчения эффективной вирусной упаковки (например, посредством AAV). В целом, однако, домены могут включать в себя HDAC, гистонметилтрансферазы (HMT) и ингибиторы гистонацетилтрансферазы (HAT), а также вовлекающие HDAC и HMT белки. Функциональный домен может представлять собой или включать в некоторых вариантах осуществления эффекторные домены HDAC, рекрутерные эффекторные домены HDAC, эффекторные домены гистонметилтрансферазы (HMT), рекрутерные эффекторные домены гистонметилтрансферазы (HMT) или ингибиторные эффекторные домены гистонацетилтрансферазы.Endogenous transcriptional repression is often mediated by chromatin modifying enzymes such as histone methyltransferases (HMTs) and deacetylases (HDACs). Typical histone effector domains are known and an illustrative list is provided below. The illustrative table mentions proteins and functional truncations of small sizes to facilitate efficient viral packaging (e.g., by AAV). In general, however, the domains may include HDACs, histone methyltransferases (HMTs), and histone acetyltransferase (HAT) inhibitors, as well as HDAC and HMT recruiting proteins. The functional domain may be or include, in some embodiments, HDAC effector domains, HDAC recruiter effector domains, histone methyltransferase (HMT) effector domains, histone methyltransferase (HMT) recruiter effector domains, or histone acetyltransferase inhibitory effector domains.
Эффекторные домены HDACHDAC effector domains
КомплексSubtype/
Complex
доменCatalytic
domain
H4K16Ac
H3K56AcH3K9Ac
H4K16Ac
H3K56Ac
H4K16AcH4K8Ac
H4K16Ac
H3K56AcH3K9Ac
H3K56Ac
Следовательно, репрессорные домены в соответствии с настоящим изобретением могут быть выбраны из гистонметилтрансфераз (HMT), гистондеацетилаз (HDAC), ингибиторов гистонацетилтрансферазы (HAT), а также вовлекающих HDAC и HMT белков.Therefore, the repressor domains according to the present invention can be selected from histone methyltransferases (HMT), histone deacetylases (HDAC), histone acetyltransferase (HAT) inhibitors, as well as HDAC and HMT recruiting proteins.
Доменом HDAC может быть любой из доменов в представленной выше таблице, а именно HDAC8, RPD3, MesoLo4, HDAC11, HDT1, SIRT3, HST2, CobB, HST2, SIRT5, Sir2A или SIRT6.The HDAC domain can be any of the domains in the table above, namely HDAC8, RPD3, MesoLo4, HDAC11, HDT1, SIRT3, HST2, CobB, HST2, SIRT5, Sir2A, or SIRT6.
В некотором варианте осуществления функциональным доменом может быть рекрутерный эффекторный домен HDAC. Предпочтительные примеры включают в себя домены в представленной ниже таблице, а именно MeCP2, MBD2b, Sin3a, NcoR, SALL1, RCOR1. NcoR является типичным в примерах настоящего изобретения, и, хотя является предпочтительным, предусматривается, что также будут применимыми и другие домены из класса.In some embodiment, the functional domain may be a HDAC recruiter effector domain. Preferred examples include the domains in the table below, namely MeCP2, MBD2b, Sin3a, NcoR, SALL1, RCOR1. NcoR is typical in the examples of the present invention, and although preferred, it is envisaged that other domains in the class will also be useful.
Таблица рекрутерных эффекторных доменов HDACTable of HDAC Recruiter Effector Domains
КомплексSubtype/
Complex
доменCatalytic
domain
В некотором варианте осуществления функциональным доменом может быть эффекторный домен метилтрансферазы (HMT). Предпочтительные примеры включают в себя домены в представленной ниже таблице, а именно NUE, vSET, EHMT2/G9A, SUV39H1, dim-5, KYP, SUVR4, SET4, SET1, SETD8 и TgSET8. NUE является типичным в примерах настоящего изобретения, и, хотя является предпочтительным, предусматривается, что также будут применимыми и другие домены из класса.In some embodiment, the functional domain may be a methyltransferase (HMT) effector domain. Preferred examples include the domains in the table below, namely NUE, vSET, EHMT2/G9A, SUV39H1, dim-5, KYP, SUVR4, SET4, SET1, SETD8, and TgSET8. NUE is typical in the examples of the present invention, and while preferred, it is envisaged that other domains in the class will also be useful.
Таблица эффекторных доменов гистонметилтрансферазы (HMT)Histone methyltransferase (HMT) effector domain table
КомплексSubtype/
Complex
SUV39 Family
SUV39
G9AEHMT2/
G9A
В некотором варианте осуществления функциональным доменом может быть рекрутерный эффекторный домен гистонметилтрансферазы (HMT). Предпочтительные примеры включают в себя домены в представленной ниже таблице, а именно Hp1a, PHF19 и NIPP1.In some embodiment, the functional domain may be a histone methyltransferase (HMT) recruiter effector domain. Preferred examples include the domains in the table below, namely Hp1a, PHF19, and NIPP1.
Таблица рекрутерных эффекторных доменов гистонметилтрансферазы (HMT)Table of histone methyltransferase (HMT) recruiter effector domains
КомплексSubtype/
Complex
В некотором варианте осуществления функциональным доменом может быть ингибиторный эффекторный домен гистонацетилтрансферазы. Предпочтительные примеры включают в себя SET/TAF-1β, приведенные в таблице ниже.In some embodiment, the functional domain may be an inhibitory effector domain of a histone acetyltransferase. Preferred examples include SET/TAF-1β, shown in the table below.
Таблица ингибиторных эффекторных доменов гистонацетилтрансферазыHistone acetyltransferase inhibitory effector domains table
КомплексSubtype/
Complex
(aa)Final size
(aa)
Также предпочтительным является нацеливание на эндогенные (регуляторные) контрольные элементы (такие как энхансеры и сайленсеры) в дополнение к промоторным или промотор-проксимальным элементам. Таким образом, настоящее изобретение также может быть использовано для нацеливания на эндогенные контрольные элементы (в том числе энхансеры и сайленсеры) в дополнение к нацеливанию на промотор. Такие контрольные элементы могут быть расположены выше и ниже сайта начала транскрипции (TSS), начинающегося от 200 т. о. от TSS до 100 т. о. Нацеливание на известные контрольные элементы может быть использовано для активации или подавления представляющего интерес гена. В некоторых случаях один контрольный элемент может влиять на транскрипцию нескольких целевых генов. Поэтому нацеливание на один контрольный элемент может быть использовано для контроля транскрипции нескольких генов одновременно.Also preferred is targeting endogenous (regulatory) control elements (such as enhancers and silencers) in addition to promoter or promoter-proximal elements. Thus, the present invention can also be used to target endogenous control elements (including enhancers and silencers) in addition to targeting a promoter. Such control elements can be located upstream and downstream of a transcription start site (TSS) starting from 200 kb from the TSS to 100 kb from the TSS. Targeting known control elements can be used to activate or repress a gene of interest. In some cases, a single control element can affect the transcription of several target genes. Therefore, targeting a single control element can be used to control the transcription of several genes simultaneously.
С другой стороны, нацеливание на предполагаемые контрольные элементы (например, путем перекрывания области предполагаемого контрольного элемента, а также от 200 п.о. до 100 т. о. около элемента) может быть использовано как средство для подтверждения таких элементов (путем измерения транскрипции представляющего интерес гена) или для выявления новых контрольных элементов (например, путем перекрывания 100 т. о. выше и ниже TSS представляющего интерес гена). Кроме того, нацеливание на предполагаемые контрольные элементы может быть применимо в контексте понимания генетических причин заболевания. Многие мутации и общие варианты SNP, ассоциированные с фенотипами заболеваний, располагаются вне кодирующих областей. После нацеливания на такие области с системами либо активации, либо подавления, описываемыми в данном документе, может следовать считывание транскрипции либо a) ряда предполагаемых мишеней (например, ряда генов, расположенных в тесной близости к контрольному элементу), либо b) полнотранскриптомное считывание, например, с помощью RNAseq или микрочипа. Это позволило бы идентифицировать вероятные кандидатные гены, вовлеченные в фенотип заболевания. Такие кандидатные гены могут быть применимы в качестве новых мишеней лекарственных средств.On the other hand, targeting putative control elements (e.g., by overlapping the region of a putative control element as well as 200 bp to 100 kb around the element) can be used as a means to confirm such elements (by measuring transcription of the gene of interest) or to identify new control elements (e.g., by overlapping 100 kb upstream and downstream of the TSS of the gene of interest). Additionally, targeting putative control elements can be useful in the context of understanding the genetic causes of disease. Many mutations and common SNP variants associated with disease phenotypes are located outside of coding regions. Targeting such regions with either the upregulation or downregulation systems described herein can be followed by transcriptional readout of either a) a set of putative targets (e.g., a set of genes located in close proximity to a control element) or b) a whole transcriptome readout, such as by RNAseq or a microarray. This would allow identification of likely candidate genes involved in the disease phenotype. Such candidate genes may be useful as new drug targets.
В данном документе упоминаются ингибиторы гистонацетилтрансферазы (HAT). Однако альтернативой в некоторых вариантах осуществления является то, что один или несколько функциональных доменов содержат ацетилтрансферазу, предпочтительно гистонацетилтрансферазу. Они применимы в области эпигеномики, например, в способах детального исследования эпигенома. Способы детального исследования эпигенома могут предусматривать, например, нацеливание на эпигеномные последовательности. Нацеливание на эпигеномные последовательности может включать в себя направляющую, направленную на эпигеномную целевую последовательность. Эпигеномная целевая последовательность может включать в себя в некоторых вариантах осуществления промотор, сайленсер или энхансерную последовательность.Inhibitors of histone acetyltransferase (HAT) are mentioned herein. However, an alternative in some embodiments is that one or more functional domains comprise an acetyltransferase, preferably a histone acetyltransferase. They are useful in the field of epigenomics, for example in methods for detailed study of the epigenome. Methods for detailed study of the epigenome may include, for example, targeting epigenomic sequences. Targeting epigenomic sequences may include a guide directed to an epigenomic target sequence. The epigenomic target sequence may include, in some embodiments, a promoter, a silencer, or an enhancer sequence.
Применение функционального домена, связанного с ферментом CRISPR-Cas, описываемым в данном документе, предпочтительно нефункционального Cas, более предпочтительно нефункционального Cas9, для нацеливания на эпигеномные последовательности может быть использовано для активации или подавления промоторов, сайленсера или энхансеров.The use of a functional domain associated with a CRISPR-Cas enzyme described herein, preferably a non-functional Cas, more preferably a non-functional Cas9, to target epigenomic sequences can be used to activate or repress promoters, silencers or enhancers.
Примеры ацетилтрансфераз известны и могут включать в себя в некоторых вариантах осуществления гистонацетилтрансферазы. В некоторых вариантах осуществления гистонацетилтрансфераза может содержать каталитическое ядро человеческой ацетилтрансферазы p300 (Gerbasch & Reddy, Nature Biotech 6th April 2015).Examples of acetyltransferases are known and may include, in some embodiments, histone acetyltransferases. In some embodiments, the histone acetyltransferase may comprise the catalytic core of human acetyltransferase p300 (Gerbasch & Reddy, Nature Biotech 6th April 2015).
В некоторых предпочтительных вариантах осуществления функциональный домен связывается с ферментом нефункциональным Cas9 для нацеливания на эпигеномные последовательности, такие как промоторы или энхансеры, и их активации. Одна или несколько направляющих, направленных на такие промоторы или энхансеры, также могут быть обеспечены для управления связывания фермента CRISPR с такими промоторами или энхансерами.In some preferred embodiments, the functional domain binds to a non-functional Cas9 enzyme to target and activate epigenomic sequences such as promoters or enhancers. One or more guides targeting such promoters or enhancers may also be provided to direct the binding of the CRISPR enzyme to such promoters or enhancers.
Термин "ассоциированный с" используют в настоящем документе в отношении ассоциации функционального домена с ферментом CRISPR или адаптерным белком. Он используется в отношении того, как одна молекула "связывается" по отношению к другой, например, между адаптерным белком и функциональным доменом или между ферментом CRISPR и функциональным доменом. В случае таких белок-белковых взаимодействий эту ассоциацию можно рассматривать с точки зрения распознавания как распознавание антителом эпитопа. Альтернативно один белок может быть ассоциирован с другим белком посредством слияния обоих, например, одна субъединица является слитой с другой субъединицей. Слияние обычно происходит путем добавления одной аминокислотной последовательности к другой, например, посредством сплайсинга нуклеотидных последовательностей, которые кодируют каждый белок или субъединицу. Альтернативно, по сути, это можно рассматривать как связывание двух молекул или прямую связь, например, белок слияния. В любом случае слитый белок может включать линкер между двумя представляющими интерес субъединицами (т.е. между ферментом и функциональным доменом или между адаптерным белком и функциональным доменом). Таким образом, в некоторых вариантах осуществления фермент CRISPR или адапторный белок ассоциируется с функциональным доменом путем связывания с ним. В других вариантах осуществления фермент CRISPR или адаптерный белок ассоциируется с функциональным доменом, поскольку два сливаются вместе, необязательно через промежуточный линкер.The term "associated with" is used herein to refer to the association of a functional domain with a CRISPR enzyme or an adaptor protein. It is used in relation to how one molecule "binds" to another, such as between an adaptor protein and a functional domain or between a CRISPR enzyme and a functional domain. In the case of such protein-protein interactions, this association can be thought of in terms of recognition, such as an antibody recognizing an epitope. Alternatively, one protein can be associated with another protein by a fusion of the two, such as one subunit being fused to another subunit. Fusion typically occurs by the addition of one amino acid sequence to another, such as by splicing the nucleotide sequences that encode each protein or subunit. Alternatively, it can be thought of in essence as a binding of two molecules or a direct link, such as a fusion protein. In any case, the fusion protein may include a linker between the two subunits of interest (i.e., between the enzyme and the functional domain or between the adapter protein and the functional domain). Thus, in some embodiments, the CRISPR enzyme or adapter protein is associated with the functional domain by binding thereto. In other embodiments, the CRISPR enzyme or adapter protein is associated with the functional domain because the two are fused together, optionally through an intervening linker.
Прикрепление функционального домена или слитого белка может быть выполнено через линкер, например, гибкий глицин-сериновый (GlyGlyGlySer), или (GGGS)3, или жесткий альфа-спиральный линкер, такой как (Ala(GluAlaAlaAlaLys)Ala). Линкеры, такие как (GGGGS)3, предпочтительно используют в данном документе для отделения белковых или пептидных доменов. (GGGGS)3 является предпочтительным, поскольку он является относительно длинным линкером (15 аминокислот). Глициновые остатки являются наиболее гибкими, а сериновые остатки повышают вероятность того, что линкер будет находится на внешней стороне белка. (GGGGS)6 (GGGGS)9 или (GGGGS)12 предпочтительно можно использовать в качестве альтернативных вариантов. Другими предпочтительными альтернативами являются (GGGGS)1, (GGGGS)2, (GGGGS)4, (GGGGS)5, (GGGGS)7, (GGGGS)8, (GGGGS)10 или (GGGGS)11. Доступны альтернативные линкеры, но считается, что очень гибкие линкеры лучше обеспечивают максимальную возможность объединения двух 2 частей Cas9 и, таким образом, восстановления активности Cas9. Одной альтернативой является то, что NLS нуклеоплазмина можно использовать в качестве линкера. Например, линкер также можно использовать между Cas9 и каким-либо функциональным доменом. Опять-таки, в данном случае можно применять линкер (GGGGS)3 (или его варианты с 6, 9 или 12 повторами) или можно использовать NLS нуклеоплазмина в качестве линкера между Cas9 и функциональным доменом.Attachment of the functional domain or fusion protein can be accomplished via a linker, such as a flexible glycine-serine (GlyGlyGlySer), or (GGGS) 3 , or a rigid alpha-helical linker such as (Ala(GluAlaAlaAlaLys)Ala). Linkers such as (GGGGS) 3 are preferably used herein to separate protein or peptide domains. (GGGGS) 3 is preferred because it is a relatively long linker (15 amino acids). Glycine residues are the most flexible, and serine residues increase the likelihood that the linker will be on the outside of the protein. (GGGGS) 6 (GGGGS) 9 or (GGGGS) 12 may preferably be used as alternatives. Other preferred alternatives are (GGGGS) 1 , (GGGGS) 2 , (GGGGS) 4 , (GGGGS) 5 , (GGGGS) 7 , (GGGGS) 8 , (GGGGS) 10 or (GGGGS) 11 . Alternative linkers are available, but highly flexible linkers are thought to better maximize the ability to combine the two 2 parts of Cas9 and thus restore Cas9 activity. One alternative is that the nucleoplasmin NLS can be used as a linker. For example, a linker can also be used between Cas9 and some functional domain. Again, in this case, the (GGGGS) 3 linker (or its 6-, 9- or 12-repeat variants) can be used, or the nucleoplasmin NLS can be used as a linker between Cas9 and a functional domain.
Насыщающий мутагенезSaturation mutagenesis
В отношении применения системы CRISPR-Cas в общем упоминаются документы, в том числе патентные заявки, патенты и патентные публикации, цитируемые по всему настоящему раскрытию, поскольку варианты осуществления настоящего изобретения могут применяться как в этих документах. Система(системы) CRISPR-Cas может быть использована для осуществления насыщающего или глубокосканирующего мутагенеза локусов генома вместе с клеточным фенотипом, например, для определения критических минимальных признаков и дискретных повреждаемостей функциональных элементов, необходимых для экспрессии гена, устойчивости к лекарственному средству и обратимости заболевания. Под насыщающим или глубокосканирующим мутагенезом подразумевается то, что каждое или практически каждое основание ДНК разрезается в локусах генома. Библиотека направляющих РНК CRISPR-Cas может быть введена в популяцию клеток. Библиотека может быть введена так, что каждая клетка получает одиночную направляющую РНК (sgRNA). В том случае, если библиотеку вводят путем трансдукции вирусного вектора, описываемого в данном документе, используется низкая мультиплетность инфекции (MOI). Библиотека может включать в себя sgRNA, нацеливающиеся на каждую последовательность выше последовательности РАМ (смежного с протоспейсером мотива) в локусе генома. Библиотека может включать в себя по меньшей мере 100 неперекрывающихся геномных последовательностей выше последовательности PAM для каждых 1000 пар оснований в локусе генома. Библиотека может включать в себя нацеливающиеся последовательности sgRNA выше по меньшей мере одной другой последовательности PAM. Система(системы) CRISPR-Cas может(могут) включать в себя более чем один белок Cas. Можно применять любой белок Cas, описываемый в данном документе, в том числе ортологи или сконструированные белки Cas, которые распознают другие последовательности PAM. Частота нецелевых сайтов для sgRNA может составлять менее 500. Оценки нецелевых событий могут быть получены для отбора sgRNA с самым низким числом нецелевых сайтов. Любой фенотип, определенный как ассоциированный с разрезанием по целевому сайту sgRNA, может быть подтвержден с использованием нацеливания sgRNA на тот же сайт в одном эксперименте. Подтверждение целевого сайта также может быть выполнено с использованием никазы Cas9, описываемой в данном документе, и двух sgRNA, нацеливающихся на представляющий интерес сайт генома. Без углубления в теорию, целевой сайт представляет собой истинное совпадение, если в подтверждающих экспериментах наблюдают изменение в фенотипе.With respect to the use of the CRISPR-Cas system, reference is generally made to documents, including patent applications, patents, and patent publications, cited throughout this disclosure, since embodiments of the present invention may be used as in these documents. The CRISPR-Cas system(s) can be used to perform saturation or deep-scan mutagenesis of genomic loci along with the cellular phenotype, for example, to determine critical minimal features and discrete lesions of functional elements required for gene expression, drug resistance, and disease reversibility. By saturation or deep-scan mutagenesis is meant that every or substantially every DNA base is cut at the genomic loci. A library of CRISPR-Cas guide RNAs can be introduced into a population of cells. The library can be introduced such that each cell receives a single guide RNA (sgRNA). When the library is introduced by transduction of the viral vector described herein, a low multiplicity of infection (MOI) is used. The library may include sgRNAs that target each sequence upstream of a PAM (protospacer adjacent motif) sequence in a genomic locus. The library may include at least 100 non-overlapping genomic sequences upstream of a PAM sequence for every 1000 base pairs in a genomic locus. The library may include sgRNA targeting sequences upstream of at least one other PAM sequence. The CRISPR-Cas system(s) may include more than one Cas protein. Any Cas protein described herein may be used, including orthologs or engineered Cas proteins that recognize other PAM sequences. The frequency of off-target sites for an sgRNA can be less than 500. Off-target event estimates can be obtained to select sgRNAs with the lowest number of off-target sites. Any phenotype determined to be associated with cleavage at an sgRNA target site can be confirmed using sgRNA targeting to the same site in a single experiment. Target site confirmation can also be accomplished using the Cas9 nickase described herein and two sgRNAs targeting the genomic site of interest. Without being bound by theory, a target site is a true hit if a change in phenotype is observed in confirmatory experiments.
Локусы генома могут включать в по меньшей мере один непрерывный участок генома. По меньшей мере один непрерывный участок генома может содержать даже полный геном. По меньшей мере один непрерывный участок генома может содержать функциональный элемент генома. Функциональный элемент может находиться в некодирующем участке, кодирующем участке, интронном участке, промоторе или энхансере. По меньшей мере один непрерывный участок генома может содержать по меньшей мере 1 т. о. предпочтительно по меньшей мере 50 т. о. геномной ДНК. По меньшей мере один непрерывный учаток генома может содержать сайт связывания фактора транскрипции. По меньшей мере один непрерывный учаток генома может содержать участок гиперчувствительности к ДНКазе I. По меньшей мере один непрерывный учаток генома может содержать транскрипционный энхансерный или репрессорный элемент. По меньшей мере один непрерывный учаток генома может содержать сайт, обогащенный эпигенетической сигнатурой. По меньшей мере один непрерывный учаток геномной ДНК может содержать эпигенетический инсулятор. По меньшей мере один непрерывный учаток генома может содержать два или более непрерывных геномных участка, которые взаимодействуют физически. Участки генома, которые взаимодействуют, могут быть определены с помощью ‘технологии 4C'. Технология 4C обеспечивает возможность скрининга всего генома объективным образом на предмет сегментов ДНК, которые взаимодействуют физически с выбранным фрагментом ДНК, как описано у Zhao et al. ((2006) Nat Genet 38, 1341-7) и в патенте США № 8642295, оба из которых включены в данный документ посредством ссылки во всей своей полноте. Эпигенетической сигнатурой может быть гистонацетилирование, гистонметилирование, гистонубиквитинирование, гистонфосфорилирование, метилирование ДНК или отсутствие таковых.The loci of the genome may comprise at least one continuous region of the genome. The at least one continuous region of the genome may even comprise the entire genome. The at least one continuous region of the genome may comprise a functional element of the genome. The functional element may be in a non-coding region, a coding region, an intronic region, a promoter or an enhancer. The at least one continuous region of the genome may comprise at least 1 kb, preferably at least 50 kb, of genomic DNA. The at least one continuous region of the genome may comprise a transcription factor binding site. The at least one continuous region of the genome may comprise a DNase I hypersensitivity region. The at least one continuous region of the genome may comprise a transcriptional enhancer or repressor element. The at least one continuous region of the genome may comprise a site enriched in an epigenetic signature. At least one contiguous region of genomic DNA may comprise an epigenetic insulator. The at least one contiguous region of the genome may comprise two or more contiguous genomic regions that physically interact. The regions of the genome that interact may be identified using ‘4C technology’. 4C technology enables the entire genome to be screened in an objective manner for segments of DNA that physically interact with a selected DNA fragment, as described in Zhao et al. ((2006) Nat Genet 38, 1341-7) and in U.S. Patent No. 8,642,295, both of which are incorporated herein by reference in their entireties. The epigenetic signature may be histone acetylation, histone methylation, histone ubiquitination, histone phosphorylation, DNA methylation, or the absence thereof.
Систему(системы) CRISPR-Cas для насыщающего или глубокосканируещего мутагенеза можно применять в популяции клеток. Систему(системы) CRISPR-Cas можно применять в эукариотических клетках, в том числе без ограничения в клетках млекопитающих и растений. Популяцией клеток могут быть прокариотические клетки. Популяцией эукариотических клеток может быть популяция эмбриональных стволовых (ES) клеток, нейронных клеток, эпителиальных клеток, иммунных клеток, эндокринных клеток, мышечных клеток, эритроцитов, лимфоцитов, растительных клеток или дрожжевых клеток.The CRISPR-Cas system(s) for saturation or deep scanning mutagenesis can be applied to a population of cells. The CRISPR-Cas system(s) can be applied to eukaryotic cells, including, but not limited to, mammalian and plant cells. The population of cells can be prokaryotic cells. The population of eukaryotic cells can be a population of embryonic stem (ES) cells, neural cells, epithelial cells, immune cells, endocrine cells, muscle cells, red blood cells, lymphocytes, plant cells, or yeast cells.
В одном аспекте настоящее изобретение относится к способу скрининга на предмет функциональных элементов, ассоциированных с изменением в фенотипе. Библиотека может быть введена в популяцию клеток, которые адаптированы с содержанием белка Cas. Клетки могут быть рассортированы по меньшей мере на две группы на основании фенотипа. Фенотипом может быть экспрессия гена, клеточный рост или клеточная жизнеспособность. Определяют относительное представление направляющих РНК, присутствующих в каждой группе, с определением тем самым сайтов генома, ассоциированных с изменением в фенотипе с помощью представления направляющих РНК, присутствующих в каждой группе. Изменением в фенотипе может быть изменение в экспрессии представляющего интерес гена. Представляющий интерес ген может быть активирован, подавлен или нокаутирован. Клетки могут быть рассортированы в группу с высокой экспрессией и группу с низкой экспрессией. Популяция клеток может содержать репортерную конструкцию, которую используют для определения фенотипа. Репортерная конструкция может включать выявляемый маркер. Клетки могут быть рассортированы с использованием выявляемого маркера.In one aspect, the present invention relates to a method of screening for functional elements associated with a change in phenotype. A library can be introduced into a population of cells that are adapted to contain a Cas protein. The cells can be sorted into at least two groups based on phenotype. The phenotype can be gene expression, cell growth or cell viability. The relative representation of guide RNAs present in each group is determined, thereby determining the sites of the genome associated with a change in phenotype using the representation of guide RNAs present in each group. The change in phenotype can be a change in the expression of a gene of interest. The gene of interest can be activated, repressed or knocked out. The cells can be sorted into a high expression group and a low expression group. The population of cells can contain a reporter construct that is used to determine the phenotype. The reporter construct can include a detectable marker. The cells can be sorted using the detectable marker.
В другом аспекте настоящее изобретение относится к способу скрининга на предмет сайтов генома, ассоциированных с устойчивостью к химическому соединению. Химическим соединением может быть лекарственное средство или пестицид. Библиотеку можно вводить в популяцию клеток, которые адаптированы с содержанием белка Cas, где каждая клетка популяции содержит не более чем одну направляющую РНК; при этом популяцию клеток обрабатывают химическим соединением и определяют представление направляющих РНК после обработки химическим соединением в более поздний момент времени по сравнению с ранним моментом времени, посредством чего определяют сайты генома, ассоциированные с устойчивостью к химическому соединению с помощью обогащения направляющих РНК. Представление sgRNA может быть определено способами глубокого секвенирования.In another aspect, the present invention relates to a method of screening for genomic sites associated with resistance to a chemical compound. The chemical compound may be a drug or a pesticide. The library may be introduced into a population of cells that are adapted to contain a Cas protein, wherein each cell of the population contains no more than one guide RNA; wherein the population of cells is treated with a chemical compound and the presentation of guide RNAs is determined after treatment with the chemical compound at a later time point compared to an early time point, thereby determining genomic sites associated with resistance to the chemical compound by enrichment of guide RNAs. The presentation of sgRNA may be determined by deep sequencing methods.
Применительно к осуществлению настоящего изобретения можно упомянуть статью под названием "BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis." Canver, M.C., Smith, E.C., Sher, F., Pinello, L., Sanjana, N.E., Shalem, O., Chen, D.D., Schupp, P.G., Vinjamur, D.S., Garcia, S.P., Luc, S., Kurita, R., Nakamura, Y., Fujiwara, Y., Maeda, T., Yuan, G., Zhang, F., Orkin, S.H., & Bauer, D.E. DOI:10.1038/nature15521, опубликованную онлайн 16 сентября 2015 г., при этом данная статья включена в данный документ посредством ссылки и кратко обсуждается ниже.In connection with the practice of the present invention, reference may be made to the article entitled "BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis." Canver, M.C., Smith, E.C., Sher, F., Pinello, L., Sanjana, N.E., Shalem, O., Chen, D.D., Schupp, P.G., Vinjamur, D.S., Garcia, S.P., Luc, S., Kurita, R., Nakamura, Y., Fujiwara, Y., Maeda, T., Yuan, G., Zhang, F., Orkin, S.H., & Bauer, D.E. DOI:10.1038/nature15521, published online September 16, 2015, which article is hereby incorporated by reference and is briefly discussed below.
Canver et al. описывают новую библиотеку объединенных в пулы направляющих РНК CRISPR-Cas9 для выполнения in situ насыщающего мутагенеза человеческих и мышиных энхансеров эритроидного BCL11A, ранее идентифицированных как энхансер, ассоциированный с уровнем фетального гемоглобина (HbF), и мышиный ортолог которого необходим для экспрессии эритроидного BCL11A. Этот подход выявляет критические минимальные признаки и дискретные повреждаемости этих энхансеров. Посредством редактирования первичных клеток-предшественников человека и мышиного трансгеноза авторы подтвердили энхансер эритроидного BCL11A в качестве мишени для повторной индукции HbF. Авторы создали подробную карту энхансеров, которая предоставляет информацию о терапевтическом редактировании генома.Canver et al. describe a novel library of pooled CRISPR-Cas9 guide RNAs to perform in situ saturation mutagenesis of human and mouse erythroid BCL11A enhancers, previously identified as an enhancer associated with fetal hemoglobin (HbF) levels and whose mouse ortholog is required for erythroid BCL11A expression. This approach identifies critical minimal features and discrete lesions of these enhancers. By editing human primary progenitor cells and mouse transgenes, the authors validated the erythroid BCL11A enhancer as a target for HbF reinduction. The authors generated a detailed enhancer map that provides insights into therapeutic genome editing.
Способ использования систем CRISPR-Cas для модификации клетки или организмаA method for using CRISPR-Cas systems to modify a cell or organism
Настоящее изобретение в некоторых вариантах осуществления охватывает способ модифицирования клетки или организма. Клетка может быть прокариотической клеткой или эукариотической клеткой. Клетка может быть клеткой млекопитающего. Клетка млекопитающего может быть клеткой отличного от человека примата, быка, свиньи, грызуна или мыши. Клетка может быть эукариотической клеткой от организма, отличного от млекопитающего, например, птицы, рыбы или креветки. Клетка также может быть растительной клеткой. Растительная клетка может происходить из культурного растения, такого как маниока, кукуруза, сорго, пшеница или рис. Растительная клетка также может происходить из водоросли, дерева или овощной культуры. Модификация, введенная в клетку с помощью настоящего изобретения, может быть такой, что клетка и потомство клетки изменяются для улучшения продуцирования биологических продуктов, таких как антитело, крахмал, спирт или другой желаемый клеточный продукт. Модификация, введенная в клетку с помощью настоящего изобретения, может быть такой, что клетка и потомство клетки будут включать в себя изменение, которое меняет продуцируемый биологический продукт.The present invention in some embodiments encompasses a method for modifying a cell or organism. The cell may be a prokaryotic cell or a eukaryotic cell. The cell may be a mammalian cell. The mammalian cell may be a cell of a non-human primate, bovine, porcine, rodent or mouse. The cell may be a eukaryotic cell from an organism other than a mammal, such as a bird, fish or shrimp. The cell may also be a plant cell. The plant cell may be from a crop plant such as cassava, corn, sorghum, wheat or rice. The plant cell may also be from an alga, tree or vegetable crop. The modification introduced into the cell by the present invention may be such that the cell and the progeny of the cell are altered to improve the production of biological products such as an antibody, starch, alcohol or other desired cellular product. A modification introduced into a cell by the present invention may be such that the cell and progeny of the cell will include a change that alters the biological product produced.
Система может содержать один или несколько разных векторов. В аспекте настоящего изобретения белок Cas является кодон-оптимизированным для экспрессии в эукариотической клетке, предпочтительно в клетке млекопитающего или клетке человека.The system may comprise one or more different vectors. In an aspect of the present invention, the Cas protein is codon-optimized for expression in a eukaryotic cell, preferably a mammalian cell or a human cell.
Системы CRISPR можно применять в растенияхCRISPR systems can be used in plants
Система(системы) CRISPR-Cas (например, одиночная(одиночные) или мультиплексная(мультиплексные)) могут быть использованы в сочетании с последними достижениями в геномике сельскохозяйственных культур. Такая(такие) система(системы) CRISPR-Cas может(могут) быть использована(использованы) для осуществления эффективного и рентабельного детального изучения или редактирования гена или генома растений или манипуляции с ними, например, для быстрого исследования, и/или отбора, и/или детальных изучений, и/или сравнения, и/или манипуляций, и/или трансформации генов или геномов растений; например, для получения, идентификации, разработки, оптимизации или придания признака(признаков) или характеристики(характеристик) растению(растениям) или для трансформации генома растения. Соответственно, может быть улучшено получение растений, новых растений с новыми комбинациями признаков или характеристик или новых растений с улучшенными признаками. Такую(такие) систему(системы) CRISPR-Cas можно использовать по отношению к растениям при сайт-направленной интеграции (SDI) или редактировании генов (GE) или в любой из методик приближенной обратной селекции (NRB) или обратной селекции (RB). В отношении применения системы CRISPR-Cas в растениях следует упомянуть веб-сайт "CRISPR-PLANT" Аризонского университета (http://www.genome.arizona.edu/crispr/) (при поддержке Университета штата Пенсильвания и AGI). Варианты осуществления настоящего изобретения можно применять при редактировании генома в растениях или в случае, когда RNAi или аналогичные методики редактирования генома были использованы ранее; см., например, Nekrasov, "Plant genome editing made easy: targeted mutagenesis in model and crop plants using the CRISPR/Cas system," Plant Methods 2013, 9:39 (doi:10.1186/1746-4811-9-39); Brooks, "Efficient gene editing in tomato in the first generation using the CRISPR/Cas9 system," Plant Physiology September 2014 pp 114.247577; Shan, "Targeted genome modification of crop plants using a CRISPR-Cas system," Nature Biotechnology 31, 686-688 (2013); Feng, "Efficient genome editing in plants using a CRISPR/Cas system," Cell Research (2013) 23:1229-1232. doi:10.1038/cr.2013.114; опубликовано онлайн 20 августа 2013 г.; Xie, "RNA-guided genome editing in plants using a CRISPR-Cas system," Mol Plant. 2013 Nov;6(6):1975-83. doi: 10.1093/mp/sst119. электронная публикация 17 августа 2013 г.; Xu, "Gene targeting using the Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice", Rice 2014, 7:5 (2014), Zhou et al., "Exploiting SNPs for biallelic CRISPR mutations in the outcrossing woody perennial Populus reveals 4-coumarate: CoA ligase specificity and Redundancy", New Phytologist (2015) (Forum) 1-4 (доступно только онлайн по адресу www.newphytologist.com); Caliando et al, "Targeted DNA degradation using a CRISPR device stably carried in the host genome", NATURE COMMUNICATIONS 6:6989, DOI: 10.1038/ncomms7989, www.nature.com/ naturecommunications DOI: 10.1038/ncomms7989; патент США № 6603061 - Agrobacterium-Mediated Plant Transformation Method; патент США № 7868149 - Plant Genome Sequences and Uses Thereof и US 2009/0100536 - Transgenic Plants with Enhanced Agronomic Traits, все содержание и раскрытие каждого из которых включено в данный документ посредством ссылки во всей полноте. При практическом осуществлении настоящего изобретения содержание и раскрытие Morrell et al "Crop genomics: advances and applications", Nat Rev Genet. 2011 Dec 29;13(2):85-96; которое включено в данный документ посредством ссылки, в том числе то, как варианты осуществления в данном документе могут быть использованы по отношению к растениям. Соответственно, ссылка в данном документе на клетки животных может также применяться, с соответствующими изменениями, по отношению к растительным клеткам, если не очевидно иное; и ферменты в данном документе, имеющие ослабленные нецелевые эффекты, и системы, использующие такие ферменты, могут быть использованы в вариантах применения растений, в том числе упомянутых в данном документе.The CRISPR-Cas system(s) (e.g., single(s) or multiplex(es)) can be used in combination with recent advances in crop genomics. Such CRISPR-Cas system(s) can be used to efficiently and cost-effectively mine, edit, or manipulate a plant gene or genome, such as to rapidly screen and/or select and/or mine and/or compare and/or manipulate and/or transform plant genes or genomes; such as to obtain, identify, develop, optimize, or impart trait(s) or characteristic(s) to a plant(s) or to transform a plant genome. Accordingly, the production of plants, new plants with new combinations of traits or characteristics, or new plants with improved traits can be improved. Such a CRISPR-Cas system(s) can be used in plants in site-directed integration (SDI) or gene editing (GE) or in any of the near reverse selection (NRB) or reverse selection (RB) techniques. For the use of the CRISPR-Cas system in plants, reference should be made to the University of Arizona's "CRISPR-PLANT" website (http://www.genome.arizona.edu/crispr/) (supported by Pennsylvania State University and AGI). Embodiments of the present invention can be used in genome editing in plants or in cases where RNAi or similar genome editing techniques have been used previously; see, for example, Nekrasov, “Plant genome editing made easy: targeted mutagenesis in model and crop plants using the CRISPR/Cas system,” Plant Methods 2013, 9:39 (doi:10.1186/1746-4811-9-39); Brooks, “Efficient gene editing in tomato in the first generation using the CRISPR/Cas9 system,” Plant Physiology September 2014 pp 114.247577; Shan, "Targeted genome modification of crop plants using a CRISPR-Cas system," Nature Biotechnology 31, 686-688 (2013); Feng, “Efficient genome editing in plants using a CRISPR/Cas system,” Cell Research (2013) 23:1229–1232. doi:10.1038/cr.2013.114; published online 20 Aug 2013; Xie, "RNA-guided genome editing in plants using a CRISPR-Cas system," Mol Plant. 2013 Nov;6(6):1975-83. doi: 10.1093/mp/sst119. online published 17 Aug 2013; Xu, "Gene targeting using the Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice", Rice 2014, 7:5 (2014), Zhou et al., "Exploiting SNPs for biallelic CRISPR mutations in the outcrossing woody perennial Populus reveals 4-coumarate: CoA ligase specificity and Redundancy", New Phytologist (2015) (Forum) 1-4 (available online only at www.newphytologist.com); Caliando et al, "Targeted DNA degradation using a CRISPR device stably carried in the host genome", NATURE COMMUNICATIONS 6:6989, DOI: 10.1038/ncomms7989, www.nature.com/naturecommunications DOI: 10.1038/ncomms7989; U.S. Patent No. 6,603,061 - Agrobacterium-Mediated Plant Transformation Method; U.S. Patent No. 7,868,149 - Plant Genome Sequences and Uses Thereof and US 2009/0100536 - Transgenic Plants with Enhanced Agronomic Traits, the entire contents and disclosure of each of which are incorporated herein by reference in their entirety. In the practice of the present invention, the contents and disclosure of Morrell et al, "Crop genomics: advances and applications", Nat Rev Genet. 2011 Dec 29;13(2):85-96; which is incorporated herein by reference, including how embodiments herein may be used with respect to plants. Accordingly, reference herein to animal cells may also apply, mutatis mutandis, to plant cells unless otherwise apparent; and enzymes herein having reduced off-target effects, and systems utilizing such enzymes, may be used in plant applications, including those mentioned herein.
Sugano et al. (Plant Cell Physiol. 2014 Mar;55(3):475-81. doi: 10.1093/pcp/pcu014. Epub 2014 Jan 18) описывают применение CRISPR/Cas9 по отношению к направленному мутагенезу в печеночном мхе Marchantia polymorpha L., который стал модельным видом для изучения эволюции наземных растений. Промотор U6 M. polymorpha был идентифицирован и клонирован с целью экспрессии gRNA. Целевая последовательность gRNA была разработана с целью нарушения работы гена, кодирующего фактор 1 ответа на ауксин (ARF1) в M. polymorpha. С помощью опосредованной Agrobacterium трансформации Sugano et al. выделили стабильные мутанты в поколении гаметофита M. polymorpha. Сайт-направленный мутагенез на основе CRISPR/Cas9 in vivo был достигнут с помощью вируса 35S мозаики цветной капусты или промотора EF1α M. polymorpha для экспрессии Cas9. Выделенные мутантные особи, проявляющие устойчивый к ауксину фенотип, не были химерными. Кроме того, стабильные мутанты были получены с помощью бесполого размножения растений T1. Несколько аллелей arf1 были легко определены с помощью направленного мутагенеза на основе CRIPSR/Cas9. Способы Sugano et al. могут быть применимы по отношению к системе CRISPR Cas по настоящему изобретению.Sugano et al. (Plant Cell Physiol. 2014 Mar;55(3):475-81. doi: 10.1093/pcp/pcu014. Epub 2014 Jan 18) describe the use of CRISPR/Cas9 for site-directed mutagenesis in the liverwort Marchantia polymorpha L., which has become a model species for studying land plant evolution. The M. polymorpha U6 promoter was identified and cloned to express a gRNA. The gRNA target sequence was designed to disrupt the gene encoding auxin response factor 1 (ARF1) in M. polymorpha. Using Agrobacterium-mediated transformation, Sugano et al. isolated stable mutants in the gametophyte generation of M. polymorpha. In vivo CRISPR/Cas9-based site-directed mutagenesis was achieved using cauliflower mosaic virus 35S or the M. polymorpha EF1α promoter to express Cas9. The isolated mutants exhibiting an auxin-resistant phenotype were not chimeric. In addition, stable mutants were obtained by asexual propagation of T1 plants. Several arf1 alleles were readily identified by CRIPSR/Cas9-based site-directed mutagenesis. The methods of Sugano et al. can be applied to the CRISPR Cas system of the present invention.
Kabadi et al. (Nucleic Acids Res. 2014 Oct 29;42(19):e147. doi: 10.1093/nar/gku749. Epub 2014 Aug 13) разработали одиночную лентивирусную систему с экспрессией варианта Cas9, репортерного гена и до четырех sgRNA включительно из независимых промоторов РНК-полимеразы III, которые включены в вектор с помощью удобного способа клонирования Golden Gate. Каждая sgRNA эффективно экспрессировала и могла опосредовать мультиплексное редактирование генов и длительную активацию транскрипции в иммортализованных и первичных клетках человека. Способы Kabadi et al. могут быть применимы по отношению к системе CRISPR Cas по настоящему изобретению.Kabadi et al. (Nucleic Acids Res. 2014 Oct 29;42(19):e147. doi: 10.1093/nar/gku749. Epub 2014 Aug 13) developed a single lentiviral system expressing a Cas9 variant, a reporter gene, and up to four sgRNAs from independent RNA polymerase III promoters incorporated into a vector using the convenient Golden Gate cloning method. Each sgRNA was efficiently expressed and could mediate multiplex gene editing and long-term transcriptional activation in immortalized and primary human cells. The methods of Kabadi et al. may be applicable to the CRISPR Cas system of the present invention.
Ling et al. (BMC Plant Biology 2014, 14:327) разработали набор бинарных векторов CRISPR/Cas9 на основе каркаса pGreen или pCAMBIA, а также gRNA. Для этого набора инструментов не требуются рестриктазы помимо BsaI для получения конечных конструкций, несущих оптимизированный по кодону маиса Cas9 и одну или несколько gRNA с высокой эффективностью лишь в одной стадии клонирования. Набор инструментов был валидирован с помощью протопластов маиса, линий трансгенного маиса и линий трансгенного арабидопсиса, и, как было показано, характеризовался высокой эффективностью и специфичностью. Что более важно, с помощью этого набора инструментов целевые мутации трех генов арабидопсиса были выявлены в трансгенных сеянцах поколения T1. Кроме того, несколько мутаций генов могли быть унаследованы следующим поколением. (Направляющая РНК) набор модульных векторов, как и набор инструментов для мультиплексного редактирования генома у растений. Набор инструментов Lin et al. может быть применен по отношению к системе CRISPR Cas по настоящему изобретению.Ling et al. (BMC Plant Biology 2014, 14:327) developed a set of binary CRISPR/Cas9 vectors based on the pGreen or pCAMBIA backbone and gRNA. This toolkit does not require restriction enzymes other than BsaI to generate final constructs carrying maize codon-optimized Cas9 and one or more gRNAs with high efficiency in only a single cloning step. The toolkit was validated using maize protoplasts, transgenic maize lines, and transgenic Arabidopsis lines and was shown to have high efficiency and specificity. More importantly, using this toolkit, targeted mutations in three Arabidopsis genes were detected in T1-generation transgenic seedlings. In addition, several gene mutations could be inherited by the next generation. (Guide RNA) set of modular vectors, as well as a toolkit for multiplexed genome editing in plants. The Lin et al. toolkit can be applied to the CRISPR Cas system of the present invention.
Протоколы для целевого редактирования генома растений посредством CRISPR/Cas9 также доступны в томе 1284 серии в Methods in Molecular Biology pp 239-255 от 10 февраля 2015 г. Включена подробная процедура для разработки, конструирования и оценки двойных gRNA для оптимизированного по кодону растений опосредованного Cas9 (pcoCas9) редактирования генома с помощью клеточных систем на основе модели протопластов Arabidopsis thaliana и Nicotiana benthamiana. Стратегии применения системы CRISPR/Cas9 с целью получения целевых модификаций генома в целых растениях также описаны. Протоколы в этой главе могут быть применены по отношению к системе CRISPR Cas по настоящему изобретению.Protocols for targeted plant genome editing via CRISPR/Cas9 are also available in volume 1284 of the series in Methods in Molecular Biology pp 239-255 dated February 10, 2015. A detailed procedure is included for the design, construction, and evaluation of dual gRNAs for plant codon-optimized Cas9-mediated (pcoCas9) genome editing using Arabidopsis thaliana and Nicotiana benthamiana protoplast model cell systems. Strategies for using the CRISPR/Cas9 system to produce targeted genome modifications in whole plants are also described. The protocols in this chapter can be applied to the CRISPR Cas system of the present invention.
Ma et al. (Mol Plant. 2015 Aug 3;8(8):1274-84. doi: 10.1016/j.molp.2015.04.007) описывают устойчивую векторную систему CRISPR/Cas9, используя оптимизированный по кодону растения ген Cas9, для удобного и высокоэффективного мультиплексного редактирования генома в однодольных и двудольных растениях. Ma et al. разработали процедуры на основе ПЦР для быстрого получения нескольких кассет экспрессии sgRNA, которые могут быть собраны в бинарные векторы CRISPR/Cas9 в одном цикле клонирования с помощью лигирования Golden Gate или сборки Gibson. С помощью этой системы Ma et al. редактировали 46 целевых сайтов у риса со средней скоростью мутации, составляющей 85,4%, большей частью в биаллельном и гомозиготном статусе. Ma et al. предусматривают примеры мутаций генов с потерей функции в растениях риса T0 и растениях арабидопсиса T1 с помощью одновременного нацеливания на несколько (до восьми) представителей семейства генов, несколько генов в пути биосинтеза или нескольких сайтов в одном гене. Способы Ma et al. могут быть применимы по отношению к системе CRISPR Cas по настоящему изобретению.Ma et al. (Mol Plant. 2015 Aug 3;8(8):1274-84. doi: 10.1016/j.molp.2015.04.007) describe a robust CRISPR/Cas9 vector system using a plant codon-optimized Cas9 gene for convenient and highly efficient multiplexed genome editing in monocots and dicots. Ma et al. developed PCR-based procedures to rapidly generate multiple sgRNA expression cassettes that can be assembled into binary CRISPR/Cas9 vectors in a single cloning round using Golden Gate ligation or Gibson assembly. Using this system, Ma et al. edited 46 target sites in rice with an average mutation rate of 85.4%, mostly in biallelic and homozygous status. Ma et al. provide examples of loss-of-function gene mutations in T0 rice plants and T1 Arabidopsis plants by simultaneously targeting multiple (up to eight) members of a gene family, multiple genes in a biosynthetic pathway, or multiple sites in a single gene. The methods of Ma et al. may be applicable to the CRISPR Cas system of the present invention.
Lowder et al. (Plant Physiol. 2015 Aug 21. pii: pp.00636.2015) также разработали набор инструментов CRISPR/Cas9, который обеспечивает мультиплексное редактирование генома и регуляцию транскрипции экспрессируемых, выключенных или некодирующих генов в растениях. Этот набор инструментов обеспечивает исследователей протоколом и реагентами для быстрой и эффективной сборки функциональных конструкций T-ДНК CRISPR/Cas9 для однодольных и двудольных с помощью способов клонирования Golden Gate и Gateway. Он поставляется вместе с полным набором возможностей, в том числе мультиплексного редактирования генов и активации или репрессии транскрипции эндогенных генов растений. Технология трансформации на основе T-ДНК является фундаментальной для современной биотехнологии, генетики, молекулярной биологии и физиологии растений. В связи с этим заявители разработали способ сборки Cas9 (WT, никазы или dCas9) и gRNA в представляющий интерес вектор назначения T-ДНК. Способ сборки основан на сборке Golden Gate и рекомбинации MultiSite Gateway. Для сборки требуется три модуля. Первый модуль представляет собой входящий вектор Cas9, который содержит Cas9 без промотора или его производные гены, фланкированные сайтами attL1 и attR5. Второй модуль представляет собой входящий вектор gRNA, который содержит входящие кассеты экспрессии на основе gRNA, фланкированные сайтами attL5 и attL2. Третий модуль включает attR1-attR2-содержащие векторы назначения T-ДНК, которые предусматривают предпочтительные промоторы для экспрессии Cas9. Набор инструментов Lowder et al. может быть применен по отношению к системе CRISPR Cas9 по настоящему изобретению.Lowder et al. (Plant Physiol. 2015 Aug 21. pii: pp.00636.2015) also developed a CRISPR/Cas9 toolkit that enables multiplexed genome editing and transcriptional regulation of expressed, silenced, or noncoding genes in plants. This toolkit provides researchers with a protocol and reagents for the rapid and efficient assembly of functional T-DNA CRISPR/Cas9 constructs in monocots and dicots via the Golden Gate and Gateway cloning methods. It comes with a full suite of capabilities, including multiplexed gene editing and transcriptional activation or repression of endogenous plant genes. T-DNA-based transformation technology is fundamental to modern biotechnology, genetics, molecular biology, and plant physiology. In this regard, we have developed a method for assembling Cas9 (WT, nickase, or dCas9) and gRNA into a T-DNA destination vector of interest. The assembly method is based on Golden Gate assembly and MultiSite Gateway recombination. Three modules are required for assembly. The first module is a Cas9 entry vector that contains promoterless Cas9 or its derivative genes flanked by attL1 and attR5 sites. The second module is a gRNA entry vector that contains gRNA-based entry expression cassettes flanked by attL5 and attL2 sites. The third module includes attR1-attR2-containing T-DNA destination vectors that provide preferred promoters for Cas9 expression. The Lowder et al. toolbox can be applied to the CRISPR Cas9 system of the present invention.
Petersen ("Towards precisely glycol engineered plants," Plant Biotech Denmark Annual meeting 2015, Copenhagen, Denmark) разработал способ применения CRISPR/Cas9 для конструирования геномных изменений в арабидопсисе, например, глико-конструирования арабидопсиса для получения белков и продуктов, имеющий желаемые посттрансляционные модификации. Hebelstrup et al. (Front Plant Sci. 2015 Apr 23; 6:247) описывает биоинженерию крахмала в растениях, предусматривающую сельскохозяйственные культуры, которые экспрессируют модифицирующие крахмал ферменты и непосредственно дают продукты, которые обычно изготовлены с помощью промышленных химических и/или физических способов обработки крахмалов. Способы Petersen and Hebelstrup могут быть применимы к системе CRISPR-Cas9 по настоящему изобретению.Petersen ("Towards precisely glycol engineered plants," Plant Biotech Denmark Annual meeting 2015, Copenhagen, Denmark) developed a method for using CRISPR/Cas9 to engineer genomic changes in Arabidopsis, such as glyco-engineering Arabidopsis to produce proteins and products having desired post-translational modifications. Hebelstrup et al. (Front Plant Sci. 2015 Apr 23; 6:247) describe starch bioengineering in plants, involving crops that express starch-modifying enzymes and directly yield products that are typically made using industrial chemical and/or physical starch processing methods. The methods of Petersen and Hebelstrup may be applicable to the CRISPR-Cas9 system of the present invention.
В предпочтительном варианте осуществления растение может представлять собой дерево. В настоящем изобретении может также применяться раскрытая в данном документе система CRISPR Cas для систем на основе травянистых растений (см., например, Belhaj et al., Plant Methods 9: 39 and Harrison et al., Genes & Development 28: 1859-1872). В особо предпочтительном варианте осуществления система CRISPR Cas по настоящему изобретению может быть направлена на однонуклеотидный полиморфизм (SNP) у деревьев (см., например, Zhou et al., New Phytologist, Volume 208, Issue 2, pages 298-301, October 2015). В исследовании Zhou et al. авторы применяли систему CRISPR Cas для древовидного многолетнего Populus в случае семейства генов 4-кумарат:лигаза CoA (4CL) в качестве примера применения и достигли 100% мутационной эффективности для двух целевых генов 4CL, при этом каждый исследуемый трансформант обладал биаллельными модификациями. В исследовании Zhou et al. система CRISPR/Cas9 была высокочувствительной по отношению к однонуклеотидным полиморфизмам (SNP), поскольку расщепление для третьего гена 4CL было отменено в результате SNP в целевой последовательности.In a preferred embodiment, the plant may be a tree. The present invention may also employ the CRISPR Cas system disclosed herein for herbaceous plant systems (see, e.g., Belhaj et al., Plant Methods 9: 39 and Harrison et al., Genes & Development 28: 1859-1872). In a particularly preferred embodiment, the CRISPR Cas system of the present invention may target a single nucleotide polymorphism (SNP) in trees (see, e.g., Zhou et al., New Phytologist, Volume 208, Issue 2, pages 298-301, October 2015). In the study by Zhou et al. The authors applied the CRISPR Cas system to the tree-like perennial Populus with the 4-coumarate:CoA ligase (4CL) gene family as an example application and achieved 100% mutation efficiency for two 4CL target genes, with each transformant tested having biallelic modifications. In the study by Zhou et al., the CRISPR/Cas9 system was highly sensitive to single nucleotide polymorphisms (SNPs), as segregation for a third 4CL gene was abolished by a SNP in the target sequence.
Способы Zhou et al. (New Phytologist, Volume 208, Issue 2, pages 298-301, October 2015) могут быть применены по отношению к настоящему изобретению следующим образом. Два гена 4CL, 4CL1 и 4CL2, ассоциированные с биосинтезом лигнина и флавоноидов соответственно, являются мишенями для редактирования с помощью CRISPR/Cas9. Клон 717-1B4 Populus tremula × alba, обычно используемый для трансформации, отличается от Populus trichocarpa с секвенированным геномом. Таким образом, gRNA 4CL1 и 4CL2, разработанные исходя из эталонного генома, детально исследуют в соответствии с внутренними данными секвенирования РНК 717 с целью обеспечения отсутствия SNP, которые могли бы ограничить эффективность Cas. Также включена третья gRNA, разработанная для 4CL5, геномной дупликации 4CL1. Соответствующая последовательность 717 содержит один SNP в каждом аллеле возле/в PAM, оба из которых, как предполагается, устраняют нацеливание со стороны 4CL5-gRNA. Все три целевые сайта gRNA расположены в первом экзоне. Для трансформации последовательности 717 gRNA экспрессируется из промотора Medicago U6.6 совместно с кодон-оптимизированным Cas человека под контролем промотора CaMV 35S в бинарном векторе. Трансформация вектором, содержащим только Cas, может выступать в качестве контроля. Случайным образом выбранные линии 4CL1 и 4CL2 подвергают секвенированию ампликонов. Затем данные обрабатывают и биаллельные мутации подтверждают во всех случаях.The methods of Zhou et al. (New Phytologist, Volume 208, Issue 2, pages 298-301, October 2015) can be applied to the present invention as follows. Two 4CL genes, 4CL1 and 4CL2, associated with lignin and flavonoid biosynthesis, respectively, are targets for editing using CRISPR/Cas9. The Populus tremula × alba clone 717-1B4, commonly used for transformation, is different from Populus trichocarpa with a sequenced genome. Therefore, the gRNAs 4CL1 and 4CL2, designed from the reference genome, were screened in detail according to the internal 717 RNA sequencing data to ensure the absence of SNPs that could limit the efficiency of Cas. A third gRNA designed for 4CL5, a genomic duplication of 4CL1, is also included. The corresponding 717 sequence contains one SNP in each allele near/in the PAM, both of which are predicted to abrogate targeting by the 4CL5 gRNA. All three gRNA target sites are located in the first exon. For transformation, the 717 gRNA sequence is expressed from the Medicago U6.6 promoter together with codon-optimized human Cas under the control of the CaMV 35S promoter in a binary vector. Transformation with a Cas-only vector can serve as a control. Randomly selected 4CL1 and 4CL2 lines are subjected to amplicon sequencing. The data are then processed and biallelic mutations are confirmed in all cases.
У растений патогены часто являются специфичными по отношению к хозяину. Например, Fusarium oxysporum f. sp. lycopersici вызывает фузариозный вилт томата, но поражает только томат, а F. oxysporum f. dianthii и Puccinia graminis f. sp. tritici поражают только пшеницу. Растения обладают присущими и индуцированными защитными реакциями, обеспечивающими устойчивость к большинству патогенов. Мутации и события рекомбинации в поколениях растений приводят к генетической изменчивости, которая обуславливает восприимчивость, тем более, что патогены размножаются с большей частотой, чем растения. У растений может наблюдаться устойчивость видов, не относящихся к хозяевам, например, хозяин и патоген являются несовместимыми. Также может наблюдаться горизонтальная устойчивость, например, частичная устойчивость ко всем расам патогена, обычно контролируемая многими генами, и вертикальная устойчивость, например, полная устойчивость к некоторым расам патогена, но не к другим расам, обычно контролируемая несколькими генами. На уровне взаимодействия генов растения и патогены эволюционируют совместно, а генетические изменения одного уравновешивают изменения другого. Соответственно, используя естественную изменчивость, селекционеры комбинируют гены, наиболее полезные для урожайности, качества, однородности, выносливости, устойчивости. Источники генов устойчивости включают нативные или чужеродные сорта, старинные сорта, родственные дикорастущие растения и индуцированные мутации, например, при обработке растительного материала мутагенными средствами. Применяя настоящее изобретение, селекционеры растений получают новый инструмент для индукции мутаций. Соответственно, специалист в данной области может проанализировать геном источников генов устойчивости, а в отношении сортов, имеющих желаемые характеристики или признаки, использовать настоящее изобретение для индукции появления генов устойчивости с большей точностью, чем в случае применявшихся ранее мутагенных средств, и, следовательно, для ускорения и улучшения программ селекции растений.In plants, pathogens are often host specific. For example, Fusarium oxysporum f. sp. lycopersici causes fusarium wilt of tomato but attacks only tomato, and F. oxysporum f. dianthii and Puccinia graminis f. sp. tritici attack only wheat. Plants have intrinsic and induced defense responses that provide resistance to most pathogens. Mutations and recombination events over generations of plants result in genetic variation that determines susceptibility, especially since pathogens replicate at a higher frequency than plants. Plants may have resistance to non-host species, for example, the host and pathogen are incompatible. There may also be horizontal resistance, for example, partial resistance to all races of a pathogen, usually controlled by many genes, and vertical resistance, for example, complete resistance to some races of a pathogen but not to other races, usually controlled by a few genes. At the level of gene interaction, plants and pathogens evolve together, and genetic changes in one balance changes in the other. Accordingly, using natural variability, breeders combine genes that are most useful for yield, quality, uniformity, endurance, and resistance. Sources of resistance genes include native or alien varieties, ancient varieties, related wild plants, and induced mutations, such as when treating plant material with mutagenic agents. Using the present invention, plant breeders receive a new tool for inducing mutations. Accordingly, a person skilled in the art can analyze the genome of resistance gene sources, and with respect to varieties that have the desired characteristics or traits, use the present invention to induce the appearance of resistance genes with greater accuracy than in the case of previously used mutagenic agents, and, therefore, to accelerate and improve plant breeding programs.
Варианты применения по отношению к растениям и дрожжам; варианты применения по отношению к биотопливуApplications for plants and yeast; applications for biofuels
Применение системы Cas9-CRISPR по отношению к растениям и дрожжамApplication of the Cas9-CRISPR system to plants and yeast
ОпределенияDefinitions
В целом, термин "растение" относится к любому отличающемуся друг от друга фотосинтезирующему, эукариотическому, одноклеточному или многоклеточному организму царства Растения, характерным образом растущему путем клеточного деления, содержащему хлоропласты и имеющему клеточные стенки, состоящие из целлюлозы. Термин "растение" охватывает однодольные и двудольные растения. В частности, растения содержат без ограничения покрытосеменные и голосеменные растения, такие как акация, люцерна, амарант, яблоня, абрикос, артишок, ясень, спаржа, авокадо, банан, ячмень, бобы, свекла, береза, бук, ежевика, голубика, брокколи, брюссельская капуста, капуста, канола, канталупа, морковь, маниок, цветная капуста, кедр, злак, сельдерей, каштан, вишня, китайская капуста, цитрус, клементин, клевер, кофе, кукуруза, хлопчатник, коровий горох, огурец, кипарис, баклажан, вяз, цикорий салатный, эвкалипт, фенхель, инжир, пихта, герань, виноград, грейпфрут, земляной орех, вишня кустарниковая, эвкалипт, болиголов, кария, браунколь, киви, кольраби, лиственница, салат-латук, лук-порей, лимон, лайм, робиния, адиантум, маис, манго, клен, дыня, просо, гриб, горчица, орехи, дуб, овес, масличная пальма, окра, лук репчатый, апельсин, декоративное растение, цветущее растение или дерево, папайя, пальма, петрушка, пастернак, горох, персик, арахис, груша, торф, перец, хурма, голубиный орех, сосна, ананас, подорожник, слива, гранат, картофель, тыква, радиккио, редис, рапс, малина, рис, рожь, сорго, сафлор, ива, соя, шпинат, ель, тыква гигантская, клубника, сахарная свекла, сахарный тростник, подсолнечник, батат, сахарная кукуруза, мандарин, чай, табак, томат, деревья, тритикале, мох, турнепс, ползучее растение, грецкий орех, кресс водяной, арбуз, пшеница, ямс, тис и тыква обыкновенная. Термин "растение" также охватывает водоросли, которые представляют собой главным образом фотоавтотрофов, объединенных преимущественно в связи с отсутствием у них корней, листьев и других органов, которые характеризуют высшие растения.In general, the term "plant" refers to any distinct photosynthetic, eukaryotic, unicellular or multicellular organism of the kingdom Plantae that characteristically grows by cell division, contains chloroplasts, and has cell walls composed of cellulose. The term "plant" includes monocots and dicots. In particular, the plants include, without limitation, angiosperms and gymnosperms such as acacia, alfalfa, amaranth, apple, apricot, artichoke, ash, asparagus, avocado, banana, barley, beans, beets, birch, beech, blackberry, blueberry, broccoli, Brussels sprouts, cabbage, canola, cantaloupe, carrot, cassava, cauliflower, cedar, cereal, celery, chestnut, cherry, Chinese cabbage, citrus, clementine, clover, coffee, corn, cotton, cowpea, cucumber, cypress, eggplant, elm, chicory, eucalyptus, fennel, fig, fir, geranium, grape, grapefruit, peanut, cherry shrub, eucalyptus, hemlock, hickory, kale, kiwi, kohlrabi, larch, lettuce, leek, lemon, lime, robinia, maidenhair, corn, mango, maple, melon, millet, mushroom, mustard, nuts, oak, oats, oil palm, okra, onion, orange, ornamental, flowering plant or tree, papaya, palm, parsley, parsnip, pea, peach, peanut, pear, peat, pepper, persimmon, pigeon nut, pine, pineapple, plantain, plum, pomegranate, potato, pumpkin, radicchio, radish, rapeseed, raspberry, rice, rye, sorghum, safflower, willow, soybean, spinach, spruce, pumpkin giant, strawberry, sugar beet, sugar cane, sunflower, sweet potato, sweet corn, mandarin, tea, tobacco, tomato, trees, triticale, moss, turnip, creeper, walnut, watercress, watermelon, wheat, yam, yew, and pumpkin. The term "plant" also includes algae, which are mainly photoautotrophs, grouped together primarily because they lack roots, leaves, and other organs that characterize higher plants.
Способы редактирования генома с помощью системы CRISPR/Cas9, как описано в данном документе, могут быть использованы для придания желаемых признаков практически любому растению. Широкий спектр растений и систем растительных клеток может быть сконструировано с целью желаемых физиологических и агрономических характеристик, описанных в данном документе, с помощью конструкций нуклеиновой кислоты по настоящему раскрытию и различных способов трансформации, упомянутых выше. В предпочтительных вариантах осуществления целевые растения и растительные клетки для конструирования включают без ограничения такие однодольные и двудольные растения, как зерновые культуры (например, пшеницу, маис, рис, просо, ячмень), плодовые культуры (например, томат, яблоня, груша, клубника, апельсин), кормовые культуры (например, люцерна), корнеплодные овощные культуры (например, морковь, картофель, сахарная свекла, ямс), лиственные овощные культуры (например, салат-латук, шпинат); цветущие растения (например, петуния, роза, хризантема), хвойные и сосновые деревья (например, сосна, пихта, ель); растения, используемые в фиторемедеации (например, растения, поглощающие тяжелые металлы); масляные культуры (например, подсолнечник, рапс) и растения, используемые для экспериментальных целей (например, Arabidopsis). Таким образом, способы и системы CRISPR-Cas могут быть применимы по отношению к широкому диапазону растений, таких как, например, двудольные растения, принадлежащие к порядкам Магнолиецветные, Иллициевые, Лавроцветные, Перечноцветные, Кирказоновые, Кувшинкоцветные, Лютикоцветные, Макоцветные, Саррацениевые, Троходендровые, Гамамелисовые, Эвкомисовые, Лейтнериевые, Мириковые, Букоцветные, Казуариновые, Гвоздичноцветные, Баталовые, Гречихоцветные, Плюмбаговые, Диллениевые, Чайные, Мальвоцветные, Крапивоцветные, Лецитисоцветные, Фиалкоцветные, Ивовые, Каперсоцветные, Верескоцветные, Диапенсиевые, Эбеновые, Примулоцветные, Розоцветные, Бобовоцветные, Подостемовые, Сланоягодникоцветные, Миртоцветные, Кизилоцветные, Протеецветные, Санталоцветные, Раффлезиевые, Бересклетоцветные, Молочаецветные, Крушиновые, Сапиндоцветные, Орехоцветные, Гераниецветные, Истодовые, Аралиецветные, Горечавкоцветные, Синюхоцветные, Ясноткоцветные, Подорожниковые, Норичникоцветные, Колокольчикоцветные, Мареноцветные, Ворсянкоцветные и Астроцветные; способы и системы CRISPR-Cas могут быть применимы по отношению к однодольным растениям, таким как принадлежащие к порядкам Частухоцветные, Панданоцветные, Наядовые, Триурисовые, Коммелиноцветные, Эриокаулоновые, Рестиевые, Тонконогоцветные, Ситниковые, Осокоцветные, Рогозовые, Бромелиецветные, Имбирецветные, Пальмоцветные, Циклантовые, Панданоцветные, Аронниковые, Лилиецветные и Орхидноцветные, или растениям, принадлежащим к голосеменным, например, принадлежащим к порядкам Сосновые, Гинкговые, Саговниковидные, Араукариевые, Кипарисовые и Гнетовидные.The genome editing methods using the CRISPR/Cas9 system as described herein can be used to impart desired traits to virtually any plant. A wide variety of plants and plant cell systems can be engineered to have the desired physiological and agronomic characteristics described herein using the nucleic acid constructs of the present disclosure and the various transformation methods mentioned above. In preferred embodiments, target plants and plant cells for engineering include, but are not limited to, monocots and dicots such as cereal crops (e.g., wheat, maize, rice, millet, barley), fruit crops (e.g., tomato, apple, pear, strawberry, orange), forage crops (e.g., alfalfa), root vegetables (e.g., carrot, potato, sugar beet, yam), leafy vegetables (e.g., lettuce, spinach); flowering plants (e.g. petunia, rose, chrysanthemum), conifers and pine trees (e.g. pine, fir, spruce); plants used in phytoremediation (e.g. heavy metal-absorbing plants); oil crops (e.g. sunflower, rapeseed) and plants used for experimental purposes (e.g. Arabidopsis). Thus, the CRISPR-Cas methods and systems can be applied to a wide range of plants, such as, for example, dicotyledonous plants belonging to the orders Magnoliales, Illitiaceae, Lauraceae, Piperiales, Aristolochiaceae, Nymphales, Ranunculales, Papiliales, Sarraceniaceae, Trochodendraceae, Hamamelidaceae, Eucomisaceae, Leutneriaceae, Myricaceae, Fagales, Casuarinaceae, Caryophyllales, Batalaceae, Polygonaceae, Plumbagoaceae, Dilleniaceae, Tea, Malvales, Urticaceae, Lecythiaceae, Violaceae, Salixaceae, Caperaceae, Ericales, Diapensiaceae, Ebenaceae, Primulales, Rosaceae, Fabaceae, Podostemaceae, Slanophytale, Myrtales, Cornus, Proteales, Santalales, Rafflesiaceae, Celastrales, Euphorbiales, Rhamnaceae, Sapindoales, Nuciferae, Geraniales, Esthales, Araliales, Gentianales, Polemonium, Lamiaceae, Plantaginaceae, Scrophulariaceae, Campanulales, Rubiaceae, Chamomillaceae and Asterales; The CRISPR-Cas methods and systems can be applied to monocotyledonous plants, such as those belonging to the orders Alistales, Pandanales, Naiadaceae, Triuridaceae, Commelinales, Eriocaulonaceae, Restiaceae, Tenulipediaceae, Rumpleaf, Cyperaceae, Typhaceae, Bromeliadiales, Zingiberales, Palmales, Cyclanthus, Pandanales, Araceae, Liliales, and Orchidales, or to plants belonging to the gymnosperms, such as those belonging to the orders Pinaceae, Ginkgoceae, Cycads, Araucariaceae, Cupressaceae, and Gnetoides.
Системы и способы применения CRISPR/Cas9, описанные в данном документе, могут быть применимы по отношению к широкому диапазону видов растений, включенных в неограничивающий перечень двудольных, однодольных или голосеменных родов, приведенных ниже: Atropa, Alseodaphne, Anacardium, Arachis, Beilschmiedia, Brassica, Carthamus, Cocculus, Croton, Cucumis, Citrus, Citrullus, Capsicum, Catharanthus, Cocos, Coffea, Cucurbita, Daucus, Duguetia, Eschscholzia, Ficus, Fragaria, Glaucium, Glycine, Gossypium, Helianthus, Hevea, Hyoscyamus, Lactuca, Landolphia, Linum, Litsea, Lycopersicon, Lupinus, Manihot, Majorana, Malus, Medicago, Nicotiana, Olea, Parthenium, Papaver, Persea, Phaseolus, Pistacia, Pisum, Pyrus, Prunus, Raphanus, Ricinus, Senecio, Sinomenium, Stephania, Sinapis, Solanum, Theobroma, Trifolium, Trigonella, Vicia, Vinca, Vilis, и Vigna; и родов Allium, Andropogon, Aragrostis, Asparagus, Avena, Cynodon, Elaeis, Festuca, Festulolium, Heterocallis, Hordeum, Lemna, Lolium, Musa, Oryza, Panicum, Pannesetum, Phleum, Poa, Secale, Sorghum, Triticum, Zea, Abies, Cunninghamia, Ephedra, Picea, Pinus, и Pseudotsuga.The CRISPR/Cas9 systems and methods described herein may be applicable to a broad range of plant species included in the non-limiting list of dicotyledonous, monocotyledonous, or gymnospermous genera listed below: Atropa, Alseodaphne, Anacardium, Arachis, Beilschmiedia, Brassica, Carthamus, Cocculus, Croton, Cucumis, Citrus, Citrullus, Capsicum, Catharanthus, Cocos, Coffea, Cucurbita, Daucus, Duguetia, Eschscholzia, Ficus, Fragaria, Glaucium, Glycine, Gossypium, Helianthus, Hevea, Hyoscyamus, Lactuca, Landolphia, Linum, Litsea, Lycopersicon, Lupinus, Manihot, Majorana, Malus, Medicago, Nicotiana, Olea, Parthenium, Papaver, Persea, Phaseolus, Pistacia, Pisum, Pyrus, Prunus, Raphanus, Ricinus, Senecio, Sinomenium, Stephania, Sinapis, Solanum, Theobroma, Trifolium, Trigonella, Vicia, Vinca, Vilis, and Vigna; and genera Allium, Andropogon, Aragrostis, Asparagus, Avena, Cynodon, Elaeis, Festuca, Festulolium, Heterocallis, Hordeum, Lemna, Lolium, Musa, Oryza, Panicum, Pannesetum, Phleum, Poa, Secale, Sorghum, Triticum, Zea, Abies, Cunninghamia, Ephedra, Picea, Pinus, and Pseudotsuga.
Системы и способы применения CRISPR/Cas9 могут быть также применимы по отношению к широкому диапазону "водорослей" или "клеток водорослей", в том числе, например, водорослей, выбранных из нескольких эукариотических отделов, в том числе Rhodophyta (красные водоросли), Chlorophyta (зеленые водоросли), Phaeophyta (коричневые водоросли), Bacillariophyta (диатомовые водоросли), Eustigmatophyta и динофлагелляты, а также прокариотическому отделу Cyanobacteria (сине-зеленые водоросли). Термин "водоросли" включает, например, водоросли, выбранные из Amphora, Anabaena, Anikstrodesmis, Botryococcus, Chaetoceros, Chlamydomonas, Chlorella, Chlorococcum, Cyclotella, Cylindrotheca, Dunaliella, Emiliana, Euglena, Hematococcus, Isochrysis, Monochrysis, Monoraphidium, Nannochloris, Nannnochloropsis, Navicula, Nephrochloris, Nephroselmis, Nitzschia, Nodularia, Nostoc, Oochromonas, Oocystis, Oscillartoria, Pavlova, Phaeodactylum, Playtmonas, Pleurochrysis, Porhyra, Pseudoanabaena, Pyramimonas, Stichococcus, Synechococcus, Synechocystis, Tetraselmis, Thalassiosira и Trichodesmium.The CRISPR/Cas9 systems and methods may also be applicable to a wide range of "algae" or "algal cells", including, for example, algae selected from several eukaryotic phyla, including Rhodophyta (red algae), Chlorophyta (green algae), Phaeophyta (brown algae), Bacillariophyta (diatoms), Eustigmatophyta, and dinoflagellates, as well as the prokaryotic phylum Cyanobacteria (blue-green algae). The term "algae" includes, for example, algae selected from Amphora, Anabaena, Anikstrodesmis, Botryococcus, Chaetoceros, Chlamydomonas, Chlorella, Chlorococcum, Cyclotella, Cylindrotheca, Dunaliella, Emiliana, Euglena, Hematococcus, Isochrysis, Monochrysis, Monoraphidium, Nannochloris, Nannnochloropsis, Navicula, Nephrochloris, Nephroselmis, Nitzschia, Nodularia, Nostoc, Oochromonas, Oocystis, Oscillartoria, Pavlova, Phaeodactylum, Playtmonas, Pleurochrysis, Porhyra, Pseudoanabaena, Pyramimonas, Stichococcus, Synechococcus, Synechocystis, Tetraselmis, Thalassiosira and Trichodesmium.
Часть растения, т.е., "растительная ткань", может быть обработана в соответствии со способами по настоящему изобретению с целью получения улучшенного растения. Растительная ткань также охватывает растительные клетки. Термин "растительная клетка" как используется в данном документе, относится к отдельным единицам живого растения, как в интактном целом растении, так и в выделенной форме, выращенной в in vitro культурах тканей, на среде или агаре, в суспензии в среде для выращивания или буфере или в виде части более высокоорганизованных единиц, таких как, например, растительная ткань, орган растения или целое растение.A part of a plant, i.e., "plant tissue", can be processed according to the methods of the present invention to obtain an improved plant. Plant tissue also includes plant cells. The term "plant cell" as used herein refers to individual units of a living plant, whether in the intact whole plant or in isolated form grown in in vitro tissue cultures, on media or agar, in suspension in a growth medium or buffer, or as part of more highly organized units such as, for example, plant tissue, a plant organ, or a whole plant.
"Протопласт" относится к растительной клетке, у которой защитная клеточная стенка была полностью или частично удалена с помощью, например, механических или ферментативных способов, в результате чего образовалась интактная биохимическая компетентная единица живого растения, которая может сформировать заново свою клеточную стенку, пролиферировать и регенерировать в целое растение в соответствующих условиях роста."Protoplast" refers to a plant cell from which the protective cell wall has been completely or partially removed by, for example, mechanical or enzymatic means, resulting in an intact biochemically competent living plant unit that can reform its cell wall, proliferate, and regenerate into a whole plant under appropriate growth conditions.
Термин "трансформация" в широком смысле относится к процессу, с помощью которого растение-хозяин генетически модифицируют введением ДНК с помощью Agrobacteria или ряда химических или физических способов. Используемый в данном документе термин "растение-хозяин" относится к любым клеткам, тканям, органам или потомству растений. Многие подходящие растительные ткани или растительные клетки могут быть трансформированы и включают без ограничения протопласты, соматические эмбрионы, пыльцу, листья, сеянцы, стебли, каллус, столоны, микроклубни и побеги. Растительная ткань также относится к любому клону такого растения, семенам, потомству, побегам, полученным половым или бесполым путем, и потомкам любых из них, таких как черенки или семена.The term "transformation" refers broadly to the process by which a host plant is genetically modified by the introduction of DNA by Agrobacteria or by a variety of chemical or physical means. As used herein, the term "host plant" refers to any plant cells, tissues, organs, or progeny. Many suitable plant tissues or plant cells can be transformed and include, but are not limited to, protoplasts, somatic embryos, pollen, leaves, seedlings, stems, callus, stolons, microtubers, and shoots. Plant tissue also refers to any clone of such a plant, seeds, progeny, propagules, whether sexually or asexually produced, and the descendants of any of these, such as cuttings or seeds.
Термин "трансформированный", как используется в данном документе, относится к клетке, ткани, органу или организму, в которые была введена чужеродная молекула ДНК, такая как конструкция. Введенная молекула ДНК может быть интегрирована в геномную ДНК реципиентной клетки, ткани, органа или организма таким образом, что введенная молекула ДНК передается последующим потокам. В этих вариантах осуществления "трансформированная" или "трансгенная" клетка или растение могут также включать потомство клетки или растения и потомство, полученное в результате программы селекции с применением такой трансформированной клетки в качестве родителя в скрещивании, и характеризующееся измененным фенотипом, полученным в результате присутствия введенной молекулы ДНК. Предпочтительно трансгенное растение является фертильным и способно передавать введенную ДНК потомству в результате полового размножения.The term "transformed" as used herein refers to a cell, tissue, organ or organism into which a foreign DNA molecule, such as a construct, has been introduced. The introduced DNA molecule may be integrated into the genomic DNA of the recipient cell, tissue, organ or organism such that the introduced DNA molecule is passed on to subsequent streams. In these embodiments, a "transformed" or "transgenic" cell or plant may also include progeny of the cell or plant and progeny resulting from a breeding program using such a transformed cell as a parent in a cross and characterized by an altered phenotype resulting from the presence of the introduced DNA molecule. Preferably, the transgenic plant is fertile and capable of passing on the introduced DNA to progeny through sexual reproduction.
Термин "потомство", такое как потомство трансгенного растения, представляет собой потомство, рожденное, произведенное или полученное из растения или трансгенного растения. Введенная молекула ДНК может также быть временно введенной в реципиентную клетку таким образом, что введенная молекула ДНК не наследуется последующим потомством, и, таким образом, она не считается "трансгенной". Соответственно, как используется в данном документе, "нетрансгенное растение" или растительная клетка представляют собой растение, которое не содержит чужеродную ДНК, стабильно интегрированную в его геном.The term "progeny," such as progeny of a transgenic plant, is progeny born, produced, or obtained from a plant or transgenic plant. The introduced DNA molecule may also be temporarily introduced into a recipient cell in such a way that the introduced DNA molecule is not inherited by subsequent progeny and is thus not considered "transgenic." Accordingly, as used herein, a "non-transgenic plant" or plant cell is a plant that does not contain foreign DNA stably integrated into its genome.
Термин "растительный промотор", как используется в данном документе, представляет собой промотор, способный инициировать транскрипцию в растительных клетках, вне зависимости от того, происходит ли он из растительной клетки. Иллюстративные подходящие растительные промоторы включают без ограничения таковые, которые получены из растений, вирусов растений и бактерий, таких как агробактерии или ризобактерии, которые содержат гены, экспрессируемые в растительных клетках.The term "plant promoter" as used herein is a promoter capable of initiating transcription in plant cells, whether or not it is derived from a plant cell. Exemplary suitable plant promoters include, but are not limited to, those derived from plants, plant viruses, and bacteria such as Agrobacterium or Rhizobacterium that contain genes expressed in plant cells.
Используемое в данном документе выражение "грибная клетка" относится к любому типу эукариотической клетки в царстве грибов. Отделы в царстве грибов включают Ascomycota, Basidiomycota, Blastocladiomycota, Chytridiomycota, Glomeromycota, Microsporidia и Neocallimastigomycota. Грибные клетки могут включать дрожжи, плесени и нитчатые грибы. В некоторых вариантах осуществления грибная клетка представляет собой клетку дрожжей.As used herein, the term "fungal cell" refers to any type of eukaryotic cell in the kingdom Fungi. Divisions in the kingdom Fungi include Ascomycota, Basidiomycota, Blastocladiomycota, Chytridiomycota, Glomeromycota, Microsporidia, and Neocallimastigomycota. Fungal cells can include yeasts, molds, and filamentous fungi. In some embodiments, the fungal cell is a yeast cell.
Используемый в данном документе термин "клетка дрожжей" относится к любой грибной клетке в пределах отделов Ascomycota и Basidiomycota. Клетки дрожжей могут включать почкующиеся клетки дрожжей, делящиеся клетки дрожжей и плесневые клетки. Не ограничиваясь этими организмами, многие типы дрожжей, используемые в лабораторных и промышленных условиях, являются частью отдела Ascomycota. В некоторых вариантах осуществления клетка дрожжей представляет собой клетку S. cerervisiae, Kluyveromyces marxianus или Issatchenkia orientalis. Другие типы клеток дрожжей могут включать без ограничения Candida spp. (например, Candida albicans), Yarrowia spp. (например, Yarrowia lipolytica), Pichia spp. (например, Pichia pastoris), Kluyveromyces spp. (например, Kluyveromyces lactis и Kluyveromyces marxianus), Neurospora spp. (например, Neurospora crassa), Fusarium spp. (например, Fusarium oxysporum) и Issatchenkia spp. (например, Issatchenkia orientalis, также известный как Pichia kudriavzevii, и Candida acidothermophilum). В некоторых вариантах осуществления грибная клетка представляет собой клетку нитчатого гриба. Используемое в данном документе термин "клетка нитчатого гриба" относится к любому типу грибной клетки, которая растет за счет филаментов, т.е. гифов или мицелия. Примеры клеток нитчатых грибов включают без ограничения Aspergillus spp. (например, Aspergillus niger), Trichoderma spp. (например, Trichoderma reesei), Rhizopus spp. (например, Rhizopus oryzae) и Mortierella spp. (например, Mortierella isabellina).As used herein, the term "yeast cell" refers to any fungal cell within the phyla Ascomycota and Basidiomycota. Yeast cells may include budding yeast cells, dividing yeast cells, and mold cells. Without being limited to these organisms, many types of yeast used in laboratory and industrial settings are part of the phylum Ascomycota. In some embodiments, the yeast cell is a S. cerervisiae, Kluyveromyces marxianus, or Issatchenkia orientalis cell. Other types of yeast cells may include, but are not limited to, Candida spp. (e.g., Candida albicans), Yarrowia spp. (e.g., Yarrowia lipolytica), Pichia spp. (e.g., Pichia pastoris), Kluyveromyces spp. (e.g., Kluyveromyces lactis and Kluyveromyces marxianus), Neurospora spp. (e.g., Neurospora crassa), Fusarium spp. (e.g., Fusarium oxysporum), and Issatchenkia spp. (e.g., Issatchenkia orientalis, also known as Pichia kudriavzevii, and Candida acidothermophilum). In some embodiments, the fungal cell is a filamentous fungal cell. As used herein, the term "filamentous fungal cell" refers to any type of fungal cell that grows by filaments, i.e., hyphae or mycelium. Examples of filamentous fungal cells include, but are not limited to, Aspergillus spp. (e.g., Aspergillus niger), Trichoderma spp. (e.g., Trichoderma reesei), Rhizopus spp. (e.g., Rhizopus oryzae), and Mortierella spp. (e.g., Mortierella isabellina).
В некоторых вариантах осуществления грибная клетка представляет собой промышленный штамм. Используемое в данном документе выражение "промышленный штамм" относится к любому штамму грибной клетки, используемому в промышленном способе или выделенному из него, например, получении продукта в коммерческом или промышленном масштабе. Промышленный штамм может относиться к виду гриба, который обычно используют в промышленном способе, или он может относиться к изоляту вида гриба, который может быть также использован для некоммерческих целей (например, лабораторное исследование). Примеры промышленных способов могут включать сбраживание (например, при получении пищевых продуктов питания и питьевых продуктов), дистилляцию, получение биотоплива, получение соединения и получение полипептида. Примеры промышленных штаммов могут включать без ограничения JAY270 и ATCC4124.In some embodiments, the fungal cell is an industrial strain. As used herein, the term "industrial strain" refers to any strain of a fungal cell used in or isolated from an industrial process, such as producing a product on a commercial or industrial scale. An industrial strain may refer to a fungal species that is commonly used in an industrial process, or it may refer to an isolate of a fungal species that may also be used for non-commercial purposes (e.g., laboratory testing). Examples of industrial processes may include fermentation (e.g., in the production of food and beverage products), distillation, biofuel production, compound production, and polypeptide production. Examples of industrial strains may include, but are not limited to, JAY270 and ATCC4124.
В некоторых вариантах осуществления грибная клетка представляет собой полиплоидную клетку. Используемое в данном документе выражение "полиплоидная" клетка может относиться к любой клетке, геном которой присутствует в более чем одной копии. Полиплоидная клетка может относиться к типу клетки, которая встречается в природе в полиплоидном состоянии или может относиться к клетке, которая была индуцирована с целью существования в полиплоидном состоянии (например, в результате специфичной регуляции, изменения, инактивации, активации или модификации мейоза, цитокинеза или репликации ДНК). Полиплоидная клетка может относиться к клетке, весь геном которой является полиплоидным, или может относиться к клетке, которая является полиплоидной в определенном представляющем интерес локусе генома. Не желая ограничиваться теорией, считается, что избыток направляющей РНК может чаще представлять собой компонент ограничения скорости при конструировании геномов полиплоидных клеток, а не гаплоидных клеток, и, таким образом, способы применения системы CRISPR/Cas9, описанные в данном документе, могут характеризоваться преимуществом применения определенного типа грибной клетки.In some embodiments, the fungal cell is a polyploid cell. As used herein, the term "polyploid" cell may refer to any cell whose genome is present in more than one copy. A polyploid cell may refer to a cell type that occurs naturally in a polyploid state or may refer to a cell that has been induced to exist in a polyploid state (e.g., by specific regulation, alteration, inactivation, activation, or modification of meiosis, cytokinesis, or DNA replication). A polyploid cell may refer to a cell whose entire genome is polyploid, or may refer to a cell that is polyploid at a particular genomic locus of interest. Without wishing to be bound by theory, it is believed that excess guide RNA may more often be a rate-limiting component when engineering the genomes of polyploid cells than haploid cells, and thus the CRISPR/Cas9 system applications described herein may benefit from using a particular type of fungal cell.
В некоторых вариантах осуществления грибная клетка представляет собой диплоидную клетку. Используемое в данном документе выражение "диплоидная" клетка может относиться к любой клетке, геном которой присутствует в двух копиях. Диплоидная клетка может относиться к типу клетки, которая встречается в природе в диплоидном состоянии, или может относиться к клетке, которая была индуцирована с целью существования в диплоидном состоянии (например, в результате специфичной регуляции, изменения, инактивации, активации или модификации мейоза, цитокинеза или репликации ДНК). Например, штамм S228C S. cerevisiae может поддерживаться в гаплоидном или диплоидном состоянии. Диплоидная клетка может относиться к клетке, весь геном которой является диплоидным, или может относиться к клетке, которая является диплоидной в определенном представляющем интерес локусе генома. В некоторых вариантах осуществления грибная клетка представляет собой гаплоидную клетку. Используемое в данном документе выражение "гаплоидная" клетка может относиться к любой клетке, геном которой присутствует в одной копии. Гаплоидная клетка может относиться к типу клетки, которая встречается в природе в гаплоидном состоянии или может относиться к клетке, которая была индуцирована с целью существования в гаплоидном состоянии (например, в результате специфичной регуляции, изменения, инактивации, активации или модификации мейоза, цитокинеза или репликации ДНК). Например, штамм S228C S. cerevisiae может поддерживаться в гаплоидном или диплоидном состоянии. Гаплоидная клетка может относиться к клетке, весь геном которой является гаплоидным, или может относиться к клетке, которая является гаплоидной в определенном представляющем интерес локусе генома.In some embodiments, the fungal cell is a diploid cell. As used herein, a "diploid" cell may refer to any cell whose genome is present in two copies. A diploid cell may refer to a cell type that occurs naturally in the diploid state, or may refer to a cell that has been induced to exist in a diploid state (e.g., by specific regulation, alteration, inactivation, activation, or modification of meiosis, cytokinesis, or DNA replication). For example, S. cerevisiae strain S228C may be maintained in a haploid or diploid state. A diploid cell may refer to a cell whose entire genome is diploid, or may refer to a cell that is diploid at a particular genomic locus of interest. In some embodiments, the fungal cell is a haploid cell. As used herein, a "haploid" cell may refer to any cell whose genome is present in a single copy. A haploid cell may refer to a cell type that occurs naturally in the haploid state or may refer to a cell that has been induced to exist in a haploid state (e.g., by specific regulation, alteration, inactivation, activation, or modification of meiosis, cytokinesis, or DNA replication). For example, S. cerevisiae strain S228C may be maintained in a haploid or diploid state. A haploid cell may refer to a cell whose entire genome is haploid or may refer to a cell that is haploid at a particular genomic locus of interest.
Используемое в данном документе выражение "дрожжевой вектор экспрессии" относится к нуклеиновой кислоте, которая содержит одну или несколько последовательностей, кодирующих РНК и/или полипептид, и может дополнительно содержать любые требуемые элементы, которые контролируют экспрессию нуклеиновой кислоты(нуклеиновых кислот), а также любые элементы, которые обеспечивают репликацию и поддержание вектора экспрессии в клетке дрожжей. Многие подходящие дрожжевые векторы экспрессии и их характеристики известны в данной области; например, различные векторы и методики проиллюстрированы в Yeast Protocols, 2nd edition, Xiao, W., ed. (Humana Press, New York, 2007) и Buckholz, R.G. and Gleeson, M.A. (1991) Biotechnology (NY) 9(11): 1067-72. Дрожжевые векторы могут содержать без ограничения центромерную (CEN) последовательность, автономную последовательность репликации (ARS), промотор, такой как промотор РНК-полимеразы III, функционально связанный с представляющими интерес последовательностью или геном, терминатором, таким как терминатор РНК-полимеразы III, точкой начала репликации и маркерным геном (например, селектируемыми маркерами ауксотрофов, селектируемыми маркерами к антибиотикам или другими селектируемыми маркерами). Примеры векторов экспрессии для применения в дрожжах могут включать плазмиды, искусственные хромосомы дрожжей, 2 мкм-плазмиды, дрожжевые интегративные плазмиды, дрожжевые репликативные плазмиды, челночные векторы и эписомальные плазмиды.As used herein, the term "yeast expression vector" refers to a nucleic acid that contains one or more sequences encoding an RNA and/or a polypeptide, and may further contain any desired elements that control expression of the nucleic acid(s), as well as any elements that ensure replication and maintenance of the expression vector in a yeast cell. Many suitable yeast expression vectors and their characteristics are known in the art; for example, various vectors and techniques are illustrated in Yeast Protocols, 2nd edition, Xiao, W., ed. (Humana Press, New York, 2007) and Buckholz, R.G. and Gleeson, M.A. (1991) Biotechnology (NY) 9(11): 1067-72. Yeast vectors may comprise, but are not limited to, a centromeric (CEN) sequence, an autonomous replication sequence (ARS), a promoter such as the RNA polymerase III promoter operably linked to a sequence or gene of interest, a terminator such as the RNA polymerase III terminator, an origin of replication, and a marker gene (e.g., selectable auxotroph markers, selectable antibiotic markers, or other selectable markers). Examples of expression vectors for use in yeast may include plasmids, yeast artificial chromosomes, 2 μm plasmids, yeast integrative plasmids, yeast replicative plasmids, shuttle vectors, and episomal plasmids.
Стабильная интеграция компонентов системы CRISPR/Cas9 в геном растений и растительных клетокStable integration of CRISPR/Cas9 system components into the genome of plants and plant cells
В конкретных вариантах осуществления предусмотрено, что полинуклеотиды, кодирующие компоненты системы CRISPR/Cas9, вводят с целью стабильной интеграции в геном растительной клетки. В этих вариантах осуществления разработка вектора трансформации или системы экспрессии может быть откорректирована в зависимости от того, когда, где и при каких условиях chi/sgRNA и/или ген Cas9 экспрессируются.In certain embodiments, it is envisaged that polynucleotides encoding components of the CRISPR/Cas9 system are introduced for the purpose of stable integration into the genome of a plant cell. In these embodiments, the design of the transformation vector or expression system can be adjusted depending on when, where, and under what conditions the chi/sgRNA and/or Cas9 gene are expressed.
В конкретных вариантах осуществления предусмотрено стабильное введение компонентов системы CRISPR/Cas9 в геномную ДНК растительной клетки. Дополнительно или альтернативно предусмотрено введение компонентов системы CRISPR/Cas9 с целью стабильной интеграции в ДНК органеллы растения, такой как без ограничения пластида, митохондрия или хлоропласт.In specific embodiments, stable introduction of components of the CRISPR/Cas9 system into the genomic DNA of a plant cell is provided. Additionally or alternatively, introduction of components of the CRISPR/Cas9 system for the purpose of stable integration into the DNA of a plant organelle, such as, but not limited to, a plastid, mitochondrion or chloroplast, is provided.
Система экспрессии для стабильной интеграции в геном растительной клетки может содержать один или несколько из следующих элементов: промоторный элемент, который может быть использован для экспрессии РНК и/или фермента Cas9 в растительной клетке; 5' нетранслируемая область для усиления экспрессии; интронный элемент для дополнительного усиления экспрессии в определенных клетках, таких как клетки однодольных растений; сайт множественного клонирования для обеспечения удобных сайтов рестрикции для вставки последовательностей chi/sgRNA и/или гена Cas9 и другие требуемые элементы; и 3'-нетранслируемая область для обеспечения эффективной терминации экспрессируемого транскрипта.An expression system for stable integration into a plant cell genome may comprise one or more of the following elements: a promoter element that can be used to express the RNA and/or Cas9 enzyme in the plant cell; a 5' untranslated region to enhance expression; an intron element to further enhance expression in certain cells, such as monocot cells; a multiple cloning site to provide convenient restriction sites for insertion of chi/sgRNA sequences and/or the Cas9 gene and other desired elements; and a 3' untranslated region to provide efficient termination of the expressed transcript.
Элементы системы экспрессии могут находиться в одной или нескольких конструкциях экспрессии, которые являются кольцевыми, такими как плазмида или вектор трансформации, или некольцевыми, такими как линейная двухнитевая ДНК.The elements of the expression system may be in one or more expression constructs, which are circular, such as a plasmid or transformation vector, or non-circular, such as linear double-stranded DNA.
В конкретных вариантах осуществления система экспрессии CRISPR-Cas9 содержит по меньшей мереIn particular embodiments, the CRISPR-Cas9 expression system comprises at least
нуклеотидную последовательность, кодирующую направляющую последовательность или chi/sgRNA, которая гибридизируется с целевой последовательностью в растении, и где направляющая последовательность или chi/sgRNA содержит направляющую последовательность и последовательность прямого повтора, иa nucleotide sequence encoding a guide sequence or chi/sgRNA that hybridizes to a target sequence in a plant, and wherein the guide sequence or chi/sgRNA comprises a guide sequence and a direct repeat sequence, and
нуклеотидную последовательность, кодирующую белок Cas9,the nucleotide sequence encoding the Cas9 protein,
где компоненты (a) или (b) расположены в одной и той же или различных конструкциях, и где различные нуклеотидные последовательности могут находиться под контролем одного и того же или различных регуляторных элементов, функционирующих в клетке.where components (a) or (b) are located in the same or different constructs, and where different nucleotide sequences may be under the control of the same or different regulatory elements functioning in the cell.
Конструкция(конструкции) ДНК, содержащая(содержащие) компоненты системы CRISPR/Cas9 и при необходимости матричную последовательность, могут быть введены в геном растения, части растения или растительной клетки с помощью ряда стандартных методик. Этот процесс, как правило, предусматривает стадии отбора подходящей клетки-хозяина или ткани-хозяина, введения конструкции(конструкций) в клетку-хозяина или ткань-хозяина и восстановление из них растительных клеток или растений.The DNA construct(s) containing the components of the CRISPR/Cas9 system and, if necessary, the template sequence, can be introduced into the genome of a plant, plant part, or plant cell using a variety of standard techniques. This process typically involves the steps of selecting a suitable host cell or host tissue, introducing the construct(s) into the host cell or host tissue, and reconstituting them into plant cells or plants.
В конкретных вариантах осуществления конструкция ДНК может быть введена в растительную клетку с помощью методик, таких как без ограничения электропорация, микроинъекция, введение с помощью аэрозольного пучкового инжектора протопластов растительных клеток, или конструкции ДНК могут быть введены непосредственно в растительную ткань с помощью биолистических способов, таких как бомбардировка частицами с ДНК (см. также Fu et al., Transgenic Res. 2000 Feb;9(1):11-9). Основой бомбардировки частицами является ускорение частиц, покрытых представляющим интерес геном/представляющими интерес генами, в клетки, что приводит к проникновению частиц в протоплазму и, как правило, стабильной интеграции в геном. (См., например, Klein et al, Nature (1987), Klein et ah, Bio/Technology (1992), Casas et ah, Proc. Natl. Acad. Sci. USA (1993).).In particular embodiments, the DNA construct can be introduced into the plant cell by techniques such as, but not limited to, electroporation, microinjection, aerosol beam injector injection of plant cell protoplasts, or the DNA constructs can be introduced directly into the plant tissue by biolistic methods such as DNA particle bombardment (see also Fu et al., Transgenic Res. 2000 Feb;9(1):11-9). Particle bombardment is based on the acceleration of particles coated with the gene(s) of interest into cells, resulting in penetration of the particles into the cytoplasm and, typically, stable integration into the genome. (See, e.g., Klein et al, Nature (1987), Klein et ah, Bio/Technology (1992), Casas et ah, Proc. Natl. Acad. Sci. USA (1993).).
В конкретных вариантах осуществления конструкции ДНК, содержащие компоненты системы CRISPR/Cas9, могут быть введены в растение с помощью опосредованной Agrobacterium трансформации. Конструкции ДНК могут быть комбинированы с подходящими фланкирующими областями T-ДНК и введены в стандартный вектор-хозяин Agrobacterium tumefaciens. Чужеродная ДНК может быть включена в геном растений путем инфицирования растений или инкубирования протопластов растений бактериями Agrobacterium, содержащими одну или несколько Ti (опухоль-индуцирующих) плазмид. (См., например, Fraley et al., (1985), Rogers et al., (1987) и патент США № 5 563 055).In particular embodiments, DNA constructs containing components of the CRISPR/Cas9 system can be introduced into a plant by Agrobacterium-mediated transformation. The DNA constructs can be combined with suitable flanking regions of T-DNA and introduced into a standard Agrobacterium tumefaciens host vector. Foreign DNA can be incorporated into the plant genome by infecting the plants or incubating plant protoplasts with Agrobacterium bacteria containing one or more Ti (tumor-inducing) plasmids. (See, e.g., Fraley et al., (1985), Rogers et al., (1987), and U.S. Patent No. 5,563,055).
Растительные промоторыPlant promoters
С целью обеспечения подходящей экспрессии в растительной клетке компоненты системы CRISPR/Cas9, описанные в данном документе, как правило, помещают под контроль растительного промотора, т.е. промотора, функционирующего в растительных клетках. Предусмотрено применение различных типов промоторов.In order to ensure appropriate expression in a plant cell, the components of the CRISPR/Cas9 system described herein are typically placed under the control of a plant promoter, i.e., a promoter that functions in plant cells. The use of different types of promoters is envisaged.
Конститутивный растительный промотор представляет собой промотор, который способен экспрессировать открытую рамку считывания (ORF), который контролирует ее во всех или почти во всех растительных тканях во время всех или почти всех стадий развития растения (так называемая "конститутивная экспрессия"). Одним неограничивающим примером конститутивного промотора является промотор вируса мозаики цветной капусты 35S. "Регуляторный промотор" относится к промоторам, которые управляют экспрессией генов не конститутивно, а путем временной и/или пространственной регуляции, и включает тканеспецифичные, тканепредпочтительные и индуцируемые промоторы. Различные промоторы могут управлять экспрессией гена в различных тканях или типах клеток, или на различных стадиях развития, или в ответ на различные средовые факторы. В конкретных вариантах осуществления один или несколько из компонентов CRISPR/Cas9 экспрессируются под контролем конститутивного промотора, такого как промотор вируса мозаики цветной капусты 35S, тканеспецифичные промоторы могут быть использованы для нацеливания усиленной экспрессии в определенных типах клеток в конкретной растительной ткани, например, сосудистых тканях или определенных клетках семени. Примеры конкретных промоторов для применения в системе CRISPR/Cas9 встречаются в Kawamata et al., (1997) Plant Cell Physiol 38:792-803; Yamamoto et al., (1997) Plant J 12:255-65; Hire et al, (1992) Plant Mol Biol 20:207-18, Kuster et al, (1995) Plant Mol Biol 29:759-72, и Capana et al., (1994) Plant Mol Biol 25:681 -91.A constitutive plant promoter is one that is capable of expressing the open reading frame (ORF) that controls it in all or nearly all plant tissues during all or nearly all stages of plant development (called "constitutive expression"). One non-limiting example of a constitutive promoter is the cauliflower mosaic virus 35S promoter. A "regulatory promoter" refers to promoters that drive gene expression not constitutively but by temporal and/or spatial regulation, and includes tissue-specific, tissue-preferred, and inducible promoters. Different promoters may drive gene expression in different tissues or cell types, or at different developmental stages, or in response to different environmental factors. In particular embodiments, one or more of the CRISPR/Cas9 components are expressed under the control of a constitutive promoter, such as the cauliflower mosaic virus 35S promoter. Tissue-specific promoters can be used to target enhanced expression in specific cell types in a particular plant tissue, such as vascular tissues or specific seed cells. Examples of specific promoters for use in the CRISPR/Cas9 system are found in Kawamata et al., (1997) Plant Cell Physiol 38:792-803; Yamamoto et al., (1997) Plant J 12:255-65; Hire et al, (1992) Plant Mol Biol 20:207-18, Kuster et al, (1995) Plant Mol Biol 29:759-72, and Capana et al., (1994) Plant Mol Biol 25:681-91.
Примеры промоторов, которые являются индуцируемыми и которые обеспечивают пространственно-временной контроль редактирования генов или экспрессии генов, могут использовать определенную форму энергии. Форма энергии может включать без ограничения звуковую энергию, электромагнитную энергию, химическую энергию и/или тепловую энергию. Примеры индуцируемых систем включают индуцируемые тетрациклином промоторы (Tet-On или Tet-Off), двухгибридные системы активации транскрипции с использованием малых молекул (FKBP, ABA и т.д.) или индуцируемые светом системы (фитохром, домены LOV или криптохром), такие как индуцируемый светом транскрипционный эффектор (LITE), который управляет изменениями транскрипционной активности специфичным к последовательности образом. Компоненты индуцируемой светом системы могут включать фермент CRISPR/Cas9, чувствительный к свету гетеродимер цитохрома (например, из Arabidopsis thaliana) и домен активации/репрессии транскрипции. Дополнительные примеры индуцируемых ДНК-связывающих белков и способы их применения представлены в US 61/736465 и US 61/721283, которые включены в данный документ посредством ссылки во всей полноте.Examples of promoters that are inducible and that provide spatiotemporal control of gene editing or gene expression may utilize some form of energy. The form of energy may include, but is not limited to, sound energy, electromagnetic energy, chemical energy, and/or thermal energy. Examples of inducible systems include tetracycline-inducible promoters (Tet-On or Tet-Off), small molecule two-hybrid transcriptional activation systems (FKBP, ABA, etc.), or light-inducible systems (phytochrome, LOV, or cryptochrome domains) such as the light-inducible transcriptional effector (LITE), which drives changes in transcriptional activity in a sequence-specific manner. Components of a light-inducible system may include a CRISPR/Cas9 enzyme, a light-sensitive cytochrome heterodimer (e.g., from Arabidopsis thaliana), and a transcriptional activation/repression domain. Additional examples of inducible DNA binding proteins and methods of using them are provided in US 61/736,465 and US 61/721,283, which are incorporated herein by reference in their entireties.
В конкретных вариантах осуществления транзиентная или индуцируемая экспрессия может быть достигнута, например, с помощью регулируемых химическим путем промоторов, т.е. в случае, когда применение экзогенного химического соединения индуцирует экспрессию генов. Модулирование экспрессии генов также может быть получено с помощью репрессируемого химическим путем промотора, где применение химического соединения репрессирует экспрессию генов. Индуцированные химическим путем промоторы включают без ограничения промотор маиса ln2-2, активируемый антидотами гербицидов на основе бензолсульфамидов (De Veylder et al., (1997) Plant Cell Physiol 38:568-77), промотор маиса GST (GST-ll-27, WO93/01294), активируемый гидрофобными электрофильными соединениями, используемыми в качестве предвсходовых гербицидов, и промотор табака PR-1 (Ono et al., (2004) Biosci Biotechnol Biochem 68:803-7), активируемый салициловой кислотой. Промоторы, которые регулируются антибиотиками, такими как индуцируемые тетрациклином и репрессируемые тетрациклином промоторы (Gatz et al., (1991 ) Mol Gen Genet 227:229-37; патенты США №№ 5814618 и 5789156), также могут быть использованы в данном документе.In particular embodiments, transient or inducible expression can be achieved, for example, by chemically regulated promoters, i.e., in the case where the application of an exogenous chemical compound induces gene expression. Modulation of gene expression can also be obtained by a chemically repressible promoter, where the application of a chemical compound represses gene expression. Chemically induced promoters include, but are not limited to, the maize ln2-2 promoter, which is activated by benzenesulfonamide herbicide safeners (De Veylder et al., (1997) Plant Cell Physiol 38:568-77), the maize GST promoter (GST-ll-27, WO93/01294), which is activated by hydrophobic electrophilic compounds used as pre-emergence herbicides, and the tobacco PR-1 promoter (Ono et al., (2004) Biosci Biotechnol Biochem 68:803-7), which is activated by salicylic acid. Promoters that are regulated by antibiotics, such as tetracycline-inducible and tetracycline-repressible promoters (Gatz et al., (1991) Mol Gen Genet 227:229-37; U.S. Patent Nos. 5,814,618 and 5,789,156), may also be used herein.
Транслокация и/или экспрессия в конкретных органеллах растенийTranslocation and/or expression in specific plant organelles
Система экспрессии может содержать элементы для транслокации и/или экспрессии в конкретной органелле растения.The expression system may contain elements for translocation and/or expression in a specific plant organelle.
Нацеливание на хлоропластыTargeting chloroplasts
В конкретных вариантах осуществления предусмотрено, что система CRISPR/Cas9 используется для специфичной модификации генов хлоропластов или для обеспечения экспрессии в хлоропласте. С этой целью используются способы трансформации хлоропластов или компартментализации компонентов системы CRISPR/Cas9 в хлоропласте. Например, введение генетических модификаций в геном пластиды может уменьшить проблемы биобезопасности, такие как поток генов через пыльцу.In particular embodiments, it is envisaged that the CRISPR/Cas9 system is used to specifically modify chloroplast genes or to ensure expression in a chloroplast. For this purpose, methods of transforming chloroplasts or compartmentalizing components of the CRISPR/Cas9 system in a chloroplast are used. For example, introducing genetic modifications into the plastid genome can reduce biosecurity issues such as gene flow through pollen.
Способы трансформации хлоропластов известны в данной области и включают бомбардировку частицами, обработку PEG и микроинъекцию. Кроме того, способы, включающие транслокацию кассет для трансформации из ядерного генома в пластиду, могут быть использованы, как описано в WO2010061186.Methods for transforming chloroplasts are known in the art and include particle bombardment, PEG treatment and microinjection. In addition, methods involving translocation of transformation cassettes from the nuclear genome to the plastid can be used as described in WO2010061186.
Альтернативно предусмотрено нацеливание одного или нескольких компонентов системы CRISPR/Cas9 на хлоропласт растения. Это достигается включением в конструкцию экспрессии последовательности, кодирующей транзитный пептид хлоропласта (CTP) или транзитный пептид пластиды, функционально связанный с 5'-областью последовательности, кодирующей белок Cas9. CTP удаляется на этапе процессинга во время транслокации в хлоропласт. Нацеливание на хлоропласты экспрессируемых белков хорошо известно специалисту в данной области (см., например, Protein Transport into Chloroplasts, 2010, Annual Review of Plant Biology,Vol. 61: 157-180). В таких вариантах осуществления также является желательным нацеливание на chi/sgRNA хлоропласта растения. Способы и конструкции, которые могут быть использованы для транслокации chi/sgRNA в хлоропласт с помощью последовательности локализации в хлоропласте описаны, например, в US 20040142476, включенном в данный документ посредством ссылки. Такие вариации конструкций могут быть включены в системы экспрессии по настоящему изобретению для эффективной транслокации Cas9-chi/sgRNA.Alternatively, it is envisaged to target one or more components of the CRISPR/Cas9 system to the plant chloroplast. This is achieved by including in the expression construct a sequence encoding a chloroplast transit peptide (CTP) or a plastid transit peptide operably linked to the 5' region of the Cas9 protein encoding sequence. The CTP is removed in a processing step during translocation into the chloroplast. Targeting of expressed proteins to chloroplasts is well known to those skilled in the art (see, e.g., Protein Transport into Chloroplasts, 2010, Annual Review of Plant Biology, Vol. 61: 157-180). In such embodiments, targeting of chi/sgRNA to the plant chloroplast is also desirable. Methods and constructs that can be used to translocate chi/sgRNA into the chloroplast using a chloroplast localization sequence are described, for example, in US 20040142476, incorporated herein by reference. Such variations of constructs can be incorporated into the expression systems of the present invention for efficient translocation of Cas9-chi/sgRNA.
Введение полинуклеотидов, кодирующих систему CRISPR-Cas9, в клетки водорослейIntroduction of polynucleotides encoding the CRISPR-Cas9 system into algal cells
Трансгенные водоросли (или другие растения, такие как рапс) могут быть особенно полезными в производстве растительных масел или таких видов биотоплива, как, например, спирты (особенно метанол и этанол), или других продуктов. Они могут быть сконструированы для синтеза или сверхсинтеза масла или спиртов на высоких уровнях для применения в масложировой или биотопливной промышленности.Transgenic algae (or other plants such as rapeseed) may be particularly useful in the production of vegetable oils or biofuels such as alcohols (especially methanol and ethanol) or other products. They may be engineered to synthesize or oversynthesize oils or alcohols at high levels for use in the oil and fat or biofuel industries.
В US 8945839 описан способ конструирования микроводорослей (виды клеток Chlamydomonas reinhardtii) с помощью Cas9. Аналогично система CRISPR/Cas9, описанная в данном документе, может быть применима по отношению к виду Chlamydomonas и другим водорослям. В конкретных вариантах осуществления Cas9 и chi/sgRNA вводят в синтезирующие водоросли с помощью вектора, который экспрессирует Cas9 под контролем конститутивного промотора, такого как Hsp70A-Rbc S2, или промотора бета 2-тубулина. Chi/sgRNA необязательно доставляют с помощью вектора, содержащего промотор T7. Альтернативно мРНК Cas9 и in vitro транскрибируемая chi/sgRNA могут быть доставлены в клетки водорослей. Протоколы электропорации доступны специалисту в данной области, такие как стандартный рекомендованный протокол из набора GeneArt Chlamydomonas Engineering.US 8,945,839 describes a method for engineering microalgae (Chlamydomonas reinhardtii cell species) using Cas9. Likewise, the CRISPR/Cas9 system described herein may be applicable to Chlamydomonas species and other algae. In particular embodiments, Cas9 and chi/sgRNA are introduced into synthesizing algae using a vector that expresses Cas9 under the control of a constitutive promoter, such as Hsp70A-Rbc S2 or the beta 2-tubulin promoter. Chi/sgRNA is optionally delivered using a vector containing a T7 promoter. Alternatively, Cas9 mRNA and in vitro transcribed chi/sgRNA may be delivered into algal cells. Electroporation protocols are available to those skilled in the art, such as the standard recommended protocol from the GeneArt Chlamydomonas Engineering kit.
В конкретных вариантах осуществления эндонуклеаза, используемая в данном документе, представляет собой фермент Split Cas9. Ферменты Split Cas9 предпочтительно используют в водорослях для целевой геномной модификации, как было описано в WO 2015086795. Применение системы Cas9 split является особенно подходящим для индуцируемого способа управления геномом, и в результате этого избегают потенциального токсического эффекта сверхэкспрессии Cas9 в клетке водорослей. В конкретных вариантах осуществления указанные домены Cas9 split (домены RuvC и HNH) могут быть одновременно или последовательно введены в клетку таким образом, что указанный домен(указанные домены) split Cas9 обрабатывает(обрабатывают) целевую последовательность нуклеиновой кислоты в клетке водорослей. Уменьшенный размер split Cas9 по сравнению с Cas9 дикого типа облегчает другие способы доставки системы CRISPR в клетки, такие как применение проникающих пептидов, как описано в данном документе. Этот способ представляет особый интерес для получения генетически модифицированных водорослей.In particular embodiments, the endonuclease used herein is a Split Cas9 enzyme. Split Cas9 enzymes are preferably used in algae for targeted genomic modification, as described in WO 2015086795. The use of the Cas9 split system is particularly suitable for an inducible method of genome manipulation, and as a result, the potential toxic effect of overexpressing Cas9 in an algal cell is avoided. In particular embodiments, said Cas9 split domains (RuvC and HNH domains) can be simultaneously or sequentially introduced into a cell such that said split Cas9 domain(s) processes a target nucleic acid sequence in an algal cell. The reduced size of split Cas9 compared to wild-type Cas9 facilitates other methods of delivering the CRISPR system to cells, such as the use of penetrating peptides, as described herein. This method is of particular interest for the production of genetically modified algae.
Введение полинуклеотидов, кодирующих компоненты Cas9, в клетки дрожжейIntroduction of polynucleotides encoding Cas9 components into yeast cells
В конкретных вариантах осуществления настоящее изобретение относится к применению системы CRISPR/Cas9 для редактирования геномов клеток дрожжей. Способы трансформации клеток дрожжей, которые могут быть использованы для введения полинуклеотидов, кодирующих компоненты системы CRISPR/Cas9, хорошо известны специалисту в данной области и описаны в Kawai et al., 2010, Bioeng Bugs. 2010 Nov-Dec; 1(6): 395-403). Неограничивающие примеры включают трансформацию клеток дрожжей с помощью обработки ацетатом лития (которая может дополнительно включать обработку ДНК-носителем и PEG), бомбардировки или с помощью электропорации.In particular embodiments, the present invention relates to the use of a CRISPR/Cas9 system for editing the genomes of yeast cells. Methods for transforming yeast cells that can be used to introduce polynucleotides encoding components of the CRISPR/Cas9 system are well known to those skilled in the art and are described in Kawai et al., 2010, Bioeng Bugs. 2010 Nov-Dec; 1(6): 395-403). Non-limiting examples include transforming yeast cells by lithium acetate treatment (which may further include treatment with a carrier DNA and PEG), bombardment, or by electroporation.
Транзиентная экспрессия компонентов системы Cas9 CRISP в растениях и растительных клеткахTransient expression of Cas9 CRISP system components in plants and plant cells
В конкретных вариантах осуществления предусмотрено, что chi/sgRNA и/или ген Cas9 транзиентно экспрессируются в растительной клетке. В этих вариантах осуществления система CRISPR/Cas9 может обеспечивать модификацию целевого гена только в случае, когда как chi/sgRNA, так и белок Cas9 присутствуют в клетке, таким образом геномную модификацию можно дополнительно контролировать. Поскольку экспрессия фермента Cas9 является транзиентной, то растения, регенерированные из таких растительных клеток, как правило, не содержат чужеродной ДНК. В конкретных вариантах осуществления фермент Cas9 стабильно экспрессируется растительной клеткой, а направляющая последовательность экспрессируется транзиентно.In particular embodiments, it is envisaged that the chi/sgRNA and/or the Cas9 gene are transiently expressed in the plant cell. In these embodiments, the CRISPR/Cas9 system can provide for modification of the target gene only when both the chi/sgRNA and the Cas9 protein are present in the cell, so that the genomic modification can be further controlled. Since the expression of the Cas9 enzyme is transient, plants regenerated from such plant cells typically do not contain foreign DNA. In particular embodiments, the Cas9 enzyme is stably expressed by the plant cell and the guide sequence is expressed transiently.
В конкретных вариантах осуществления компоненты системы CRISPR/Cas9 могут быть введены в растительные клетки с помощью вектора на основе вируса растений (Scholthof et al. 1996, Annu Rev Phytopathol. 1996;34:299-323). В дополнительных конкретных вариантах осуществления указанный вирусный вектор представляет собой вектор из ДНК-содержащего вируса. Например, геминивирус (например, вирус курчавости капустного листа, вирус желтой карликовости бобов, вирус карликовости пшеницы, вирус курчавости томатного листа, вирус полосы кукурузы, вирус курчавости листа табака или вирус золотистой мозаики томата) или нановирус (например, вирус желтого некроза конских бобов). В других конкретных вариантах осуществления указанный вирусный вектор представляет собой вектор из РНК-содержащего вируса. Например, тобравирус (например, вирус погремковости табака, вирус табачной мозаики), потексвирус (например, Х-вирус картофеля) или хордейвирус (например, вирус штриховой мозаики ячменя). Реплицирующиеся геномы растительных вирусов представляют собой неинтегративные векторы.In specific embodiments, components of the CRISPR/Cas9 system can be introduced into plant cells using a plant virus vector (Scholthof et al. 1996, Annu Rev Phytopathol. 1996;34:299-323). In further specific embodiments, the viral vector is a DNA virus vector. For example, a geminivirus (e.g., cabbage leaf curl virus, bean yellow dwarf virus, wheat dwarf virus, tomato leaf curl virus, maize streak virus, tobacco leaf curl virus, or tomato golden mosaic virus) or a nanovirus (e.g., faba bean yellow necrosis virus). In other specific embodiments, the viral vector is an RNA virus vector. For example, tobravirus (e.g., tobacco rattle virus, tobacco mosaic virus), potexvirus (e.g., potato virus X) or hordeivirus (e.g., barley streak mosaic virus). The replicating genomes of plant viruses are non-integrative vectors.
В конкретных вариантах осуществления вектор, используемый для транзиентной экспрессии конструкций CRISPR/Cas9, представляет собой, например, вектор pEAQ, который подходит для опосредованной Agrobacterium транзиентной экспрессии (Sainsbury F. et al., Plant Biotechnol J. 2009 Sep;7(7):682-93) в протопласте. Точное нацеливание на локализацию в геноме было показано с помощью вектора на основе модифицированного вируса курчавости капустного листа (CaLCuV) с целью экспрессии gRNA в стабильных трансгенных растениях, экспрессирующих фермент CRISPR (Scientific Reports 5, номер статьи: 14926 (2015), doi:10.1038/srep14926).In particular embodiments, the vector used for transient expression of the CRISPR/Cas9 constructs is, for example, the pEAQ vector, which is suitable for Agrobacterium-mediated transient expression (Sainsbury F. et al., Plant Biotechnol J. 2009 Sep;7(7):682-93) in protoplasts. Precise targeting of genomic localization has been demonstrated using a modified cabbage leaf curl virus (CaLCuV) vector for the expression of gRNA in stable transgenic plants expressing the CRISPR enzyme (Scientific Reports 5, article number: 14926 (2015), doi:10.1038/srep14926).
В конкретных вариантах осуществления фрагменты двухнитевой ДНК, кодирующие chi/sgRNA и /или ген Cas9, могут быть транзиентно введены в растительную клетку. В таких вариантах осуществления введенные фрагменты двухнитевой ДНК предусмотрены в достаточном количестве с целью модификации клетки, однако не сохраняются по прошествии предусмотренного периода времени или после одного или нескольких клеточных делений. Способы прямого переноса ДНК в растения известны специалисту в данной области (см., например, Davey et al. Plant Mol Biol. 1989 Sep;13(3):273-85.)In particular embodiments, double-stranded DNA fragments encoding chi/sgRNA and/or a Cas9 gene may be transiently introduced into a plant cell. In such embodiments, the introduced double-stranded DNA fragments are provided in sufficient quantity to modify the cell, but are not retained after a predetermined period of time or after one or more cell divisions. Methods for directly transferring DNA into plants are known to those skilled in the art (see, e.g., Davey et al. Plant Mol Biol. 1989 Sep;13(3):273-85.)
В других вариантах осуществления РНК-полинуклеотид, кодирующий белок Cas9, вводят в растительную клетку, который затем транслируется и процессируется клеткой-хозяином, образующей белок в достаточном количестве для модификации клетки (в присутствии по меньшей мере одной chi/sgRNA), но который не сохраняется по происшествию предусмотренного периода времени или после одного или нескольких клеточных делений. Способы введения мРНК в протопласты растений для транзиентной экспрессии известны специалисту в данной области (см., например, в Gallie, Plant Cell Reports (1993), 13;119-122).In other embodiments, an RNA polynucleotide encoding a Cas9 protein is introduced into a plant cell, which is then translated and processed by the host cell to produce protein in sufficient quantity to modify the cell (in the presence of at least one chi/sgRNA), but which is not retained after a predetermined period of time or after one or more cell divisions. Methods for introducing mRNA into plant protoplasts for transient expression are known to those skilled in the art (see, e.g., Gallie, Plant Cell Reports (1993), 13;119-122).
Также предусмотрены комбинации различных способов, описанных выше.Combinations of the various methods described above are also provided.
Доставка компонентов CRISPR/Cas9 в растительную клеткуDelivery of CRISPR/Cas9 components into plant cells
В конкретных вариантах осуществления представляет интерес доставка одного или нескольких компонентов системы CRISPR/Cas9 непосредственно в растительную клетку. Это представляет интерес, помимо прочего, для получения нетрансгенных растений (см. ниже). В конкретных вариантах осуществления один или несколько компонентов Cas9 получают за пределами растения или растительной клетки и доставляют в клетку. Например, в конкретных вариантах осуществления белок Cas9 получают in vitro до введения в растительную клетку. Белок Cas9 может быть получен с помощью различных способов, известных специалисту в данной области, в том числе рекомбинантного получения. После экспрессии белок Cas9 выделяют, при необходимости повторно подвергают фолдингу, очищают и необязательно обрабатывают для удаления любых меток, таких как His-метка. Непосредственно после получения неочищенного, частично очищенного или более полно очищенного белка Cas9 белок может быть введен в растительную клетку.In particular embodiments, it is of interest to deliver one or more components of the CRISPR/Cas9 system directly into a plant cell. This is of interest, among other things, for producing non-transgenic plants (see below). In particular embodiments, one or more Cas9 components are produced outside of the plant or plant cell and delivered into the cell. For example, in particular embodiments, the Cas9 protein is produced in vitro prior to introduction into the plant cell. The Cas9 protein can be produced by a variety of methods known to those skilled in the art, including recombinant production. Once expressed, the Cas9 protein is isolated, optionally refolded, purified, and optionally processed to remove any tags, such as a His-tag. Once the crude, partially purified, or more completely purified Cas9 protein is produced, the protein can be introduced into the plant cell.
В конкретных вариантах осуществления белок Cas9 смешивают с chi/sgRNA, нацеленной на представляющий интерес ген с получением предварительно собранного рибонуклеопротеина.In specific embodiments, the Cas9 protein is mixed with chi/sgRNA targeting a gene of interest to produce a preassembled ribonucleoprotein.
Отдельные компоненты или предварительно собранный рибонуклеопротеин могут быть введены в растительную клетку с помощью электропорации, с помощью бомбардировки частицами, покрытыми продуктом гена, ассоциированного с Cas9, с помощью химической трансфекции или с помощью других средств транспорта через клеточную мембрану. Например, была показана трансфекция протопласта растения предварительно собранным рибонуклеопротеином CRISPR с целью обеспечения целевой модификации генома растения (как описано Woo et al. Nature Biotechnology, 2015; DOI: 10.1038/nbt.3389).Individual components or pre-assembled ribonucleoprotein can be introduced into plant cells by electroporation, by bombardment with particles coated with the product of a Cas9-associated gene, by chemical transfection, or by other means of transport across the cell membrane. For example, transfection of plant protoplasts with pre-assembled CRISPR ribonucleoprotein has been demonstrated to mediate targeted modification of the plant genome (as described by Woo et al. Nature Biotechnology, 2015; DOI: 10.1038/nbt.3389).
В конкретных вариантах осуществления компоненты системы CRISPR/Cas9 вводят в растительные клетки с помощью наночастиц. Компоненты, как в виде белка, так в виде нуклеиновой кислоты или их комбинации, могут быть нагружены или упакованы в наночастицы и нанесены на растения (такие как, например, описаны в WO 2008042156 и US 20130185823). В частности, варианты осуществления по настоящему изобретению предусматривают наночастицы, нагруженные или упакованные молекулой(молекулами) ДНК, кодирующей(кодирующими) белок Cas9, молекулами ДНК, кодирующими chi/sgRNA и/или выделенную chi/sgRNA, как описано в WO2015089419.In particular embodiments, components of the CRISPR/Cas9 system are introduced into plant cells using nanoparticles. The components, either in the form of protein or nucleic acid or a combination thereof, can be loaded or packaged into nanoparticles and applied to plants (such as, for example, those described in WO2008042156 and US20130185823). In particular, embodiments of the present invention provide nanoparticles loaded or packaged with DNA molecule(s) encoding a Cas9 protein, DNA molecules encoding chi/sgRNA and/or isolated chi/sgRNA, as described in WO2015089419.
Дополнительные средства введения одного или нескольких компонентов системы CRISPR/Cas9 в растительную клетку предусматривают проникающие пептиды (CPP). Соответственно, в частности, варианты осуществления по настоящему изобретению предусматривают проникающий пептид, связанный с белком Cas9. В конкретных вариантах осуществления настоящего изобретения белок Cas9 и/или chi/sgRNA связаны с одним или несколькими CPP с целью эффективной транспортировки в протопласты клеток (как описано Ramakrishna (2014 Genome Res. 2014 Jun;24(6):1020-7 в случае Cas9 в человеческих клетках). В других вариантах осуществления ген Cas9 и/или chi/sgRNA кодируются одной или несколькими кольцевой(кольцевыми) или некольцевой(некольцевыми) молекулой(молекулами) ДНК, которые связаны с одним или несколькими CPP для доставки в протопласты растений. Протопласты растений затем регенерируют до растительных клеток и затем до растений. CPP, как правило, описаны в виде коротких пептидов из менее чем 35 аминокислот, полученных как из белков, так и из химерных последовательностей, которые способны транспортировать биомолекулы через клеточную мембрану рецепторно-зависимым образом. CPP может представлять собой катионные пептиды, пептиды, имеющие гидрофобные последовательности, амфипатические пептиды, пептиды, имеющие последовательность с высоким содержанием пролина и антимикробную последовательность, и химерные или состоящие из двух частей пептиды (Pooga and Langel 2005). CPP способны проникать через биологические мембраны и таким образом вызывать движение различных биомолекул через клеточные мембраны в цитоплазму, и улучшать внутриклеточное движение, и, таким образом, облегчать взаимодействие биомолекулы с мишенью. Примеры CPP включают среди прочего Tat, ядерный белок транскрипционный активатор для вирусной репликации HIV 1 типа, пенетратин, сигнальную пептидную последовательность на основе фактора роста фибробластов Капоши (FGF), сигнальную пептидную последовательность на основе интегрина β3; Arg-последовательность на основе полиаргининового пептида, молекулярные транспортеры с высоким содержанием гуанина, пептид "sweet arrow" и др.Additional means for introducing one or more components of the CRISPR/Cas9 system into a plant cell include cell penetrating peptides (CPPs). Accordingly, in particular, embodiments of the present invention provide a cell penetrating peptide linked to a Cas9 protein. In particular embodiments of the present invention, the Cas9 protein and/or chi/sgRNA are linked to one or more CPPs for efficient transport into cell protoplasts (as described by Ramakrishna (2014 Genome Res. 2014 Jun;24(6):1020-7 for Cas9 in human cells). In other embodiments, the Cas9 gene and/or chi/sgRNA are encoded by one or more circular or non-circular DNA molecule(s) that are linked to one or more CPPs for delivery into plant protoplasts. The plant protoplasts are then regenerated to plant cells and then to plants. CPPs are typically described as short peptides of less than 35 amino acids, derived from both proteins and chimeric sequences, that are capable of transporting biomolecules across the cell membrane in a receptor-dependent manner. CPPs can be cationic peptides, peptides having hydrophobic sequences, amphipathic peptides, peptides having a proline-rich sequence and an antimicrobial sequence, and chimeric or bipartite peptides (Pooga and Langel 2005). CPPs are able to penetrate biological membranes and thus induce the movement of various biomolecules across cellular membranes into the cytoplasm, and improve intracellular movement, and thus facilitate the interaction of a biomolecule with a target. Examples of CPPs include, among others, Tat, a nuclear protein transcriptional activator for HIV type 1 viral replication, penetratin, a Kaposi's fibroblast growth factor (FGF)-based signal peptide, a β3 integrin-based signal peptide; Arg-based polyarginine peptide, guanine-rich molecular transporters, the "sweet arrow" peptide, etc.
Применение системы CRISPR/Cas9 для получения генетически модифицированных нетрансгенных растенийApplication of the CRISPR/Cas9 system to obtain genetically modified non-transgenic plants
В конкретных вариантах осуществления способы, описанные в данном документе, используются для модификации эндогенных генов или для модификации их экспрессии без перманентного введения в геном растения какого-либо чужеродного гена, в том числе кодирующих компонентов CRISPR, с тем, чтобы избежать присутствия чужеродной ДНК в геноме растения. Это может представлять интерес, поскольку регуляторные требования для нетрансгенных растений являются менее жесткими.In particular embodiments, the methods described herein are used to modify endogenous genes or to modify their expression without permanently introducing any foreign gene, including CRISPR coding components, into the plant genome, so as to avoid the presence of foreign DNA in the plant genome. This may be of interest because regulatory requirements for non-transgenic plants are less stringent.
В конкретных вариантах осуществления это обеспечивается транзиентной экспрессией компонентов CRISPR/Cas9. В конкретных вариантах осуществления один или несколько из компонентов CRISPR экспрессируются одним или несколькими вирусными векторами, которые продуцируют достаточно белка Cas9 и chi/sgRNA для стабильного обеспечения модификации представляющего интерес гена в соответствии со способом, описанным в данном документе.In particular embodiments, this is achieved by transient expression of CRISPR/Cas9 components. In particular embodiments, one or more of the CRISPR components are expressed by one or more viral vectors that produce sufficient Cas9 protein and chi/sgRNA to stably achieve modification of the gene of interest in accordance with the method described herein.
В конкретных вариантах осуществления транзиентная экспрессия конструкций CRISPR/Cas9 обеспечивается в протопластах растений и, таким образом, не интегрирована в геном. Ограниченное окно экспрессии может быть достаточным для обеспечения того, чтобы система CRISPR/Cas9 обеспечила модификацию целевого гена, как описано в данном документе.In particular embodiments, transient expression of the CRISPR/Cas9 constructs is provided in plant protoplasts and is thus not integrated into the genome. The limited expression window may be sufficient to ensure that the CRISPR/Cas9 system provides modification of the target gene as described herein.
В конкретных вариантах осуществления различные компоненты системы CRISPR/Cas9 вводят в растительную клетку, протопласт или растительную ткань, как раздельно, так и в смеси, с целью раздельной доставки молекул, таких как наночастицы или молекулы CPP, как описано в данном документ выше.In specific embodiments, various components of the CRISPR/Cas9 system are introduced into a plant cell, protoplast, or plant tissue, either separately or in a mixture, to separately deliver molecules, such as nanoparticles or CPP molecules, as described herein above.
Экспрессия компонентов CRISPR/Cas9 может индуцировать целевую модификацию генома, как путем непосредственной активности нуклеазы Cas9 и необязательного введения матричной ДНК, так и путем модификации целевых генов с помощью системы CRISPR/Cas9, как описано в данном документе. Различные стратегии, описанные в данном документе выше, обеспечивают Cas9-опосредованное целевое редактирование генома, требующее введения компонентов CRISPR/Cas9 в геном растений. Компоненты, которые транзиентно вводят в растительную клетку, как правило, удаляют при селекции.Expression of CRISPR/Cas9 components can induce targeted genome modification either through direct Cas9 nuclease activity and optional introduction of template DNA or through modification of target genes by the CRISPR/Cas9 system as described herein. The various strategies described herein above achieve Cas9-mediated targeted genome editing that require the introduction of CRISPR/Cas9 components into the plant genome. Components that are transiently introduced into the plant cell are typically removed by selection.
Выявление модификаций в растительных геном-селектируемых маркерахDetection of modifications in plant genome-selectable markers
В конкретных вариантах осуществления, где способ включает модификацию эндогенного целевого гена генома растения, для определения может быть применен любой подходящий способ после того, как растение, часть растения или растительную клетку инфицируют или трансфицируют системой CRISPR/Cas9, вне зависимости от того, произошло или не произошло нацеливание на ген или направленный мутагенез в целевом сайте. Если способ предусматривает введение трансгена, то трансформированная растительная клетка, каллюс, ткань или растение могут быть идентифицированы и выделены с помощью отбора или скрининга сконструированного растительного материала на наличие трансгена или признаков, кодируемых трансгеном. Физические и биохимические способы могут быть использованы для выявления трансформантов растений или растительных клеток, содержащих вставленные генные конструкции или модификацию эндогенной ДНК. Эти способы включают без ограничения: 1) саузерн-анализ или ПЦР-амплификацию для выявления и определения структуры вставки рекомбинантной ДНК или модифицированных эндогенных генов; 2) нозерн-блоттинг, защиту от S1 РНКазы, достройку праймера или ПЦР-апмлификацию с помощью обратной транскриптазы для выявления и исследования РНК-транскриптов генных конструкций; 3) ферментативные анализы для выявления активности ферментов или рибозимов, где такие продукты генов кодируются генной конструкцией, или экспрессия нарушена в результате генетической модификации; 4) гель-электрофорез белка, методики вестерн-блоттинга, иммуноосаждение или иммуноанализы с иммобилизованными ферментами, где генная конструкция или продукты эндогенных генов представляют собой белки. Дополнительные методики, такие как гибридизация in situ, ферментативное окрашивание и иммуноокрашивание, также могут быть использованы для выявления наличия или экспрессии рекомбинантной конструкции или выявления модификации эндогенного гена в конкретных органах или тканях растений. Способы для выполнения всех этих анализов хорошо известны специалистам в данной области.In particular embodiments where the method involves modifying an endogenous target gene of the plant genome, any suitable method can be used to determine whether or not gene targeting or site-directed mutagenesis has occurred after the plant, plant part, or plant cell is infected or transfected with the CRISPR/Cas9 system. If the method involves introducing a transgene, the transformed plant cell, callus, tissue, or plant can be identified and isolated by selecting or screening the engineered plant material for the presence of the transgene or traits encoded by the transgene. Physical and biochemical methods can be used to detect transformants of plants or plant cells containing inserted gene constructs or modification of endogenous DNA. These methods include, but are not limited to: 1) Southern analysis or PCR amplification to detect and determine the structure of the recombinant DNA insert or modified endogenous genes; 2) Northern blotting, S1 RNase protection, primer extension, or reverse transcriptase PCR amplification to detect and analyze RNA transcripts of the gene constructs; 3) enzymatic assays to detect enzyme or ribozyme activity, where such gene products are encoded by the gene construct or expression is impaired by genetic modification; 4) protein gel electrophoresis, Western blotting techniques, immunoprecipitation, or enzyme-linked immunoassays, where the gene construct or endogenous gene products are proteins. Additional techniques such as in situ hybridization, enzymatic staining, and immunostaining may also be used to detect the presence or expression of a recombinant construct or to detect endogenous gene modification in specific plant organs or tissues. Methods for performing all of these assays are well known to those skilled in the art.
Кроме того (или альтернативно), систему экспрессии, кодирующую компоненты CRISPR/Cas9, обычно разрабатывают с целью содержания одного или нескольких селектируемых или выявляемых маркеров, которые обеспечивают средство для выделения или эффективного отбора клеток, которые содержат систему CRISPR/Cas9 и/или были модифицированы ей на ранней стадии и в большом объеме.Additionally (or alternatively), the expression system encoding the CRISPR/Cas9 components is typically engineered to contain one or more selectable or detectable markers that provide a means for isolating or efficiently selecting cells that contain and/or have been modified by the CRISPR/Cas9 system early and extensively.
В случае опосредованной Agrobacterium трансформации кассета с маркерами может находиться вблизи границ фланкирующей T-ДНК или между ними и содержаться в бинарном векторе. В другом варианте осуществления кассета с маркерами может находиться за пределами Т-ДНК. Кассета с селектируемыми маркерами может также находиться на границах той же самой T-ДНК, что и кассета экспрессии, или вблизи них и может находиться в каком-то другом месте во второй Т-ДНК в бинарном векторе (например, системе 2 T-ДНК).In the case of Agrobacterium-mediated transformation, the marker cassette may be located near or between the boundaries of the flanking T-DNA and contained in a binary vector. In another embodiment, the marker cassette may be located outside the T-DNA. The selectable marker cassette may also be located at or near the boundaries of the same T-DNA as the expression cassette and may be located elsewhere in the second T-DNA in the binary vector (e.g., a 2 T-DNA system).
В случае бомбардировки частицами или трансформации протопласта система экспрессии может содержать один или несколько выделенных линейных фрагментов или может быть частью более крупной конструкции, которая должна содержать элементы репликации бактерий, селектируемые маркеры бактерий или другие выявляемые элементы. Кассета(кассеты) экспрессии, содержащая(содержащие) полинуклеотиды, кодирующие направляющую последовательность и/или Cas9, может(могут) быть физически связана(связаны) с кассетой с маркерами или может(могут) быть смешана(смешаны) со второй молекулой нуклеиновой кислоты, кодирующей кассету с маркерами. Кассета с маркерами состоит из необходимых элементов для экспрессии выявляемого или селектируемого маркера, который обеспечивает эффективный отбор трансформированных клеток.In the case of particle bombardment or protoplast transformation, the expression system may comprise one or more isolated linear fragments or may be part of a larger construct that must contain bacterial replication elements, bacterial selectable markers, or other detectable elements. The expression cassette(s) containing the polynucleotides encoding the guide sequence and/or Cas9 may be physically linked to the marker cassette or may be mixed with a second nucleic acid molecule encoding the marker cassette. The marker cassette comprises the necessary elements for expression of a detectable or selectable marker that provides efficient selection of transformed cells.
Процедура отбора в случае клеток на основании селектируемого маркера будет зависеть от природы маркерного гена. В конкретных вариантах осуществления применяют селектируемый маркер, т.е. маркер, который обеспечивает непосредственный отбор клеток на основе экспрессии маркера. Селектируемый маркер может обеспечивать положительный или отрицательный отбор и зависит или не зависит от наличия внешних субстратов (Miki et al. 2004, 107(3): 193-232). Как правило, гены устойчивости к антибиотикам или гербицидам используют в качестве маркеров, при этом отбор должен выполняться в зависимости от роста сконструированного растительного материала на средах, содержащих ингибирующее количество антибиотика или гербицида, к которому маркерный ген придает устойчивость. Примерами таких генов являются гены, которые придают устойчивость к антибиотикам, таким как гигромицин (hpt) и канамицин (nptII), и гены, которые придают устойчивость к гербицидам, таким как фосфинотрицин (bar) и хлорсульфурон (als).The selection procedure in the case of cells based on a selectable marker will depend on the nature of the marker gene. In particular embodiments, a selectable marker is used, i.e. a marker that provides direct selection of cells based on the expression of the marker. The selectable marker may provide positive or negative selection and may or may not be dependent on the presence of external substrates (Miki et al. 2004, 107(3): 193-232). Typically, antibiotic or herbicide resistance genes are used as markers, and selection should be performed based on the growth of the engineered plant material on media containing an inhibitory amount of the antibiotic or herbicide to which the marker gene confers resistance. Examples of such genes are genes that confers resistance to antibiotics such as hygromycin (hpt) and kanamycin (nptII), and genes that confers resistance to herbicides such as phosphinothricin (bar) and chlorsulfuron (als).
Трансформированные растения и растительные клетки могут также быть идентифицированы с помощью скрининга на виды активности видимого маркера, как правило, фермента, способного обработать окрашенный субстрат (например, β-глюкоронидазу, люциферазу, гены B или C1). Такие методики отбора и скрининга хорошо известны специалистам в данной области.Transformed plants and plant cells can also be identified by screening for the activity of a visible marker, typically an enzyme capable of processing a colored substrate (e.g., β-glucuronidase, luciferase, B or C1 genes). Such selection and screening techniques are well known to those skilled in the art.
Культуры и регенерация растенийCrops and plant regeneration
В конкретных вариантах осуществления растительные клетки имеют модифицированный геном, и те, которые образованы или получены с помощью любого из способов, описанных в данном документе, могут быть культивированы с регенерацией целого растения, которое обладает трансформированным или модифицированным генотипом и, таким образом, желаемым фенотипом. Стандартные методики регенерации хорошо известны специалистам в данной области. Конкретные примеры таких методик регенерации основаны на действии определенных фитогормонов в среде для роста культуры тканей, и, как правило, основаны на биоцидном и/или гербицидном маркере, который был введен совместно с требуемыми нуклеотидными последовательностями. В дополнительных конкретных вариантах осуществления регенерация растений осуществляется исходя из культивируемых протопластов, каллюса, эксплантов, органов, пыльцы, эмбрионов растений или их частей (см., например, Evans et al. (1983), Handbook of Plant Cell Culture, Klee et al (1987) Ann. Rev. of Plant Phys.).In specific embodiments, plant cells have a modified genome, and those generated or obtained by any of the methods described herein can be cultured to regenerate a whole plant that has the transformed or modified genotype and thus the desired phenotype. Standard regeneration techniques are well known to those skilled in the art. Specific examples of such regeneration techniques rely on the action of certain phytohormones in the tissue culture growth medium, and typically rely on a biocidal and/or herbicidal marker that has been co-introduced with the desired nucleotide sequences. In further specific embodiments, plant regeneration is performed from cultured protoplasts, callus, explants, plant organs, pollen, embryos, or parts thereof (see, e.g., Evans et al. (1983), Handbook of Plant Cell Culture, Klee et al (1987) Ann. Rev. of Plant Phys.).
В конкретных вариантах осуществления трансформированные или улучшенные растения, как описано в данном документе, могут быть самоопылены с получением семян для гомозитных улучшенных растений по настоящему изобретению (гомозиготных для модификации ДНК) или скрещены с нетрансгенными растениями или различными улучшенными растениями с получением семян для гетерозиготных растений. Если рекомбинантная ДНК была внесена в растительную клетку, то полученное в результате такой селекции растение представляет собой растение, которое является гетерозиготным по рекомбинантной молекуле ДНК. Оба такие гомозиготное и гетерозиготное растения, полученные при скрещивании от улучшенных растений и содержащие генетическую модификацию (которая может представлять собой рекомбинантную ДНК), называются в данном документе "потомство". Дочерние растения представляют собой растения, происходящие от исходного родительского растения и содержащие модификацию генома или молекулу рекомбинантной ДНК, введенную с помощью способов, предусмотренных в данном документе. Альтернативно генетически модифицированные растения могут быть получены с помощью одного из способов, описанных выше, с применением Cas9, где чужеродная ДНК не вводится в геном. Потомство таких растений, полученных с помощью дополнительной селекции, также может содержать генетическую модификацию. Скрещивания выполняют с помощью любых способов селекции, которые широко применяют для различных сельскохозяйственных культур (например, Allard, Principles of Plant Breeding, John Wiley & Sons, NY, U. of CA, Davis, CA, 50-98 (1960).In particular embodiments, the transformed or improved plants as described herein can be self-pollinated to produce seed for homositic improved plants of the present invention (homozygous for the DNA modification) or crossed with non-transgenic plants or different improved plants to produce seed for heterozygous plants. If the recombinant DNA has been introduced into a plant cell, the resulting plant from such selection is a plant that is heterozygous for the recombinant DNA molecule. Both such homozygous and heterozygous plants obtained from the crossed improved plants and containing the genetic modification (which may be recombinant DNA) are referred to herein as "progeny". Daughter plants are plants derived from the original parent plant and containing the genomic modification or recombinant DNA molecule introduced by the methods provided herein. Alternatively, genetically modified plants can be produced by one of the methods described above using Cas9, where foreign DNA is not introduced into the genome. The progeny of such plants, obtained by additional selection, can also contain the genetic modification. Crosses are performed by any of the selection methods that are widely used for various agricultural crops (e.g., Allard, Principles of Plant Breeding, John Wiley & Sons, NY, U. of CA, Davis, CA, 50-98 (1960).
Получение растений с улучшенными агрономическими характеристикамиObtaining plants with improved agronomic characteristics
Системы CRISPR на основе Cas9, предусмотренные в данном документе, могут быть использованы для введения целевых двунитевых или однонитевых разрывов и/или для введения систем активаторов и/или репрессоров генов и без ограничения могут быть использованы для целенправленного воздействия на гены, замещения генов, направленного мутагенеза, целевых делеций или вставок, целевых инверсий и/или целевых транслокаций. С помощью коэкспрессии нескольких нацеливающих РНК, направленных на получение нескольких модификаций в одной клетке, может быть обеспечена мультиплексная модификация геномов. Эта технология может быть использована для высокоточного конструирования растений с улучшенными характеристиками, в том числе повышенной пищевой ценностью, повышенной устойчивостью к биотическому и абиотическому стрессу и повышенной продукцией коммерчески ценных растительных продуктов или гетерологичных соединений.The Cas9-based CRISPR systems provided herein can be used to introduce targeted double-strand or single-strand breaks and/or to introduce gene activator and/or repressor systems and can be used, without limitation, for gene targeting, gene replacement, site-directed mutagenesis, targeted deletions or insertions, targeted inversions, and/or targeted translocations. Multiplexed modification of genomes can be achieved by co-expressing multiple targeting RNAs directed to produce multiple modifications in a single cell. This technology can be used to precisely engineer plants with improved characteristics, including increased nutritional value, increased resistance to biotic and abiotic stress, and increased production of commercially valuable plant products or heterologous compounds.
В конкретных вариантах осуществления система CRISPR/Cas9, как описано в данном документе, используется для введения целевых двунитевых разрывов (DSB) в последовательность эндогенной ДНК. DSB активирует клеточные пути репарации ДНК, которые могут быть использованы для достижения требуемых модификаций последовательности ДНК возле сайта разрыва. Это представляет интерес, если инактивация эндогенных генов может придавать желаемый признак или способствует его появлению. В конкретных вариантах осуществления гомологичная рекомбинация матричной последовательностью активизируется в сайте DSB с целью введения представляющего интерес гена.In particular embodiments, the CRISPR/Cas9 system as described herein is used to introduce targeted double-strand breaks (DSBs) into an endogenous DNA sequence. The DSB activates cellular DNA repair pathways that can be used to achieve desired modifications to the DNA sequence near the site of the break. This is of interest if inactivation of endogenous genes can confer or promote a desired trait. In particular embodiments, homologous recombination by a template sequence is activated at the site of the DSB to introduce a gene of interest.
В конкретных вариантах осуществления система CRISPR/Cas9 может быть использована в качестве генерического связывающегося с нуклеиновой кислотой белка при слиянии или при функциональном связывании с функциональным доменом для активации и/или репрессии эндогенных генов растений. Иллюстративные функциональные домены могут включать без ограничения инициатор трансляции, активатор трансляции, репрессор трансляции, нуклеазы, в частности, рибонуклеазы, сплайсосому, гранулы, индуцируемый/контролируемый светом домен или химически индуцируемый/контролируемый домен. Как правило, в этих вариантах осуществления белок Cas9 содержит по меньшей мере одну мутацию, например, он характеризуется не более чем 5% активности белка Cas9, не имеющего по меньшей мере одной мутации; chi/sgRNA содержит направляющую последовательность, способную к гибридизации с целевой последовательностью.In particular embodiments, the CRISPR/Cas9 system can be used as a generic nucleic acid binding protein in fusion or in operably linked to a functional domain for activating and/or repressing endogenous plant genes. Exemplary functional domains can include, but are not limited to, a translation initiator, a translation activator, a translation repressor, nucleases, in particular ribonucleases, a spliceosome, granules, a light-inducible/controlled domain, or a chemically inducible/controlled domain. Typically, in these embodiments, the Cas9 protein comprises at least one mutation, such as having no more than 5% of the activity of a Cas9 protein lacking at least one mutation; the chi/sgRNA comprises a guide sequence capable of hybridizing to a target sequence.
Способы, описанные в данном документе, как правило, приводят к получению "улучшенных растений" в том отношении, что они имеют один или несколько желаемых признаков по сравнению с растением дикого типа. В конкретных вариантах осуществления полученные растения, растительные клетки или части растения представляют собой трансгенные растения, содержащие последовательность экзогенной ДНК, включенную в геном всех или части клеток растения. В конкретных вариантах осуществления нетрансгенные генетически модифицированные растения, части растений или растительные клетки получают таким образом, что никакой последовательности экзогенной ДНК не включено в геном любой из растительных клеток растения. В таких вариантах осуществления улучшенные растения являются нетрансгенными. В случае, если обеспечивают только модификацию экзогенного гена и никаких чужеродных генов не вводят или не сохраняют в геноме растения, то полученные в результате генетически модифицированные сельскохозяйственные культуры не содержат чужеродных генов и могут, таким образом, по существу, считаться нетрансгенными. Различные варианты применения системы CRISPR/Cas9 для редактирования геномов растений описаны более подробно ниже.The methods described herein generally result in "improved plants" in that they have one or more desirable traits compared to a wild-type plant. In particular embodiments, the resulting plants, plant cells, or plant parts are transgenic plants that contain an exogenous DNA sequence incorporated into the genome of all or a portion of the cells of the plant. In particular embodiments, non-transgenic genetically modified plants, plant parts, or plant cells are produced such that no exogenous DNA sequence is incorporated into the genome of any of the plant cells of the plant. In such embodiments, the improved plants are non-transgenic. In the event that only an exogenous gene modification is provided and no foreign genes are introduced or maintained in the genome of the plant, the resulting genetically modified crop plants do not contain foreign genes and may thus be considered non-transgenic as such. Various uses of the CRISPR/Cas9 system for editing plant genomes are described in more detail below.
a) Введение одного или нескольких чужеродных генов для придания представляющей интерес сельскохозяйственной характеристикиa) Introduction of one or more foreign genes to impart an agricultural characteristic of interest
Настоящее изобретение относится к способам редактирования геномов или модификации последовательностей, ассоциированных с представляющим интерес целевым локусом или находящихся в нем, где способ включает введение комплекса эффекторного белка Cas9 в растительную клетку, при этом комплекс эффекторного белка Cas9 эффективно функционирует с целью интеграции вставки ДНК, например, кодирующей представляющий интерес чужеродный ген в геном растительной клетки. В предпочтительных вариантах осуществления интеграция вставки ДНК облегчается с помощью HR с экзогенно введенной ДНК-матрицей или матрицей для репарации. Как правило, экзогенно введенную ДНК-матрицу или матрицу для репарации доставляют совместно с комплексом эффекторного белка Cas9 или одного компонента или полинуклеотидного вектора для экспрессии компонента комплекса.The present invention relates to methods of editing genomes or modifying sequences associated with or located at a target locus of interest, wherein the method comprises introducing a Cas9 effector protein complex into a plant cell, wherein the Cas9 effector protein complex functions effectively to integrate a DNA insert, for example encoding a foreign gene of interest, into the genome of the plant cell. In preferred embodiments, integration of the DNA insert is facilitated by HR with an exogenously introduced DNA template or repair template. Typically, the exogenously introduced DNA template or repair template is delivered together with the Cas9 effector protein complex or one component or a polynucleotide vector for expressing a component of the complex.
Системы CRISPR/Cas9, предусмотренные в данном документе, обеспечивают целевую доставку генов. Стало более ясно, что экспрессия представляющего интерес гена в большой степени определяется положением интеграции в геном. Способы настоящего изобретения обеспечивают подвергаемую нацеливанию интеграцию чужеродного гена в необходимое положение в геноме. Положение может быть выбрано на основе информации о ранее полученных событиях или может быть выбрано с помощью способов, раскрытых в других местах в данном документе.The CRISPR/Cas9 systems provided herein provide targeted gene delivery. It has become increasingly clear that expression of a gene of interest is largely determined by the location of integration into the genome. The methods of the present invention provide targeted integration of a foreign gene into a desired location in the genome. The location may be selected based on information about previously obtained events or may be selected using methods disclosed elsewhere herein.
В конкретных вариантах осуществления способы, предусмотренные в данном документе, предусматривают (a) введение в клетку комплекса CRISPR/Cas9, содержащего chi/sgRNA, содержащую прямой повтор и направляющую последовательность, где направляющая последовательность гибридизируется с целевой последовательностью, которая является эндогенной по отношению к растительной клетке; (b) введение в растительную клетку эффекторной молекулы Cas9, которая образует комплексы с chi/sgRNA, когда направляющая последовательность гибридизируется с целевой последовательностью и индуцирует двунитевой разрыв в последовательности, на которую нацеливается направляющая последовательность, или возле нее; и (c) введение в клетку нуклеотидной последовательности, кодирующей матрицу для репарации HDR, которая кодирует представляющий интерес ген и который вводят в положение DS разрыва в результате HDR. В конкретных вариантах осуществления стадия введения может предусматривать доставку в растительную клетку одного или нескольких полинуклеотидов, кодирующих эффекторный белок Cas9, chi/sgRNA и матрицу для репарации. В конкретных вариантах осуществления полинуклеотиды доставляют в клетку с помощью ДНК-содержащего вируса (например, гемнивируса) или РНК-содержащего вируса (например, тобравируса). В конкретных вариантах осуществления стадии введения предусматривают введение в растительную клетку T-ДНК, содержащей одну или несколько полинуклеотидных последовательностей, кодирующих эффекторный белок Cas9, chi/sgRNA и матрицу для репарации, где доставка осуществляется посредством Agrobacterium. Последовательность нуклеиновой кислоты, кодирующей эффекторный белок Cas9, может быть функционально связанной с промотором, таким как конститутивный промотор (например, промотор вируса мозаики цветной капусты 35S), или клеточноспецифический, или индуцируемый промотор. В конкретных вариантах осуществления полинуклеотид вводят с помощью бомбардировки микрочастицами. В конкретных вариантах осуществления способ дополнительно предусматривает скрининг растительной клетки после стадий введения с целью определения того, была ли введена матрица для репарации, т.е. представляющий интерес ген. В конкретных вариантах осуществления способы предусматривают стадию регенерации растения из растительной клетки. В дополнительных вариантах осуществления способы предусматривают кроссбридинг растения с получением генетически требуемой линии растений. Примеры чужеродных генов, кодирующих представляющий интерес признак, приведены ниже.In particular embodiments, the methods provided herein comprise (a) introducing into a cell a CRISPR/Cas9 complex comprising a chi/sgRNA comprising a direct repeat and a guide sequence, wherein the guide sequence hybridizes to a target sequence that is endogenous to the plant cell; (b) introducing into the plant cell a Cas9 effector molecule that complexes with the chi/sgRNA when the guide sequence hybridizes to the target sequence and induces a double-strand break at or near a sequence targeted by the guide sequence; and (c) introducing into the cell a nucleotide sequence encoding an HDR repair template that encodes a gene of interest and that is introduced at the DS position of the HDR break. In particular embodiments, the introducing step may comprise delivering into the plant cell one or more polynucleotides encoding a Cas9 effector protein, a chi/sgRNA, and a repair template. In particular embodiments, the polynucleotides are delivered to the cell using a DNA virus (e.g., a gemnivirus) or an RNA virus (e.g., a tobravirus). In particular embodiments, the introducing steps comprise introducing into the plant cell a T-DNA comprising one or more polynucleotide sequences encoding a Cas9 effector protein, a chi/sgRNA, and a repair template, wherein the delivery is accomplished by Agrobacterium. The nucleic acid sequence encoding the Cas9 effector protein may be operably linked to a promoter, such as a constitutive promoter (e.g., the cauliflower mosaic virus 35S promoter) or a cell-specific or inducible promoter. In particular embodiments, the polynucleotide is introduced using microparticle bombardment. In particular embodiments, the method further comprises screening the plant cell after the introducing steps to determine whether the repair template, i.e., the gene of interest, has been introduced. In particular embodiments, the methods comprise the step of regenerating a plant from a plant cell. In further embodiments, the methods comprise crossbreeding the plant to produce a genetically desired plant line. Examples of foreign genes encoding a trait of interest are provided below.
b) Редактирование эндогенных генов для придания представляющей интерес сельскохозяйственной характеристикиb) Editing endogenous genes to impart an agricultural characteristic of interest
Настоящее изобретение относится к способам редактирования геномов или модификации последовательностей, ассоциированных с представляющим интерес целевым локусом, где способ включает введение комплекса эффекторного белка Cas9 в растительную клетку, при этом комплекс Cas9 модифицирует экспрессию эндогенного гена растения. Это может быть достигнуто различными путями. В конкретных вариантах осуществления устранение экспрессии эндогенного гена является желательным, и комплекс CRISPR/Cas9 используют для нацеливания на эндогенный ген с целью модификации экспрессии гена и его расщепления. В этих вариантах осуществления способы, предусмотренные в данном документе, предусматривают (a) введение в растительную клетку комплекса CRISPR/Cas9, содержащего chi/sgRNA, содержащую прямой повтор и направляющую последовательность, где направляющая последовательность гибридизируется с целевой последовательность в представляющем интерес гене в геноме растительной клетки; и (b) введение в клетку эффекторного белка Cas9, который при связывании с chi/sgRNA, содержащей направляющую последовательность, которая гибридизируется с целевой последовательностью, обеспечивает двунитевой разрыв в последовательности, на которую направляющая последовательность оказывает нацеливание, или возле нее. В конкретных вариантах осуществления стадия введения может предусматривать доставку в растительную клетку одного или нескольких полинуклеотидов, кодирующих эффекторный белок Cas9 и chi/sgRNA.The present invention relates to methods of editing genomes or modifying sequences associated with a target locus of interest, the method comprising introducing a Cas9 effector protein complex into a plant cell, wherein the Cas9 complex modifies the expression of an endogenous gene of the plant. This can be achieved in a variety of ways. In particular embodiments, abolishing the expression of the endogenous gene is desired, and a CRISPR/Cas9 complex is used to target the endogenous gene to modify gene expression and cleave it. In these embodiments, the methods provided herein comprise (a) introducing into a plant cell a CRISPR/Cas9 complex comprising a chi/sgRNA comprising a direct repeat and a guide sequence, wherein the guide sequence hybridizes to a target sequence in a gene of interest in the genome of the plant cell; and (b) introducing into the cell a Cas9 effector protein that, when bound to a chi/sgRNA comprising a guide sequence that hybridizes to a target sequence, creates a double-strand break at or near the sequence that the guide sequence targets. In particular embodiments, the introducing step may comprise delivering into the plant cell one or more polynucleotides encoding a Cas9 effector protein and a chi/sgRNA.
В конкретных вариантах осуществления полинуклеотиды доставляют в клетку с помощью ДНК-содержащего вируса (например, гемнивируса) или РНК-содержащего вируса (например, тобравируса). В конкретных вариантах осуществления стадии введения предусматривают введение в растительную клетку T-ДНК, содержащей одну или несколько полинуклеотидных последовательностей, кодирующих эффекторный белок Cas9 и chi/sgRNA, где доставка осуществляется посредством Agrobacterium. Полинуклеотидная последовательность, кодирующая компоненты системы CRISPR/Cas9, может быть функционально связанной с промотором, таким как конститутивный промотор (например, промотор вируса мозаики цветной капусты 35S), или клеточноспецифический, или индуцируемый промотор. В конкретных вариантах осуществления полинуклеотид вводят с помощью бомбардировки микрочастицами. В конкретных вариантах осуществления способ дополнительно предусматривает скрининг растительной клетки после стадий введения с целью определения того, была ли модифицирована экспрессия представляющего интерес гена. В конкретных вариантах осуществления способы предусматривают стадию регенерации растения из растительной клетки. В дополнительных вариантах осуществления способы предусматривают кроссбридинг растения с получением генетически требуемой линии растений.In particular embodiments, the polynucleotides are delivered to the cell using a DNA virus (e.g., a gemnivirus) or an RNA virus (e.g., a tobravirus). In particular embodiments, the introducing steps comprise introducing into the plant cell a T-DNA comprising one or more polynucleotide sequences encoding a Cas9 effector protein and a chi/sgRNA, wherein the delivery is accomplished by Agrobacterium. The polynucleotide sequence encoding components of the CRISPR/Cas9 system may be operably linked to a promoter, such as a constitutive promoter (e.g., the cauliflower mosaic virus 35S promoter) or a cell-specific or inducible promoter. In particular embodiments, the polynucleotide is introduced using microprojectile bombardment. In particular embodiments, the method further comprises screening the plant cell after the introducing steps to determine whether expression of the gene of interest has been modified. In particular embodiments, the methods comprise the step of regenerating a plant from the plant cell. In additional embodiments, the methods include cross-breeding the plant to produce a genetically desired plant line.
В конкретных вариантах осуществления способов, описанных выше, устойчивые к болезням сельскохозяйственные растения получают с помощью целевой мутации генов подверженности к болезням или генов, кодирующих отрицательные регуляторы (например, ген Mlo), из генов, обеспечивающих защиту растений. В конкретном варианте осуществления устойчивые к гербицидам сельскохозяйственные растения получают с помощью целевой замены конкретных нуклеотидов в генах растений, таких как кодирующие ацетолактатсинтазу (ALS) и протопорфириногеноксидазу (PPO). В конкретных вариантах осуществления предусмотрено получение засухоустойчивых и солевыносливых сельскохозяйственных растений с помощью целевой мутации генов, кодирующих отрицательные регуляторы переносимости абиотического стресса, зерновых культур с низким содержанием амилозы с помощью мутации гена Waxy, риса или других зерновых культур со сниженной прогорклостью с помощью целевой мутации основных генов липазы в алейроновом слое и т.д. Более подробный перечень эндогенных генов, кодирующих представляющие интерес признаки, приведен ниже.In particular embodiments of the methods described above, disease-resistant crop plants are produced by targeted mutation of disease susceptibility genes or genes encoding negative regulators (e.g., the Mlo gene) from plant defense genes. In a particular embodiment, herbicide-resistant crop plants are produced by targeted substitution of specific nucleotides in plant genes, such as those encoding acetolactate synthase (ALS) and protoporphyrinogen oxidase (PPO). In particular embodiments, drought-resistant and salt-tolerant crop plants are produced by targeted mutation of genes encoding negative regulators of abiotic stress tolerance, low-amylose grains by mutation of the Waxy gene, rice or other grains with reduced rancidity by targeted mutation of essential aleurone lipase genes, etc. A more detailed list of endogenous genes encoding traits of interest is provided below.
c) Модулирование эндогенных генов с помощью системы CRISPR/Cas9 для придания представляющего интерес сельскохозяйственного признакаc) Modulation of endogenous genes using the CRISPR/Cas9 system to confer an agricultural trait of interest
В данном документе также предусмотрены способы модулирования (т.е. активации или репрессии) экспрессии эндогенного гена с помощью белка Cas9, предусмотренного в данном документе. В таких способах применяют различающаяся(различающиеся) последовательность(последовательности) РНК, которая(которые) нацеливаются на геном растений с помощью комплекса Cas9. В частности, различающаяся(различающиеся) последовательность(последовательности) РНК связывается(связываются) с двумя или более адаптерными белками (например, аптамерами), где каждый адаптерный белок ассоциирован с одним или несколькими функциональными доменами и где по меньшей мере один или несколько функциональных доменов, ассоциированных с адаптерным белком, имеют одну или несколько видов активности, предусматривающих метилазную активность, деметилазную активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность интеграции ДНК, активность расщепления РНК, активность расщепления ДНК или активность связывания нуклеиновых кислот. Функциональные домены используют для модулирования экспрессии эндогенного гена растений для того, чтобы получить желаемый признак. Как правило, в этих вариантах осуществления эффекторный белок Cas9 имеет одну или несколько мутаций таким образом, что он имеет не более 5% нуклеазоной активности эффекторного белка Cas9, не имеющего по меньшей мере одной мутации.The present document also provides methods for modulating (i.e., activating or repressing) the expression of an endogenous gene using the Cas9 protein provided herein. Such methods employ distinct RNA sequence(s) that are targeted to the plant genome using the Cas9 complex. In particular, the distinct RNA sequence(s) bind(s) to two or more adaptor proteins (e.g., aptamers), wherein each adaptor protein is associated with one or more functional domains and wherein at least one or more functional domains associated with the adaptor protein have one or more activities comprising a methylase activity, a demethylase activity, a transcriptional activation activity, a transcriptional repression activity, a transcript release factor activity, a histone modification activity, a DNA integration activity, an RNA cleavage activity, a DNA cleavage activity, or a nucleic acid binding activity. The functional domains are used to modulate the expression of an endogenous plant gene to obtain a desired trait. Typically, in these embodiments, the Cas9 effector protein has one or more mutations such that it has no more than 5% of the nuclease activity of a Cas9 effector protein that does not have at least one mutation.
В конкретных вариантах осуществления способы, предусмотренные в данном документе, предусматривают стадии (a) введения в клетку комплекса CRISPR/Cas9, содержащего chi/sgRNA, содержащую прямой повтор и направляющую последовательность, где направляющая последовательность гибридизируется с целевой последовательностью, которая является эндогенной по отношению к растительной клетке; (b) введения в растительную клетку эффекторной молекулы Cas9, которая образует комплексы с chi/sgRNA, когда направляющая последовательность гибридизируется с целевой последовательностью; и где chi/sgRNA модифицируют с целью содержания различающейся последовательности РНК (аптамера), связывающейся с функциональным доменом, и/или эффекторный белок Cas9 модифицируют таким образом, что он связывается с функциональным доменом. В конкретных вариантах осуществления стадия введения может предусматривать доставку в растительную клетку одного или нескольких полинуклеотидов, кодирующих (модифицированный) эффекторный белок Cas9 и (модифицированную) chi/sgRNA. Подробности о компонентах системы CRISPR/Cas9 для применения в этих способах описаны в других местах в данном документе.In particular embodiments, the methods provided herein comprise the steps of (a) introducing into a cell a CRISPR/Cas9 complex comprising a chi/sgRNA comprising a direct repeat and a guide sequence, wherein the guide sequence hybridizes to a target sequence that is endogenous to the plant cell; (b) introducing into the plant cell a Cas9 effector molecule that complexes with the chi/sgRNA when the guide sequence hybridizes to the target sequence; and wherein the chi/sgRNA is modified to comprise a distinct RNA sequence (aptamer) that binds to a functional domain and/or the Cas9 effector protein is modified such that it binds to a functional domain. In particular embodiments, the introducing step may comprise delivering into the plant cell one or more polynucleotides encoding the (modified) Cas9 effector protein and the (modified) chi/sgRNA. Details of the components of the CRISPR/Cas9 system for use in these methods are described elsewhere in this document.
В конкретных вариантах осуществления полинуклеотиды доставляют в клетку с помощью ДНК-содержащего вируса (например, гемнивируса) или РНК-содержащего вируса (например, тобравируса). В конкретных вариантах осуществления стадии введения предусматривают введение в растительную клетку T-ДНК, содержащей одну или несколько полинуклеотидных последовательностей, кодирующих эффекторный белок Cas9 и chi/sgRNA, где доставка осуществляется посредством Agrobacterium. Последовательность нуклеиновой кислоты, кодирующая один или несколько компонентов системы CRISPR/Cas9, может быть функционально связанной с промотором, таким как конститутивный промотор (например, промотор вируса мозаики цветной капусты 35S), или клеточноспецифический, или индуцируемый промотор. В конкретных вариантах осуществления полинуклеотид вводят с помощью бомбардировки микрочастицами. В конкретных вариантах осуществления способ дополнительно предусматривает скрининг растительной клетки после стадий введения с целью определения того, была ли модифицирована экспрессия представляющего интерес гена. В конкретных вариантах осуществления способы предусматривают стадию регенерации растения из растительной клетки. В дополнительных вариантах осуществления способы предусматривают кроссбридинг растения с получением генетически требуемой линии растений. Более подробный перечень эндогенных генов, кодирующих представляющий интерес признак, приведен ниже.In particular embodiments, the polynucleotides are delivered to the cell using a DNA virus (e.g., a gemnivirus) or an RNA virus (e.g., a tobravirus). In particular embodiments, the introducing steps comprise introducing into the plant cell a T-DNA comprising one or more polynucleotide sequences encoding a Cas9 effector protein and a chi/sgRNA, wherein the delivery is accomplished by Agrobacterium. The nucleic acid sequence encoding one or more components of the CRISPR/Cas9 system may be operably linked to a promoter, such as a constitutive promoter (e.g., the cauliflower mosaic virus 35S promoter) or a cell-specific or inducible promoter. In particular embodiments, the polynucleotide is introduced using microprojectile bombardment. In particular embodiments, the method further comprises screening the plant cell after the introducing steps to determine whether the expression of the gene of interest has been modified. In particular embodiments, the methods comprise the step of regenerating a plant from the plant cell. In additional embodiments, the methods involve crossbreeding the plant to obtain a genetically desired plant line. A more detailed list of endogenous genes encoding the trait of interest is provided below.
Применение Cas9 для модификации полиплоидных растенийApplication of Cas9 to modify polyploid plants
Многие растения являются полиплоидными, что означает, что они несут двойные копии своих геномов - иногда до шести, как у пшеницы. Способы в соответствии с настоящим изобретением, в которых применяют эффекторный белок CRISPR/Cas9, могут быть "мультиплексными" с целью воздействия на все копии гена или нацеливания на несколько генов сразу. Например, в конкретных вариантах осуществления способы по настоящему изобретению применяют для одновременного обеспечения мутации потери функции в различных генах, ответственных за подавление защиты по отношению к болезни. В конкретных вариантах осуществления способы по настоящему изобретению применяют для одновременной супрессии экспрессии последовательности нуклеиновой кислоты TaMLO-Al, TaMLO-Bl и TaMLO-Dl в растительной клетке пшеницы и регенерации из нее растения пшеницы, чтобы обеспечить устойчивость растения пшеницы к мучнистой росе (см. также WO2015109752).Many plants are polyploid, meaning that they carry double copies of their genomes - sometimes up to six, as in wheat. The methods of the present invention that use a CRISPR/Cas9 effector protein can be "multiplexed" to affect all copies of a gene or to target multiple genes at once. For example, in particular embodiments, the methods of the present invention are used to simultaneously introduce a loss-of-function mutation in different genes responsible for suppressing defense against a disease. In particular embodiments, the methods of the present invention are used to simultaneously suppress the expression of a TaMLO-Al, TaMLO-Bl, and TaMLO-Dl nucleic acid sequence in a wheat plant cell and regenerate a wheat plant therefrom to provide powdery mildew resistance to the wheat plant (see also WO2015109752).
Иллюстративные гены, придающие агрономические признакиIllustrative genes conferring agronomic traits
Как описано в данном документе выше, в конкретных вариантах осуществления настоящее изобретение охватывает применение системы CRISPR/Cas9, как описано в данном документе, для вставки представляющей интерес ДНК, в том числе одного или нескольких экспрессируемых генов растения. В дополнительных конкретных вариантах осуществления настоящее изобретение охватывает способы и средства, в которых применяют систему Cas9, как описано в данном документе, для частичного или полного удаления одного или нескольких экспрессируемых генов растения. В других дополнительных вариантах осуществления настоящее изобретение охватывает способы и средства, в которых применяют систему Cas9, как описано в данном документе, для обеспечения модификации одного или нескольких экспрессируемых в растениях генов с помощью мутации, замены, вставки одного или нескольких нуклеотидов. В других вариантах осуществления настоящее изобретение охватывает применение системы CRISPR/Cas9, как описано в данном документе, для обеспечения модификации экспрессии одного или нескольких экспрессируемых в растениях генов с помощью специфической модификации одного или нескольких из регуляторных элементов, управляющих экспрессией указанных генов.As described herein above, in specific embodiments, the present invention encompasses the use of a CRISPR/Cas9 system as described herein to insert a DNA of interest, including one or more expressed plant genes. In further specific embodiments, the present invention encompasses methods and means that use a Cas9 system as described herein to partially or completely remove one or more expressed plant genes. In still further embodiments, the present invention encompasses methods and means that use a Cas9 system as described herein to provide for the modification of one or more plant expressed genes by mutation, substitution, insertion of one or more nucleotides. In other embodiments, the present invention encompasses the use of a CRISPR/Cas9 system as described herein to provide for the modification of the expression of one or more plant expressed genes by specifically modifying one or more of the regulatory elements that control the expression of said genes.
В конкретных вариантах осуществления настоящее изобретение охватывает способы, которые предусматривают введение экзогенных генов и/или воздействия на эндогенные гены и их регуляторные элементы, такие как приведенные ниже:In particular embodiments, the present invention encompasses methods that involve introducing exogenous genes and/or manipulating endogenous genes and their regulatory elements, such as the following:
1. Гены, которые придают устойчивость к вредителям или болезням1. Genes that confer resistance to pests or diseases
Гены, придающие устойчивость к болезням растений. Растение может быть трансформировано клонированными генами устойчивости с целью конструирования растений, которые являются устойчивыми к специфическим патогенным штаммам. См., например, Jones et al., Science 266:789 (1994) (клонирование гена устойчивости томата Cf-9 к Cladosporium fulvum); Martin et al., Science 262:1432 (1993) (ген устойчивости томата Pto к Pseudomonas syringae pv. tomato кодирует протеинкиназу); Mindrinos et al., Cell 78:1089 (1994) (арабидопсис может иметь ген RSP2 устойчивости к Pseudomonas syringae).Genes conferring resistance to plant diseases. Plants can be transformed with cloned resistance genes to engineer plants that are resistant to specific pathogenic strains. See, for example, Jones et al., Science 266:789 (1994) (cloning of the tomato Cf-9 resistance gene to Cladosporium fulvum); Martin et al., Science 262:1432 (1993) (the tomato Pto resistance gene to Pseudomonas syringae pv. tomato encodes a protein kinase); Mindrinos et al., Cell 78:1089 (1994) (Arabidopsis may have the RSP2 resistance gene to Pseudomonas syringae).
Гены, придающие устойчивость к вредителю, такому как соевая цистообразующая нематода. См., например, заявку согласно PCT WO 96/30517; заявку согласно PCT WO 93/19181.Genes conferring resistance to a pest such as the soybean cyst nematode. See, for example, PCT application WO 96/30517; PCT application WO 93/19181.
Белки Bacillus thuringiensis, см., например, в Geiser et al., Gene 48:109 (1986).For proteins of Bacillus thuringiensis, see, for example, Geiser et al., Gene 48:109 (1986).
Лектины, см., например, в Van Damme et al., Plant Molec. Biol. 24:25 (1994).Lectins, see, for example, Van Damme et al., Plant Molec. Biol. 24:25 (1994).
Витамин-связывающий белок, такой как авидин, см. в заявке согласно PCT US93/06487, описывающей применение авидина и гомологов авидина в качестве ларвацидов против насекомых-вредителей.For a vitamin binding protein such as avidin, see PCT application US93/06487, which describes the use of avidin and avidin homologues as larvacides against insect pests.
Ингибиторы ферментов, такие как ингибиторы протеазы или протеиназы или ингибиторы амилазы. См., например, Abe et al., J. Biol. Chem. 262:16793 (1987), Huub et al., Plant Molec. Biol. 21:985 (1993)), Sumitani et al., Biosci. Biotech. Biochem. 57:1243 (1993) и патент США № 5494813.Enzyme inhibitors such as protease or proteinase inhibitors or amylase inhibitors. See, e.g., Abe et al., J. Biol. Chem. 262:16793 (1987), Huub et al., Plant Molec. Biol. 21:985 (1993)), Sumitani et al., Biosci. Biotech. Biochem. 57:1243 (1993), and U.S. Patent No. 5,494,813.
Специфичные в отношении насекомых гормоны или феромоны, такие как экдистероид, или ювенильный гормон, его вариант, миметик на его основе или его антагонист или агонист. См., например, Hammock et al., Nature 344:458 (1990).Insect-specific hormones or pheromones, such as ecdysteroid or juvenile hormone, its variant, its mimetic, or its antagonist or agonist. See, e.g., Hammock et al., Nature 344:458 (1990).
Специфичные в отношении насекомых пептиды или нейропептиды, которые при экспрессии нарушают физиологию пораженного вредителя. Например, Regan, J. Biol. Chem. 269:9 (1994) и Pratt et al., Biochem. Biophys. Res. Comm. 163:1243 (1989). См. также патент США № 5266317.Insect-specific peptides or neuropeptides that, when expressed, disrupt the physiology of the affected pest. For example, Regan, J. Biol. Chem. 269:9 (1994) and Pratt et al., Biochem. Biophys. Res. Comm. 163:1243 (1989). See also U.S. Patent No. 5,266,317.
Специфичный в отношении насекомых яд, вырабатываемый в природе змеей, осой или любым другим организмом. Например, см. Pang et al., Gene 116: 165 (1992).A venom specific to insects, produced in nature by a snake, wasp, or any other organism. For example, see Pang et al., Gene 116: 165 (1992).
Ферменты, ответственные за гипераккумуляцию монотерпена, сесквитерпена, стероида, гидроксамовой кислоты, производного фенилпропаноида или другой небелковой молекулы с инсектицидной активностью.Enzymes responsible for the hyperaccumulation of a monoterpene, sesquiterpene, steroid, hydroxamic acid, phenylpropanoid derivative, or other non-protein molecule with insecticidal activity.
Ферменты, участвующие в модификации, в том числе посттрансляционной модификации, биологически активной молекулы; например, гликолитический фермент, протеолитический фермент, липолитический фермент, нуклеаза, циклаза, трансаминаза, эстереза, гидролаза, фосфатаза, киназа, фосфорилаза, полимераза, эластаза, хитиназа и глюканаза, вне зависимости от того являются ли они натуральными или синтетическими. См. заявку согласно PCT WO93/02197, Kramer et al., Insect Biochem. Molec. Biol. 23:691 (1993) и Kawalleck et al., Plant Molec. Biol. 21 :673 (1993).Enzymes involved in the modification, including post-translational modification, of a biologically active molecule; for example, a glycolytic enzyme, a proteolytic enzyme, a lipolytic enzyme, a nuclease, a cyclase, a transaminase, an esterase, a hydrolase, a phosphatase, a kinase, a phosphorylase, a polymerase, an elastase, a chitinase, and a glucanase, whether natural or synthetic. See PCT application WO93/02197, Kramer et al., Insect Biochem. Molec. Biol. 23:691 (1993) and Kawalleck et al., Plant Molec. Biol. 21:673 (1993).
Молекулы, которые стимулируют передачу сигнала. Например, см. Botella et al., Plant Molec. Biol. 24:757 (1994) и Griess et al., Plant Physiol. 104:1467 (1994).Molecules that stimulate signal transduction. For example, see Botella et al., Plant Molec. Biol. 24:757 (1994) and Griess et al., Plant Physiol. 104:1467 (1994).
Вирусные инвазивные белки или сложный токсин, полученный из них. См. Beachy et al., Ann. rev. Phytopathol. 28:451 (1990).Viral invasive proteins or complex toxin derived from them. See Beachy et al., Ann. rev. Phytopathol. 28:451 (1990).
Белки, останавливающие развитие, образуемые в природе патогеном или паразитом. См. Lamb et al., Bio/Technology 10:1436 (1992) и Toubart et al., Plant J. 2:367 (1992).Developmental arrest proteins produced in nature by a pathogen or parasite. See Lamb et al., Bio/Technology 10:1436 (1992) and Toubart et al., Plant J. 2:367 (1992).
Белок, останавливающий развитие, образуемый в природе растением. Например, Logemann et al., Bio/Technology 10:305 (1992).A growth arrest protein produced naturally by plants. For example, Logemann et al., Bio/Technology 10:305 (1992).
У растений патогены часто являются специфичными по отношению к хозяину. Например, некоторые виды Fusarium будут вызывать вилт томата, однако поражают только томат, в то время как другие виды Fusarium поражают только пшеницу. Растения обладают присущими и индуцированными защитными реакциями, обеспечивающими устойчивость к большинству патогенов. Мутации и события рекомбинации в поколениях растений приводят к генетической изменчивости, которая обуславливает восприимчивость, тем более, что патогены размножаются с большей частотой, чем растения. У растений может присутствовать нехозяйская устойчивость, например, хозяин и патоген несовместимы, или может присутствовать частичная устойчивость по отношению ко всем расам патогена, как правило, контролируемая многими генами, и/или также полная устойчивость к некоторым расам патогена, но не к другим расам. Такая устойчивость, как правило, контролируется несколькими генами. С помощью способов и компонентов системы CRISP-Cas9 в настоящее время существует новое средство для индукции предполагаемых мутаций. Соответственно, можно проанализировать геном источников генов устойчивости, и в растениях, имеющих желаемые характеристики или признаки, применять способ и компоненты системы CRISPR/Cas9 для индукции образования генов устойчивости. Системы настоящего изобретения могут выполнять это с большей точностью, чем применявшиеся ранее мутагенные средства, и, следовательно, ускорять и улучшать программы селекции растений.In plants, pathogens are often host-specific. For example, some Fusarium species will cause tomato wilt but only attack tomato, while other Fusarium species attack only wheat. Plants have intrinsic and induced defense responses that provide resistance to most pathogens. Mutations and recombination events over generations of plants result in genetic variation that determines susceptibility, especially since pathogens replicate at a higher frequency than plants. Plants may have non-host resistance, e.g., the host and pathogen are incompatible, or they may have partial resistance to all races of the pathogen, usually controlled by many genes, and/or also complete resistance to some races of the pathogen but not to other races. Such resistance is usually controlled by a few genes. Using the methods and components of the CRISP-Cas9 system, a new tool now exists for inducing putative mutations. Accordingly, the genome of resistance gene sources can be analyzed, and the method and components of the CRISPR/Cas9 system can be used in plants having the desired characteristics or traits to induce the formation of resistance genes. The systems of the present invention can do this with greater precision than previously used mutagenic agents, and therefore accelerate and improve plant breeding programs.
2. Гены, участвующие в болезнях растений, таких как приведенные в WO 2013046247.2. Genes involved in plant diseases, such as those disclosed in WO 2013046247.
Болезни риса: Magnaporthe grisea, Cochliobolus miyabeanus, Rhizoctonia solani, Gibberella fujikuroi; болезни пшеницы: Erysiphe graminis, Fusarium graminearum, F. avenaceum, F. culmorum, Microdochium nivale, Puccinia striiformis, P. graminis, P. recondita, Micronectriella nivale, Typhula sp., Ustilago tritici, Tilletia caries, Pseudocercosporella herpotrichoides, Mycosphaerella graminicola, Stagonospora nodorum, Pyrenophora tritici-repentis; болезни ячменя: Erysiphe graminis, Fusarium graminearum, F. avenaceum, F. culmorum, Microdochium nivale, Puccinia striiformis, P. graminis, P. hordei, Ustilago nuda, Rhynchosporium secalis, Pyrenophora teres, Cochliobolus sativus, Pyrenophora graminea, Rhizoctonia solani; болезни маиса: Ustilago maydis, Cochliobolus heterostrophus, Gloeocercospora sorghi, Puccinia polysora, Cercospora zeae-maydis, Rhizoctonia solani;Rice diseases: Magnaporthe grisea, Cochliobolus miyabeanus, Rhizoctonia solani, Gibberella fujikuroi; wheat diseases: Erysiphe graminis, Fusarium graminearum, F. avenaceum, F. culmorum, Microdochium nivale, Puccinia striiformis, P. graminis, P. recondita, Micronectriella nivale, Typhula sp., Ustilago tritici, Tilletia caries, Pseudocercosporella herpotrichoides, Mycosphaerella graminicola, Stagonospora nodorum, Pyrenophora tritici-repentis; barley diseases: Erysiphe graminis, Fusarium graminearum, F. avenaceum, F. culmorum, Microdochium nivale, Puccinia striiformis, P. graminis, P. hordei, Ustilago nuda, Rhynchosporium secalis, Pyrenophora teres, Cochliobolus sativus, Pyrenophora graminea, Rhizoctonia solani; maize diseases: Ustilago maydis, Cochliobolus heterostrophus, Gloeocercospora sorghi, Puccinia polysora, Cercospora zeae-maydis, Rhizoctonia solani;
болезни цитрусовых: Diaporthe citri, Elsinoe fawcetti, Penicillium digitatum, P. italicum, Phytophthora parasitica, Phytophthora citrophthora; болезни яблонь: Monilinia mali, Valsa ceratosperma, Podosphaera leucotricha, Alternaria alternata apple pathotype, Venturia inaequalis, Colletotrichum acutatum, Phytophtora cactorum;citrus diseases: Diaporthe citri, Elsinoe fawcetti, Penicillium digitatum, P. italicum, Phytophthora parasitica, Phytophthora citrophthora; apple tree diseases: Monilinia mali, Valsa ceratosperma, Podosphaera leucotricha, Alternaria alternata apple pathotype, Venturia inaequalis, Colletotrichum acutatum, Phytophtora cactorum;
болезни груш: Venturia nashicola, V. pirina, Alternaria alternata Japanese pear pathotype, Gymnosporangium haraeanum, Phytophtora cactorum;pear diseases: Venturia nashicola, V. pirina, Alternaria alternata Japanese pear pathotype, Gymnosporangium haraeanum, Phytophtora cactorum;
болезни персиков: Monilinia fructicola, Cladosporium carpophilum, Phomopsis sp.;peach diseases: Monilinia fructicola, Cladosporium carpophilum, Phomopsis sp.;
болезни винограда: Elsinoe ampelina, Glomerella cingulata, Uninula necator, Phakopsora ampelopsidis, Guignardia bidwellii, Plasmopara viticola;grape diseases: Elsinoe ampelina, Glomerella cingulata, Uninula necator, Phakopsora ampelopsidis, Guignardia bidwellii, Plasmopara viticola;
болезни хурмы: Gloesporium kaki, Cercospora kaki, Mycosphaerela nawae;persimmon diseases: Gloesporium kaki, Cercospora kaki, Mycosphaerela nawae;
болезни тыквы бутылочной: Colletotrichum lagenarium, Sphaerotheca fuliginea, Mycosphaerella melonis, Fusarium oxysporum, Pseudoperonospora cubensis, Phytophthora sp., Pythium sp.;bottle gourd diseases: Colletotrichum lagenarium, Sphaerotheca fuliginea, Mycosphaerella melonis, Fusarium oxysporum, Pseudoperonospora cubensis, Phytophthora sp., Pythium sp.;
болезни томата: Alternaria solani, Cladosporium fulvum, Phytophthora infestans;tomato diseases: Alternaria solani, Cladosporium fulvum, Phytophthora infestans;
болезни баклажана: Phomopsis vexans, Erysiphe cichoracearum;eggplant diseases: Phomopsis vexans, Erysiphe cichoracearum;
болезни капустных овощей: Alternaria japonica, Cercosporella brassicae, Plasmodiophora brassicae, Peronospora parasitica;cabbage vegetable diseases: Alternaria japonica, Cercosporella brassicae, Plasmodiophora brassicae, Peronospora parasitica;
болезни лука-батуна: Puccinia allii, Peronospora destructor;diseases of chives: Puccinia allii, Peronospora destructor;
болезни сои: Cercospora kikuchii, Elsinoe glycines, Diaporthe phaseolorum var. sojae, Septoria glycines, Cercospora sojina, Phakopsora pachyrhizi, Phytophthora sojae, Rhizoctonia solani, Corynespora casiicola, Sclerotinia sclerotiorum;soybean diseases: Cercospora kikuchii, Elsinoe glycines, Diaporthe phaseolorum var. sojae, Septoria glycines, Cercospora sojina, Phakopsora pachyrhizi, Phytophthora sojae, Rhizoctonia solani, Corynespora casiicola, Sclerotinia sclerotiorum;
болезни турецких бобов: Colletrichum lindemthianum;diseases of Turkish beans: Colletrichum lindemthianum;
болезни арахиса: Cercospora personata, Cercospora arachidicola, Sclerotium rolfsii;peanut diseases: Cercospora personata, Cercospora arachidicola, Sclerotium rolfsii;
болезни гороха: Erysiphe pisi;Pea diseases: Erysiphe pisi;
болезни картофеля: Alternaria solani, Phytophthora infestans, Phytophthora erythroseptica, Spongospora subterranean, f. sp. Subterranean;potato diseases: Alternaria solani, Phytophthora infestans, Phytophthora erythroseptica, Spongospora subterranean, f. sp. Subterranean;
болезни клубники: Sphaerotheca humuli, Glomerella cingulata;strawberry diseases: Sphaerotheca humuli, Glomerella cingulata;
болезни чая: Exobasidium reticulatum, Elsinoe leucospila, Pestalotiopsis sp., Colletotrichum theaesinensis;tea diseases: Exobasidium reticulatum, Elsinoe leucospila, Pestalotiopsis sp., Colletotrichum theaesinensis;
болезни табака: Alternaria longipes, Erysiphe cichoracearum, Colletotrichum tabacum, Peronospora tabacina, Phytophthora nicotianae;tobacco diseases: Alternaria longipes, Erysiphe cichoracearum, Colletotrichum tabacum, Peronospora tabacina, Phytophthora nicotianae;
болезни рапса: Sclerotinia sclerotiorum, Rhizoctonia solani;rape diseases: Sclerotinia sclerotiorum, Rhizoctonia solani;
болезни хлопчатника: Rhizoctonia solani;cotton diseases: Rhizoctonia solani;
болезни свеклы: Cercospora beticola, Thanatephorus cucumeris, Thanatephorus cucumeris, Aphanomyces cochlioides;beet diseases: Cercospora beticola, Thanatephorus cucumeris, Thanatephorus cucumeris, Aphanomyces cochlioides;
болезни роз: Diplocarpon rosae, Sphaerotheca pannosa, Peronospora sparsa;rose diseases: Diplocarpon rosae, Sphaerotheca pannosa, Peronospora sparsa;
болезни хризантем и астровых: Bremia lactuca, Septoria chrysanthemi-indici, Puccinia horiana;diseases of chrysanthemums and asters: Bremia lactuca, Septoria chrysanthemi-indici, Puccinia horiana;
болезни различных растений: Pythium aphanidermatum, Pythium debarianum, Pythium graminicola, Pythium irregulare, Pythium ultimum, Botrytis cinerea, Sclerotinia sclerotiorum;diseases of various plants: Pythium aphanidermatum, Pythium debarianum, Pythium graminicola, Pythium irregulare, Pythium ultimum, Botrytis cinerea, Sclerotinia sclerotiorum;
болезни редиса: Alternaria brassicicola;radish diseases: Alternaria brassicicola;
болезни цойсии: Sclerotinia homeocarpa, Rhizoctonia solani;diseases of zoysia: Sclerotinia homeocarpa, Rhizoctonia solani;
болезни банана: Mycosphaerella fijiensis, Mycosphaerella musicola;banana diseases: Mycosphaerella fijiensis, Mycosphaerella musicola;
болезни подсолнечника: Plasmopara halstedii;sunflower diseases: Plasmopara halstedii;
болезни семян и болезни на начальных стадиях роста различных растений, вызванные Aspergillus spp., Penicillium spp., Fusarium spp., Gibberella spp., Tricoderma spp., Thielaviopsis spp., Rhizopus spp., Mucor spp., Corticium spp., Rhoma spp., Rhizoctonia spp., Diplodia spp. и т.п.;seed diseases and diseases at the initial stages of growth of various plants caused by Aspergillus spp., Penicillium spp., Fusarium spp., Gibberella spp., Tricoderma spp., Thielaviopsis spp., Rhizopus spp., Mucor spp., Corticium spp., Rhoma spp., Rhizoctonia spp., Diplodia spp. etc.;
вирусные болезни различных растений, опосредованные Polymixa spp., Olpidium spp. и т.п.viral diseases of various plants mediated by Polymixa spp., Olpidium spp., etc.
3. Примеры генов, которые придают устойчивость к гербицидам3. Examples of genes that confer herbicide resistance
Устойчивость к гербицидам, которые ингибируют точку роста или меристему, такие как имидазолинон или сульфомочевина, например, Lee et al., EMBO J. 7:1241 (1988), и Miki et al., Theor. Appl. Genet. 80:449 (1990) соответственно.Resistance to herbicides that inhibit the growing point or meristem, such as imidazolinone or sulfonylurea, e.g., Lee et al., EMBO J. 7:1241 (1988), and Miki et al., Theor. Appl. Genet. 80:449 (1990), respectively.
Переносимость глифосата (устойчивость, придаваемая, например, генами мутантной 5-енолпирувилшикимат-3-фосфатсинтазы (EPSPS), генами aroA и генами глифосатацетилтрансферазы (GAT) соответственно), или устойчивость к другим фосфоновым соединениям, например, с помощью генов глюфосината (фосфинотрицинацетилтрансферазы (PAT) от видов Streptomyces, в том числе Streptomyces hygroscopicus и Streptomyces viridichromogenes), и к пиридинокси- или феноксипропионовым кислотам и циклогексонам с помощью генов, кодирующих ингибиторы ACCазы. См., например, патент США № 4940835 и патент США № 6248876, патент США № 4769061, EP № 0333033 и патент США № 4975374. См. также EP № 0242246, DeGreef et al., Bio/Technology 7:61 (1989), Marshall et al., Theor. Appl. Genet. 83:435 (1992), WO 2005012515 от Castle et. al. и WO 2005107437.Tolerance to glyphosate (resistance conferred, for example, by mutant 5-enolpyruvylshikimate-3-phosphate synthase (EPSPS) genes, aroA genes, and glyphosate acetyltransferase (GAT) genes, respectively), or resistance to other phosphonic compounds, for example by glufosinate genes (phosphinothricin acetyltransferase (PAT) from Streptomyces species, including Streptomyces hygroscopicus and Streptomyces viridichromogenes), and to pyridineoxy- or phenoxypropionic acids and cyclohexons by genes encoding ACCase inhibitors. See, for example, U.S. Patent No. 4,940,835 and U.S. Patent No. 6,248,876, U.S. Patent No. 4,769,061, EP No. 0333033, and U.S. Patent No. 4,975,374. See also EP No. 0242246, DeGreef et al., Bio/Technology 7:61 (1989), Marshall et al., Theor. Appl. Genet. 83:435 (1992), WO 2005012515 of Castle et. al., and WO 2005107437.
Устойчивость к гербицидам, которые ингибируют фотосинтез, такие как триазин (гены psbA и gs+) или бензонитрил (ген нитрилазы), и глутатион-S-трансфераза, в Przibila et al., Plant Cell 3:169 (1991), патент США № 4810648, и Hayes et al., Biochem. J. 285: 173 (1992).Resistance to herbicides that inhibit photosynthesis, such as triazine (psbA and gs+ genes) or benzonitrile (nitrilase gene), and glutathione S-transferase, in Przibila et al., Plant Cell 3:169 (1991), U.S. Patent No. 4,810,648, and Hayes et al., Biochem. J. 285: 173 (1992).
Гены, кодирующие ферменты, детоксифицирующие гербицид, или мутантный фермент глутаминсинтазу, которая устойчива к ингибированию, например, в заявке на патент США с серийным № 11/760602. Или детоксифицирующий фермент представляет собой фермент, кодирующий фосфинотрицинацетилтрансферазу (такую как белок bar или pat от видов Streptomyces). Фосфинотрицинацетилтрансферазы описаны, например, в патентах США №№ 5561236; 5648477; 5646024; 5273894; 5637489; 5276268; 5739082; 5908810 и 7112665.Genes encoding herbicide detoxifying enzymes or a mutant glutamine synthase enzyme that is resistant to inhibition are, for example, in U.S. Patent Application Serial No. 11/760,602. Or the detoxifying enzyme is an enzyme encoding a phosphinothricin acetyltransferase (such as the bar or pat protein from Streptomyces species). Phosphinothricin acetyltransferases are described, for example, in U.S. Patent Nos. 5,561,236; 5,648,477; 5,646,024; 5,273,894; 5,637,489; 5,276,268; 5,739,082; 5,908,810; and 7,112,665.
Ингибиторы гидроксифенилпируватдиоксигеназ (HPPD), т.е. встречающиеся в природе устойчивые к HPPD ферменты, или гены, кодирующие мутированный или химерный фермент HPPD, как описано в WO 96/38567, WO 99/24585 и WO 99/24586, WO 2009/144079, WO 2002/046387 или патенте США № 6768044.Hydroxyphenylpyruvate dioxygenase (HPPD) inhibitors, i.e. naturally occurring HPPD-resistant enzymes, or genes encoding a mutated or chimeric HPPD enzyme, as described in WO 96/38567, WO 99/24585 and WO 99/24586, WO 2009/144079, WO 2002/046387 or U.S. Patent No. 6,768,044.
4. Примеры генов, участвующих в переносимости абиотического стресса4. Examples of genes involved in abiotic stress tolerance
Трансген, способный с ослаблению экспрессии и/или активности гена поли(ADP-рибозо)полимеразы (PARP) в растительных клетках или растениях, как описано в WO 00/04173 или WO/2006/045633.A transgene capable of reducing the expression and/or activity of the poly(ADP-ribose) polymerase (PARP) gene in plant cells or plants, as described in WO 00/04173 or WO/2006/045633.
Трансгены, способные с ослаблению экспрессии и/или активности кодирующих PARG генов растений или растительных клеток, как описано в WO 2004/090140.Transgenes capable of reducing the expression and/or activity of PARG-encoding genes in plants or plant cells as described in WO 2004/090140.
Трансгены, кодирующие функциональный в растениях фермент пути утилизации и синтеза никотинамидадениндинуклеотида, в том числе никотинамидазу, никотинатфосфорибозилтрансферазу, мононуклеотидаденилтрансферазу никотиновой кислоты, никотинамидадениндинуклеотидсинтетазу или никотинамидфосфорибозилтрансферзазу, как описано в EP 04077624.7, WO 2006/133827, PCT/EP07/002,433, EP 1999263 или WO 2007/107326.Transgenes encoding a functional enzyme in plants of the nicotinamide adenine dinucleotide utilization and synthesis pathway, including nicotinamidase, nicotinate phosphoribosyltransferase, nicotinic acid mononucleotide adenyltransferase, nicotinamide adenine dinucleotide synthetase or nicotinamide phosphoribosyltransferase, as described in EP 04077624.7, WO 2006/133827, PCT/EP07/002,433, EP 1999263 or WO 2007/107326.
Ферменты, участвующие в биосинтезе углеводов, включают описанные например, в EP 0571427, WO 95/04826, EP 0719338, WO 96/15248, WO 96/19581, WO 96/27674, WO 97/11188, WO 97/26362, WO 97/32985, WO 97/42328, WO 97/44472, WO 97/45545, WO 98/27212, WO 98/40503, WO99/58688, WO 99/58690, WO 99/58654, WO 00/08184, WO 00/08185, WO 00/08175, WO 00/28052, WO 00/77229, WO 01/12782, WO 01/12826, WO 02/101059, WO 03/071860, WO 2004/056999, WO 2005/030942, WO 2005/030941, WO 2005/095632, WO 2005/095617, WO 2005/095619, WO 2005/095618, WO 2005/123927, WO 2006/018319, WO 2006/103107, WO 2006/108702, WO 2007/009823, WO 00/22140, WO 2006/063862, WO 2006/072603, WO 02/034923, EP 06090134.5, EP 06090228.5, EP 06090227.7, EP 07090007.1, EP 07090009.7, WO 01/14569, WO 02/79410, WO 03/33540, WO 2004/078983, WO 01/19975, WO 95/26407, WO 96/34968, WO 98/20145, WO 99/12950, WO 99/66050, WO 99/53072, патенте США № 6734341, WO 00/11192, WO 98/22604, WO 98/32326, WO 01/98509, WO 01/98509, WO 2005/002359, патенте США № 5824790, патенте США № 6013861, WO 94/04693, WO 94/09144, WO 94/11520, WO 95/35026 или WO 97/20936, или ферменты, участвующие в образовании полифруктозы, в частности, из инулина или леванов, как раскрыто в EP 0663956, WO 96/01904, WO 96/21023, WO 98/39460 и WO 99/24593, образовании альфа-1,4-глюканов, как раскрыто в WO 95/31553, US 2002031826, патенте США № 6284479, патенте США № 5712107, WO 97/47806, WO 97/47807, WO 97/47808 и WO 00/14249, образовании альфа-1,6 разветвленных альфа-1,4-глюканов, как раскрыто в WO 00/73422, образовании альтернана, как раскрыто, например, в WO 00/47727, WO 00/73422, EP 06077301.7, патенте США № 5908975 и EP 0728213, образовании гиалуронана, например, как раскрыто в WO 2006/032538, WO 2007/039314, WO 2007/039315, WO 2007/039316, JP 2006304779 и WO 2005/012529.Enzymes involved in carbohydrate biosynthesis include those described, for example, in EP 0 571 427, WO 95/04826, EP 0 719 338, WO 96/15248, WO 96/19581, WO 96/27674, WO 97/11188, WO 97/26362, WO 97/32985, WO 97/42328, WO 97/44472, WO 97/45545, WO 98/27212, WO 98/40503, WO99/58688, WO 99/58690, WO 99/58654, WO 00/08184, WO 00/08185, WO 00/08175, WO 00/28052, WO 00/77229, WO 01/12782, WO 01/12826, WO 02/101059, WO 03/071860, WO 2004/056999, WO 2005/030942, WO 2005/030941, WO 2005/095632, WO 2005/095617, WO 2005/095619, WO 2005/095618, WO 2005/123927, WO 2006/018319, WO 2006/103107 WO 2006/108702, WO 2007/009823, WO 00/22140, WO 2006/063862, WO 2006/072603, WO 02/034923, EP 06090134.5, EP 06090228.5, EP 06090227.7, EP 07090007.1, EP 07090009.7, WO 01/14569, WO 02/79410, WO 03/33540, WO 2004/078983, WO 01/19975, WO 95/26407, WO 96/34968, WO 98/20145, WO 99/12950, WO 99/66050, WO 99/53072, US Patent No. 6,734,341, WO 00/11192, WO 98/22604, WO 98/32326, WO 01/98509, WO 01/98509, WO 2005/002359, US Patent No. 5,824,790, US Patent No. 6,013,861, WO 94/04693, WO 94/09144, WO 94/11520, WO 95/35026 or WO 97/20936, or enzymes involved in the formation of polyfructose, in particular from inulin or levans as disclosed in EP 0 663 956, WO 96/01904, WO 96/21023, WO 98/39460 and WO 99/24593, the formation of alpha-1,4-glucans as disclosed in WO 95/31553, US 2002 031 826, US Patent No. 6,284,479, US Patent No. 5,712,107, WO 97/47806, WO 97/47807, WO 97/47808 and WO 00/14249, the formation of alpha-1,6 branched alpha-1,4-glucans as disclosed in WO 00/73422, the formation of alternan as disclosed, for example, in WO 00/47727, WO 00/73422, EP 06077301.7, US Patent No. 5908975 and EP 0728213, the formation of hyaluronan, for example as disclosed in WO 2006/032538, WO 2007/039314, WO 2007/039315, WO 2007/039316, JP 2006304779 and WO 2005/012529.
Гены, которые повышают засухоустойчивость. Например, в WO 2013122472 раскрыто, что отсутствие или сниженный уровень функционального белка убиквитинпротеинлигазы (UPL), в частности, UPL3, приводит к сниженной потребности в воде или повышенной устойчивости к засухе указанного растения. Другие примеры трансгенных растений с повышенной переносимостью засухи раскрыты, например, в US 2009/0144850, US 2007/0266453 и WO 2002/083911. В US2009/0144850 описано растение, проявляющее фенотип переносимости засухи в результате измененной экспрессии нуклеиновой кислоты DR02. В US 2007/0266453 описано растение, проявляющее фенотип переносимости засухи в результате измененной экспрессии нуклеиновой кислоты DR03, и в WO 2002/08391 1 описано растение, имеющее повышенную переносимость стресса, вызванного засухой, в результате ослабленной активности АВС-транспортера, который экспрессируется в замыкающих клетках. Другим примером является исследование Kasuga и соавторов (1999), которые описывают, что сверхэкспрессия кДНК, кодирующей DREB1 A в трансгенных растениях, активировала экспрессию многих генов переносимости стресса при нормальных условиях роста и приводила к повышенной устойчивости к засухе, солевой нагрузке и замораживанию. Однако экспрессия DREB1A также приводила к тяжелой задержке роста при нормальных условиях роста (Kasuga (1999) Nat Biotechnol 17(3) 287-291).Genes that enhance drought tolerance. For example, WO2013122472 discloses that the absence or reduced level of a functional ubiquitin protein ligase (UPL) protein, in particular UPL3, results in a reduced water requirement or increased drought tolerance in said plant. Other examples of transgenic plants with increased drought tolerance are disclosed, for example, in US2009/0144850, US2007/0266453 and WO2002/083911. US2009/0144850 describes a plant exhibiting a drought tolerance phenotype as a result of altered expression of a DR02 nucleic acid. US 2007/0266453 describes a plant exhibiting a drought tolerance phenotype as a result of altered expression of the DR03 nucleic acid, and WO 2002/08391 1 describes a plant having increased tolerance to drought stress as a result of impaired activity of an ABC transporter expressed in guard cells. Another example is the study of Kasuga et al. (1999), who described that overexpression of a cDNA encoding DREB1 A in transgenic plants activated the expression of many stress tolerance genes under normal growth conditions and resulted in increased tolerance to drought, salt stress, and freezing. However, expression of DREB1A also resulted in severe growth retardation under normal growth conditions (Kasuga (1999) Nat Biotechnol 17(3) 287-291).
В дополнительных конкретных вариантах осуществления сельскохозяйственные растения могут быть улучшены под влиянием определенных признаков растений. Например, при разработке растений, устойчивых к пестицидам, повышении устойчивости к заболеваниям у растений, повышении устойчивости к вредным для растений насекомым и нематодам, повышении устойчивости растений к паразитирующим сорнякам, повышении засухоустойчивости растений, повышении пищевой ценности растений, повышении переносимости стресса растений, избегании самоопыления, повышении перевариваемости кормовых растений, биомассы, урожая зерна и др. Несколько конкретных неограничивающих примеров предусмотрены в данном документе ниже.In additional specific embodiments, agricultural plants can be improved by influencing certain plant traits. For example, in developing pesticide-resistant plants, increasing disease resistance in plants, increasing resistance to plant-harmful insects and nematodes, increasing plant resistance to parasitic weeds, increasing drought resistance in plants, increasing plant nutritional value, increasing plant stress tolerance, avoiding self-pollination, increasing forage digestibility, biomass, grain yield, etc. Several specific non-limiting examples are provided herein below.
Кроме целевой мутации единичных генов, комплексы Cas9CRISPR могут быть разработаны для обеспечения целевой мутации нескольких генов, делеции хромосомного фрагмента, сайт-специфической интеграции трансгена, сайт-направленного мутагенеза in vivo и точного замещения гена или замены аллелей у растений. Таким образом, способы, описанные в данном документе, имеют широкие варианты применения при обнаружении и валидации генов, мутационной и цисгенной селекции и гибридной селекции. Эти варианты применения облегчают получение нового поколения генетически модифицированных сельскохозяйственных культур с различными улучшенными агрономическими признаками, такими как устойчивость к гербицидам, устойчивость к болезням, переносимость абиотического стресса, высокая урожайность и отличное качество.In addition to targeted mutation of single genes, Cas9CRISPR complexes can be designed to provide targeted mutation of multiple genes, deletion of a chromosomal fragment, site-specific transgene integration, site-directed mutagenesis in vivo, and precise gene replacement or allelic replacement in plants. Thus, the methods described herein have broad applications in gene discovery and validation, mutation and cisgenic breeding, and hybrid breeding. These applications facilitate the production of a new generation of genetically modified crops with various improved agronomic traits, such as herbicide tolerance, disease resistance, abiotic stress tolerance, high yield, and excellent quality.
Применение гена Cas9 для получения мужских стерильных растенийUsing Cas9 gene to produce male sterile plants
Гибридные растения, как правило, имеют предпочтительные агрономические признаки по сравнению с инбредными растениями. Однако для самоопылящихся растений получение гибридов может быть проблематичным. У различных типов растений были идентифицированы гены, которые важны для фертильности растений, в частности, мужской фертильности. Например, у маиса были идентифицированы по меньшей мере два гена, которые важны для фертильности (Amitabh Mohanty International Conference on New Plant Breeding Molecular Technologies Technology Development And Regulation, Oct 9-10, 2014, Jaipur, India; Svitashev et al. Plant Physiol. 2015 Oct;169(2):931-45; Djukanovic et al. Plant J. 2013 Dec;76(5):888-99). Способы, предусмотренные в данном документе, могут быть использованы для нацеливания на гены, необходимые для мужской фертильности, для того, чтобы получить мужские стерильные растения, которые могут быть легко скрещены с получением гибридов. В конкретных вариантах осуществления система CRISPR/Cas9, предусмотренная в данном документе, используется для направленного мутагенеза цитохром P450-подобного гена (MS26) или гена мегануклеазы (MS45), тем самым придавая мужскую стерильность растению маиса. Растения маиса, которые по этой причине генетически изменены, можно применять в программах селекции гибридов.Hybrid plants generally have favorable agronomic traits compared to inbred plants. However, for self-pollinating plants, producing hybrids can be problematic. Genes that are important for plant fertility, particularly male fertility, have been identified in various plant types. For example, in maize, at least two genes have been identified that are important for fertility (Amitabh Mohanty International Conference on New Plant Breeding Molecular Technologies Technology Development And Regulation, Oct 9-10, 2014, Jaipur, India; Svitashev et al. Plant Physiol. 2015 Oct;169(2):931-45; Djukanovic et al. Plant J. 2013 Dec;76(5):888-99). The methods provided herein can be used to target genes required for male fertility in order to produce male sterile plants that can be easily crossed to produce hybrids. In particular embodiments, the CRISPR/Cas9 system provided herein is used to site-directed mutagenesis of a cytochrome P450-like gene (MS26) or a meganuclease gene (MS45), thereby rendering a maize plant male sterile. Maize plants that are genetically altered for this reason can be used in hybrid breeding programs.
Повышение стадии фертильности у растенийIncreasing the fertility stage in plants
В конкретных вариантах осуществления способы, предусмотренные в данном документе, используют для продления стадии фертильности растения, такого как растение риса. Например, на ген стадии фертильности риса, такой как Ehd3, можно нацеливаться с получением мутации в гене, а сеянцы могут быть отобраны в отношении продленной стадии фертильности при регенерации растений (как описано в CN 104004782)In particular embodiments, the methods provided herein are used to extend the fertile stage of a plant, such as a rice plant. For example, a rice fertile stage gene, such as Ehd3, can be targeted to produce a mutation in the gene, and seedlings can be selected for an extended fertile stage in plant regeneration (as described in CN 104004782)
Применение Cas9 для получения генетической вариации у представляющего интерес сельскохозяйственного растенияUsing Cas9 to Genetically Genetically Adapt a Crop of Interest
Доступность идиоплазмы дикого типа и генетические вариации в сельскохозяйственных растениях является ключевым моментом для программ улучшения сельскохозяйственных культур, однако доступная изменчивость идиоплазм от сельскохозяйственных культур является ограниченной. Настоящее изобретение предусматривает способы получения разнообразия генетических вариаций представляющей интерес идиоплазмы. В настоящей заявке системы CRISPR/Cas9 предусмотрена библиотека chi/sgRNA, нацеленных на различные локусы в геноме растений, и ее вводят в растительные клетки совместно с эффекторным белком Cas9. В этом отношении может быть получена коллекция геномных точковых мутаций и генных нокаутов. В конкретных вариантах осуществления способы включают получение части растения или растения из клеток, полученных таким образом, и скрининг клеток на наличие представляющего интерес признака. Целевые гены могут включать кодирующие и некодирующие области. В конкретных вариантах осуществления признак представляет собой переносимость стресса, а способ представляет собой способ получения сортов сельскохозяйственных растений с переносимостью стресса.The availability of wild-type germplasm and genetic variation in crop plants is a key point for crop improvement programs, however, the available germplasm variability from crops is limited. The present invention provides methods for obtaining a diversity of genetic variations of a germplasm of interest. In the present application, a CRISPR/Cas9 system is provided with a library of chi/sgRNA targeting various loci in the plant genome and is introduced into plant cells in conjunction with a Cas9 effector protein. In this regard, a collection of genomic point mutations and gene knockouts can be obtained. In particular embodiments, the methods include obtaining a plant part or plant from the cells thus obtained and screening the cells for the presence of a trait of interest. The target genes can include coding and non-coding regions. In particular embodiments, the trait is stress tolerance and the method is a method for producing crop varieties with stress tolerance.
Применение Cas9 для воздействия на созревание плодовApplication of Cas9 to influence fruit ripening
Созревание представляет собой нормальную фазу в процессе созревания плодов и овощей. Лишь спустя несколько дней после своего начала оно делает плод или овощ несъедобным. Этот процесс приносит значительные убытки как фермерам, так и потребителям. В конкретных вариантах осуществления способы по настоящему изобретению используют для ослабления образования этилена. Это достигается при обеспечении одного или нескольких из следующего. a. Подавления экспрессии гена ACC-синтазы. ACC-(1-аминоциклопропан-1-карбоновая кислота)-синтаза представляет собой фермент, ответственный за превращение S-аденозилметионина (SAM) в ACC, происходящее со второй до последней стадии в биосинтезе этилена. Экспрессия ферментов нарушена, если антисмысловая ("зеркльное отображение") или усеченная копия гена синтазы вставлена в геном растения; b. вставки гена ACC-дезаминазы. Ген, кодирующий фермент, получают из Pseudomonas chlororaphis, распространенной непатогенной почвенной бактерии. Он превращает ACC в другое соединение, тем самым снижая количество ACC, доступное для образования этилена; c. вставки гена SAM-гидролазы. Этот подход является аналогичным в случае ACC-дезаминазы, где образования этилена нарушается, когда количество его метаболита-предшественника снижено; в этом случае SAM превращается в гомосерин. Ген, кодирующий фермент, получают из бактериофага E. coli T3, и d. супрессии экспрессии гена ACC-оксидазы. ACC-оксидаза представляет собой фермент, который катализирует окисление ACC в этилен, являющееся последней стадией в пути биосинтеза этилена. С помощью способов, описанных в данном документе, снижение экспрессии гена ACC-оксидазы приводит к подавлению образования этилена, тем самым происходит задержка созревания плодов. В конкретных вариантах осуществления дополнительно или альтернативно к модификациям, описанным в данном документе, применяют способы, описанные в данном документе, для модификации этиленовых рецепторов с тем, чтобы нарушить сигналы от этилена, получаемые плодом. В конкретных вариантах осуществления экспрессия гена ETR1, кодирующего этилен-связывающий белок, является модифицированной, в частности, супрессированной. В конкретных вариантах осуществления дополнительно или альтернативно к модификациям, описанным в данном документе, используют способы, описанные в данном документе, для модификации экспрессии гена, кодирующего полигалактуроназу (PG), которая представляет собой фермент, ответственный за разрушение пектина, соединения, которое поддерживает целостность клеточных стенок растений. Разрушение пектина происходит в начале процесса созревания, приводя к размягчению плода. Соответственно, в конкретных вариантах осуществления способы, описанные в данном документе, используют для введения мутации в ген PG или для супрессии активации гена PG с целью снижения количества образующегося фермента PG, тем самым задерживая разрушение пектина.Ripening is a normal phase in the ripening process of fruits and vegetables. Only a few days after its onset, it renders the fruit or vegetable inedible. This process causes significant losses to both farmers and consumers. In particular embodiments, the methods of the present invention are used to reduce ethylene formation. This is achieved by providing one or more of the following. a. Suppressing the expression of the ACC synthase gene. ACC (1-aminocyclopropane-1-carboxylic acid) synthase is an enzyme responsible for the conversion of S-adenosylmethionine (SAM) to ACC, which occurs from the second to the last step in ethylene biosynthesis. Enzyme expression is impaired when an antisense ("mirror image") or truncated copy of the synthase gene is inserted into the plant genome; b. insertion of the ACC deaminase gene. The gene encoding the enzyme is obtained from Pseudomonas chlororaphis, a common non-pathogenic soil bacterium. It converts ACC into another compound, thereby reducing the amount of ACC available for ethylene formation; c. insertion of the SAM hydrolase gene. This approach is similar to the case of ACC deaminase, where ethylene formation is impaired when the amount of its precursor metabolite is reduced; in this case, SAM is converted to homoserine. The gene encoding the enzyme is obtained from the E. coli T3 bacteriophage, and d. suppression of ACC oxidase gene expression. ACC oxidase is an enzyme that catalyzes the oxidation of ACC to ethylene, which is the last step in the ethylene biosynthetic pathway. By the methods described herein, reduction of ACC oxidase gene expression results in suppression of ethylene formation, thereby delaying fruit ripening. In particular embodiments, in addition to or as an alternative to the modifications described herein, the methods described herein are used to modify ethylene receptors to disrupt ethylene signals received by the fruit. In particular embodiments, the expression of the ETR1 gene, which encodes an ethylene binding protein, is modified, in particular suppressed. In particular embodiments, in addition to or as an alternative to the modifications described herein, the methods described herein are used to modify the expression of a gene encoding polygalacturonase (PG), which is an enzyme responsible for the degradation of pectin, a compound that maintains the integrity of plant cell walls. Pectin degradation occurs early in the ripening process, resulting in softening of the fruit. Accordingly, in particular embodiments, the methods described herein are used to introduce a mutation into the PG gene or to suppress the activation of the PG gene to reduce the amount of PG enzyme produced, thereby delaying pectin degradation.
Таким образом, в конкретных вариантах осуществления способы включают применение системы CRISPR/Cas9 для обеспечения одной или нескольких модификаций генома растительной клетки, таких как описаны выше, и регенерации из нее растения. В конкретных вариантах осуществления растение представляет собой растения томата.Thus, in particular embodiments, the methods include using a CRISPR/Cas9 system to provide one or more modifications to the genome of a plant cell, such as those described above, and regenerating a plant therefrom. In particular embodiments, the plant is a tomato plant.
Повышение срока хранения растенийIncreasing the shelf life of plants
В конкретных вариантах осуществления способы по настоящему изобретению используют для модификации генов, участвующих в образовании соединений, которые влияют на срок годности растения или части растений. В частности, модификацию выполняют в гене, которая предупреждает накопление восстанавливающих сахаров в клубнях картофеля. При обработке высокой температурой эти восстанавливающие сахара реагируют со свободными аминокислотами, приводя к образованию продуктов коричневого цвета с горьким вкусом и повышенных уровней акриламида, который является потенциальным канцерогеном. В конкретных вариантах осуществления способы, предусмотренные в данном документе, используют для ослабления или ингибирования экспрессии гена вакуолярной инвертазы (VInv), который кодирует белок, который разрушает сахарозу до глюкозы и фруктозы (Clasen et al. DOI: 10.1111/pbi.12370).In particular embodiments, the methods of the present invention are used to modify genes involved in the formation of compounds that affect the shelf life of a plant or plant part. In particular, the modification is made in a gene that prevents the accumulation of reducing sugars in potato tubers. When treated with high heat, these reducing sugars react with free amino acids, resulting in the formation of brown, bitter-tasting products and elevated levels of acrylamide, which is a potential carcinogen. In particular embodiments, the methods provided herein are used to reduce or inhibit the expression of the vacuolar invertase (VInv) gene, which encodes a protein that breaks down sucrose into glucose and fructose (Clasen et al. DOI: 10.1111/pbi.12370).
Применение системы CRISPR/Cas9 для обеспечения признака с дополнительным эффектомUsing the CRISPR/Cas9 system to provide a trait with an additional effect
В конкретных вариантах осуществления систему CRISPR/Cas9 используют для получения сельскохозяйственных культур с улучшенными питательными свойствами. В конкретных вариантах осуществления способы, предусмотренные в данном документе, адаптированы к получению "функциональных продуктов питания", т.е. модифицированного продукта питания или продуктового компонента, которые могут обеспечивать пользу для здоровья помимо традиционных нутриентов, которые он содержит, или "нутрицевтиков", т.е. веществ, которые могут рассматриваться продуктом питания или частью продукта питания, и обеспечивают пользу для здоровья, в том числе предупреждение и лечения заболевания. В конкретных вариантах осуществления нутрицевтик является полезным для предупреждения и/или лечения одного или нескольких из рака, диабета, сердечно-сосудистого заболевания или гипертензии.In particular embodiments, the CRISPR/Cas9 system is used to produce crops with improved nutritional properties. In particular embodiments, the methods provided herein are adapted to produce "functional foods," i.e., a modified food or food component that can provide health benefits beyond the traditional nutrients it contains, or "nutraceuticals," i.e., substances that can be considered a food or part of a food and provide health benefits, including the prevention and treatment of disease. In particular embodiments, the nutraceutical is useful for the prevention and/or treatment of one or more of cancer, diabetes, cardiovascular disease, or hypertension.
Примеры сельскохозяйственных культур с улучшенными питательными свойствами включают (Newell-McGloughlin, Plant Physiology, July 2008, Vol. 147, pp. 939-953):Examples of crops with improved nutritional properties include (Newell-McGloughlin, Plant Physiology, July 2008, Vol. 147, pp. 939-953):
модифицированное качество белка, содержание и/состав аминокислот, например, как описано для гречки заметной (Luciani et al. 2005, Florida Genetics Conference Poster), канолы (Roesler et al., 1997, Plant Physiol 113 75-81), маиса (Cromwell et al, 1967, 1969 J Anim Sci 26 1325-1331, O'Quin et al. 2000 J Anim Sci 78 2144-2149, Yang et al. 2002, Transgenic Res 11 11-20, Young et al. 2004, Plant J 38 910-922), картофеля (Yu J and Ao, 1997 Acta Bot Sin 39 329-334; Chakraborty et al. 2000, Proc Natl Acad Sci USA 97 3724-3729; Li et al. 2001) Chin Sci Bull 46 482-484, Rice (Katsube et al. 1999, Plant Physiol 120 1063-1074), сои (Dinkins et al. 2001, Rapp 2002, In Vitro Cell Dev Biol Plant 37 742-747), батата (Egnin and Prakash 1997, In Vitro Cell Dev Biol 33 52A).modified protein quality, amino acid content and/or composition, such as described for buckwheat (Luciani et al. 2005, Florida Genetics Conference Poster), canola (Roesler et al., 1997, Plant Physiol 113 75-81), maize (Cromwell et al, 1967, 1969 J Anim Sci 26 1325-1331, O'Quin et al. 2000 J Anim Sci 78 2144-2149, Yang et al. 2002, Transgenic Res 11 11-20, Young et al. 2004, Plant J 38 910-922), potato (Yu J and Ao, 1997 Acta Bot Sin 39 329-334; Chakraborty et al. 2000, Proc Natl Acad Sci USA 97 3724-3729; Li et al. 2001) Chin Sci Bull 46 482-484, Rice (Katsube et al. 1999, Plant Physiol 120 1063-1074), soybean (Dinkins et al. 2001, Rapp 2002, In Vitro Cell Dev Biol Plant 37 742-747), sweet potato (Egnin and Prakash 1997, In Vitro Cell Dev Biol 33 52A).
Cодержание незаменимых аминокислот, например, как описано для канолы (Falco et al. 1995, Bio/Technology 13 577-582), Lupin (White et al. 2001, J Sci Food Agric 81 147-154), маиса (Lai and Messing, 2002, Agbios 2008 GM crop database (March 11, 2008)), картофеля (Zeh et al. 2001, Plant Physiol 127 792-802), сорго (Zhao et al. 2003, Kluwer Academic Publishers, Dordrecht, The Netherlands, pp 413-416), сои (Falco et al. 1995 Bio/Technology 13 577-582; Galili et al. 2002 Crit Rev Plant Sci 21 167-204).Essential amino acid content, for example, as described for canola (Falco et al. 1995, Bio/Technology 13 577–582), lupin (White et al. 2001, J Sci Food Agric 81 147–154), maize (Lai and Messing, 2002, Agbios 2008 GM crop database (March 11, 2008)), potato (Zeh et al. 2001, Plant Physiol 127 792–802), sorghum (Zhao et al. 2003, Kluwer Academic Publishers, Dordrecht, The Netherlands, pp 413–416), soybean (Falco et al. 1995 Bio/Technology 13 577–582; Galili et al. 2002 Crit Rev Plant Sci 21 167–204).
Масла и жирные кислоты, например, для канолы (Dehesh et al. (1996) Plant J 9 167-172 [PubMed] ; Del Vecchio (1996) INFORM International News on Fats, Oils and Related Materials 7 230-243; Roesler et al. (1997) Plant Physiol 113 75-81 [PMC free article] [PubMed]; Froman and Ursin (2002, 2003) Abstracts of Papers of the American Chemical Society 223 U35; James et al. (2003) Am J Clin Nutr 77 1140-1145 [PubMed]; Agbios (2008, выше); хлопчатника (Chapman et al. (2001). J Am Oil Chem Soc 78 941-947; Liu et al. (2002) J Am Coll Nutr 21 205S-211S [PubMed]; O'Neill (2007) Australian Life Scientist. http://www.biotechnews.com.au/index.php/id;866694817;fp;4;fpid;2 (June 17, 2008), льна (Abbadi et al., 2004, Plant Cell 16: 2734-2748), маиса (Young et al., 2004, Plant J 38 910-922), масличной пальмы (Jalani et al. 1997, J Am Oil Chem Soc 74 1451-1455; Parveez, 2003, AgBiotechNet 113 1-8), риса (Anai et al., 2003, Plant Cell Rep 21 988-992), сои (Reddy and Thomas, 1996, Nat Biotechnol 14 639-642; Kinney and Kwolton, 1998, Blackie Academic and Professional, London, pp 193-213), подсолнечника (Arcadia, Biosciences 2008).Oils and fatty acids, such as for canola (Dehesh et al. (1996) Plant J 9 167–172 [PubMed] ; Del Vecchio (1996) INFORM International News on Fats, Oils and Related Materials 7 230–243; Roesler et al. (1997) Plant Physiol 113 75–81 [PMC free article] [PubMed]; Froman and Ursin (2002, 2003) Abstracts of Papers of the American Chemical Society 223 U35; James et al. (2003) Am J Clin Nutr 77 1140–1145 [PubMed]; Agbios (2008, above); cotton (Chapman et al. (2001) J Am Oil Chem Soc 78 941–947; Liu et al. (2002) J Am Coll Nutr 21 205S-211S [PubMed]; O'Neill (2007) Australian Life Scientist. http://www.biotechnews.com.au/index.php/id;866694817;fp;4;fpid;2 (June 17, 2008), flax (Abbadi et al., 2004, Plant Cell 16: 2734–2748), maize (Young et al., 2004, Plant J 38 910–922), oil palm (Jalani et al. 1997, J Am Oil Chem Soc 74 1451–1455; Parveez, 2003, AgBiotechNet 113 1–8), rice (Anai et al., 2003, Plant Cell Rep 21 988-992), soybean (Reddy and Thomas, 1996, Nat Biotechnol 14 639-642; Kinney and Kwolton, 1998, Blackie Academic and Professional, London, pp 193-213), sunflower (Arcadia, Biosciences 2008).
Углеводы, такие как фруктаны, описанные, например, для цикория (Smeekens (1997) Trends Plant Sci 2 286-287, Sprenger et al. (1997) FEBS Lett 400 355-358, Sévenier et al. (1998) Nat Biotechnol 16 843-846), маиса (Caimi et al. (1996) Plant Physiol 110 355-363), картофеля (Hellwege et al. ,1997 Plant J 12 1057-1065), сахарной свеклы (Smeekens et al. 1997, выше), инулин, например, как описано для картофеля (Hellewege et al. 2000, Proc Natl Acad Sci USA 97 8699-8704), крахмал, например, как описано для риса (Schwall et al. (2000) Nat Biotechnol 18 551-554, Chiang et al. (2005) Mol Breed 15 125-143),Carbohydrates such as fructans, described for example for chicory (Smeekens (1997) Trends Plant Sci 2 286-287, Sprenger et al. (1997) FEBS Lett 400 355-358, Sévenier et al. (1998) Nat Biotechnol 16 843-846), maize (Caimi et al. (1996) Plant Physiol 110 355-363), potato (Hellwege et al., 1997 Plant J 12 1057-1065), sugar beet (Smeekens et al. 1997, above), inulin, for example as described for potato (Hellewege et al. 2000, Proc Natl Acad Sci USA 97 8699-8704), starch, for example as described for rice (Schwall et al. (2000) Nat Biotechnol 18 551-554, Chiang et al. (2005) Mol Breed 15 125-143),
Витамины и каротиноиды, например, описанные для канолы (Shintani and DellaPenna (1998) Science 282 2098-2100), маиса (Rocheford et al. (2002). J Am Coll Nutr 21 191S-198S, Cahoon et al. (2003) Nat Biotechnol 21 1082-1087, Chen et al. (2003) Proc Natl Acad Sci USA 100 3525-3530), семени горчицы (Shewmaker et al. (1999) Plant J 20 401-412, картофеля (Ducreux et al., 2005, J Exp Bot 56 81-89), риса (Ye et al. (2000) Science 287 303-305, клубники (Agius et al. (2003), Nat Biotechnol 21 177-181 ), томата (Rosati et al. (2000) Plant J 24 413-419, Fraser et al. (2001) J Sci Food Agric 81 822-827, Mehta et al. (2002) Nat Biotechnol 20 613-618, Díaz de la Garza et al. (2004) Proc Natl Acad Sci USA 101 13720-13725, Enfissi et al. (2005) Plant Biotechnol J 3 17-27, DellaPenna (2007) Proc Natl Acad Sci USA 104 3675-3676.Vitamins and carotenoids, such as those described for canola (Shintani and DellaPenna (1998) Science 282 2098–2100), maize (Rocheford et al. (2002) J Am Coll Nutr 21 191S–198S, Cahoon et al. (2003) Nat Biotechnol 21 1082–1087, Chen et al. (2003) Proc Natl Acad Sci USA 100 3525–3530), mustard seed (Shewmaker et al. (1999) Plant J 20 401–412, potato (Ducreux et al., 2005, J Exp Bot 56 81–89), rice (Ye et al. (2000) Science 287 303-305, strawberry (Agius et al. (2003), Nat Biotechnol 21 177-181), tomato (Rosati et al. (2000) Plant J 24 413-419, Fraser et al. (2001) J Sci Food Agric 81 822-827, Mehta et al. (2002) Nat Biotechnol 20 613-618, Díaz de la Garza et al. (2004) Proc Natl Acad Sci USA 101 13720-13725, Enfissi et al. (2005) Plant Biotechnol J 3 17-27, DellaPenna (2007) Proc Natl Acad Sci USA 104 3675-3676.
Функциональные вторичные метаболиты, например, описанные для яблони (стильбены, Szankowski et al. (2003) Plant Cell Rep 22: 141-149), люцерны (ресвератрол, Hipskind and Paiva (2000) Mol Plant Microbe Interact 13 551-562), киви (ресвератрол, Kobayashi et al. (2000) Plant Cell Rep 19 904-910), маиса и сои (флавоноиды, Yu et al. (2000) Plant Physiol 124 781-794), картофеля (антоцианин, алкалоид и гликозид, Lukaszewicz et al. (2004) J Agric Food Chem 52 1526-1533), риса (флавоноиды и ресвератрол, Stark-Lorenzen et al. (1997) Plant Cell Rep 16 668-673, Shin et al. (2006) Plant Biotechnol J 4 303-315), томата (+ресвератрол, хлорогеновая кислота, флавоноиды, стильбен; Rosati et al. (2000) выше, Muir et al. (2001) Nature 19 470-474, Niggeweg et al. (2004) Nat Biotechnol 22 746-754, Giovinazzo et al. (2005) Plant Biotechnol J 3 57-69), пшеницы (кофеиновая и феруловая кислоты, ресвератрол; United Press International (2002)); иFunctional secondary metabolites, such as those described for apple (stilbenes, Szankowski et al. (2003) Plant Cell Rep 22: 141–149), alfalfa (resveratrol, Hipskind and Paiva (2000) Mol Plant Microbe Interact 13 551–562), kiwi (resveratrol, Kobayashi et al. (2000) Plant Cell Rep 19 904–910), maize and soybean (flavonoids, Yu et al. (2000) Plant Physiol 124 781–794), potato (anthocyanin, alkaloid, and glycoside, Lukaszewicz et al. (2004) J Agric Food Chem 52 1526–1533), rice (flavonoids and resveratrol, Stark-Lorenzen et al. (1997) Plant Cell Rep 16 668–673, Shin et al. (2006) Plant Biotechnol J 4 303–315), tomato (+resveratrol, chlorogenic acid, flavonoids, stilbene; Rosati et al. (2000) above, Muir et al. (2001) Nature 19 470–474, Niggeweg et al. (2004) Nat Biotechnol 22 746–754, Giovinazzo et al. (2005) Plant Biotechnol J 3 57–69), wheat (caffeic and ferulic acids, resveratrol; United Press International (2002)); and
доступность минеральных компонентов, например, как описано для люцерны (фитаза, Austin-Phillips et al. (1999) http://www.molecularfarming.com/nonmedical.html), салата-латука (железо, Goto et al. (2000) Theor Appl Genet 100 658-664), риса (железо, Lucca et al. (2002) J Am Coll Nutr 21 184S-190S), маиса, сои и пшеницы (фитаза, Drakakaki et al. (2005) Plant Mol Biol 59 869-880, Denbow et al. (1998) Poult Sci 77 878-881, Brinch-Pedersen et al. (2000) Mol Breed 6 195-206).availability of mineral components, such as described for alfalfa (phytase, Austin-Phillips et al. (1999) http://www.molecularfarming.com/nonmedical.html), lettuce (iron, Goto et al. (2000) Theor Appl Genet 100 658-664), rice (iron, Lucca et al. (2002) J Am Coll Nutr 21 184S-190S), maize, soybean and wheat (phytase, Drakakaki et al. (2005) Plant Mol Biol 59 869-880, Denbow et al. (1998) Poult Sci 77 878-881, Brinch-Pedersen et al. (2000) Mol Breed 6 195-206).
В конкретных вариантах осуществления признак с дополнительным эффектом относится к предусмотренной пользе для здоровья соединений, присутствующих в растении. Например, в конкретных вариантах осуществления сельскохозяйственную культуру с дополнительным эффектом получают с помощью способов по настоящему изобретению для обеспечения модификации и/или индукции/повышения синтеза одного или нескольких из следующих соединений.In particular embodiments, the additional effect trait refers to the intended health benefit of compounds present in the plant. For example, in particular embodiments, the additional effect crop is obtained by the methods of the present invention to provide modification and/or induction/increase in the synthesis of one or more of the following compounds.
Каротиноиды, такие как α-каротин, присутствующие в моркови, нейтрализуют свободные радикалы, которые могут вызвать разрушение клеток, или β-каротин, присутствующий в различных плодах и овощах, который нейтрализует свободные радикалы.Carotenoids such as α-carotene present in carrots neutralize free radicals that can cause cell damage, or β-carotene present in various fruits and vegetables that neutralizes free radicals.
Лютеин, присутствующий в зеленых овощах, который способствует сохранению нормального зрения.Lutein, present in green vegetables, which helps maintain normal vision.
Ликопин, присутствующий в томате и томатных продуктах, который, как считается, снижает риск возникновения рака предстательной железы.Lycopene, present in tomatoes and tomato products, which is believed to reduce the risk of prostate cancer.
Зеаксантин, присутствующий в цитрусовых и маисе, который способствует сохранению нормального зрения.Zeaxanthin, found in citrus fruits and maize, helps maintain normal vision.
Пищевые волокна, такие как нерастворимые волокна, присутствующие в пшеничных отрубях, которые могут снижать риск возникновения рака молочной железы и/или рака кишечника, и β-глюкан, присутствующий в овсе, растворимые волокна, присутствующие в псиллуме и цельных зернах, которые могут снижать риск возникновения сердечно-сосудистого заболевания (CVD).Dietary fibres such as insoluble fibre present in wheat bran which may reduce the risk of breast cancer and/or bowel cancer, and β-glucan present in oats, soluble fibre present in psyllium and whole grains which may reduce the risk of cardiovascular disease (CVD).
Жирные кислоты, такие как ω-3 жирные кислоты, которые могут снижать риск возникновения CVD и улучшать умственные и зрительные функции, конъюгированная линолевая кислота, которая может улучшать состав организма, может снижать риск возникновения определенных видов рака, и GLA, которая может снижать риск возникновения воспаления, рака и CVD, может улучшать состав организма.Fatty acids such as omega-3 fatty acids, which may reduce the risk of CVD and improve mental and visual function, conjugated linoleic acid, which may improve body composition, may reduce the risk of certain cancers, and GLA, which may reduce the risk of inflammation, cancer, and CVD, may improve body composition.
Флавоноиды, такие как гидроксициннаматы, присутствующие в пшенице, которые имеют подобную антиоксидантной активность, могут снижать риск возникновения дегенеративных заболеваний, флавонолы, катехины и таннины, присутствующие в плодах и овощах, которые нейтрализуют свободные радикалы и могут снижать риск возникновения рака.Flavonoids such as hydroxycinnamates present in wheat, which have similar antioxidant activity and may reduce the risk of degenerative diseases, flavonols, catechins and tannins present in fruits and vegetables, which neutralize free radicals and may reduce the risk of cancer.
Глюкозинолаты, индолы, изотиоцианаты, такие как сульфорафан, присутствующие в овощах семейства крестоцветных (брокколи, браунколь), редьке, которые нейтрализуют свободные радикалы, могут снижать риск возникновения рака.Glucosinolates, indoles, isothiocyanates such as sulforaphane, present in cruciferous vegetables (broccoli, kale), radishes, which neutralize free radicals, can reduce the risk of cancer.
Фенольные смолы, такие как стильбены, присутствующие в винограде, которые могут снижать риск возникновения дегенеративных заболеваний, заболевания сердца и рака, могут влиять на долгожительство, кофеиновая кислота и ферулиновая кислота, присутствующие в овощах и цитрусовых, которые имеют подобную антиоксидантной активность, могут снижать риск возникновения дегенеративных заболеваний, заболевания сердца и заболевания глаз, и эпикатехин, присутствующий в какао, который имеет подобную антиоксидантной активность, может снижать риск возникновения дегенеративных заболеваний и заболевания сердца.Phenolics such as stilbenes present in grapes which may reduce the risk of degenerative diseases, heart disease and cancer may affect longevity, caffeic acid and ferulic acid present in vegetables and citrus fruits which have similar antioxidant activity may reduce the risk of degenerative diseases, heart disease and eye disease, and epicatechin present in cocoa which has similar antioxidant activity may reduce the risk of degenerative diseases and heart disease.
Растительные станолы/стеролы, присутствующие в маисе, сое, пшенице, и древесные смолы могут снижать риск возникновения коронарного заболевания сердца в результате снижения уровней холестерина в крови.Plant stanols/sterols present in maize, soy, wheat, and tree resins may reduce the risk of coronary heart disease by lowering blood cholesterol levels.
Фруктаны, инулины, фруктоолигосахариды, присутствующие в топинамбуре, шалоте, луковом порошке, которые могут улучшить состояние желудочно-кишечного тракта.Fructans, inulins, fructooligosaccharides present in Jerusalem artichoke, shallots, onion powder, which can improve the condition of the gastrointestinal tract.
Сапонины, присутствующие в сое, которые могут снижать уровень холестерина LDL.Saponins present in soybeans which can lower LDL cholesterol levels.
Белок сои, присутствующий в сое, который может снижать риск возникновения заболевания сердца.Soy protein, present in soybeans, which may reduce the risk of heart disease.
Фитоэстрогены, такие как изофлавоны, присутствующие в сое, могут снижать симптомы менопаузы, такие как приливы, могут ослаблять остеопороз и CVD, и лигнаны, присутствующие во льне, ржи и овощах, которые могут защищать от заболевания сердца и некоторых видов рака, могут снижать уровень холестерина LDL, общего холестерина.Phytoestrogens such as isoflavones present in soy may reduce menopausal symptoms such as hot flashes, may ease osteoporosis and CVD, and lignans present in flax, rye and vegetables which may protect against heart disease and some cancers may reduce LDL cholesterol, total cholesterol.
Сульфиды и тиолы, такие как диаллил сульфид, присутствующие в луке, чесноке, маслине, луке-порее и зеленом луке, и аллилметилтрисульфид, дитиотионы, присутствующие в овощах семейства крестоцветные, которые могу снижать уровень холестерина LDL, способствуют поддержанию иммунной системы.Sulfides and thiols such as diallyl sulfide, present in onions, garlic, olives, leeks and green onions, and allyl methyl trisulfide, dithiothiones, present in cruciferous vegetables, which can lower LDL cholesterol levels, help support the immune system.
Таннины, такие как проантоцианидины, присутствующие в клюкве, какао, которые могут улучшать состояние мочевыводящих путей, могут снижать риск возникновения CVD и повышенного кровяного давления и др.Tannins such as proanthocyanidins present in cranberries, cocoa, which can improve urinary tract health, may reduce the risk of CVD and high blood pressure, etc.
Кроме того, способы по настоящему изобретению также предусматривают модификацию функциональных свойств белков/крахмалов, срока хранения, вкуса/эстетических характеристик, качества волокон, и признаков, связанных со снижением аллергенов, антинутриентов и токсинов.In addition, the methods of the present invention also provide for modification of protein/starch functional properties, shelf life, taste/aesthetic characteristics, fiber quality, and attributes associated with reduction of allergens, antinutrients, and toxins.
В одном варианте осуществления растение может представлять собой бобовое растение. В настоящем изобретении можно применять раскрытую в данном документе систему CRISP-Cas9 для исследования и модификации, например, без ограничения сои, гороха и арахиса. Curtin et al. предусматривает набор средств для функциональной геномики бобовых растений. (См. Curtin et al., "A genome engineering toolbox for legume Functional genomics," International Plant and Animal Genome Conference XXII 2014). Curtin использовал генетическую трансформацию CRISPR для нокаута/нокдауна одной копии и дуплицированных генов бобовых в системах корневых волосков и целых растений. Некоторые из целевых генов были выбраны с целью исследования и оптимизации характеристик систем нокаута/нокдауна (например, фитоендесатураза), в то время как другие были идентифицированы с помощью гомологии сои с Dicer-подобными генами арабидопсиса или с помощью исследований полногеномных ассоциаций при образовании клубеньков у Medicago.In one embodiment, the plant can be a legume. The present invention can use the CRISP-Cas9 system disclosed herein to study and modify, for example, but not limited to, soybean, pea, and peanut. Curtin et al. provide a toolbox for legume functional genomics. (See Curtin et al., "A genome engineering toolbox for legume Functional genomics," International Plant and Animal Genome Conference XXII 2014). Curtin used CRISPR genetic transformation to knockout/knockdown single copy and duplicate legume genes in root hair and whole plant systems. Some of the target genes were selected for the purpose of exploring and optimizing the performance of the knockout/knockdown systems (e.g., phytoene desaturase), while others were identified using soybean homology to Arabidopsis Dicer-like genes or genome-wide association studies in nodulation in Medicago.
Аллергические реакции на арахис и аллергические реакции на бобовые растения, как правило, являются реальной и серьезной проблемной для здоровья. Система эффекторного белка CRISPR-Cas9 по настоящему изобретению может быть использована для выявления и последующего редактирования или сайленсинга генов, кодирующих аллергенные белки таких бобовых растений. Не ограничиваясь такими генами и белками, Nicolaou et al. выявили аллергенные белки в арахисе, сое, чечевице, горохе, люпине, зеленой фасоли и золотистой фасоли. См. Nicolaou et al., Current Opinion in Allergy and Clinical Immunology 2011;11(3):222).Peanut allergies and legume allergies are generally a real and serious health problem. The CRISPR-Cas9 effector protein system of the present invention can be used to identify and subsequently edit or silence genes encoding allergenic proteins from such legumes. Without limiting such genes and proteins, Nicolaou et al. identified allergenic proteins in peanuts, soybeans, lentils, peas, lupines, green beans, and mung beans. See Nicolaou et al., Current Opinion in Allergy and Clinical Immunology 2011;11(3):222).
Соответственно, настоящее изобретение охватывает способы получения растений с дополнительным питательным эффектом, при этом указанные способы предусматривают введение в растительную клетку гена, кодирующего фермент, участвующий в образовании компонента с дополнительным питательным эффектом с помощью системы CRISPR/Cas9, как описано в данном документе, и регенерацию растения из указанной растительной клетки, указанного растения, характеризующегося повышением экспрессии указанного компонента с дополнительным питательным эффектом. В конкретных вариантах осуществления систему CRISPR/Cas9 используют для модификации эндогенного синтеза этих соединений опосредованно, например, с помощью модификации одного или нескольких факторов транскрипции, которые контролируют метаболизм этого соединения. Способы введения представляющего интерес гена в растительную клетку и/или модификации эндогенного гена с помощью системы CRISPR/Cas9 описаны в данном документе выше.Accordingly, the present invention encompasses methods for producing plants with additional nutritional effect, said methods comprising introducing into a plant cell a gene encoding an enzyme involved in the formation of a component with additional nutritional effect using a CRISPR/Cas9 system as described herein, and regenerating a plant from said plant cell, said plant having an increased expression of said component with additional nutritional effect. In particular embodiments, a CRISPR/Cas9 system is used to modify the endogenous synthesis of these compounds indirectly, for example, by modifying one or more transcription factors that control the metabolism of the compound. Methods for introducing a gene of interest into a plant cell and/or modifying an endogenous gene using a CRISPR/Cas9 system are described herein above.
Некоторые конкретные примеры модификаций в растениях, которые были модифицированы для придания признаков с дополнительным эффектом, представляют собой растения с модифицированным метаболизмом жирных кислот, например, с помощью трансформации растения антисмысловым геном стеарил-ACP-десатуразы с целью повышения содержания стеариновой кислоты в растении. См. Knultzon et al., Proc. Natl. Acad. Sci. U.S.A. 89:2624 (1992). Другой пример включает снижение содержания фитата, например, с помощью клонирования и последующего введения ДНК, связанной с одним аллелем, который может отвечать за мутанты маиса, характеризующиеся низким содержанием фитиновой кислоты. См. Raboy et al, Maydica 35:383 (1990).Some specific examples of modifications in plants that have been engineered to impart traits with additive effects are plants with modified fatty acid metabolism, such as by transforming a plant with an antisense stearyl ACP desaturase gene to increase the stearic acid content of the plant. See Knultzon et al., Proc. Natl. Acad. Sci. U.S.A. 89:2624 (1992). Another example involves reducing phytate content, such as by cloning and then introducing DNA linked to one allele that can produce mutants of maize characterized by low phytic acid content. See Raboy et al, Maydica 35:383 (1990).
Аналогично экспрессия Tfs C1 и R маиса (Zea mays), которые регулируют образование флавоноидов в алейроновых слоях маиса под контролем сильного промотора, приводила к высокой скорости накопления антоцианинов в арабидопсисе (Arabidopsis thaliana), предположительно в результате активации всего пути (Bruce et al., 2000, Plant Cell 12:65-80). DellaPenna (Welsch et al., 2007 Annu Rev Plant Biol 57: 711-738) обнаружил, что Tf RAP2.2 и его взаимодействующий элемент SINAT2 повышали каротиногенез в листьях арабидопсиса. Экспрессия Tf Dof1 индуцировала повышение экспрессии генов, кодирующих ферменты для образования углеродных скелетов, выраженное повышение содержания аминокислот и снижение уровня Glc в трансгенном арабидопсисе (Yanagisawa, 2004 Plant Cell Physiol 45: 386-391), а DOF Tf AtDof1.1 (OBP2) активировал все стадии в пути биосинтеза глюкозинолата в арабидопсисе (Skirycz et al., 2006 Plant J 47: 10-24).Similarly, expression of Tfs C1 and R from maize (Zea mays), which regulate flavonoid formation in maize aleurone layers under the control of a strong promoter, resulted in high rates of anthocyanin accumulation in Arabidopsis (Arabidopsis thaliana), presumably resulting from activation of the entire pathway (Bruce et al., 2000, Plant Cell 12:65-80). DellaPenna (Welsch et al., 2007 Annu Rev Plant Biol 57: 711-738) found that Tf RAP2.2 and its interactor SINAT2 increased carotenogenesis in Arabidopsis leaves. Expression of Tf Dof1 induced increased expression of genes encoding enzymes for carbon skeleton formation, a marked increase in amino acid content, and a decrease in Glc levels in transgenic Arabidopsis (Yanagisawa, 2004 Plant Cell Physiol 45: 386–391), and DOF Tf AtDof1.1 (OBP2) activated all steps in the glucosinolate biosynthetic pathway in Arabidopsis (Skirycz et al., 2006 Plant J 47: 10–24).
Снижение аллергенов в растенияхReducing allergens in plants
В конкретных вариантах осуществления способы, предусмотренные в данном документе, применяют для получения растений со сниженным уровнем аллергенов, делая их более безопасными для потребителя. В конкретных вариантах осуществления способы включают модификацию экспрессии одного или нескольких генов, ответственных за образование растительных аллергенов. Например, в конкретных вариантах осуществления способы включают снижение экспрессии гена Lol p5 в растительной клетке, такой как растительная клетка райграса, и регенерацию из нее растения, с целью снижения аллергенности пыльцы указанного растения (Bhalla et al. 1999, Proc. Natl. Acad. Sci. USA Vol. 96: 11676-11680).In particular embodiments, the methods provided herein are used to produce plants with reduced levels of allergens, making them safer for the consumer. In particular embodiments, the methods comprise modifying the expression of one or more genes responsible for the production of plant allergens. For example, in particular embodiments, the methods comprise reducing the expression of the Lol p5 gene in a plant cell, such as a ryegrass plant cell, and regenerating a plant therefrom, to reduce the allergenicity of the pollen of the plant (Bhalla et al. 1999, Proc. Natl. Acad. Sci. USA Vol. 96: 11676-11680).
Способы скрининга представляющих интерес эндогенных геновMethods for screening endogenous genes of interest
Способы, предусмотренные в данном документе, дополнительно обеспечивают выявление ценных генов, кодирующих ферменты, участвующие в образовании компонента с дополнительным питательным эффектом, или в целом генов, влияющих на представляющие интерес агрономические признаки, в пределах вида, типа и растительного царства. В результате избирательного нацеливания, например, на гены, кодирующие ферменты метаболических путей в растениях с помощью системы CRISPR/Cas9, как описано в данном документе, могут быть идентифицированы гены, ответственные за определенные питательные аспекты растения. Аналогично в результате избирательного нацеливания на гены, которые могут влиять на желаемый агрономический признак, могут быть идентифицированы соответствующие гены. Соответственно, настоящее изобретение охватывает способы скрининга генов, кодирующих ферменты, участвующие в образовании соединений с определенной пищевой ценностью и/или агрономическими признаками.The methods provided herein further enable the identification of valuable genes encoding enzymes involved in the formation of a component with additional nutritional effect, or in general genes influencing agronomic traits of interest, within a species, type and plant kingdom. By selectively targeting, for example, genes encoding enzymes of metabolic pathways in plants using the CRISPR/Cas9 system as described herein, genes responsible for certain nutritional aspects of the plant can be identified. Similarly, by selectively targeting genes that can influence a desired agronomic trait, corresponding genes can be identified. Accordingly, the present invention encompasses methods for screening genes encoding enzymes involved in the formation of compounds with certain nutritional value and/or agronomic traits.
Дополнительные варианты применения системы CRISPR/Cas9 в растениях и дрожжахAdditional applications of the CRISPR/Cas9 system in plants and yeast
Применение системы CRISPR/Cas9 в получении биотопливаApplication of the CRISPR/Cas9 system in biofuel production
Термин "биотопливо", как используется в данном документе, представляет собой альтернативное топливо, полученное из растительных ресурсов или ресурсов растительного происхождения. Восполняемые виды биотоплива могут быть экстрагированы из органического вещества, энергия которого была получена в процессе фиксации углерода, или получены в результате использования или превращения биомассы. Эта биомасса может быть использована непосредственно для видов биотоплива или может быть превращена в удобные содержащие энергию вещества с помощью теплового превращения, химического превращения или биохимического превращения. Это превращение биомассы может приводить к образованию топлива в твердой, жидкой или газообразной форме. Существует два типа биотоплива: биоэтанол и биодизель. Биоэтанол образуется главным образом в результате процесса сбраживания сахаров из целлюлозы (крахмала), которую преимущественно получают из маиса и сахарного тростника. Биодизель, с другой стороны, главным образом образуется из масляных сельскохозяйственных культур, таких как рапс, пальма и соя. Биотоплива используют главным образом для транспортных средств.The term "biofuel" as used herein is an alternative fuel derived from plant or plant-derived resources. Renewable biofuels may be extracted from organic matter whose energy has been obtained through the process of carbon fixation or obtained through the use or conversion of biomass. This biomass may be used directly for biofuels or may be converted into useful energy-containing substances through thermal conversion, chemical conversion or biochemical conversion. This conversion of biomass may result in the formation of fuel in solid, liquid or gaseous form. There are two types of biofuels: bioethanol and biodiesel. Bioethanol is formed primarily through the fermentation of sugars from cellulose (starch), which is primarily obtained from maize and sugar cane. Biodiesel, on the other hand, is formed primarily from oil crops such as canola, palm and soybeans. Biofuels are used primarily for transportation.
Улучшение свойств растений для получения биотопливаImproving the properties of plants to produce biofuels
В конкретных вариантах осуществления способы с использованием системы CRISPR/Cas9, как описано в данном документе, применяют для изменения свойств клеточной стенки с целью облегчения доступа с помощью основных гидролизующих средств для более эффективного высвобождения сахаров для сбраживания. В конкретных вариантах осуществления модифицируют биосинтез целлюлозы и/или лигнина. Целлюлоза является основным компонентом клеточной стенки. Биосинтез целлюлозы и лигнина корегулируют. При снижении доли лигнина в растении доля целлюлозы может быть повышена. В конкретных вариантах осуществления способы, описанные в данном документе, используют для снижения биосинтеза лигнина в растении с целью повышения содержания сбраживаемых углеводов. В частности, способы, описанные в данном документе, используют для снижения экспрессии по меньшей мере первого гена биосинтеза лигнина, выбранного из группы, состоящей из 4-кумарат 3-гидроксилазы (C3H), фенилаланин аммонийлиазы (PAL), циннамат 4-гидроксилазы (C4H), гидроксициннамоилтрансферазы (HCT), О-метилтрансферазы кофеиновой кислоты (COMT), кафеол CoA 3-O-метилтрансферазы (CCoAOMT), ферулат 5-гидроксилазы (F5H), циннамилалкогольдегидрогеназы (CAD), циннамоил CoA-редуктазы (CCR), 4-кумарат-CoA лигазы (4CL), монолигнол-лигнин-специфичной гликозилтрансферазы и альдегиддегидрогеназы (ALDH), как раскрыто в WO 2008064289 A2.In particular embodiments, methods using the CRISPR/Cas9 system as described herein are used to alter the properties of the cell wall to facilitate access by primary hydrolyzing agents to more efficiently release sugars for fermentation. In particular embodiments, the biosynthesis of cellulose and/or lignin is modified. Cellulose is a major component of the cell wall. The biosynthesis of cellulose and lignin is coregulated. By decreasing the proportion of lignin in a plant, the proportion of cellulose can be increased. In particular embodiments, the methods described herein are used to decrease lignin biosynthesis in a plant to increase the content of fermentable carbohydrates. In particular, the methods described herein are used to reduce the expression of at least a first lignin biosynthesis gene selected from the group consisting of 4-coumarate 3-hydroxylase (C3H), phenylalanine ammonium lyase (PAL), cinnamate 4-hydroxylase (C4H), hydroxycinnamoyltransferase (HCT), caffeic acid O-methyltransferase (COMT), caffeol CoA 3-O-methyltransferase (CCoAOMT), ferulate 5-hydroxylase (F5H), cinnamyl alcohol dehydrogenase (CAD), cinnamoyl CoA reductase (CCR), 4-coumarate-CoA ligase (4CL), monolignol-lignin-specific glycosyltransferase and aldehyde dehydrogenase (ALDH), as disclosed in WO 2008064289 A2.
В конкретных вариантах осуществления способы, описанные в данном документе, применяют для получения растительной массы, которая приводит к образованию более низких уровней уксусной кислоты во время сбраживания (см. также WO 2010096488). В частности, способы, раскрытые в данном документе, используют для получения мутаций в гомологах CaslL с целью снижения ацетилирования полисахаридов.In particular embodiments, the methods described herein are used to produce plant material that produces lower levels of acetic acid during fermentation (see also WO2010096488). In particular, the methods disclosed herein are used to produce mutations in CaslL homologues to reduce acetylation of polysaccharides.
Модификация дрожжей для получения биотопливаModifying yeast to produce biofuels
В конкретных вариантах осуществления фермент Cas9, предусмотренный в данном документе, используют для получения биотоплива с помощью рекомбинантных микроорганизмов. Например, Cas9 может быть использован для конструкции микроорганизмов, таких как дрожжи, с целью получения биотоплива или биополимеров из сбраживаемых сахаров и необязательно способности к разрушению лигноцеллюлозы растительного происхождения, полученной из сельскохозяйственных остатков, в качестве источника сбраживаемых сахаров. В частности, настоящее изобретение относится к способам, где применяют комплекс CRISPR/Cas9 для введения чужеродных генов, требуемых для получения биотоплива, в микроорганизмы, и/или для модификации эндогенных генов, которые могут нарушать синтез биотоплива. В частности, способы предусматривают введение в микроорганизм, такой как дрожжи, одной или нескольких нуклеотидных последовательностей, кодирующих ферменты, участвующие в превращении пирувата в этанол или другой представляющий интерес продукт. В конкретных вариантах осуществления способы предусматривают введение одного или нескольких ферментов, которые способствуют разрушению микроорганизмом целлюлозы, такого как целлюлаза. В еще одних дополнительных вариантах осуществления комплекс CRISPR/Cas9 применяют для модификации эндогенных метаболических путей, которые конкурируют с путем образования биотоплива.In particular embodiments, the Cas9 enzyme provided herein is used to produce biofuels using recombinant microorganisms. For example, Cas9 can be used to engineer microorganisms, such as yeast, to produce biofuels or biopolymers from fermentable sugars and, optionally, the ability to degrade plant-derived lignocellulose derived from agricultural residues as a source of fermentable sugars. In particular, the present invention relates to methods that use a CRISPR/Cas9 complex to introduce foreign genes required for biofuel production into microorganisms and/or to modify endogenous genes that may interfere with biofuel synthesis. In particular, the methods involve introducing into a microorganism, such as yeast, one or more nucleotide sequences encoding enzymes involved in the conversion of pyruvate to ethanol or another product of interest. In particular embodiments, the methods comprise introducing one or more enzymes that facilitate the breakdown of cellulose by the microorganism, such as cellulase. In yet further embodiments, the CRISPR/Cas9 complex is used to modify endogenous metabolic pathways that compete with the biofuel pathway.
Соответственно, в более конкретных вариантах осуществления способы, описанные в данном документе, применяют для модификации микроорганизма следующим образом:Accordingly, in more specific embodiments, the methods described herein are used to modify a microorganism as follows:
- введения по меньшей мере одной гетерологичной нуклеиновой кислоты или повышения экспрессии по меньшей мере одной эндогенной нуклеиновой кислоты, кодирующей фермент для разрушения растительной клеточной стенки, таким образом, что указанный микроорганизм способен экспрессировать указанную нуклеиновую кислоту и образовывать и секретировать указанный фермент для разрушения растительной клеточной стенки;- introducing at least one heterologous nucleic acid or increasing the expression of at least one endogenous nucleic acid encoding an enzyme for degrading a plant cell wall, such that said microorganism is capable of expressing said nucleic acid and forming and secreting said enzyme for degrading a plant cell wall;
- введения по меньшей мере одной гетерологичной нуклеиновой кислоты или повышения экспрессии по меньшей мере одной эндогенной нуклеиновой кислоты, кодирующей фермент, который превращает пируват в ацетальдегид, необязательно в сочетании по меньшей мере с одной гетерологичной нуклеиновой кислотой, кодирующей фермент, который превращает ацетальдегид в этанол, таким образом, что указанная клетка-хозяин способна экспрессировать указанную нуклеиновую кислоту; и/или- introducing at least one heterologous nucleic acid or increasing the expression of at least one endogenous nucleic acid encoding an enzyme that converts pyruvate into acetaldehyde, optionally in combination with at least one heterologous nucleic acid encoding an enzyme that converts acetaldehyde into ethanol, such that said host cell is capable of expressing said nucleic acid; and/or
- модификации по меньшей мере одной нуклеиновой кислоты, кодирующей фермент в метаболическом пути в указанной клетке-хозяине, где указанный путь приводит к образованию метаболита, отличного от ацетальдегида, из пирувата или этанола из ацетальдегида, и где указанная модификация приводит к уменьшенному образованию указанного метаболита, или введения по меньшей мере одной нуклеиновой кислоты, кодирующей ингибитор указанного фермента.- modifying at least one nucleic acid encoding an enzyme in a metabolic pathway in said host cell, wherein said pathway results in the formation of a metabolite other than acetaldehyde from pyruvate or ethanol from acetaldehyde, and wherein said modification results in reduced formation of said metabolite, or introducing at least one nucleic acid encoding an inhibitor of said enzyme.
Модификация водорослей и растений для получения растительных масел или видов биотопливаModification of algae and plants to produce vegetable oils or biofuels
Трансгенные водоросли или другие растения, такие как рапс, могут быть особенно полезными в производстве растительных масел или таких видов биотоплива, как, например, спирты (особенно метанол и этанол). Они могут быть сконструированы для синтеза или сверхсинтеза масла или спиртов на высоких уровнях для применения в масложировой или биотопливной промышленности.Transgenic algae or other plants such as rapeseed may be particularly useful in the production of vegetable oils or biofuels such as alcohols (especially methanol and ethanol). They can be engineered to synthesize or oversynthesize oils or alcohols at high levels for use in the oil and fat or biofuel industries.
В US 8945839 описан способ конструирования микроводорослей (виды клеток Chlamydomonas reinhardtii) с помощью Cas9. С помощью аналогичных средств способы системы CRISPR/Cas9, описанной в данном документе, могут быть применимы по отношению к виду Chlamydomonas и другим водорослям. В конкретных вариантах осуществления Cas9 и chi/sgRNA вводят в синтезирующие водоросли с помощью вектора, который экспрессирует Cas9 под контролем конститутивного промотора, такого как Hsp70A-Rbc S2, или промотора бета 2-тубулина. Chi/sgRNA будет доставлена с помощью вектора, содержащего промотор T7. Альтернативно мРНК Cas9 и in vitro транскрибируемая chi/sgRNA могут быть доставлены в клетки водорослей. Протокол электропорации следует стандартному рекомендованному протоколу для набора GeneArt Chlamydomonas Engineering kit.US 8,945,839 describes a method for engineering microalgae (Chlamydomonas reinhardtii cell species) with Cas9. By similar means, the methods of the CRISPR/Cas9 system described herein may be applied to Chlamydomonas species and other algae. In particular embodiments, Cas9 and chi/sgRNA are introduced into the synthesizing algae using a vector that expresses Cas9 under the control of a constitutive promoter, such as Hsp70A-Rbc S2 or the beta 2-tubulin promoter. Chi/sgRNA will be delivered using a vector containing the T7 promoter. Alternatively, Cas9 mRNA and in vitro transcribed chi/sgRNA may be delivered into the algae cells. The electroporation protocol follows the standard recommended protocol for the GeneArt Chlamydomonas Engineering kit.
Применение Cas9 при получении микроорганизмов, способных к продуцированию жирных кислотApplication of Cas9 in obtaining microorganisms capable of producing fatty acids
В конкретных вариантах осуществления способы по настоящему изобретению применяют для получения генетически модифицированных микроорганизмов, способных к образованию жирных сложных эфиров, таких как метиловые сложные эфиры жирных кислот ("FAME") и этиловые сложные эфиры жирных кислот ("FAEE").In particular embodiments, the methods of the present invention are used to produce genetically modified microorganisms capable of producing fatty esters, such as fatty acid methyl esters ("FAME") and fatty acid ethyl esters ("FAEE").
В конкретных вариантах осуществления предусмотрено специфично модифицировать гены, которые участвуют в модификации количества липидов и/или качества липидов, образованных клеткой водорослей. Примеры генов, кодирующих ферменты, участвующие в путях синтеза жирных кислот, могут кодировать белки, имеющие, например, активность ацетил-CoA карбоксилазы, синтазы жирных кислот, 3-кетоацил-синтазы III ацил-белка переносчика, глицерол-3-фосфатдегидрогеназы (G3PDH), еноил-ацил-редуктазы белка-переносчика (еноил-ACP-редуктазы), глицерол-3-фосфатацилтрансферазы, лизофосфатидин ацилтрансферазы или диацилглицеролацилтрансферазы, фосфолипид:диацилглицеролацилтрансферазы, фосфатидинфосфатазы, тиоэстеразы жирной кислоты, такой как пальмитоилпротеинтиоэстеразы, или малатдегидрогеназы. В дополнительных вариантах осуществления предусмотрено получение диатомовых водорослей, которые характеризуются повышенным накоплением липидов. Это может быть достигнуто с помощью нацеливания на гены, которые снижают катаболизм липидов. Особого интереса для применения в способах по настоящему изобретению заслуживают гены, участвующие в активации триглецерола и свободных жирных кислот, а также генов, непосредственно участвующих в β-окислении жирных кислот, таких как ацил-CoA синтетаза, 3-кетоацил-CoA тиолаза, ацил-CoA оксидаза и фосфоглюкомутаза. Система Cas9 и способы, описанные в данном документе, могут быть использованы для специфической активации таких генов в диатомовых водорослях с целью повышения содержания в них липидов.In specific embodiments, it is envisaged to specifically modify genes that are involved in modifying the amount of lipids and/or the quality of lipids formed by an algal cell. Examples of genes encoding enzymes involved in fatty acid synthesis pathways may encode proteins having, for example, acetyl-CoA carboxylase, fatty acid synthase, 3-ketoacyl synthase III acyl protein carrier, glycerol-3-phosphate dehydrogenase (G3PDH), enoyl-acyl carrier protein reductase (enoyl-ACP reductase), glycerol-3-phosphate acyltransferase, lysophosphatidine acyltransferase or diacylglycerol acyltransferase, phospholipid:diacylglycerol acyltransferase, phosphatidine phosphatase, fatty acid thioesterase such as palmitoyl protein thioesterase, or malate dehydrogenase activity. In additional embodiments, it is provided to obtain diatoms that are characterized by increased lipid accumulation. This can be achieved by targeting genes that reduce lipid catabolism. Of particular interest for use in the methods of the present invention are genes involved in the activation of triglycerol and free fatty acids, as well as genes directly involved in fatty acid β-oxidation, such as acyl-CoA synthetase, 3-ketoacyl-CoA thiolase, acyl-CoA oxidase and phosphoglucomutase. The Cas9 system and methods described herein can be used to specifically activate such genes in diatoms to increase their lipid content.
Как правило, клетки-хозяева могут быть сконструированы таким образом, чтобы образовывать жирные сложные эфиры из источника углерода, такого как спирт, присутствующий в среде, в результате экспрессии или сверхэкспрессии гена, кодирующего тиоэстеразу, гена, кодирующего ацил-CoA синтазу, и гена, кодирующего синтазу сложных эфиров. Соответственно, способы, предусмотренные в данном документе, применяют для модификации микроорганизмов с целью сверхэкспрессии или введения гена тиоэстеразы, гена, кодирующего ацит-CoA синтазу и гена, кодирующего синтазу сложных эфиров. В конкретных вариантах осуществления ген тиоэстеразы выбран из tesA, 'tesA, tesB, fatB, fatB2, fatB3, fatAl или fatA. В конкретных вариантах осуществления ген, кодирующий ацил-CoA синтазу, выбран из fadDJadK, BH3103, pfl-4354, EAV15023, fadDl, fadD2, RPC_4074,fadDD35, fadDD22, faa39 или идентифицированного гена, кодирующего фермент, имеющий те же самые свойства. В конкретных вариантах осуществления ген, кодирующий синтазу сложных эфиров, представляет собой ген, кодирующий синтазу/ацил-CoA:диацилглицерилацилтрансферазу из Simmondsia chinensis, Acinetobacter sp. ADP, Alcanivorax borkumensis, Pseudomonas aeruginosa, Fundibacter jadensis, Arabidopsis thaliana или Alkaligenes eutrophus или их вариантов.Typically, host cells can be engineered to form fatty esters from a carbon source, such as an alcohol, present in the medium by expressing or overexpressing a gene encoding a thioesterase, a gene encoding an acyl-CoA synthase, and a gene encoding an ester synthase. Accordingly, the methods provided herein are used to modify microorganisms to overexpress or introduce a thioesterase gene, an acyl-CoA synthase gene, and an ester synthase gene. In particular embodiments, the thioesterase gene is selected from tesA, 'tesA, tesB, fatB, fatB2, fatB3, fatAl, or fatA. In particular embodiments, the gene encoding the acyl-CoA synthase is selected from fadDJadK, BH3103, pfl-4354, EAV15023, fadDl, fadD2, RPC_4074, fadDD35, fadDD22, faa39, or an identified gene encoding an enzyme having the same properties. In particular embodiments, the gene encoding the ester synthase is a gene encoding the synthase/acyl-CoA:diacylglyceryl acyltransferase from Simmondsia chinensis, Acinetobacter sp. ADP, Alcanivorax borkumensis, Pseudomonas aeruginosa, Fundibacter jadensis, Arabidopsis thaliana, or Alkaligenes eutrophus, or variants thereof.
Дополнительно или альтернативно способы, предусмотренные в данном документе, применяют для снижения экспрессии в указанном микроорганизме по меньшей мере одного гена, кодирующего ацил-CoA дегидрогеназу, гена, кодирующего рецептор белка наружной мембраны, и гена, кодирующего регулятор транскрипции биосинтеза жирных кислот. В конкретных вариантах осуществления один или несколько генов являются инактивированными, например, с помощью введения мутации. В конкретных вариантах осуществления ген, кодирующий ацил-CoA дегидрогеназу, представляет собой fadE. В конкретных вариантах осуществления ген, кодирующий регулятор транскрипции биосинтеза жирных кислот, кодирует репрессор транскрипции ДНК, например, fabR.Additionally or alternatively, the methods provided herein are used to reduce the expression in said microorganism of at least one gene encoding an acyl-CoA dehydrogenase, a gene encoding an outer membrane protein receptor, and a gene encoding a transcriptional regulator of fatty acid biosynthesis. In particular embodiments, one or more genes are inactivated, such as by introducing a mutation. In particular embodiments, the gene encoding the acyl-CoA dehydrogenase is fadE. In particular embodiments, the gene encoding the transcriptional regulator of fatty acid biosynthesis encodes a DNA transcriptional repressor, such as fabR.
Дополнительно или альтернативно указанный микроорганизм модифицируют с целью снижения экспрессии по меньшей мере одного гена, кодирующего пируватформатлиазу, гена, кодирующего лактатдегидрогеназу, или обоих. В конкретных вариантах осуществления ген, кодирующий пируватформатлиазу, представляет собой pflB. В конкретных вариантах осуществления ген, кодирующий лактатдегидрогеназу, представляет собой IdhA. В конкретных вариантах осуществления один или несколько генов являются инактивированными, например, с помощью введения в них мутации.Additionally or alternatively, said microorganism is modified to reduce the expression of at least one gene encoding pyruvate formate lyase, a gene encoding lactate dehydrogenase, or both. In particular embodiments, the gene encoding pyruvate formate lyase is pflB. In particular embodiments, the gene encoding lactate dehydrogenase is IdhA. In particular embodiments, one or more genes are inactivated, such as by introducing a mutation therein.
В конкретных вариантах осуществления микроорганизм выбран из рода Escherichia, Bacillus, Lactobacillus, Rhodococcus, Synechococcus, Synechoystis, Pseudomonas, Aspergillus, Trichoderma, Neurospora, Fusarium, Humicola, Rhizomucor, Kluyveromyces, Pichia, Mucor, Myceliophtora, Penicillium, Phanerochaete, Pleurotus, Trametes, Chrysosporium, Saccharomyces, Stenotrophamonas, Schizosaccharomyces, Yarrowia или Streptomyces.In specific embodiments, the microorganism is selected from the genus Escherichia, Bacillus, Lactobacillus, Rhodococcus, Synechococcus, Synechoystis, Pseudomonas, Aspergillus, Trichoderma, Neurospora, Fusarium, Humicola, Rhizomucor, Kluyveromyces, Pichia, Mucor, Myceliophtora, Penicillium, Phanerochaete, Pleurotus, Trametes, Chrysosporium, Saccharomyces, Stenotrophamonas, Schizosaccharomyces, Yarrowia or Streptomyces.
Применение Cas9 при получении микроорганизмов, способных к продуцированию органических кислотApplication of Cas9 in obtaining microorganisms capable of producing organic acids
Способы, предусмотренные в данном документе, дополнительно применяют для конструирования микроорганизмов, способных к продуцированию органических кислот, в частности, из пентозы или гексозных сахаров. В конкретных вариантах осуществления способы включают введение в микроорганизм эндогенного гена LDH. В конкретных вариантах осуществления продуцирование органических кислот в указанных микроорганизмах дополнительно или альтернативно повышается при инактивации эндогенных генов, кодирующих белки, участвующие в эндогенном метаболическом пути, который приводит к образованию метаболита, отличного от представляющей интерес органической кислоты, и/или в случае, когда в эндогенном метаболическом пути потребляется органическая кислота. В конкретных вариантах осуществления модификация обеспечивает то, что образование метаболита, отличного от представляющей интерес органической кислоты, снижается. В соответствии с конкретными вариантами осуществления применяют способы для введения по меньшей мере одной сконструированной делеции гена и/или инактивации эндогенного пути, в котором органическая кислота потребляется, или гена, кодирующего продукт, участвующий в эндогенном пути, который приводит к образованию метаболита, отличного от представляющей интерес органической кислоты. В конкретных вариантах осуществления по меньшей мере одна сконструированная делеция или инактивация гена находится в одном или нескольких генах, кодирующих фермент, выбранный из группы, состоящей из пируватдекарбоксилазы (pdc), фумаратредуктазы, алкогольдегидрогеназы (adh), ацетальдегиддегидрогеназы, фосфоенолпируваткарбоксилазы (ppc), D-лактатдегидрогеназы (d-ldh), L-лактатдегидрогеназы (l-ldh), лактат-2-монооксигеназы. В дополнительных вариантах осуществления по меньшей мере одна сконструированная делеция и/или инактивация гена находятся в эндогенном гене, кодирующем пируватдекарбоксилазу (pdc).The methods provided herein are further used to engineer microorganisms capable of producing organic acids, particularly from pentose or hexose sugars. In particular embodiments, the methods comprise introducing an endogenous LDH gene into the microorganism. In particular embodiments, the production of organic acids in said microorganisms is additionally or alternatively increased by inactivating endogenous genes encoding proteins involved in an endogenous metabolic pathway that results in the formation of a metabolite other than the organic acid of interest and/or in the case where the endogenous metabolic pathway consumes an organic acid. In particular embodiments, the modification ensures that the formation of a metabolite other than the organic acid of interest is reduced. According to specific embodiments, methods are used for introducing at least one engineered gene deletion and/or inactivation of an endogenous pathway in which an organic acid is consumed, or a gene encoding a product involved in an endogenous pathway that results in the formation of a metabolite other than the organic acid of interest. In specific embodiments, the at least one engineered gene deletion or inactivation is in one or more genes encoding an enzyme selected from the group consisting of pyruvate decarboxylase (pdc), fumarate reductase, alcohol dehydrogenase (adh), acetaldehyde dehydrogenase, phosphoenolpyruvate carboxylase (ppc), D-lactate dehydrogenase (d-ldh), L-lactate dehydrogenase (l-ldh), lactate-2-monooxygenase. In additional embodiments, at least one engineered deletion and/or gene inactivation is in an endogenous gene encoding pyruvate decarboxylase (pdc).
В дополнительных вариантах осуществления микроорганизм конструируют с образованием молочной кислоты, и по меньшей мере одна сконструированная делеция гена и/или инактивация находятся в эндогенном гене, кодирующем лактатдегидрогеназу. Дополнительно или альтернативно микроорганизм содержит по меньшей мере одну сконструированную делецию гена или инактивацию эндогенного гена, кодирующего цитохром-зависимую лактатдегидрогеназу, такую как цитохром B2-зависимая L-лактатдегидрогеназа.In further embodiments, the microorganism is engineered to produce lactic acid and at least one engineered gene deletion and/or inactivation is in an endogenous gene encoding lactate dehydrogenase. Additionally or alternatively, the microorganism comprises at least one engineered gene deletion or inactivation of an endogenous gene encoding a cytochrome-dependent lactate dehydrogenase, such as cytochrome B2-dependent L-lactate dehydrogenase.
Применение Cas9 при получении улучшенных штаммов дрожжей, утилизирующих ксилозу или целлобиозуApplication of Cas9 in obtaining improved yeast strains that utilize xylose or cellobiose
В конкретных вариантах осуществления система CRISPR/Cas9 может быть применима для выбора улучшенных штаммов дрожжей, утилизирующих ксилозу или целлобиозу. ПЦР сниженной точности может быть использована для амплификации одного (или нескольких) генов, участвующих в путях утилизации ксилозы или целлобиозы. Примеры генов, участвующих в путях утилизации ксилозы и путях утилизации целлобиозы, могут включать без ограничения описанные в Ha, S.J., et al. (2011) Proc. Natl. Acad. Sci. USA 108(2):504-9 и Galazka, J.M., et al. (2010) Science 330(6000):84-6. Полученные библиотеки двухнитевых молекул ДНК, каждая из которых содержит случайную мутацию в таком определенном гене, могли быть котрансформированы компонентами системы CRISPR/Cas9 в штамм дрожжей (например, S288C) и могут быть отобраны штаммы с повышенной способностью к утилизации ксилозы или целлобиозы, как описано в WO2015138855.In particular embodiments, the CRISPR/Cas9 system may be useful for selecting improved xylose or cellobiose utilizing yeast strains. Reduced fidelity PCR may be used to amplify one or more genes involved in xylose or cellobiose utilizing pathways. Examples of genes involved in xylose utilizing pathways and cellobiose utilizing pathways may include, but are not limited to, those described in Ha, S. J., et al. (2011) Proc. Natl. Acad. Sci. USA 108(2):504-9 and Galazka, J. M., et al. (2010) Science 330(6000):84-6. The resulting libraries of double-stranded DNA molecules, each containing a random mutation in such a specific gene, could be co-transformed with components of the CRISPR/Cas9 system into a yeast strain (e.g. S288C) and strains with increased xylose or cellobiose utilization capacity could be selected, as described in WO2015138855.
Применение Cas9 при получении улучшенных штаммов дрожжей для использования при биосинтезе изопреноидовApplication of Cas9 in the production of improved yeast strains for use in isoprenoid biosynthesis
Tadas Jakočiūnas et al. описали успешное применение мультиплексной системы CRISPR/Cas9 для конструирования генома из различных геномных локусов в количестве до 5 на одной стадии трансформации в пекарских дрожжах Saccharomyces cerevisiae (Metabolic Engineering Volume 28, March 2015, Pages 213-222), при этом были получены штаммы с высокой продукцией мевалоната, ключевого посредника для промышленно важного пути биосинтеза изопреноидов. В конкретных вариантах осуществления система CRISPR/Cas9 может быть применена в способе конструирования мультиплексного генома, как описано в данном документе, для идентификации дополнительных высокопродуктивных штаммов дрожжей для применения в синтезе изопреноидов.Tadas Jakočiūnas et al. described the successful use of a multiplex CRISPR/Cas9 system to engineer a genome from up to 5 different genomic loci in a single transformation step in the baker's yeast Saccharomyces cerevisiae (Metabolic Engineering Volume 28, March 2015, Pages 213-222), yielding strains with high production of mevalonate, a key intermediate in the industrially important isoprenoid biosynthetic pathway. In particular embodiments, the CRISPR/Cas9 system can be used in the multiplex genome engineering method described herein to identify additional high-yielding yeast strains for use in isoprenoid synthesis.
Применение Cas9 при получении штаммов дрожжей, продуцирующих молочную кислотуApplication of Cas9 in the production of lactic acid-producing yeast strains
В другом варианте осуществления охватывается успешное применение мультиплексной системы CRISPR/Cas9. По аналогии с Vratislav Stovicek et al. (Metabolic Engineering Communications, Volume 2, December 2015, Pages 13-22) улучшенные штаммы, продуцирующие молочную кислоту, могут быть разработаны и получены в одном событии трансформации. В конкретном варианте осуществления систему CRISPR/Cas9 применяют для одновременной вставки гетерологичного гена лактатдегидрогеназы и разрыва двух эндогенных генов PDC1 и PDC5.In another embodiment, the successful use of a multiplex CRISPR/Cas9 system is encompassed. In analogy with Vratislav Stovicek et al. (Metabolic Engineering Communications, Volume 2, December 2015, Pages 13-22), improved lactic acid producing strains can be developed and obtained in a single transformation event. In a specific embodiment, the CRISPR/Cas9 system is used to simultaneously insert a heterologous lactate dehydrogenase gene and disrupt two endogenous genes, PDC1 and PDC5.
Дополнительные варианты применения системы CRISPR/Cas9 в растенияхAdditional Applications of the CRISPR/Cas9 System in Plants
В конкретных вариантах осуществления система CRISPR и предпочтительно система CRISPR/Cas9, описанные в данном документе, могут быть использованы для визуализации динамики генетических элементов. Например, с помощью отображения CRISPR можно визуализировать как повторяющиеся, так и неповторяющиеся геномные последовательности, описывать изменение длины теломеров и движения теломеров и контролировать динамику генных локусов во время клеточного цикла (Chen et al., Cell, 2013). Эти способы могут быть применимы к растениям.In particular embodiments, the CRISPR system and preferably the CRISPR/Cas9 system described herein can be used to visualize the dynamics of genetic elements. For example, CRISPR imaging can visualize both repetitive and non-repetitive genomic sequences, characterize telomere length changes and telomere movement, and monitor the dynamics of gene loci during the cell cycle (Chen et al., Cell, 2013). These methods can be applied to plants.
Другие варианты применения системы CRISPR и предпочтительно системы CRISPR/Cas9, описанной в данном документе, предусматривают скрининг относительно положительной селекции нарушения функционирования целевого гена in vitro и in vivo (Malina et al., Genes and Development, 2013). Эти способы могут быть применимы к растениям.Other applications of the CRISPR system, and preferably the CRISPR/Cas9 system described herein, include screening for positive selection of target gene dysfunction in vitro and in vivo (Malina et al., Genes and Development, 2013). These methods may be applicable to plants.
В конкретных вариантах осуществления слияние неактивных эндонуклеаз Cas9 с модифицирующими гистоны ферментами может вводить специфические изменения в сложном эпигеноме (Rusk et al., Nature Methods, 2014). Эти способы могут быть применимы к растениям.In specific embodiments, fusion of inactive Cas9 endonucleases to histone modifying enzymes can introduce specific changes in the complex epigenome (Rusk et al., Nature Methods, 2014). These methods may be applicable to plants.
В конкретных вариантах осуществления система CRISPR и предпочтительно система CRISPR/Cas9, описанная в данном документе, могут быть использованы для очистки конкретного участка хроматина и выявления ассоциированных белков, при этом устанавливается их регуляторная роль в транскрипции (Waldrip et al., Epigenetics, 2014). Эти способы могут быть применимы к растениям.In particular embodiments, the CRISPR system, and preferably the CRISPR/Cas9 system described herein, can be used to purify a specific region of chromatin and identify associated proteins, thereby establishing their regulatory role in transcription (Waldrip et al., Epigenetics, 2014). These methods can be applied to plants.
В конкретных вариантах осуществления настоящее изобретение может быть использовано в качестве терапии для удаления вируса в растительных системах, поскольку можно расщеплять как вирусную ДНК, так и РНК. Предыдущие исследования в человеческих системах показали успех применения CRISPR при нацеливании на содержащий однонитевую РНК вирус гепатита С (A. Price, et al., Proc. Natl. Acad. Sci, 2015), а также на содержащий двухнитевую ДНК вирус гепатита B (V. Ramanan, et al., Sci. Rep, 2015). Эти способы могут быть адаптированы для применения системы CRISPR/Cas9 у растений.In particular embodiments, the present invention can be used as a therapy for virus removal in plant systems because both viral DNA and RNA can be cleaved. Previous studies in human systems have shown success using CRISPR in targeting single-stranded RNA hepatitis C virus (A. Price, et al., Proc. Natl. Acad. Sci, 2015) as well as double-stranded DNA hepatitis B virus (V. Ramanan, et al., Sci. Rep, 2015). These methods can be adapted for use of the CRISPR/Cas9 system in plants.
В конкретных вариантах осуществления настоящее изобретение могло бы быть применимо для изменения вариабельности генома. В дополнительных конкретных вариантах осуществления система CRISPR и предпочтительно система CRISPR/Cas9, описанная в данном документе, могут быть использованы для нарушения или изменения числа хромосом и получения гаплоидных растений, которые содержат хромосомы только от одного родителя. Такие растения могут быть индуцированы с целью осуществления хромосомной дупликации и превращены в диплоидные растения, содержащие только гомозиготные аллели (Karimi-Ashtiyani et al., PNAS, 2015; Anton et al., Nucleus, 2014). Эти способы могут быть применимы к растениям.In particular embodiments, the present invention could be used to alter genomic variability. In further particular embodiments, the CRISPR system, and preferably the CRISPR/Cas9 system described herein, can be used to disrupt or alter chromosome numbers and produce haploid plants that contain chromosomes from only one parent. Such plants can be induced to undergo chromosomal duplication and converted into diploid plants containing only homozygous alleles (Karimi-Ashtiyani et al., PNAS, 2015; Anton et al., Nucleus, 2014). These methods can be applied to plants.
В конкретных вариантах осуществления система CRISPR/Cas9, описанная в данном документе, может быть использована для саморасщепления. Описанный промотор фермента Cas9 и sgRNA представляет собой конститутивный промотор, а вторую sgRNA вводят в ту же самую кассету трансформации, но контролируют с помощью индуцируемого промотора. Эта вторая sgRNA может быть сконструирована с целью индукции сайт-специфического расщепления в гене Cas9 с получением нефункционального Cas9. В дополнительном конкретном варианте осуществления вторая sgRNA индуцирует расщепление на обоих концах кассеты для трансформации, приводя к удалению кассеты из генома хозяина. Эта система обеспечивает контролируемую продолжительность воздействия на клетку фермента Cas и дополнительно сводит к минимуму нецелевое редактирование. Кроме того, расщепление обоих концов кассеты CRISPR/Cas может быть использовано для получения не содержащих трансгенов растений T0 с биаллельными мутациями (например, Moore et al., Nucleic Acids Research, 2014; Schaeffer et al., Plant Science, 2015). Способы Moore et al. могут быть применены по отношению к системам CRISPR/Cas9, описанным в данном документе.In specific embodiments, the CRISPR/Cas9 system described herein can be used for self-cleavage. The described Cas9 enzyme and sgRNA promoter is a constitutive promoter, and a second sgRNA is introduced into the same transformation cassette, but is controlled by an inducible promoter. This second sgRNA can be engineered to induce site-specific cleavage in the Cas9 gene to produce a non-functional Cas9. In a further specific embodiment, the second sgRNA induces cleavage at both ends of the transformation cassette, resulting in the removal of the cassette from the host genome. This system provides a controlled duration of exposure of the cell to the Cas enzyme and further minimizes off-target editing. In addition, cleavage of both ends of the CRISPR/Cas cassette can be used to generate transgene-free T 0 plants with biallelic mutations (e.g., Moore et al., Nucleic Acids Research, 2014; Schaeffer et al., Plant Science, 2015). The methods of Moore et al. can be applied to the CRISPR/Cas9 systems described herein.
Улучшенные растенияImproved Plants
Настоящее изобретение также предусматривает растения и дрожжевые клетки, получаемые и полученные с помощью способов, предусмотренных в данном документе. Улучшенные растения, полученные с помощью способов, описанных в данном документе, могут быть полезны при получении продуктов питания и кормов посредством экспрессии генов, которые, например, обеспечивают переносимость вредителей растений, гербицидов, засухи, низких или высоких температур, избытка воды и др.The present invention also provides plants and yeast cells obtainable and obtainable by the methods provided in this document. Improved plants obtained by the methods described in this document can be useful in the production of food and feed products by expressing genes that, for example, provide tolerance to plant pests, herbicides, drought, low or high temperatures, excess water, etc.
Улучшенные растения, полученные с помощью способов, описанных в данном документе, в частности, сельскохозяйственные культуры и водоросли, могут быть полезны в производстве продуктов питания и кормов посредством синтеза, например, более высоких уровней белка, углеводов, нутриентов или витаминов, чем в норме наблюдались бы при диком типе. В этом отношении улучшенные растения, в частности, зернобобовые и клубнеплоды, являются предпочтительными.Improved plants obtained by the methods described herein, in particular crops and algae, may be useful in the production of food and feed by synthesizing, for example, higher levels of protein, carbohydrates, nutrients or vitamins than would normally be observed in the wild type. In this regard, improved plants, in particular legumes and tubers, are preferred.
Улучшенные водоросли или другие растения, такие как рапс, могут быть особенно полезными в производстве растительных масел или таких видов биотоплива, как, например, спирты (особенно метанол и этанол). Они могут быть сконструированы для синтеза или сверхсинтеза масла или спиртов на высоких уровнях для применения в масложировой или биотопливной промышленности.Enhanced algae or other plants such as rapeseed may be particularly useful in the production of vegetable oils or biofuels such as alcohols (especially methanol and ethanol). They can be engineered to synthesize or oversynthesize oils or alcohols at high levels for use in the oil and fat or biofuel industries.
Настоящее изобретение также предусматривает улучшенные части растения. Части растений включают без ограничения листья, стебли, корни, клубни, семена, эндосперм, семяпочку и пыльцу. Части растений, как предусмотрено в данном документе, могут быть жизнеспособными, нежизнеспособными, регенерируемыми и/или нерегенерируемыми.The present invention also provides improved plant parts. Plant parts include, but are not limited to, leaves, stems, roots, tubers, seeds, endosperm, ovules, and pollen. Plant parts, as provided herein, may be viable, non-viable, regenerable, and/or non-regenerable.
В данном документе также охвачены растительные клетки и растения в соответствии со способами по настоящему изобретению. Гаметы, семена, эмбрионы, как зиготические, так и соматические, потомство или гибриды растений, содержащих генетическую модификацию, которые получены с помощью традиционных способов селекции, также включены в объем настоящего изобретения. Такие растения могут содержать гетерологичную последовательность или последовательность чужеродной ДНК, вставленные в целевую последовательность или вместо нее. Альтернативно такие растения могут содержать только изменение (мутацию, делецию, вставку, замену) в одном или нескольких нуклеотидах. Например, такие растения будут отличаться только от своих растений-предшественников по наличию определенной модификации.Plant cells and plants according to the methods of the present invention are also encompassed by this document. Gametes, seeds, embryos, both zygotic and somatic, progeny or hybrids of plants containing a genetic modification that are obtained using traditional breeding methods are also included within the scope of the present invention. Such plants may contain a heterologous sequence or a foreign DNA sequence inserted into or in place of the target sequence. Alternatively, such plants may contain only a change (mutation, deletion, insertion, substitution) in one or more nucleotides. For example, such plants will differ from their progenitor plants only by the presence of a certain modification.
Сельскохозяйственные и продуктивные животныеAgricultural and productive animals
Таким образом, настоящее изобретение относится к растению, животному или клетке, полученным с помощью способа по настоящему изобретению, или их потомству. Потомство может представлять собой клон полученного растения или животного, или его можно получить с помощью полового размножения посредством скрещивания с другими индивидами того же вида для придания дополнительных желаемых признаков их потомкам. Клетка может находиться in vivo или ex vivo в случае многоклеточных организмов, в частности, животных или растений.The present invention thus relates to a plant, animal or cell obtained by the method of the present invention, or their progeny. The progeny may be a clone of the obtained plant or animal, or it may be obtained by sexual reproduction by crossing with other individuals of the same species to impart additional desired characteristics to their progeny. The cell may be in vivo or ex vivo in the case of multicellular organisms, in particular animals or plants.
Организмы и животные; способыOrganisms and animals; methods
Настоящая заявка также может распространяться на другие варианты сельскохозяйственного применения, такие как, например, сельскохозяйственные и продуктивные животные. Например, свиньи имеют многие характеристики, которые делают их привлекательными в качестве биомедицинских моделей, в частности, в регенеративной медицине. В частности, свиньи с тяжелым комбинированным иммунодефицитом (SCID) могут обеспечивать полезные модели для регенеративной медицины, ксенотрансплантации и опухолевого развития и будут способствовать разработке лекарственных препаратов для пациентов-людей с SCID. Lee et al. (Proc Natl Acad Sci U S A. 2014 May 20;111(20):7260-5) использовали направляемую репортером систему эффекторной нуклеазы, подобной активаторам транскрипции (TALEN), по отношению к полученным целевым модификациям гена, активирующего рекомбинацию (RAG) 2, в соматических клетках с высокой эффективностью, в том числе некоторым, которые влияли на оба аллеля. Система CRISPR Cas может быть применима к аналогичной системе.This application may also extend to other agricultural applications, such as, for example, agricultural and production animals. For example, pigs have many characteristics that make them attractive as biomedical models, particularly in regenerative medicine. In particular, severe combined immunodeficiency (SCID) pigs may provide useful models for regenerative medicine, xenotransplantation, and tumorigenesis, and will facilitate the development of therapeutics for human patients with SCID. Lee et al. (Proc Natl Acad Sci U S A. 2014 May 20;111(20):7260-5) used a reporter-directed transcription activator-like effector nuclease (TALEN) system to produce targeted modifications of the recombination activating gene (RAG) 2 in somatic cells with high efficiency, including some that affected both alleles. The CRISPR Cas system may be applicable to a similar system.
Способы Lee et al., (Proc Natl Acad Sci U S A. 2014 May 20;111(20):7260-5) могут быть применимы по отношению к настоящему изобретению следующим образом. Мутированных свиней получают с помощью целевой модификации RAG2 в фибробластах плода, после чего происходит SCNT и перенос эмбрионов. Конструкции, кодирующие CRISPR Cas и репортер, электропорируют в фибробласты, полученные из плода. Через 48 часов трансфицированные клетки, экспрессирующие зеленый флуоресцентный белок, сортируют в отдельные лунки 96-луночного планшета при предполагаемом разведении одна клетка на лунку. Целевые модификации RAG2 подвергают скринингу с помощью амплификации фрагмента геномной ДНК, фланкирующей любые сайты рестрикции CRISPR Cas, после чего выполняют секвенирование ПЦР-продуктов. После скрининга и обеспечения отсутствия нецелевых мутаций клетки, несущие целевую модификацию RAG2, используют для SCNT. Полярное тельце вместе с частью прилегающей цитоплазмы ооцита, предположительно содержащего метафазную пластинку II, удаляют, и донорскую клетку помещают в перивителлин. Реконструированные эмбрионы затем электропорируют для слияния донорской клетки с ооцитом и затем химически активируют. Активированные эмбрионы инкубируют в среде для развития свиных зигот 3 (PZM3) с 0,5 мкМ скриптаидом (S7817; Sigma-Aldrich) в течение 14-16 часов. Эмбрионы затем промывают с удалением скриптаида и культивируют в PZM3 до тех пор, пока они не будут перенесены в маточные трубы суррогатных свиней.The methods of Lee et al., (Proc Natl Acad Sci U S A. 2014 May 20;111(20):7260-5) can be applied to the present invention as follows. Mutated pigs are generated by targeted modification of RAG2 in fetal fibroblasts, followed by SCNT and embryo transfer. Constructs encoding CRISPR Cas and a reporter are electroporated into fetal fibroblasts. After 48 hours, transfected cells expressing green fluorescent protein are sorted into individual wells of a 96-well plate at an expected dilution of one cell per well. Targeted modifications of RAG2 are screened by amplifying a fragment of genomic DNA flanking any CRISPR Cas restriction sites, followed by sequencing of the PCR products. After screening and ensuring the absence of off-target mutations, cells harboring the targeted modification of RAG2 are used for SCNT. The polar body along with a portion of the adjacent cytoplasm of the oocyte presumed to contain metaphase plate II are removed and the donor cell is placed in perivitelline. The reconstructed embryos are then electroporated to fuse the donor cell with the oocyte and then chemically activated. The activated embryos are incubated in porcine zygote development medium 3 (PZM3) with 0.5 μM scriptaid (S7817; Sigma-Aldrich) for 14–16 h. The embryos are then washed to remove scriptaid and cultured in PZM3 until they are transferred into the fallopian tubes of surrogate pigs.
Настоящее изобретение также применимо к модификации SNP других животных, таких как коровы. Tan et al. (Proc Natl Acad Sci U S A. 2013 Oct 8; 110(41): 16526-16531) расширили набор для редактирования генов крупного рогатого скота с включением репарации с участием гомологичной рекомбинации (HDR), стимулированной эффекторной нуклеазой, подобной активаторам транскрипции (TAL) (TALEN) и коротких палиндромных повторов, регулярно расположенных группами (CRISPR)/Cas9, с использованием плазмиды, rAAV и олигонуклеотидных матриц. Геноспецифические последовательности gRNA были клонированы в вектор на основе gRNA Church lab (Addgene ID: 41824) в соответствии с их способами (Mali P, et al. (2013) RNA-Guided Human Genome Engineering via Cas9. Science 339(6121):823-826). Нуклеазу Cas9 получали с помощью котрансфекции плазмиды hCas9 (Addgene ID: 41815) или синтезировали с помощью мРНК из RCIScript-hCas9. Эта система RCIScript-hCas9 была сконструирована с помощью субклонирования фрагмента XbaI-AgeI из плазмиды hCas9 (охватывающей кДНК hCas9) в плазмиду RCIScript.The present invention is also applicable to SNP modification in other animals, such as cows. Tan et al. (Proc Natl Acad Sci U S A. 2013 Oct 8; 110(41): 16526-16531) expanded the bovine gene editing kit to include transcription activator-like effector nuclease (TAL)-stimulated homologous recombination repair (HDR) and clustered regularly interspaced short palindromic repeats (CRISPR)/Cas9 using plasmid, rAAV, and oligonucleotide templates. The gene-specific gRNA sequences were cloned into Church lab gRNA-based vector (Addgene ID: 41824) according to their methods (Mali P, et al. (2013) RNA-Guided Human Genome Engineering via Cas9. Science 339(6121):823-826). Cas9 nuclease was generated by co-transfection of hCas9 plasmid (Addgene ID: 41815) or synthesized using mRNA from RCIScript-hCas9. This RCIScript-hCas9 system was constructed by subcloning the XbaI-AgeI fragment from hCas9 plasmid (covering the hCas9 cDNA) into RCIScript plasmid.
Heo et al. (Stem Cells Dev. 2015 Feb 1;24(3):393-402. doi: 10.1089/scd.2014.0278. Epub 2014 Nov 3) описали высокоэффективное нацеливание на ген в бычьем геноме с использованием бычьих плюрипотентных клеток и коротких палиндромных повторов, регулярно расположенных группами, (CRISPR)/нуклеазы Cas9. Впервые Heo et al. получили индуцированные плюрипотентные стволовые клетки (iPSC) из бычьих соматических фибробластов с помощью эктопической экспрессии факторов Яманаки и обработки ингибитором GSK3β и MEK (2i). Heo et al. наблюдали, что эти бычьи iPSC очень похожи на наивные плюрипотентные стволовые клетки в отношении экспрессии генов и потенциала развития в тератомы. Кроме того, нуклеаза CRISPR/Cas9, которая была специфичной по отношению к бычьему локусу NANOG, характеризовалась высокоэффективным редактированием бычьего генома в бычьих iPSC и эмбрионах.Heo et al. (Stem Cells Dev. 2015 Feb 1;24(3):393-402. doi: 10.1089/scd.2014.0278. Epub 2014 Nov 3) described highly efficient gene targeting in the bovine genome using bovine pluripotent cells and clustered regularly interspaced short palindromic repeats (CRISPR)/Cas9 nuclease. Heo et al. first generated induced pluripotent stem cells (iPSCs) from bovine somatic fibroblasts by ectopically expressing Yamanaka factors and treating with a GSK3β and MEK inhibitor (2i). Heo et al. observed that these bovine iPSCs were highly similar to naïve pluripotent stem cells with respect to gene expression and teratoma development potential. Furthermore, the CRISPR/Cas9 nuclease, which was specific for the bovine NANOG locus, was characterized by highly efficient editing of the bovine genome in bovine iPSCs and embryos.
Igenity® предусматривает профильный анализ животных, таких как коровы, для проявления и передачи генов экономически важных признаков, таких как состав туши, качество туши, материнские и репродуктивные признаки и средний суточный прирост. Анализ полного профиля Igenity® начинается с обнаружения ДНК-маркеров (чаще всего однонуклеотидных полиморфизмов или SNP). Все маркеры в рамках профиля Igenity® были обнаружены независимыми учеными в исследовательских институтах, в том числе университетах, исследовательских организациях и государственных организациях, таких как USDA. Затем маркеры анализировали с помощью Igenity® в популяциях для валидации. В Igenity® используют популяции из нескольких ресурсов, которые отражают различные условия производственной среды и биологические типы, при этом часто выполняют работы с промышленными партнерами из маточного, скотоводческого, откормочного и/или упаковочного сегментов скотоводческой промышленности для сбора фенотипов, которые обычно не доступны. Базы данных геномов крупного рогатого скота являются широко доступными, см., например, NAGRP Cattle Genome Coordination Program (http://www.animalgenome.org/cattle/maps/db.html). Таким образом, настоящее изобретение может быть применено для нацеливания на бычьи SNP. Специалист в данной области может использовать вышеупомянутые протоколы для нацеливания на SNP и применения их по отношению к бычьим SNP, как, например, Tan et al. или Heo et al.Igenity® involves profiling animals, such as cows, to express and transmit genes for economically important traits such as carcass composition, carcass quality, maternal and reproductive traits, and average daily gain. Analysis of a complete Igenity® profile begins with the discovery of DNA markers (most often single nucleotide polymorphisms, or SNPs). All markers within an Igenity® profile were discovered by independent scientists at research institutions, including universities, research organizations, and government agencies such as the USDA. The markers were then analyzed using Igenity® in validation populations. Igenity® utilizes populations from multiple resources that reflect a variety of production environments and biological types, often working with industry partners in the breeding, finishing, finishing, and/or packing segments of the cattle industry to capture phenotypes that are not typically available. Databases of bovine genomes are widely available, see, for example, the NAGRP Cattle Genome Coordination Program (http://www.animalgenome.org/cattle/maps/db.html). Thus, the present invention can be applied to target bovine SNPs. One skilled in the art can use the above-mentioned protocols for targeting SNPs and apply them to bovine SNPs, such as Tan et al. or Heo et al.
Qingjian Zou et al. (Journal of Molecular Cell Biology Advance Access, опубликовано 12 октября 2015 г.) показали повышение мышечной массы у собак с помощью нацеливания на первый экзон гена миостатина собаки (MSTN) (отрицательный регулятор скелетной мышечной массы). Прежде всего, валидировали эффективность sgRNA с помощью котрансфекции sgRNA, нацеленной на MSTN, с помощью вектора Cas9 в собачьих эмбриональных фибробластах (CEF). Затем собак MSTN KO получали с помощью микроинъекции эмбрионам с нормальной морфологией смеси мРНК Cas9 и sgRNA MSTN и аутотрансплантации зигот в маточную трубу той же самой суки. Нокаутированные щенки проявляли выраженный мышечный фенотип в области бедер по сравнению со своим однопометником дикого типа.Qingjian Zou et al. (Journal of Molecular Cell Biology Advance Access, published October 12, 2015) showed increased muscle mass in dogs by targeting the first exon of the canine myostatin (MSTN) gene (a negative regulator of skeletal muscle mass). First, the efficacy of sgRNA was validated by cotransfecting MSTN-targeting sgRNA with a Cas9 vector in canine embryonic fibroblasts (CEFs). MSTN KO dogs were then generated by microinjecting embryos with a mixture of Cas9 mRNA and MSTN sgRNA and autotransplanting the zygotes into the fallopian tube of the same female. The KO puppies exhibited a pronounced muscular phenotype in the thigh region compared to their wild-type littermate.
Домашний скот - свиньиLivestock - pigs
Вирусные мишени в домашнем скоте могут включать в некоторых вариантах осуществления свиной CD163, например, на свиных макрофагах. CD163 ассоциирован с инфекцией (предположительно в результате вхождения вируса в клетку) в результате PRRSv (вируса свиного репродуктивного и респираторного синдрома, артеривируса). Инфекция в результате PRRSv, в частности, свиных альвеолярных макрофагов (встречающихся в легких), приводит к ранее неизлечимому свиному синдрому ("таинственная болезнь свиней" или "болезнь синего уха"), который вызывает болезнь, в том числе репродуктивную недостаточность, потерю веса и высокую смертность у домашних свиней. Оппортунистические инфекции, такие как энзоотическая пневмония, менингит и отечность ушей, часто наблюдаются в результате иммунодефицита вследствие потери активности макрофагов. Это также имеет значительные экономические и средовые последствия в связи с повышенным применением антибиотиков и финансовым ущербом (по оценкам 660 млн. дол. в год).Viral targets in livestock may include, in some embodiments, porcine CD163, such as on porcine macrophages. CD163 is associated with infection (presumably as a result of viral entry into the cell) by PRRSv (porcine reproductive and respiratory syndrome virus, an arterivirus). Infection by PRRSv, particularly of porcine alveolar macrophages (found in the lungs), results in a previously incurable porcine syndrome ("mystery pig disease" or "blue ear disease"), which causes disease including reproductive failure, weight loss, and high mortality in domestic pigs. Opportunistic infections such as enzootic pneumonia, meningitis, and ear swelling are often observed as a result of immunodeficiency due to loss of macrophage activity. It also has significant economic and environmental consequences due to increased antibiotic use and financial losses (estimated at $660 million per year).
Как было описано Kristin M Whitworth and Dr Randall Prather et al. (Nature Biotech 3434, опубликовано онлайн 07 декабря 2015 г.) в Университете штата Миссури и в сотрудничестве с Genus Plc, CD163 подвергали нацеливанию CRISPR-Cas9 и потомство "редактированных" свиней было устойчиво при воздействии PRRSv. Одного хряка-основателя и одну свиноматку-основательницу, оба из которых имели мутации в экзоне 7 CD163, скрещивали с получением потомства. Хряк-основатель характеризовался делецией из 11 п. о. в экзоне 7 в одном аллеле, которая приводила к мутации типа сдвига рамки и миссенс-трансляции в аминокислоте 45 в домене 5 и последующему преждевременному стоп-кодону по аминокислоте 64. Другой аллель характеризовался добавлением из 2 п.о. в экзоне 7 и делецией из 377 п. о. в предшествующем интроне, которые, как предполагалось, приводили к экспрессии первых 49 аминокислот домена 5, затем преждевременного стоп-кодона в аминокислоте 85. Свиноматка характеризовалась добавлением из 7 п. о. в одном аллеле, которое при трансляции, как предполагалось, экспрессировало первые 48 аминокислот домена 5, затем преждевременный стоп-кодон в аминокислоте 70. Другой аллель свиноматки был неамплифицированным. Некоторые потомки, как предполагалось, представляли собой нуль-животное (CD163-/-), т.е. нокаут по CD163.As described by Kristin M Whitworth and Dr Randall Prather et al. (Nature Biotech 3434, published online 07 December 2015) at the University of Missouri and in collaboration with Genus Plc, CD163 was targeted with CRISPR-Cas9 and the offspring of the edited pigs were resistant to PRRSv. One founder boar and one founder sow, both of which had mutations in exon 7 of CD163, were mated to produce offspring. The founder boar had an 11 bp deletion in exon 7 on one allele, resulting in a frameshift and missense translation mutation at amino acid 45 in domain 5 and a subsequent premature stop codon at amino acid 64. The other allele had a 2 bp addition to the gene for CD163. in exon 7 and a 377 bp deletion in the preceding intron that were predicted to result in expression of the first 49 amino acids of domain 5 followed by a premature stop codon at amino acid 85. The sow had a 7 bp addition in one allele that, when translated, was predicted to express the first 48 amino acids of domain 5 followed by a premature stop codon at amino acid 70. The sow's other allele was unamplified. Some offspring were predicted to be null animals (CD163-/-), i.e., CD163 knockouts.
Соответственно, в некоторых вариантах осуществления свиные альвеолярные макрофаги могут быть подвергнуты нацеливанию белка CRISPR. В некоторых вариантах осуществления свиной CD163 может быть подвергнут нацеливанию белка CRISPR. В некоторых вариантах осуществления свиной CD163 может быть нокаутирован посредством индукции DSB или в результате вставок или делеций, например, нацеливания на делецию или модификацию экзона 7, в том числе одного или нескольких из описанных выше, или в других областях гена, например, делецию или модификацию экзона 5.Accordingly, in some embodiments, porcine alveolar macrophages can be targeted with a CRISPR protein. In some embodiments, porcine CD163 can be targeted with a CRISPR protein. In some embodiments, porcine CD163 can be knocked out by inducing a DSB or by insertions or deletions, such as targeting a deletion or modification of exon 7, including one or more of those described above, or in other regions of the gene, such as a deletion or modification of exon 5.
Также предусмотрены "редактированная" свинья и ее потомство, например, нокаутированная по CD163 свинья. Это может быть предусмотрено для целей скотоводства, селекции и моделирования (т.е., свиная модель). Также предусмотрена семенная жидкость, содержащая нокаут гена.An "edited" pig and its offspring, such as a CD163 knockout pig, are also envisaged. This may be envisaged for the purposes of livestock breeding, selection and modeling (i.e., a pig model). Semen containing the gene knockout is also envisaged.
CD163 представляет собой представителя суперсемейства фагоцитарных рецепторов с высоким содержанием цистеина (SRCR). На основе in vitro исследований SRCR домен 5 белка представляет собой домен, ответственный за распаковку и высвобождение вирусного генома. Например, другие представители суперсемейства SRCR также могут быть подвергнуты нацеливанию для получения устойчивости к другим вирусам. PRRSV также представляет собой представителя группы артеривирусов млекопитающих, которая также включает вирус, повышающий уровень лактат-дегидрогеназы у мышей, вирус геморрагической лихорадки обезьян и вирус артерита лошадей. Артеривирусы имеют общие важные свойства патогенеза, в том числе макрофагальный тропизм и способность вызывать как тяжелую болезнь, так и хроническую инфекцию. Соответственно, артеривирусы и, в частности, вирус, вызывающий повышение уровня лактат-дегидрогеназы у мышей, вирус геморрагической лихорадки обезьян и вирус артерита лошадей, могут быть подвергнуты нацеливанию, например, свиного CD163 или его гомологов у других видов, и также предусмотрены мышиные, обезьяньи и лошадиные модели и нокаут.CD163 is a member of the cysteine-rich receptor (SRCR) superfamily. Based on in vitro studies, SRCR domain 5 is the domain responsible for unpacking and releasing the viral genome. For example, other members of the SRCR superfamily can also be targeted to confer resistance to other viruses. PRRSV is also a member of the mammalian arterivirus group, which also includes murine lactate dehydrogenase-increasing virus, simian hemorrhagic fever virus, and equine arteritis virus. Arteriviruses share important pathogenesis properties, including macrophage tropism and the ability to cause both severe disease and chronic infection. Accordingly, arteriviruses, and in particular mouse lactate dehydrogenase-inducing virus, simian hemorrhagic fever virus, and equine arteritis virus, can be targeted, for example, by porcine CD163 or its homologues in other species, and mouse, monkey, and equine models and knockout are also envisaged.
Действительно, этот подход может быть распространен на вирусы или бактерии, которые вызывают другие заболевания домашнего скота, которые могут передаваться человеку, такие как штаммы вируса свиного гриппа (SIV), которые включают грипп C и подтипы гриппа A, известные как H1N1, H1N2, H2N1, H3N1, H3N2 и H2N3, а также пневмонию, менингит и отечность, упомянутые выше.Indeed, this approach could be extended to viruses or bacteria that cause other livestock diseases that can be transmitted to humans, such as the swine influenza virus (SIV) strains that include influenza C and the influenza A subtypes known as H1N1, H1N2, H2N1, H3N1, H3N2 and H2N3, as well as the pneumonia, meningitis and oedema mentioned above.
Ксенотрансплантация, ксенотрансплантатыXenotransplantation, xenografts
Настоящее изобретение также предусматривает применение системы CRISPR-Cas, описанной в данном документе, например, систем эффекторного белка Cas9, для получения РНК-направляемых ДНК-нуклеаз, адаптированных для использования с целью получения модифицированных тканей для трансплантации. Например, РНК-направляемые ДНК-нуклеазы могут быть использованы для нокаута, нокдауна или разрыва определенных генов у животного, такого как трансгенная свинья (такая как линия трансгенных свиней с гемоксигеназой-1 человека), например, для нарушения экспрессии генов, которые кодируют эпитопы, распознаваемые иммунной системой человека, т.е. генами ксеноантигенов. Кандидатные свиные гены для разрыва, например, могут включать гены α(l,3)-галактозилтрансферазы и гидролазы цитидинмонофосфат-N-ацетилнейраминовой кислоты (см. публикацию заявки на патент согласно PCT WO 2014/066505). Кроме того, гены, кодирующие эндогенные ретровирусы, могут быть разорваны, например, гены, кодирующие все свиные эндогенные ретровирусы (см. Yang et al., 2015, Genome-wide inactivation of porcine endogenous retroviruses (PERVs), Science 27 November 2015: Vol. 350 no. 6264 pp. 1101-1104). Кроме того, РНК-направляемые ДНК-нуклеазы могут быть использованы для нацеливания на сайт с целью интеграции дополнительных генов у животных-доноров с ксенотрансплантатами, таких как ген человеческого CD55, для повышения защиты против сверхострого отторжения.The present invention also provides the use of the CRISPR-Cas system described herein, such as the Cas9 effector protein systems, to produce RNA-guided DNA nucleases adapted for use in producing modified tissues for transplantation. For example, RNA-guided DNA nucleases can be used to knock out, knock down, or disrupt specific genes in an animal, such as a transgenic pig (such as a human heme oxygenase-1 transgenic pig strain), such as to disrupt the expression of genes that encode epitopes recognized by the human immune system, i.e., xenoantigen genes. Candidate porcine genes for disruption can, for example, include the α(1,3)-galactosyltransferase and cytidine monophosphate-N-acetylneuraminic acid hydrolase genes (see PCT Patent Application Publication No. WO 2014/066505). In addition, genes encoding endogenous retroviruses can be disrupted, such as the genes encoding all porcine endogenous retroviruses (see Yang et al., 2015, Genome-wide inactivation of porcine endogenous retroviruses (PERVs), Science 27 November 2015: Vol. 350 no. 6264 pp. 1101-1104). Furthermore, RNA-guided DNA nucleases can be used to target the site for integration of additional genes in xenograft donor animals, such as the human CD55 gene, to enhance protection against hyperacute rejection.
Генные драйвы и применение по отношению к комарам и малярииGene drives and application to mosquitoes and malaria
Настоящее изобретение также предусматривает применение системы CRISPR-Cas, описанной в данном документе, например, систем эффекторных белков Cas9, для обеспечения РНК-направляемых генных драйвов, например, в системах, аналогичных генным драйвам, описанным в публикации заявки на патент согласно PCT WO 2015/105928. Системы этого типа, например, могут предусматривать способы изменения эукариотических клеток зародышевой линии с помощью введения в клетку зародышевой линии последовательности нуклеиновой кислоты, кодирующей РНК-направляемую ДНК-нуклеазу и одну или несколько направляющих РНК. Направляющие РНК могут быть разработаны так, что являются комплементарными одной или нескольким целевым локусам в геномной ДНК клетки зародышевой линии. Последовательность нуклеиновой кислоты, кодирующая РНК-направляемую ДНК-нуклеазу, и последовательность нуклеиновой кислоты, кодирующая направляющие РНК, могут быть получены в конструкциях между фланкирующими последовательностями, с промоторами, расположенными таким образом, что клетка зародышевой линии может экспрессировать РНК-направляемую ДНК-нуклеазу и направляющие РНК, совместно с любыми требуемыми кодирующими молекулы-карго последовательностями, которые также расположены между фланкирующими последовательностями. Фланкирующие последовательности будут, как правило, включать последовательность, которая является идентичной соответствующей последовательности на определенной хромосоме, таким образом, что фланкирующие последовательности функционируют с компонентами, кодируемыми конструкцией для облегчения вставки чужеродных последовательностей конструкций нуклеиновой кислоты в геномную ДНК в целевом сайте для разрезания с помощью механизмов, таких как гомологичная рекомбинация, для воспроизведения клетки зародышевой линии, гомозиготной по чужеродной последовательности нуклеиновой кислоты. Таким образом, системы генного драйва способны к интрогрессии требуемых генов во всей популяции производителей (Gantz et al., 2015, Highly efficient Cas9-mediated gene drive for population modification of the malaria vector mosquito Anopheles stephensi, PNAS 2015, электронная публикация, предшествующая печатной, от 23 ноября 2015 г., doi:10.1073/pnas.1521077112; Esvelt et al., 2014, Concerning RNA-guided gene drives for the alteration of wild populations eLife 2014;3:e03401). В определенных вариантах осуществления могут быть отобраны целевые последовательности, которые имеют мало потенциальных нецелевых сайтов в геноме. Целевое воздействие на несколько сайтов в целевом локусе с помощью нескольких направляющих РНК может повышать частоту разрезания и замедлять эволюцию устойчивых к драйву генов. Усеченные направляющие РНК могут снижать нецелевое разрезание. Парные никазы могут быть использованы вместо одной нуклеазы для дополнительного повышения специфичности. Конструкции для генного драйва могут включать последовательности молекул-карго, кодирующие регуляторы транскрипции, например, для активации гомологичных рекомбинантных генов и/или репрессии негомологичного соединения концов. Целевые сайты могут быть выбраны в важном гене таким образом, что события негомологичного соединения концов могут вызывать летальность, а не образование устойчивого к драйву аллеля. Конструкции для генного драйва могут быть сконструированы для функционирования в ряде хозяев при диапазоне температур (Cho et al. 2013, Rapid and Tunable Control of Protein Stability in Caenorhabditis elegans Using a Small Molecule, PLoS ONE 8(8): e72393. doi:10.1371/journal.pone.0072393).The present invention also provides for the use of the CRISPR-Cas system described herein, such as Cas9 effector protein systems, to provide RNA-guided gene drives, such as in systems similar to the gene drives described in PCT Patent Application Publication No. WO 2015/105928. Systems of this type may, for example, provide methods for altering eukaryotic germline cells by introducing into a germline cell a nucleic acid sequence encoding an RNA-guided DNA nuclease and one or more guide RNAs. The guide RNAs may be designed to be complementary to one or more target loci in the genomic DNA of the germline cell. The nucleic acid sequence encoding the RNA-guided DNA nuclease and the nucleic acid sequence encoding the guide RNAs may be provided in constructs between flanking sequences, with promoters positioned such that the germline cell can express the RNA-guided DNA nuclease and the guide RNAs, together with any desired cargo molecule encoding sequences that are also positioned between the flanking sequences. The flanking sequences will typically include a sequence that is identical to a corresponding sequence on a particular chromosome, such that the flanking sequences function with the components encoded by the construct to facilitate the insertion of the foreign sequences of the nucleic acid constructs into genomic DNA at the target cleavage site by mechanisms such as homologous recombination to produce a germline cell homozygous for the foreign nucleic acid sequence. Thus, gene drive systems are capable of introgression of desired genes throughout the breeder population (Gantz et al., 2015, Highly efficient Cas9-mediated gene drive for population modification of the malaria vector mosquito Anopheles stephensi, PNAS 2015, online publication ahead of print, November 23, 2015, doi:10.1073/pnas.1521077112; Esvelt et al., 2014, Concerning RNA-guided gene drives for the alteration of wild populations eLife 2014;3:e03401). In certain embodiments, target sequences that have few potential off-target sites in the genome can be selected. Targeting multiple sites within a target locus with multiple guide RNAs can increase cleavage frequency and slow the evolution of drive-resistant genes. Truncated guide RNAs can reduce off-target cleavage. Paired nicksases can be used instead of a single nuclease to further increase specificity. Gene drive constructs can include cargo molecule sequences encoding transcriptional regulators, for example, to activate homologous recombinant genes and/or repress non-homologous end joining. Target sites can be selected in an essential gene such that non-homologous end joining events cause lethality rather than the formation of a drive-resistant allele. Gene drive constructs can be designed to function in a range of hosts and temperatures (Cho et al. 2013, Rapid and Tunable Control of Protein Stability in Caenorhabditis elegans Using a Small Molecule, PLoS ONE 8(8): e72393. doi:10.1371/journal.pone.0072393).
FISH и иллюстративные способы применения инактивированных ферментов CRISPR Cas9FISH and illustrative applications of inactivated CRISPR Cas9 enzymes
В одном аспекте настоящее изобретение относится к сконструированной не встречающуюся в природе системе CRISPR-Cas, содержащей каталитически неактивный белок Cas, описанный в данном документе, предпочтительно инактивированный Cas9 (dCas9), и применение в этой системе флуоресцентной гибридизации in situ (FISH). dCas9, который не обладает способностью выполнять разрывы в двух нитях ДНК, может быть слит с флуоресцентным белком, таким как усиленный зеленый флуоресцентный белок (eEGFP), и коэкспрессировать с малыми направляющими РНК для нацеливания на перицентрические, центрические и телоцентрические повторы in vivo. Система dCas9 может быть использована для визуализации повторяющихся последовательностей и отдельных генов в геноме человека. Такие новые варианты применения меченых систем dCas9 CRISPR-cas могут быть важными в визуализации клеток и изучении функциональной ядерной архитектуры, особенно в случаях с небольшим объемом ядра или сложными 3-D-структурами. (Chen B, Gilbert LA, Cimini BA, Schnitzbauer J, Zhang W, Li GW, Park J, Blackburn EH, Weissman JS, Qi LS, Huang B. 2013. Dynamic imaging of genomic loci in living human cells by an optimized CRISPR/Cas system. Cell 155(7):1479-91. doi: 10.1016/j.cell.2013.12.001.)In one aspect, the present invention relates to an engineered non-naturally occurring CRISPR-Cas system comprising a catalytically inactive Cas protein as described herein, preferably inactivated Cas9 (dCas9), and the use of fluorescence in situ hybridization (FISH) in the system. dCas9, which lacks the ability to make double-strand DNA breaks, can be fused to a fluorescent protein, such as enhanced green fluorescent protein (eEGFP), and co-expressed with small guide RNAs to target pericentric, centric, and telocentric repeats in vivo. The dCas9 system can be used to visualize repetitive sequences and individual genes in the human genome. Such novel uses of labeled dCas9 CRISPR-cas systems may be important in cell imaging and the study of functional nuclear architecture, particularly in cases with small nuclear volumes or complex 3-D structures. (Chen B, Gilbert LA, Cimini BA, Schnitzbauer J, Zhang W, Li GW, Park J, Blackburn EH, Weissman JS, Qi LS, Huang B. 2013. Dynamic imaging of genomic loci in living human cells by an optimized CRISPR/Cas system. Cell 155(7):1479-91. doi: 10.1016/j.cell.2013.12.001.)
Терапевтическое нацеливание с помощью РНК-направляемого комплекса эффекторного белкаTherapeutic targeting using RNA-guided effector protein complex
Как будет понятно, предусматривается, что настоящую систему можно использовать для целенаправленного воздействия на любую представляющую интерес полинуклеотидную последовательность. Настоящее изобретение относится к не встречающейся в природе или сконструированной композиции, или одному или нескольким полинуклеотидам, кодирующим компоненты указанной композиции, или вектору или системам доставки, содержащим один или несколько полинуклеотидов, кодирующих компоненты указанной композиции, для применения при модификации целевой клетки in vivo, ex vivo или in vitro, и они могут быть выполнены при помощи способа, который изменяет клетку таким образом, что после модификации потомство или линия клеток клетки, модифицированной при помощи CRISPR, сохраняет измененный фенотип. Модифицированные клетки и потомство могут быть частью многоклеточного организма, такого как растение или животное, с применением ex vivo или in vivo системы CRISPR по отношению к желаемым типам клеток. Изобретение CRISPR может представлять собой терапевтический способ лечения. Терапевтический способ лечения может включать редактирование гена или генома или генную терапию.As will be appreciated, it is envisaged that the present system can be used to target any polynucleotide sequence of interest. The present invention relates to a non-naturally occurring or engineered composition, or one or more polynucleotides encoding components of said composition, or a vector or delivery systems comprising one or more polynucleotides encoding components of said composition, for use in modifying a target cell in vivo, ex vivo or in vitro, and can be made using a method that alters the cell such that after modification, the progeny or cell line of the CRISPR-modified cell retains the altered phenotype. The modified cells and progeny can be part of a multicellular organism, such as a plant or an animal, using an ex vivo or in vivo CRISPR system against desired cell types. The CRISPR invention can be a therapeutic method of treatment. The therapeutic method of treatment can include gene or genome editing or gene therapy.
Лечение патогенов, например, бактериальных, грибковых и паразитарных патогеновTreatment of pathogens such as bacterial, fungal and parasitic pathogens
Настоящее изобретение также может быть применимо к лечению бактериальных, грибковых и паразитарных патогенов. Большинство исследовательских усилий было сосредоточено на создании новых антибиотиков, которые после создания все равно стали бы предметом аналогичных проблем, связанных с устойчивостью к лекарственному средству. Настоящее изобретение относится к новым альтернативам на основе CRISPR, которые преодолевают эти сложности. Кроме того, в отличие от существующих антибиотиков варианты лечения на основе CRISPR могут быть проведены специфично по отношению к патогенам, с индукцией клеточной смерти целевого патогена, при этом не затрагиваются полезные бактерии.The present invention may also be applicable to the treatment of bacterial, fungal and parasitic pathogens. Most research efforts have focused on creating new antibiotics, which, once created, would still be subject to similar problems associated with drug resistance. The present invention relates to new CRISPR-based alternatives that overcome these challenges. In addition, unlike existing antibiotics, CRISPR-based treatments can be pathogen-specific, inducing cell death of the target pathogen while sparing beneficial bacteria.
Jiang et al. ("RNA-guided editing of bacterial genomes using CRISPR-Cas systems," Nature Biotechnology vol. 31, p. 233-9, March 2013) использовали систему CRISPR-Cas9 для мутирования или уничтожения S. pneumoniae и E. coli. Исследование, в результате которого происходило введение точных мутаций в геномы, опиралось на расщепление в целевом сайте генома под управлением системы двойная РНК:Cas9 для уничтожения немутированных клеток и устраняло необходимость в селектируемых маркерах или системах негативного отбора. Системы CRISPR были использованы для обращения устойчивости к антибиотикам и устранения переноса устойчивости между штаммами. Bickard et al. показали, что Cas9, перепрограммированный для нацеливания на гены вирулентности, уничтожают вирулентный, а не авирулентный, S. aureus. Перепрограммирование нуклеазы для нацеливания на гены устойчивости к антибиотиками разрушало плазмиды стафилококков, которые имели гены устойчивости к антибиотикам, и иммунизировало против распространения плазмидных генов устойчивости. (см., Bikard et al., "Exploiting CRISPR-Cas nucleases to produce sequence-specific antimicrobials," Nature Biotechnology vol. 32, 1146-1150, doi:10.1038/nbt.3043, опубликовано онлайн 5 октября 2014 г.) Bikard показал, что антимикробные средства на основе CRISPR-Cas9 функционируют in vivo для уничтожения S. aureus в мышиной модели колонизации кожи. Аналогично Yosef et al. использовали систему CRISPR для нацеливания на гены, кодирующие ферменты, которые придают устойчивость к β-лактамным антибиотикам (см. Yousef et al., "Temperate and lytic bacteriophages programmed to sensitize and kill antibiotic-resistant bacteria," Proc. Natl. Acad. Sci. USA, vol. 112, p. 7267-7272, doi: 10.1073/pnas.1500107112, опубликовано онлайн 18 мая 2015 г.).Jiang et al. ("RNA-guided editing of bacterial genomes using CRISPR-Cas systems," Nature Biotechnology vol. 31, p. 233-9, March 2013) used the CRISPR-Cas9 system to mutate or kill S. pneumoniae and E. coli. The study, which introduced precise mutations into the genomes, relied on dual RNA:Cas9-guided cleavage at a target site in the genome to kill unmutated cells and eliminated the need for selectable markers or negative selection systems. CRISPR systems have been used to reverse antibiotic resistance and eliminate the transfer of resistance between strains. Bickard et al. showed that Cas9 reprogrammed to target virulence genes kills virulent, but not avirulent, S. aureus. Reprogramming the nuclease to target antibiotic resistance genes destroyed staphylococcal plasmids that harbored antibiotic resistance genes and immunized against the spread of plasmid-borne resistance genes. (See, Bikard et al., "Exploiting CRISPR-Cas nucleases to produce sequence-specific antimicrobials," Nature Biotechnology vol. 32, 1146–1150, doi:10.1038/nbt.3043, published online October 5, 2014.) Bikard showed that CRISPR-Cas9-based antimicrobials function in vivo to kill S. aureus in a mouse model of skin colonization. Similarly, Yosef et al. used the CRISPR system to target genes encoding enzymes that confer resistance to β-lactam antibiotics (see Yousef et al., "Temperate and lytic bacteriophages programmed to sensitize and kill antibiotic-resistant bacteria," Proc. Natl. Acad. Sci. USA, vol. 112, p. 7267–7272, doi: 10.1073/pnas.1500107112, published online May 18, 2015).
Системы CRISPR могут быть использованы для редактирования геномов паразитов, которые являются устойчивыми к другим генетическим подходам. Например, система CRISPR-Cas9, как было показано, вводит двухнитевые разрывы в геном Plasmodium yoelii (см., Zhang et al., "Efficient Editing of Malaria Parasite Genome Using the CRISPR/Cas9 System," mBio. vol. 5, e01414-14, Jul-Aug 2014). Ghorbal et al. ("Genome editing in the human malaria parasite Plasmodium falciparumusing the CRISPR-Cas9 system," Nature Biotechnology, vol. 32, p. 819-821, doi: 10.1038/nbt.2925, опубликовано онлайн 1 июня 2014 г.) модифицировали последовательности двух генов, orc1 и kelch13, которые имеют предположительные функции сайленсинга генов и возникновения устойчивости к артемизинину соответственно. Паразиты, которые были изменены в подходящих сайтах, были восстановлены с очень высокой эффективностью, несмотря на отсутствие прямого отбора в отношении модификации, указывая на то, что нейтральные или даже вредные мутации могут быть получены с помощью этой системы. Систему CRISPR-Cas9 также используют для модификации других патогенных паразитов, в том числе Toxoplasma gondii (см. Shen et al., "Efficient gene disruption in diverse strains of Toxoplasma gondii using CRISPR/CAS9," mBio vol. 5:e01114-14, 2014; and Sidik et al., "Efficient Genome Engineering of Toxoplasma gondii Using CRISPR/Cas9," PLoS One vol. 9, e100450, doi: 10.1371/journal.pone.0100450, опубликовано онлайн 27 июня 2014 г.).CRISPR systems can be used to edit the genomes of parasites that are resistant to other genetic approaches. For example, the CRISPR-Cas9 system has been shown to introduce double-strand breaks into the Plasmodium yoelii genome (see, Zhang et al., "Efficient Editing of Malaria Parasite Genome Using the CRISPR/Cas9 System," mBio. vol. 5, e01414-14, Jul-Aug 2014). Ghorbal et al. ("Genome editing in the human malaria parasite Plasmodium falciparum using the CRISPR-Cas9 system," Nature Biotechnology, vol. 32, p. 819–821, doi: 10.1038/nbt.2925, published online 1 June 2014) modified the sequences of two genes, orc1 and kelch13, which have putative functions in gene silencing and artemisinin resistance, respectively. Parasites that were modified at the appropriate sites were recovered with very high efficiency despite the lack of direct selection for the modification, indicating that neutral or even deleterious mutations can be generated using this system. The CRISPR-Cas9 system has also been used to modify other pathogenic parasites, including Toxoplasma gondii (see Shen et al., "Efficient gene disruption in diverse strains of Toxoplasma gondii using CRISPR/CAS9," mBio vol. 5:e01114-14, 2014; and Sidik et al., "Efficient Genome Engineering of Toxoplasma gondii Using CRISPR/Cas9," PLoS One vol. 9, e100450, doi: 10.1371/journal.pone.0100450, published online June 27, 2014).
Vyas et al. ("A Candida albicans CRISPR system permits genetic engineering of essential genes and gene families," Science Advances, vol. 1, e1500248, DOI: 10.1126/sciadv.1500248, от 3 апреля 2015 г.) использовали систему CRISPR для преодоления долго существующих препятствий для генной инженерии в C. albicans и эффективного мутирования в одном эксперименте обеих копий нескольких различных генов. В организме, где несколько механизмов способствуют устойчивости к лекарственному средству, Vyas получал гомозиготные двойные мутанты, которые больше не проявляли гиперустойчивость к флуконазолу или циклогексимиду, обнаруживаемую родительским клиническим изолятом Can90. Vyas также получал гомозиготные мутации потери функции в важных генах C. albicans с помощью создания условных аллелей. Нуль-аллели DCR1, который требуется для процессинга рибосомальной РНК, являются летальными при низкой температуре, но жизнеспособными при высокой температуре. Vyas использовал матрицу для репарации, которая вводила нонсенс-мутацию, и выделял мутантов dcr1/dcr1, которые не могли расти при 16°C.Vyas et al. ("A Candida albicans CRISPR system permits genetic engineering of essential genes and gene families," Science Advances, vol. 1, e1500248, DOI: 10.1126/sciadv.1500248, April 3, 2015) used the CRISPR system to overcome long-standing obstacles to genetic engineering in C. albicans and efficiently mutate both copies of several different genes in a single experiment. In an organism where multiple mechanisms contribute to drug resistance, Vyas generated homozygous double mutants that no longer exhibited the hyperresistance to fluconazole or cycloheximide exhibited by the parental clinical isolate Can90. Vyas also generated homozygous loss-of-function mutations in essential C. albicans genes by creating conditional alleles. Null alleles of DCR1, which is required for ribosomal RNA processing, are lethal at low temperature but viable at high temperature. Vyas used a repair template that introduced a nonsense mutation and isolated dcr1/dcr1 mutants that could not grow at 16°C.
Система CRISPR по настоящему изобретению для применения в P. falciparum посредством разрыва хромосомных локусов. Ghorbal et al. ("Genome editing in the human malaria parasite Plasmodium falciparum using the CRISPR-Cas9 system", Nature Biotechnology, 32, 819-821 (2014), DOI: 10.1038/nbt.2925, от 1 июня 2014 г.) использовали систему CRISPR для введения специфических нокаутов генов и однонуклеотидных замен в геном малярийного плазмодия. Для адаптации системы CRISPR-Cas9 по отношению к P. falciparum Ghorbal et al. получали векторы экспрессии для контроля регуляторных элементов плазмодия в эписоме pUF1-Cas9, которая также несет селектируемый в отношении лекарственного препарата маркер ydhodh, который придает устойчивость к DSM1, ингибитору дигидрооротатдегидрогензы (PfDHODH) P. falciparum, и для транскрипции sgRNA использовали регуляторные элементы малых ядерных (sn)RNA U6 P. falciparum, помещая направляющую РНК и донорскую ДНК-матрицу для гомологичной рекомбинационной репарации на одну и ту же плазмиду pL7. См. также Zhang C. et al. ("Efficient editing of malaria parasite genome using the CRISPR/Cas9 system", MBio, 2014 Jul 1; 5(4):E01414-14, doi: 10.1128/MbIO.01414-14) и Wagner et al. ("Efficient CRISPR-Cas9-mediated genome editing in Plasmodium falciparum, Nature Methods 11, 915-918 (2014), DOI: 10.1038/nmeth.3063).The CRISPR system of the present invention for use in P. falciparum by disrupting chromosomal loci. Ghorbal et al. ("Genome editing in the human malaria parasite Plasmodium falciparum using the CRISPR-Cas9 system", Nature Biotechnology, 32, 819-821 (2014), DOI: 10.1038/nbt.2925, from June 1, 2014) used the CRISPR system to introduce specific gene knockouts and single nucleotide substitutions into the genome of the malaria parasite. To adapt the CRISPR-Cas9 system to P. falciparum, Ghorbal et al. generated expression vectors to control Plasmodium regulatory elements in the pUF1-Cas9 episome, which also carries the drug-selectable marker ydhodh, which confers resistance to DSM1, a P. falciparum dihydroorotate dehydrogenase (PfDHODH) inhibitor, and used P. falciparum U6 small nuclear (sn)RNA regulatory elements for sgRNA transcription by placing the guide RNA and the donor DNA template for homologous recombinational repair on the same plasmid, pL7. See also Zhang C. et al. ("Efficient editing of malaria parasite genome using the CRISPR/Cas9 system", MBio, 2014 Jul 1; 5(4):E01414-14, doi: 10.1128/MbIO.01414-14) and Wagner et al. (“Efficient CRISPR-Cas9-mediated genome editing in Plasmodium falciparum,” Nature Methods 11, 915-918 (2014), DOI: 10.1038/nmeth.3063).
Лечение патогенов, аналогичных вирусным патогенам, таким как HIVTreatment of pathogens similar to viral pathogens such as HIV
Cas-опосредованное редактирование генома может быть использовано для введения защитных мутаций в соматические ткани для лечения негенетических или сложных заболеваний. Например, NHEJ-опосредованная инактивация рецептора CCR5 в лимфоцитах (Lombardo et al., Nat Biotechnol. 2007 Nov; 25(11):1298-306) может представлять собой эффективную стратегию для устранения инфекции, обусловленной HIV, в то время как делеция PCSK9 (Cohen et al., Nat Genet. 2005 Feb; 37(2):161-5) или ангиопоэтина (Musunuru et al., N Engl J Med. 2010 Dec 2; 363(23):2220-7) может обеспечивать терапевтические эффекты по отношению к устойчивой к статинам гиперхолестеринемии или гиперлипидемии. Несмотря на то, что эти мишени могут также подвергаться воздействию с помощью siRNA-опосредованного нокдауна белков, уникальное преимущество NHEJ-опосредованной инактивации генов заключается в способности достигать долговременного терапевтического эффекта без необходимости в продолжении лечения. Как и в случае всех видов генной терапии, это будет, безусловно, важным для установления того, что каждое предлагаемое терапевтическое применение имеет эффективное соотношение "риск-польза".Cas-mediated genome editing can be used to introduce protective mutations into somatic tissues to treat non-genetic or complex diseases. For example, NHEJ-mediated inactivation of the CCR5 receptor in lymphocytes (Lombardo et al., Nat Biotechnol. 2007 Nov; 25(11):1298-306) may represent an effective strategy to eliminate HIV infection, while deletion of PCSK9 (Cohen et al., Nat Genet. 2005 Feb; 37(2):161-5) or angiopoietin (Musunuru et al., N Engl J Med. 2010 Dec 2; 363(23):2220-7) may provide therapeutic effects against statin-resistant hypercholesterolemia or hyperlipidemia. Although these targets can also be targeted by siRNA-mediated protein knockdown, the unique advantage of NHEJ-mediated gene inactivation is the ability to achieve a long-term therapeutic effect without the need for ongoing treatment. As with all gene therapies, it will certainly be important to establish that each proposed therapeutic application has an effective risk-benefit ratio.
Гидродинамическая доставка плазмидной ДНК, кодирующей Cas9 и направляющую РНК совместно с матрицей для репарации, в печень в модели тирозинемии у взрослых мышей, как было показано, способна корректировать мутантный ген Fah и восстанавливать экспрессию белка Fah дикого типа в ~1 из 250 клеток (Nat Biotechnol. 2014 Jun; 32(6):551-3). Кроме того, в клинических исследованиях успешно применяли нуклеазы ZF для лечения инфекции, обусловленной HIV, с помощью ex vivo нокаута рецептора CCR5. У всех пациентов уровни ДНК HIV снижались, и у одного из четырех пациентов РНК HIV становилась невыявляемой (Tebas et al., N Engl J Med. 2014 Mar 6; 370(10):901-10). Оба из этих результата показывают потенциал программируемых нуклеаз в качестве новой терапевтической платформы.Hydrodynamic delivery of plasmid DNA encoding Cas9 and guide RNA together with a repair template to the liver in an adult mouse model of tyrosinemia was shown to correct the mutant Fah gene and restore wild-type Fah protein expression in ~1 in 250 cells (Nat Biotechnol. 2014 Jun; 32(6):551-3). Furthermore, ZF nucleases have been successfully used in clinical studies to treat HIV infection by ex vivo knockout of the CCR5 receptor. In all patients, HIV DNA levels were reduced, and in one out of four patients, HIV RNA became undetectable (Tebas et al., N Engl J Med. 2014 Mar 6; 370(10):901-10). Both of these results highlight the potential of programmable nucleases as a novel therapeutic platform.
В другом варианте осуществления самоинактивирующиеся лентивирусные векторы с siRNA, нацеленной на общий экзон, который имеет tat/rev HIV, сигналом ядрышковой локализации TAR-ловушкой и специфичным к CCR5 рибозимом в виде головки молотка (см., например, DiGiusto et al. (2010) Sci Transl Med 2:36ra43) можно использовать и/или адаптировать для системы CRISPR-Cas9 по настоящему изобретению. Не менее 2,5 × 106 CD34+ клеток на килограмм веса пациента можно собирать и предварительно стимулировать в течение 16-20 часов в среде X-VIVO 15 (Lonza), содержащей 2 мкмоль/L-глутамина, фактор стволовых клеток (100 нг/мл), лиганд Flt-3 (Flt-3L) (100 нг/мл) и тромбопоэтин (10 нг/мл) (CellGenix), при плотности 2 × 106 клеток/мл. Предварительно стимулированные клетки можно трансдуцировать лентивирусом при множественности заражения 5 в течение 16-24 часов во флаконах с культурой тканей на 75 см2, покрытых фибронектином (25 мг/см2) (RetroNectin, Takara Bio Inc.).In another embodiment, self-inactivating lentiviral vectors with siRNA targeting a common exon that has tat/rev HIV, a TAR trap nucleolar localization signal, and a CCR5-specific hammerhead ribozyme (see, e.g., DiGiusto et al. (2010) Sci Transl Med 2:36ra43) can be used and/or adapted for the CRISPR-Cas9 system of the present invention. At least 2.5 × 10 6 CD34+ cells/kg patient weight can be harvested and prestimulated for 16-20 hours in X-VIVO 15 medium (Lonza) containing 2 μmol/L-glutamine, stem cell factor (100 ng/mL), Flt-3 ligand (Flt-3L) (100 ng/mL), and thrombopoietin (10 ng/mL) (CellGenix) at a density of 2 × 10 6 cells/mL. Prestimulated cells can be transduced with lentivirus at an MOI of 5 for 16-24 hours in 75 cm 2 tissue culture flasks coated with fibronectin (25 mg/cm 2 ) (RetroNectin, Takara Bio Inc.).
Специалист в данной области с использованием знаний в данной области и идей настоящего изобретения может корректировать HSC в отношении состояния иммунодефицита, такого как HIV/AIDS, включая приведение HSC в контакт с системой CRISPR-Cas9, которая целенаправленно воздействует на CCR5 и приводит к его нокауту. Направляющую РНК (и преимущественно подход с двумя направляющими последовательностями, например, парой различных РНК; например, направляющих РНК, нацеленных на два клинически значимых гена, B2M и CCR5, в первичных CD4+ T-клетках человека и CD34+ гемопоэтических стволовых клетках и клетках-предшественниках (HSPC)), которая нацеливается и нокаутирует частицу, содержащую CCR5 и белок Cas9, приводят в контакт с HSC. Приведенные таким образом в контакт клетки можно вводить и необязательно обрабатывать и размножать; см. Cartier. См. также Kiem, "Hematopoietic stem cell-based gene therapy for HIV disease," Cell Stem Cell. Feb 3, 2012; 10(2): 137-147; включенную в данный документ посредством ссылки вместе с документами, которые в ней перечислены; Mandal et al, "Efficient Ablation of Genes in Human Hematopoietic Stem and Effector Cells using CRISPR/Cas9," Cell Stem Cell, Volume 15, Issue 5, p643-652, 6 November 2014; включенную в данный документ посредством ссылки вместе с документами, которые в ней перечислены. Также упоминается публикация Ebina, "CRISPR/Cas9 system to suppress HIV-1 expression by editing HIV-1 integrated proviral DNA" SCIENTIFIC REPORTS | 3 : 2510 | DOI: 10.1038/srep02510, включенная в данный документ посредством ссылки вместе с документами, которые в ней перечислены, в качестве иных средств борьбы с HIV/AIDS с применением системы CRISPR-Cas9.One skilled in the art, using the knowledge in the art and the teachings of the present invention, can correct HSCs with respect to an immunodeficiency state such as HIV/AIDS, including contacting HSCs with a CRISPR-Cas9 system that targets and knocks down CCR5. A guide RNA (and preferably a dual guide approach, such as a pair of different RNAs; for example, guide RNAs targeting two clinically relevant genes, B2M and CCR5, in primary human CD4+ T cells and CD34+ hematopoietic stem and progenitor cells (HSPCs)) that targets and knocks down a particle containing CCR5 and a Cas9 protein is contacted with the HSCs. The cells so contacted can be administered and optionally processed and expanded; see Cartier. See also Kiem, "Hematopoietic stem cell-based gene therapy for HIV disease," Cell Stem Cell. Feb 3, 2012; 10(2): 137-147; incorporated herein by reference, along with the documents listed therein; Mandal et al, "Efficient Ablation of Genes in Human Hematopoietic Stem and Effector Cells using CRISPR/Cas9," Cell Stem Cell, Volume 15, Issue 5, p643-652, 6 November 2014; incorporated herein by reference, along with the documents listed therein. Also cited is Ebina, "CRISPR/Cas9 system to suppress HIV-1 expression by editing HIV-1 integrated proviral DNA" SCIENTIFIC REPORTS | 3 : 2510 | DOI: 10.1038/srep02510, incorporated herein by reference, along with the documents listed therein, as other means of combating HIV/AIDS using the CRISPR-Cas9 system.
Основание для редактирования генома для лечения HIV исходит из наблюдения того, что индивидуумы, гомозиготные по мутациям с потерей функции в CCR5, клеточном корецепторе для вируса, обладают высокой устойчивостью к инфекции и, в иных случаях, здоровы, что дает основание предполагать, что имитирование этой мутации с редактированием генома может быть безопасной и эффективной терапевтической стратегией [Liu, R., et al. Cell 86, 367-377 (1996)]. Эта идея была подтверждена клинически, когда инфицированному HIV пациенту пересаживали аллогенный трансплантат костного мозга от донора, гомозиготного по мутации с потерей функции в CCR5, что приводило к необнаруживаемым уровням HIV и восстановлению нормальных значений числа клеток CD4 T [Hutter, G., et al. The New England journal of medicine 360, 692-698 (2009)]. Хотя трансплантация костного мозга не является приемлемой стратегией лечения для большинства пациентов с HIV в связи со стоимостью и потенциальной реакцией "трансплантат против хозяина", виды терапии HIV, которые трансформируют собственные T-клетки пациента в CCR5, являются желательными.The rationale for genome editing to treat HIV comes from the observation that individuals homozygous for loss-of-function mutations in CCR5, a cellular coreceptor for the virus, are highly resistant to infection and otherwise healthy, suggesting that mimicking this mutation with genome editing might be a safe and effective therapeutic strategy [Liu, R., et al. Cell 86, 367–377 (1996)]. This idea was confirmed clinically when an HIV-infected patient received an allogeneic bone marrow transplant from a donor homozygous for a loss-of-function mutation in CCR5, resulting in undetectable levels of HIV and restoration of normal CD4 T cell counts [Hutter, G., et al. The New England journal of medicine 360, 692–698 (2009)]. Although bone marrow transplantation is not an acceptable treatment strategy for most HIV patients due to cost and potential graft-versus-host disease, HIV therapies that transform the patient's own T cells into CCR5 are desirable.
Ранние исследования с применением ZFN и NHEJ для нокаута CCR5 в гуманизированных мышиных моделях HIV показали, что трансплантация CD4 T-клеток с отредактированным CCR5 улучшала вирусную нагрузку и значения числа клеток CD4 T [Perez, E.E., et al. Nature biotechnology 26, 808-816 (2008)]. Важно, что данные модели также показали, что инфекция, обусловленная HIV, приводила к отбору нуль-клеток по CCR5, свидетельствуя о том, что редактирование обеспечивает преимущество пригодности и потенциально предоставляет возможность небольшому количеству редактированных клеток создавать терапевтический эффект.Early studies using ZFN and NHEJ to knock out CCR5 in humanized mouse models of HIV showed that transplantation of CCR5-edited CD4 T cells improved viral load and CD4 T cell counts [Perez, E.E., et al. Nature biotechnology 26, 808–816 (2008)]. Importantly, these models also showed that HIV infection resulted in selection of CCR5 null cells, suggesting that editing confers a fitness advantage and potentially allows a small number of edited cells to exert therapeutic effect.
Как результат данного и других многообещающих доклинических исследований, терапия с применением редактирования генома, которая обеспечивает нокаут CCR5 в T-клетках пациентов, в настоящее время проходит тестирование на людях [Holt, N., et al. Nature biotechnology 28, 839-847 (2010); Li, L., et al. Molecular therapy : the journal of the American Society of Gene Therapy 21, 1259-1269 (2013)]. В недавно проведенной I фазе клинического испытания CD4+ T-клетки отбирали у пациентов с HIV, редактировали с помощью ZFN, сконструированными для нокаута гена CCR5, и аутологически трансплантировали обратно пациентам [Tebas, P., et al. The New England journal of medicine 370, 901-910 (2014)].As a result of this and other promising preclinical studies, a genome-editing therapy that knocks out CCR5 in patients’ T cells is now being tested in humans [Holt, N., et al. Nature biotechnology 28, 839–847 (2010); Li, L., et al. Molecular therapy : the journal of the American Society of Gene Therapy 21, 1259–1269 (2013)]. In a recent phase I clinical trial, CD4+ T cells were isolated from HIV patients, edited with ZFNs engineered to knock out the CCR5 gene, and autologously transplanted back into patients [Tebas, P., et al. The New England journal of medicine 370, 901–910 (2014)].
В другом исследовании (Mandal et al., Cell Stem Cell, Volume 15, Issue 5, p643-652, от 6 ноября 2014 г.) система CRISPR-Cas9 нацеливалась на два клинически значимых гена, B2M и CCR5, в CD4+ T-клетках и CD34+ гемопоэтических стволовых и клетках-предшественниках человека (HSPC). Применение одиночных направляющих РНК приводило к высокоэффективному мутагенезу в HSPC, но не в T-клетках. Подход с двумя направляющими последовательностями повышал эффективность удаления гена в обоих типах клеток. HSPC, которые подвергались редактированию генома с помощью CRISPR-Cas9, сохраняли способность к мультилинейности. Предполагаемые целевые и нецелевые мутации были исследованы посредством целевого секвенирования с захватом в HSPC и низкие уровни нецелевого мутагенеза наблюдали лишь в одном сайте. Эти результаты показывают, что система CRISPR-Cas9 может эффективно удалять гены в HSPC с минимальным нецелевым мутагенезом, что имеет широкую применимость для терапии на основе гемопоэтических клеток.In another study (Mandal et al., Cell Stem Cell, Volume 15, Issue 5, p643-652, November 6, 2014), the CRISPR-Cas9 system targeted two clinically relevant genes, B2M and CCR5, in CD4+ T cells and CD34+ human hematopoietic stem and progenitor cells (HSPCs). Use of single guide RNAs resulted in highly efficient mutagenesis in HSPCs but not in T cells. A dual guide approach increased the efficiency of gene ablation in both cell types. HSPCs that underwent genome editing with CRISPR-Cas9 retained multilineage capacity. Putative on- and off-target mutations were examined by targeted capture sequencing in HSPCs, and low levels of off-target mutagenesis were observed at only one site. These results demonstrate that the CRISPR-Cas9 system can efficiently delete genes in HSPCs with minimal off-target mutagenesis, which has broad applicability to hematopoietic cell-based therapies.
Wang et al. (PLoS One. 2014 Dec 26;9(12):e115987. doi: 10.1371/journal.pone.0115987) подвергали сайленсингу CCR5 посредством CRISPR-ассоциированного белка 9 (Cas9) и одиночных направляющих РНК (направяющих РНК) с лентивирусными векторами, экспрессирующими направляющие РНК для Cas9 и CCR5. Wang et al. показали, что трансдукция за один цикл лентивирусных векторов, экспрессирующих направляющие РНК Cas9 и CCR5, в восприимчивых к HIV-1 CD4+ клетках человека приводит к высоким частотам нарушения функционирования гена CCR5. Клетки с разорванным геном CCR5 являются не только устойчивыми к R5-тропному HIV-1, в том числе изолятам передаваемых вирусов/вирусов-основателей (T/F) HIV-1, но также имеют селективное преимущество над клетками с неразорванным геном CCR5 во время инфекции R5-тропным HIV-1. Геномные мутации в потенциальных нецелевых сайтах, которые являются высокогомологичными этим направляющим РНК для CCR5, в стабильно трансдуцированных клетках даже через 84 дня после трансдукции не были обнаружены с помощью анализа T7 эндонуклеазы I.Wang et al. (PLoS One. 2014 Dec 26;9(12):e115987. doi: 10.1371/journal.pone.0115987) silenced CCR5 via CRISPR-associated protein 9 (Cas9) and single guide RNAs (gRNAs) with lentiviral vectors expressing Cas9 and CCR5 gRNAs. Wang et al. showed that single-cycle transduction of lentiviral vectors expressing Cas9 and CCR5 gRNAs into HIV-1-susceptible human CD4+ cells resulted in high frequencies of CCR5 gene disruption. Not only are CCR5 disrupted cells resistant to R5-tropic HIV-1, including transmissible/founder (T/F) HIV-1 isolates, but they also have a selective advantage over intact CCR5 cells during R5-tropic HIV-1 infection. Genomic mutations at potential off-target sites that are highly homologous to this CCR5 guide RNA were not detected in stably transduced cells even 84 days post-transduction using the T7 endonuclease I assay.
Fine et al. (Sci Rep. 2015 Jul 1;5:10777. doi: 10.1038/srep10777) идентифицировали двухкассетную систему, экспрессирующую части белка Cas9 S. pyogenes (SpCas9), который подвергался сплайсингу в клетке с образованием функционального белка, способного к сайт-специфичному расщеплению ДНК. С помощью специфических направляющих нитей CRISPR Fine et al. показали эффективность этой системы в расщеплении генов HBB и CCR5 в клетках HEK-293T человека в виде одного Cas9 и пары никаз Cas9. Транс-сплайсированный SpCas9 (tsSpCas9) характеризовался ~35% от нуклеазной активности по сравнению с SpCas9 дикого типа (wtSpCas9) при стандартных дозах для трансфекции, однако имел значительно сниженную активность при более низких уровнях доз. Существенно уменьшенная длина открытой рамки считывания tsSpCas9 по отношению к wtSpCas9 потенциально способствует упаковке более сложных и длинных генетических элементов в вектор на основе AAV, в том числе тканеспецифичных промоторов, экспрессии мультиплексной направляющей РНК и слиянию эффекторных доменов с SpCas9.Fine et al. (Sci Rep. 2015 Jul 1;5:10777. doi: 10.1038/srep10777) identified a dual-cassette system expressing portions of the S. pyogenes Cas9 protein (SpCas9) that were spliced in the cell to form a functional protein capable of site-specific DNA cleavage. Using specific CRISPR guide strands, Fine et al. showed the efficiency of this system in cleaving the HBB and CCR5 genes in human HEK-293T cells as a single Cas9 and a pair of nicase Cas9s. Trans-spliced SpCas9 (tsSpCas9) had ~35% of the nuclease activity of wild-type SpCas9 (wtSpCas9) at standard transfection doses, but had significantly reduced activity at lower dose levels. The significantly reduced length of the tsSpCas9 open reading frame relative to wtSpCas9 potentially facilitates packaging of more complex and longer genetic elements into the AAV-based vector, including tissue-specific promoters, expression of multiplex guide RNA, and fusion of effector domains to SpCas9.
Li et al. (J Gen Virol. 2015 Aug;96(8):2381-93. doi: 10.1099/vir.0.000139. Epub 2015 Apr 8) показали, что система CRISPR-Cas9 может эффективно опосредовать редактирование локуса CCR5 в линиях клеток, приводя к нокауту экспрессии CCR5 на клеточной поверхности. При секвенировании следующего поколения было обнаружено, что различные мутации вводили возле предполагаемого сайта расщепления CCR5. Для каждой из трех наиболее эффективных направляющих РНК, которые были проанализированы, значительных нецелевых эффектов выявлено не было в 15 потенциальных сайтах с наивысшими баллами. С помощью конструирования химерных аденовирусов Ad5F35, несущих компоненты CRISPR-Cas9, Li et al. эффективно трансдуцировали первичные CD4+ T-лимфоциты и нарушали экспрессию CCR5, а положительно трансдуцированным клеткам придавали устойчивость к HIV-1.Li et al. (J Gen Virol. 2015 Aug;96(8):2381-93. doi: 10.1099/vir.0.000139. Epub 2015 Apr 8) showed that the CRISPR-Cas9 system can efficiently mediate editing of the CCR5 locus in cell lines, resulting in knockout of CCR5 cell surface expression. By next-generation sequencing, various mutations were found to be introduced near the putative CCR5 cleavage site. For each of the three top-scoring guide RNAs that were analyzed, no significant off-target effects were detected at the 15 potential sites with the highest scores. By constructing chimeric adenoviruses Ad5F35 carrying CRISPR-Cas9 components, Li et al. effectively transduced primary CD4+ T lymphocytes and disrupted CCR5 expression, and positively transduced cells were rendered resistant to HIV-1.
Следует упомянуть WO 2015/148670 и в идеях, изложенных в данном документе, настоящее изобретение подразумевает способы и материалы этого документа, применяемые в сочетании с идеями, изложенными в данном документе. В одном аспекте генной терапии подразумеваются способы и композиции для редактирования целевой последовательности, связанной или находящейся в связи с вирусом иммунодефицита человека (HIV) и синдром приобретенного иммунодефицита (AIDS). В связанном аспекте настоящее изобретение, описанное в данном документе, подразумевает предупреждение и лечение инфекции, обусловленной HIV, и AIDS с помощью введения одной или нескольких мутаций в гене рецептора C-C-хемокина 5 типа (CCR5). Ген CCR5 также известен как CKR5, CCR-5, CD195, CKR-5, CCCKR5, CMKBR5, IDDM22 и CC-CKR-5. В дополнительном аспекте настоящее изобретение, описанное в данном документе, подразумевает применение с целью предупреждения или уменьшения инфекции, обусловленной HIV, и/или предупреждения или уменьшения способности HIV попадать в клетки-хозяева, например, у субъектов, которые уже инфицированы. Иллюстративные клетки-хозяева для HIV включают без ограничения CD4-клетки, T-клетки, лимфоидную ткань, ассоциированную с кишечником (GALT), макрофаги, дендритные клетки, миелоидные клетки-предшественники и микроглию. Попадание вируса в клетки-хозяева требует взаимодействия вирусных гликопротеинов gp41 и gp120 с CD4-рецептором и корецептором, например, CCR5. Если корецептор, например, CCR5, не присутствует на поверхности клеток-хозяев, то вирус не может связаться и попасть в клетки-хозяева. Таким образом, прогрессирование заболевания затрудняется. С помощью нокаута или нокдауна CCR5 в клетках-хозяевах, например, при введении защитной мутации (такой как мутация CCR5 дельта 32), предупреждают попадание вируса HIV в клетки-хозяева.Reference should be made to WO 2015/148670 and in the teachings set forth herein, the present invention pertains to the methods and materials of this document used in combination with the teachings set forth herein. In one aspect of gene therapy, methods and compositions for editing a target sequence associated with or in association with the human immunodeficiency virus (HIV) and acquired immunodeficiency syndrome (AIDS) are pertained. In a related aspect, the present invention described herein pertains to the prevention and treatment of HIV infection and AIDS by introducing one or more mutations in the C-C chemokine receptor type 5 (CCR5) gene. The CCR5 gene is also known as CKR5, CCR-5, CD195, CKR-5, CCCKR5, CMKBR5, IDDM22 and CC-CKR-5. In a further aspect, the present invention described herein involves use for preventing or reducing infection with HIV and/or preventing or reducing the ability of HIV to enter host cells, such as in subjects who are already infected. Exemplary host cells for HIV include, but are not limited to, CD4 cells, T cells, gut-associated lymphoid tissue (GALT), macrophages, dendritic cells, myeloid progenitor cells, and microglia. Entry of the virus into host cells requires interaction of the viral glycoproteins gp41 and gp120 with the CD4 receptor and a coreceptor, such as CCR5. If the coreceptor, such as CCR5, is not present on the surface of the host cells, the virus cannot bind to and enter the host cells. Thus, disease progression is impeded. By knocking out or knocking down CCR5 in host cells, for example by introducing a protective mutation (such as the CCR5 delta 32 mutation), the HIV virus is prevented from entering the host cells.
Специалист в данной области может воспользоваться вышеописанными исследованиями, например, Holt, N., et al. Nature biotechnology 28, 839-847 (2010), Li, L., et al. Molecular therapy : the journal of the American Society of Gene Therapy 21, 1259-1269 (2013), Mandal et al., Cell Stem Cell, Volume 15, Issue 5, p643-652, 6 November 2014, Wang et al. (PLoS One. 2014 Dec 26;9(12):e115987. doi: 10.1371/journal.pone.0115987), Fine et al. (Sci Rep. 2015 Jul 1;5:10777. doi: 10.1038/srep10777) и Li et al. (J Gen Virol. 2015 Aug;96(8):2381-93. doi: 10.1099/vir.0.000139. Epub 2015 Apr 8), для нацеливания на CCR5 с помощью системы CRISPR Cas9 по настоящему изобретению.One skilled in the art can refer to the above-mentioned studies, such as Holt, N., et al. Nature biotechnology 28, 839-847 (2010), Li, L., et al. Molecular therapy : the journal of the American Society of Gene Therapy 21, 1259-1269 (2013), Mandal et al., Cell Stem Cell, Volume 15, Issue 5, p643-652, 6 November 2014, Wang et al. (PLoS One. 2014 Dec 26;9(12):e115987. doi: 10.1371/journal.pone.0115987), Fine et al. (Sci Rep. 2015 Jul 1;5:10777. doi: 10.1038/srep10777) and Li et al. (J Gen Virol. 2015 Aug;96(8):2381-93. doi: 10.1099/vir.0.000139. Epub 2015 Apr 8), for targeting CCR5 using the CRISPR Cas9 system of the present invention.
Лечение патогенов, аналогичных вирусным патогенам, таким как HBVTreatment of pathogens similar to viral pathogens such as HBV
Хроническая инфекция вируса гепатита B (HBV) является распространенной, смертельной и редко излечимой в связи с устойчивостью вирусной эписомальной ДНК (cccDNA) в инфицированных клетках. Ramanan et al. (Ramanan V, Shlomai A, Cox DB, Schwartz RE, Michailidis E, Bhatta A, Scott DA, Zhang F, Rice CM, Bhatia SN, Sci Rep. 2015 Jun 2;5:10833. doi: 10.1038/srep10833, опубликовано онлайн 2 июня 2015 г.) показали, что система CRISPR/Cas9 может специфично нацеливаться и расщеплять консервативные области в геноме HBV, приводя к устойчивой супрессии экспрессии и репликации генов. При длительной экспрессии Cas9 и соответствующим образом выбранных направляющих РНК они показали расщепление cccDNA с помощью Cas9 и существенное снижение cccDNA и других параметров экспрессии и репликации вирусных генов. Таким образом, они показали, что непосредственное нацеливание на эписомальную ДНК является новым терапевтическим подходом к контролю вируса и, возможно, излечению пациентов. Это также описано в WO2015089465 A1, от имени The Broad Institute (института Броада) et al., содержание которого тем самым включено в данный документ посредством ссылки.Chronic hepatitis B virus (HBV) infection is common, fatal, and rarely curable due to the persistence of viral episomal DNA (cccDNA) in infected cells. Ramanan et al. (Ramanan V, Shlomai A, Cox DB, Schwartz RE, Michailidis E, Bhatta A, Scott DA, Zhang F, Rice CM, Bhatia SN, Sci Rep. 2015 Jun 2;5:10833. doi: 10.1038/srep10833, published online June 2, 2015) showed that the CRISPR/Cas9 system can specifically target and cleave conserved regions in the HBV genome, resulting in persistent suppression of gene expression and replication. With long-term expression of Cas9 and appropriately selected guide RNAs, they showed cleavage of cccDNA by Cas9 and a significant reduction in cccDNA and other parameters of viral gene expression and replication. They thus showed that direct targeting of episomal DNA is a new therapeutic approach to control the virus and possibly cure patients. This is also described in WO2015089465 A1, on behalf of The Broad Institute et al., the contents of which are hereby incorporated by reference.
Настоящее изобретение также можно применять для лечения вируса гепатита B (HBV). Однако система CRISPR-Cas должна быть приспособлена для того, чтобы избежать недостатков RNAi, таких как риск перенасыщения эндогенных путей малых РНК, с помощью, например, оптимизации дозы и последовательности (см., например, Grimm et al., Nature vol. 441, 26 May 2006). Например, предусматриваются низкие дозы, такие как приблизительно 1-10 x 1014 частиц на человека. В другом варианте осуществления систему CRISPR-Cas, направленную против HBV, можно вводить в липосомах, таких как стабильная частица из нуклеиновой кислоты и липидов (SNALP) (см., например, Morrissey et al., Nature Biotechnology, Vol. 23, No. 8, August 2005). Предусматриваются ежедневные внутривенные инъекции приблизительно 1, 3 или 5 мг/кг/день CRISPR Cas, целенаправленно воздействующей на РНК HBV в SNALP. Обработку можно осуществлять ежедневно в течение приблизительно трех дней, а затем еженедельно в течение приблизительно пяти недель. В других вариантах осуществления систему согласно Chen et al. (Gene Therapy (2007) 14, 11-19) можно применять к системе CRISPR-Cas согласно настоящему изобретению и/или адаптировать к ней. Chen et al. использовали двухнитевой псевдотипированный вектор на основе аденоассоциированного вируса 8 (dsAAV2/8) для доставки shRNA. Однократное введение вектора dsAAV2/8 (1 x 1012 векторных геномов на мышь), несущего специфичную к HBV shRNA, эффективно подавляло стабильный уровень белка, мРНК и репликативной ДНК HBV в печени трансгенных мышей с HBV, что приводило к снижению нагрузки HBV в кровотоке на вплоть до 2-3 log10. Значительное подавление HBV продолжалось в течение по меньшей мере 120 дней после введения вектора. Терапевтический эффект shRNA зависел от целевой последовательности и не включал активацию интерферона. В соответствии с настоящим изобретением систему CRISPR-Cas, направленную в отношении HBV, можно клонировать в вектор на основе AAV, например, вектор на основе dsAAV2/8, и вводить человеку, например, в дозе от приблизительно 1 x 1015 векторных геномов до приблизительно 1 x 1016 векторных геномов на человека. В другом варианте осуществления способ согласно Wooddell et al. (Molecular Therapy vol. 21 no. 5, 973-985 May 2013) можно применять к системе CRISPR-Cas согласно настоящему изобретению и/или адаптировать к ней. Woodell et al. продемонстрировали, что простая совместная инъекция целенаправленно воздействующего на гепатоциты, конъюгированного с N-ацетилгалактозамином мелиттин-подобного пептида (NAG-MLP) с тропной к печени конъюгированной с холестерином siRNA (chol-siRNA), целенаправленно воздействующей на фактор коагуляции VII (F7), приводит в результате к эффективному нокдауну F7 у мышей и приматов, отличных от человека, без изменений клинических химических показателей или индукции цитокинов. Используя временные и трансгенные мышиные модели инфекции, обусловленной HBV, Wooddell et al. продемонстрировали, что однократная совместная инъекция NAG-MLP с активной chol-siRNA, целенаправленно воздействующей на консервативные последовательности HBV, приводила в результате к многократной репрессии вирусной РНК, белков и вирусной ДНК с большой продолжительностью эффекта. Внутривенные совместные инъекции, например, приблизительно 6 мг/кг NAG-MLP и 6 мг/кг специфичной к HBV CRISPR-Cas, могут быть предусмотрены в настоящем изобретении. В альтернативном случае приблизительно 3 мг/кг NAG-MLP и 3 мг/кг специфичной к HBV CRISPR-Cas могут доставляться в первый день с последующим введением приблизительно 2-3 мг/кг NAG-MLP и 2-3 мг/кг специфичной к HBV CRISPR-Cas две недели спустя.The present invention can also be used to treat hepatitis B virus (HBV). However, the CRISPR-Cas system should be adapted to avoid the disadvantages of RNAi, such as the risk of oversaturation of endogenous small RNA pathways, by, for example, dose and sequence optimization (see, for example, Grimm et al., Nature vol. 441, 26 May 2006). For example, low doses such as about 1-10 x 10 14 particles per person are envisaged. In another embodiment, the CRISPR-Cas system directed against HBV can be administered in liposomes, such as a stable nucleic acid lipid particle (SNALP) (see, for example, Morrissey et al., Nature Biotechnology, Vol. 23, No. 8, August 2005). Daily intravenous injections of about 1, 3, or 5 mg/kg/day of CRISPR Cas targeting HBV RNA at SNALPs are contemplated. Treatment may be daily for about three days, and then weekly for about five weeks. In other embodiments, the system of Chen et al. (Gene Therapy (2007) 14, 11-19) may be applied to and/or adapted from the CRISPR-Cas system of the present invention. Chen et al. used a double-stranded pseudotyped adeno-associated virus 8 (dsAAV2/8) vector to deliver shRNA. A single administration of the dsAAV2/8 vector (1 x 10 12 vector genomes per mouse) carrying the HBV-specific shRNA effectively suppressed the steady-state level of HBV protein, mRNA and replicative DNA in the liver of HBV transgenic mice, resulting in a reduction in the circulating HBV load by up to 2-3 log 10 . Significant HBV suppression lasted for at least 120 days after vector administration. The therapeutic effect of the shRNA was dependent on the target sequence and did not involve interferon activation. According to the present invention, the HBV-targeted CRISPR-Cas system can be cloned into an AAV-based vector, such as a dsAAV2/8-based vector, and administered to a human, such as at a dose of from about 1 x 10 15 vector genomes to about 1 x 10 16 vector genomes per human. In another embodiment, the method of Wooddell et al. (Molecular Therapy vol. 21 no. 5, 973-985 May 2013) can be applied to and/or adapted to the CRISPR-Cas system of the present invention. Woodell et al. demonstrated that simple co-injection of a hepatocyte-targeting N-acetylgalactosamine-conjugated melittin-like peptide (NAG-MLP) with a liver-tropic cholesterol-conjugated siRNA (chol-siRNA) targeting coagulation factor VII (F7) results in efficient knockdown of F7 in mice and non-human primates, without changes in clinical chemistry or cytokine induction. Using transient and transgenic mouse models of HBV infection, Wooddell et al. demonstrated that a single co-injection of NAG-MLP with active chol-siRNA targeting conserved sequences of HBV resulted in multiple repression of viral RNA, proteins and viral DNA with a long duration of effect. Intravenous co-injections of, for example, about 6 mg/kg NAG-MLP and 6 mg/kg HBV-specific CRISPR-Cas can be provided by the present invention. Alternatively, about 3 mg/kg NAG-MLP and 3 mg/kg HBV-specific CRISPR-Cas can be delivered on the first day, followed by about 2-3 mg/kg NAG-MLP and 2-3 mg/kg HBV-specific CRISPR-Cas two weeks later.
Lin et al. (Mol Ther Nucleic Acids. 2014 Aug 19;3:e186. doi: 10.1038/mtna.2014.38) разработали восемь gRNA к HBV генотипа A. с помощью специфичных к HBV gRNA система CRISPR-Cas9 значительно снижала образование коровых и поверхностных белков HBV в клетках Huh-7, трансфицированных вектором экспрессии на основе HBV. Среди восьми подвергнутых скринингу gRNA были идентифицированы две эффективные. Одна gRNA, нацеленная на консервативную последовательность HBV, действовала против различных генотипов. С использованием гидродинамической мышиной модели устойчивости HBV Lin et al. дополнительно продемонстрировали, что эта система могла расщеплять плазмиду, содержащую геном HBV, в печени и облегчать ее клиренс in vivo, приводя к снижению уровней поверхностных антигенов сыворотки. Эти данные свидетельствуют о том, что система CRISPR-Cas9 могла разрывать HBV-экспрессирующие матрицы как in vitro, так и in vivo, указывая на потенциал в устранении хронической инфекции, обусловленной HBV.Lin et al. (Mol Ther Nucleic Acids. 2014 Aug 19;3:e186. doi: 10.1038/mtna.2014.38) designed eight gRNAs against HBV genotype A. Using HBV-specific gRNAs, the CRISPR-Cas9 system significantly reduced the production of HBV core and surface proteins in Huh-7 cells transfected with an HBV-based expression vector. Among the eight gRNAs screened, two were identified as effective. One gRNA targeting a conserved sequence of HBV was active against multiple genotypes. Using a hydrodynamic mouse model of HBV resistance, Lin et al. further demonstrated that this system could cleave the plasmid containing the HBV genome in the liver and facilitate its clearance in vivo, resulting in reduced serum surface antigen levels. These data indicate that the CRISPR-Cas9 system could disrupt HBV-expressing templates both in vitro and in vivo, indicating potential in eliminating chronic HBV infection.
Dong et al. (Antiviral Res. 2015 Jun;118:110-7. doi: 10.1016/j.antiviral.2015.03.015. Epub 2015 Apr 3) использовали систему CRISPR-Cas9 для нацеливания на геном HBV и эффективного ингибирования инфекции, обусловленной HBV. Dong et al. синтезировали четыре одиночные направляющие РНК (направляющие РНК), нацеливающиеся на консервативные области HBV. Экспрессия этих направляющих РНК с Cas9 снижала образование вирусов в клетках Huh7, а также в клетках HepG2.2.15, реплицирующих HBV. Dong et al. дополнительно продемонстрировали, что непосредственное расщепление системой CRISPR-Cas9 и опосредованный расщеплением мутагенез происходили в cccDNA HBV трансфицированных клеток. В мышиной модели cccDNA, несущей HBV, инъекция плазмид на основе направляющей РНК и Cas9 в хвостовую вену приводила к низкому уровню cccDNA и белка HBV.Dong et al. (Antiviral Res. 2015 Jun;118:110-7. doi: 10.1016/j.antiviral.2015.03.015. Epub 2015 Apr 3) used the CRISPR-Cas9 system to target the HBV genome and effectively inhibit HBV infection. Dong et al. synthesized four single guide RNAs (gRNAs) targeting conserved regions of HBV. Expression of these gRNAs with Cas9 reduced virus production in Huh7 cells as well as in HepG2.2.15 cells replicating HBV. Dong et al. further demonstrated that direct cleavage by the CRISPR-Cas9 system and cleavage-mediated mutagenesis occurred in cccDNA of HBV transfected cells. In a cccDNA-bearing HBV mouse model, injection of guide RNA- and Cas9-based plasmids into the tail vein resulted in low levels of cccDNA and HBV protein.
Liu et al. (J Gen Virol. 2015 Aug;96(8):2252-61. doi: 10.1099/vir.0.000159. Epub 2015 Apr 22) разработали восемь направляющих РНК (gRNA), которые нацеливались на консервативные области различных генотипов HBV, которые могли значительно ингибировать репликацию HBV как in vitro, так и in vivo, с целью исследования возможности применения системы CRISPR-Cas9 для разрыва ДНК-матриц HBV. Специфичная к HBV система gRNA/Cas9 могла ингибировать репликацию HBV различных генотипов в клетках, а уровень вирусной ДНК значительно снижался в результате действия системы одиночной gRNA/Cas9, и она выводилась в результате комбинации различных систем gRNA/Cas9.Liu et al. (J Gen Virol. 2015 Aug;96(8):2252-61. doi: 10.1099/vir.0.000159. Epub 2015 Apr 22) designed eight guide RNAs (gRNAs) targeting conserved regions of different HBV genotypes that could significantly inhibit HBV replication both in vitro and in vivo to investigate the feasibility of using the CRISPR-Cas9 system to disrupt HBV DNA templates. The HBV-specific gRNA/Cas9 system could inhibit HBV replication of different genotypes in cells, and the viral DNA level was significantly reduced by the single gRNA/Cas9 system and cleared by the combination of different gRNA/Cas9 systems.
Wang et al. (World J Gastroenterol. 2015 Aug 28;21(32):9554-65. doi: 10.3748/wjg.v21.i32.9554) разработали 15 gRNA к HBV генотипов A-D. Были выбраны одиннадцать комбинаций из двух вышеуказанных gRNA (двойные gRNA), охватывающие регуляторную область HBV. Эффективность каждой gRNA и 11 двойных gRNA по отношению к супрессии репликации HBV (генотипы A-D) исследовали с помощью измерения поверхностного антигена HBV (HBsAg) или антигена e (HBeAg) в супернатанте культуры. Разрушение HBV-экспрессирующих векторов исследовали в клетках HuH7, котрансфицированных вектором, экспрессирующим двойные gRNA и HBV, с помощью метода полимеразной цепной реакции (ПЦР) и секвенирования, а разрушение cccDNA исследовали в клетках HepAD38 с помощью осаждения KCl, переваривания АТФ-зависимой ДНКазой, безопасной для плазмиды (PSAD), комбинированного способа амплификации по типу катящегося кольца и количественной ПЦР. Цитотоксичность этих gRNA определяли с помощью анализа тетразолия в митохондриях. Все из gRNA могли значительно снижать образование HBsAg или HBeAg в супернатанте культуры, которое зависело от области направленности gRNA. Все из двойных gRNA могли эффективно супрессировать образование HBsAg и/или HBeAg в случае HBV генотипов A-D, и эффективность двойных gRNA в супрессии образования HBsAg и/или HBeAg значительно повышалась при сравнении с использованием только одиночных gRNA. Кроме того, с помощью прямого ПЦР-секвенирования авторы настоящего изобретения подтвердили, что эти двойные gRNA могли специфично разрушать HBV-экспрессирующие матрицы посредством удаления фрагмента между сайтами расщепления двух используемых gRNA. Что более важно, комбинация gRNA-5 и gRNA-12 не только могла эффективно супрессировать образование HBsAg и/или HBeAg, но также разрушать запасы cccDNA в клетках HepAD38.Wang et al. (World J Gastroenterol. 2015 Aug 28;21(32):9554-65. doi: 10.3748/wjg.v21.i32.9554) designed 15 gRNAs to HBV genotypes A-D. Eleven combinations of the above two gRNAs (dual gRNAs) covering the HBV regulatory region were selected. The efficacy of each gRNA and the 11 dual gRNAs in suppressing HBV replication (genotypes A-D) was examined by measuring HBV surface antigen (HBsAg) or e antigen (HBeAg) in the culture supernatant. The degradation of HBV-expressing vectors was examined in HuH7 cells co-transfected with dual gRNA and HBV expressing vector by polymerase chain reaction (PCR) and sequencing, and the degradation of cccDNA was examined in HepAD38 cells by KCl precipitation, plasmid-safe ATP-dependent DNase (PSAD) digestion, combined rolling circle amplification method and quantitative PCR. The cytotoxicity of these gRNAs was determined by mitochondrial tetrazolium assay. All of the gRNAs could significantly reduce the formation of HBsAg or HBeAg in the culture supernatant, which depended on the targeting region of the gRNA. All of the dual gRNAs could effectively suppress the formation of HBsAg and/or HBeAg in the case of HBV genotypes A-D, and the efficiency of the dual gRNAs in suppressing the formation of HBsAg and/or HBeAg was significantly increased when compared with the use of single gRNAs alone. In addition, the present inventors confirmed by direct PCR sequencing that these dual gRNAs could specifically degrade HBV-expressing templates by removing the fragment between the cleavage sites of the two gRNAs used. More importantly, the combination of gRNA-5 and gRNA-12 not only could effectively suppress the formation of HBsAg and/or HBeAg but also degrade the cccDNA pool in HepAD38 cells.
Karimova et al. (Sci Rep. 2015 Sep 3;5:13734. doi: 10.1038/srep13734) идентифицировали консервативные последовательности HBV между генотипами в S и X области генома HBV, которые были подвергнуты нацеливанию специфичного и эффективного расщепления с помощью никазы Cas9. С помощью этого подхода нарушали не только эписомальные cccDNA и интегрированные в хромосомы целевые сайты HBV в репортерных линиях клеток, но также репликацию HBV в линиях клеток гепатомы с хронической и de novo инфекцией.Karimova et al. (Sci Rep. 2015 Sep 3;5:13734. doi: 10.1038/srep13734) identified conserved HBV sequences between genotypes in the S and X regions of the HBV genome that were targeted for specific and efficient cleavage by Cas9 nickase. This approach disrupted not only episomal cccDNA and chromosomally integrated HBV target sites in reporter cell lines but also HBV replication in chronically and de novo infected hepatoma cell lines.
Специалист в данной области может воспользоваться вышеприведенными исследованиями, например, Lin et al. (Mol Ther Nucleic Acids. 2014 Aug 19;3:e186. doi: 10.1038/mtna.2014.38), Dong et al. (Antiviral Res. 2015 Jun;118:110-7. doi: 10.1016/j.antiviral.2015.03.015. Epub 2015 Apr 3), Liu et al. (J Gen Virol. 2015 Aug;96(8):2252-61. doi: 10.1099/vir.0.000159. Epub 2015 Apr 22), Wang et al. (World J Gastroenterol. 2015 Aug 28;21(32):9554-65. doi: 10.3748/wjg.v21.i32.9554) и Karimova et al. (Sci Rep. 2015 Sep 3;5:13734. doi: 10.1038/srep13734) для нацеливания на HBV с помощью системы CRISPR Cas по настоящему изобретению.One skilled in the art can refer to the above studies, such as Lin et al. (Mol Ther Nucleic Acids. 2014 Aug 19;3:e186. doi: 10.1038/mtna.2014.38), Dong et al. (Antiviral Res. 2015 Jun;118:110-7. doi: 10.1016/j.antiviral.2015.03.015. Epub 2015 Apr 3), Liu et al. (J Gen Virol. 2015 Aug;96(8):2252-61. doi: 10.1099/vir.0.000159. Epub 2015 Apr 22), Wang et al. (World J Gastroenterol. 2015 Aug 28;21(32):9554-65. doi: 10.3748/wjg.v21.i32.9554) and Karimova et al. (Sci Rep. 2015 Sep 3;5:13734. doi: 10.1038/srep13734) for targeting HBV using the CRISPR Cas system of the present invention.
Способы персонифицированного скрининга пациентовMethods of personalized screening of patients
Систему CRISPR-Cas, которая целенаправленно воздействуют на нуклеотиды, например, на тринуклеотидные повторы, можно использовать для проведения скрининга пациентов или образцов пациентов на присутствие таких повторов. Повторы могут представлять собой мишень для РНК системы CRISPR-Cas, и если происходит их связывание с системой CRISPR-Cas, то связывание можно выявить, что указывает тем самым на присутствие такого повтора. Таким образом, систему CRISPR-Cas можно использовать для скрининга пациентов или образцов пациентов на присутствие повторов. Пациенту затем можно вводить подходящее соединение(подходящие соединения), направленное(направленные) на состояние; или можно вводить систему CRISPR-Cas для связывания с нуклеотидом и осуществления вставки, делеции или мутации и облегчения тяжести состояния.A CRISPR-Cas system that specifically targets nucleotides, such as trinucleotide repeats, can be used to screen patients or patient samples for the presence of such repeats. The repeats can be targeted by the RNA of the CRISPR-Cas system, and if they bind to the CRISPR-Cas system, the binding can be detected, thereby indicating the presence of such a repeat. Thus, a CRISPR-Cas system can be used to screen patients or patient samples for the presence of repeats. The patient can then be administered a suitable compound(s) that targets the condition; or the CRISPR-Cas system can be administered to bind to the nucleotide and cause an insertion, deletion, or mutation and alleviate the severity of the condition.
Лечение заболеваний с генетическими и эпигенетическими аспектамиTreatment of diseases with genetic and epigenetic aspects
Системы CRISPR-Cas9 по настоящему раскрытию могут быть использованы для коррекции генетических мутаций, в отношении которых ранее предпринимались попытки с ограниченным успехом с помощью TALEN и ZFN и которые были идентифицированны в качестве потенциальных мишеней для систем Cas9, в том числе, как в опубликованных заявках на патент Editas Medicine, описывающих способы применения систем Cas9 для нацеливания на локусы с целью терапевтической направленности на заболевания с помощью генной терапии, в том числе WO 2015/048577 CRISPR-RELATED METHODS AND COMPOSITIONS Gluckmann et al.; WO 2015/070083 CRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNING gRNAS Glucksmann et al.The CRISPR-Cas9 systems of the present disclosure can be used to correct genetic mutations that have previously been attempted with limited success using TALENs and ZFNs and that have been identified as potential targets for Cas9 systems, including as in published patent applications by Editas Medicine describing methods of using Cas9 systems to target loci for the purpose of therapeutically targeting diseases using gene therapy, including WO 2015/048577 CRISPR-RELATED METHODS AND COMPOSITIONS Gluckmann et al.; WO 2015/070083 CRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNING gRNAS Glucksmann et al.
Следует упомянуть WO 2015/134812 CRISPR/CAS-RELATED METHODS AND COMPOSITIONS FOR TREATING USHER SYNDROME AND RETINITIS PIGMENTOSA, Maeder et al. В идеях, изложенных в данном документе, настоящее изобретение подразумевает способы и материалы этих документов, применяемые в сочетании с идеями, изложенными в данном документе. В одном аспекте генная терапия заболеваний зрения и слуха, способы и композиции для лечения синдрома Ушера и пигментного ретинита могут быть адаптированы к системе CRISPR-Cas по настоящему изобретению (см., например, WO 2015/134812). В одном варианте осуществления WO 2015/134812 предусматривает лечение или задержку наступления или прогрессирования синдрома Ушера IIA типа (USH2A, USH11A) и пигментного ретинита 39 типа (RP39) с помощью редактирования генов, например, с помощью способов, опосредованных системой CRISPR-Cas9, с целью коррекции делеции гуанина в положении 2299 в гене USH2A (например, замены удаленного гуанинового остатка в положении 2299 в гене USH2A). В связанном аспекте мутация повергается нацеливанию с помощью расщепления одной или несколькими нуклеазами, одной или несколькими никазами или их комбинацией, например, для индукции HDR с донорской матрицей, которая корректирует точковую мутацию (например, однонуклеотидную, например, гуаниновую, делецию). Изменение или коррекция мутантного гена USH2A может быть опосредована любым механизмом. Иллюстративные механизмы, которые могут быть ассоциированы с изменением (например, коррекцией) мутантного гена HSH2A, включают без ограничения негомологичное соединение концов, опосредованное микрогомологией связывание концов (MMEJ), репарацию с участием гомологичной рекомбинации (например, опосредованную эндогенной донорской матрицей), SDSA (синтез-зависимый отжиг нитей), однонитевой отжиг и однонитевую инвазию. В варианте осуществления способ, применяемый для лечения синдрома Ушера и пигментного ретинита, может включать получение информации о мутации, переносимой субъектом, например, с помощью секвенирования соответствующего участка гена USH2A.Mention should be made of WO 2015/134812 CRISPR/CAS-RELATED METHODS AND COMPOSITIONS FOR TREATING USHER SYNDROME AND RETINITIS PIGMENTOSA, Maeder et al. In the teachings set forth herein, the present invention contemplates the methods and materials of these documents used in combination with the teachings set forth herein. In one aspect, gene therapy for vision and hearing disorders, methods and compositions for treating Usher syndrome and retinitis pigmentosa can be adapted to the CRISPR-Cas system of the present invention (see, for example, WO 2015/134812). In one embodiment, WO 2015/134812 provides for treating or delaying the onset or progression of Usher syndrome type IIA (USH2A, USH11A) and retinitis pigmentosa type 39 (RP39) by gene editing, such as by CRISPR-Cas9 mediated methods, to correct a guanine deletion at position 2299 in the USH2A gene (e.g., replacing a deleted guanine residue at position 2299 in the USH2A gene). In a related aspect, the mutation is targeted by cleavage with one or more nucleases, one or more nickases, or a combination thereof, such as to induce HDR with a donor template that corrects a point mutation (e.g., a single nucleotide, such as a guanine, deletion). The alteration or correction of the mutant USH2A gene may be mediated by any mechanism. Exemplary mechanisms that may be associated with alteration (e.g., correction) of a mutant HSH2A gene include, but are not limited to, non-homologous end joining, microhomology-mediated end joining (MMEJ), homologous recombination repair (e.g., endogenous donor template mediated), SDSA (synthesis-dependent strand annealing), single-strand annealing, and single-strand invasion. In an embodiment, a method used to treat Usher syndrome and retinitis pigmentosa may include obtaining information about a mutation carried by a subject, such as by sequencing the relevant region of the USH2A gene.
В некоторых вариантах осуществления предусмотрено лечение, профилактика и диагностика первичной открытоугольной глаукомы (POAG). Мишенью предпочтительно является ген MYOC. Это описано в WO 2015/153780, раскрытие которого включено в данный документ посредством ссылки. In some embodiments, treatment, prevention and diagnosis of primary open-angle glaucoma (POAG) is provided. The target is preferably the MYOC gene. This is described in WO 2015/153780, the disclosure of which is incorporated herein by reference.
Следует упомянуть WO 2015/138510 и в идеях, изложенных в данном документе, настоящее изобретение (с помощью системы CRISPR-Cas9) подразумевает обеспечение лечения или задержку наступления или прогрессирования врожденного амавроза Лебера 10 типа (LCA 10). LCA 10 вызван мутацией в гене CEP290, например, c.2991+1655, мутацией аденина в гуанин в гене CEP290, который приводит к образованию криптического сайта сплайсинга в интроне 26. Это мутация в нуклеотиде 1655 интрона 26 CEP290, например, мутация A в G. CEP290 также известен как CT87; MKS4; POC3; rd16; BBS14; JBTS5; LCAJO; NPHP6; SLSN6 и 3H11Ag (см., например, WO 2015/138510). В одном аспекте генной терапии настоящее изобретение предусматривает введение одного или нескольких разрывов возле сайта целевого положения LCA (например, c.2991 + 1655; A в G) в по меньшей мере одном аллеле гена CEP290. Изменение целевого положения LCA10 относится к (1) индуцированному разрывом введению вставок/делеций (также обозначаемому в данном документе как NHEJ-опосредованное введение вставок/делеций) в непосредственной близости к целевому положению LCA10 или включая его (например, c.2991+1655 A в G), или (2) индуцированной разрывом делеции (также обозначаемой как NHEJ-опосредованная делеция) геномной последовательности, в том числе мутацию в целевом положении LCA10 (например, c.2991+1655 A в G). Оба подхода приводят к потере функции или разрушению криптического сайта сплайсинга, образующегося в результате мутации в целевом положении LCA 10.WO 2015/138510 should be mentioned and in the teachings set out in this document, the present invention (using the CRISPR-Cas9 system) involves providing a treatment or delaying the onset or progression of Leber congenital amaurosis type 10 (LCA 10). LCA 10 is caused by a mutation in the CEP290 gene, for example c.2991+1655, an adenine to guanine mutation in the CEP290 gene that results in the formation of a cryptic splice site in intron 26. This is a mutation at nucleotide 1655 of intron 26 of CEP290, for example an A to G mutation. CEP290 is also known as CT87; MKS4; POC3; rd16; BBS14; JBTS5; LCAJO; NPHP6; SLSN6 and 3H11Ag (see, for example, WO 2015/138510). In one aspect of gene therapy, the present invention provides for the introduction of one or more breaks near the LCA target site (e.g., c.2991 + 1655; A to G) in at least one allele of the CEP290 gene. Alteration of the LCA10 target position refers to (1) a break-induced insertion/deletion (also referred to herein as NHEJ-mediated insertion/deletion) in close proximity to or including the LCA10 target position (e.g., c.2991+1655 A to G), or (2) a break-induced deletion (also referred to as NHEJ-mediated deletion) of the genomic sequence, including a mutation at the LCA10 target position (e.g., c.2991+1655 A to G). Both approaches result in loss of function or disruption of the cryptic splice site resulting from the mutation at the LCA 10 target position.
В одном аспекте настоящее изобретение (с помощью системы CRISPR-Cas9) подразумевает обеспечение лечения или задержку наступления или прогрессирования врожденного амавроза Лебера 10 типа (LCA 10). LCA 10 вызван мутацией в гене CEP290, например, c.2991+1655, мутацией аденина в гуанин в гене CEP290, который приводит к образованию криптического сайта сплайсинга в интроне 26. Это мутация в нуклеотиде 1655 интрона 26 CEP290, например, мутация A в G. CEP290 также известен как CT87; MKS4; POC3; rd16; BBS14; JBTS5; LCAJO; NPHP6; SLSN6 и 3H11Ag (см., например, WO 2015/138510). В одном аспекте генной терапии настоящее изобретение предусматривает введение одного или нескольких разрывов возле сайта целевого положения LCA (например, c.2991 + 1655; A в G) в по меньшей мере одном аллеле гена CEP290. Изменение целевого положения LCA10 относится к (1) индуцированному разрывом введению вставок/делеций (также обозначаемому в данном документе как NHEJ-опосредованное введение вставок/делеций) в непосредственной близости к целевому положению LCA10 или включая его (например, c.2991+1655 A в G), или (2) индуцированной разрывом делеции (также обозначаемой как NHEJ-опосредованная делеция) геномной последовательности, в том числе мутацию в целевом положении LCA10 (например, c.2991+1655 A в G). Оба подхода приводят к потере функции или разрушению криптического сайта сплайсинга, образующегося в результате мутации в целевом положении LCA 10.In one aspect, the present invention (using the CRISPR-Cas9 system) involves treating or delaying the onset or progression of Leber congenital amaurosis type 10 (LCA 10). LCA 10 is caused by a mutation in the CEP290 gene, such as c.2991+1655, an adenine to guanine mutation in the CEP290 gene that results in a cryptic splice site in intron 26. This is a mutation at nucleotide 1655 of intron 26 of CEP290, such as an A to G mutation. CEP290 is also known as CT87; MKS4; POC3; rd16; BBS14; JBTS5; LCAJO; NPHP6; SLSN6 and 3H11Ag (see, such as WO 2015/138510). In one aspect of gene therapy, the present invention provides for the introduction of one or more breaks near the site of an LCA target position (e.g., c.2991+1655; A to G) in at least one allele of the CEP290 gene. An alteration of the LCA10 target position refers to (1) a break-induced insertion/deletion introduction (also referred to herein as NHEJ-mediated insertion/deletion introduction) in close proximity to or including the LCA10 target position (e.g., c.2991+1655 A to G), or (2) a break-induced deletion (also referred to as NHEJ-mediated deletion) of the genomic sequence, including a mutation at the LCA10 target position (e.g., c.2991+1655 A to G). Both approaches result in loss of function or disruption of the cryptic splice site resulting from mutation at the target position of LCA 10.
Исследователи рассматривают вопрос о том, можно ли применять генную терапию для лечения широкого диапазона заболеваний. Системы CRISPR по настоящему изобретению, основанные на эффекторном белке Cas9, предусмотрены для таких вариантов терапевтического применения, включая без ограничения дополнительные приведенные в примерах области и способы доставки, приведенные ниже. Некоторые примеры состояний или заболеваний, которые можно эффективно лечить с использованием системы по настоящему изобретению, включенные в примеры генов и ссылок, включенных в данный документ, и в настоящее время ассоциированные с такими состояниями, также предусмотрены в данном документе. Приведенные в качестве примеров гены и состояния не являются исчерпывающими.Researchers are considering whether gene therapy can be used to treat a wide range of diseases. The Cas9 effector protein-based CRISPR systems of the present invention are contemplated for such therapeutic applications, including, but not limited to, additional exemplified regions and delivery methods provided below. Some examples of conditions or diseases that can be effectively treated using the system of the present invention, included in the exemplified genes and references incorporated herein and currently associated with such conditions, are also provided herein. The exemplified genes and conditions are not exhaustive.
Лечение заболеваний сердечно-сосудистой системыTreatment of cardiovascular diseases
Настоящее изобретение также предусматривает доставку системы CRISPR-Cas9, в частности, новых систем эффекторного белка CRISPR, описанных в данном документе, в кровь или гемопоэтические стволовые клетки. Экзосомы плазмы крови согласно Wahlgren et al. (Nucleic Acids Research, 2012, Vol. 40, No. 17 e130) были описаны ранее, и их можно использовать для доставки системы CRISPR Cas9 в кровь. Система нацеливания на нуклеиновую кислоту по настоящему изобретению также предусматривается для лечения гемоглобинопатий, таких как формы талассемии и серповидноклеточной анемии. См., например, международную публикацию заявки на патент WO 2013/126794 в отношении потенциальных мишеней, на которые может нацеливаться система CRISPR Cas9 по настоящему изобретению.The present invention also provides for the delivery of a CRISPR-Cas9 system, in particular the novel CRISPR effector protein systems described herein, into blood or hematopoietic stem cells. The plasma exosomes of Wahlgren et al. (Nucleic Acids Research, 2012, Vol. 40, No. 17 e130) have been previously described and can be used to deliver the CRISPR Cas9 system into blood. The nucleic acid targeting system of the present invention is also provided for the treatment of hemoglobinopathies, such as forms of thalassemia and sickle cell anemia. See, for example, International Patent Application Publication No. WO 2013/126794 for potential targets that can be targeted by the CRISPR Cas9 system of the present invention.
В публикации Drakopoulou, "Review Article, The Ongoing Challenge of Hematopoietic Stem Cell-Based Gene Therapy for β-Thalassemia", Stem Cells International, Volume 2011, Article ID 987980, 10 pages, doi:10.4061/2011/987980, включенной в данный документ посредством ссылки вместе с документами, которые в ней перечислены так, если бы они были изложены в полном объеме, обсуждается модификация HSC с применением лентивируса, который доставляет ген β-глобина или γ-глобина. В отличие от применения лентивируса специалист в данной области с использованием знаний в данной области и идей настоящего изобретения может корректировать HSC относительно β-талассемии с применением системы CRISPR-Cas9, которая нацеливается на мутацию и корректирует ее (например, с помощью подходящей матрицы для HDR, которая доставляет кодирующую последовательность для β-глобина или γ-глобина, преимущественно β-глобина или γ-глобина несерповидных форм эритроцитов); в частности, направляющая РНК может осуществлять нацеливание на мутацию, которая приводит к β-талассемии, и HDR может обеспечивать кодирование, приводящее к надлежащей экспрессии β-глобина или γ-глобина. Направляющая РНК, которая нацеливается на мутацию и частицу, содержащую белок Cas9, контактирует с HSC, несущими мутацию. Частица также может содержать подходящую матрицу для HDR для коррекции мутации с целью надлежащей экспрессии β-глобина или γ-глобина; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. Приведенные таким образом в контакт клетки можно вводить и необязательно обрабатывать и размножать; см. Cartier. В этом отношении следует упомянуть публикацию Cavazzana "Outcomes of Gene Therapy for β-Thalassemia Major via Transplantation of Autologous Hematopoietic Stem Cells Transduced Ex Vivo with a Lentiviral βA-T87Q-Globin Vector." tif2014.org/abstractFiles/Jean%20Antoine%20Ribeil_Abstract.pdf; Cavazzana-Calvo "Transfusion independence and HMGA2 activation after gene therapy of human β-thalassaemia", Nature 467, 318-322 (16 сентября 2010) doi:10.1038/nature09328; Nienhuis "Development of Gene Therapy for Thalassemia, Cold Spring Harbor Perspectives in Medicine, doi: 10.1101/cshperspect.a011833 (2012), LentiGlobin BB305, лентивирусный вектор, содержащий сконструированный ген β-глобина (βA-T87Q); и Xie et al. "Seamless gene correction of β-thalassaemia mutations in patient-specific iPSCs using CRISPR/Cas9 and piggyback" Genome Research gr.173427.114 (2014) http://www.genome.org/cgi/doi/10.1101/gr.173427.114 (Cold Spring Harbor Laboratory Press); который является предметом исследования Cavazzana, включая β-талассемию человека, и предметом исследования Xie, причем все включены в данный документ посредством ссылки, вместе со всеми документами, которые в них перечислены или связаны с ними. В настоящем изобретении матрица для HDR может обеспечивать экспрессию HSC сконструированного гена β-глобина (например, βA-T87Q) или β-глобина, указанного у Xie.Drakopoulou, "Review Article, The Ongoing Challenge of Hematopoietic Stem Cell-Based Gene Therapy for β-Thalassemia", Stem Cells International, Volume 2011, Article ID 987980, 10 pages, doi:10.4061/2011/987980, incorporated herein by reference along with the documents that would be listed therein if they were cited in full, discusses the modification of HSC using a lentivirus that delivers the β-globin or γ-globin gene. In contrast to the use of a lentivirus, a person skilled in the art, using the knowledge in the art and the teachings of the present invention, can correct HSCs for β-thalassemia using a CRISPR-Cas9 system that targets and corrects a mutation (e.g., using a suitable template for HDR that delivers a coding sequence for β-globin or γ-globin, preferably β-globin or γ-globin of non-sickled red blood cells); in particular, the guide RNA can target a mutation that leads to β-thalassemia, and HDR can provide coding that leads to proper expression of β-globin or γ-globin. The guide RNA that targets the mutation and the particle containing the Cas9 protein contacts the HSCs carrying the mutation. The particle may also contain a suitable HDR template for correcting the mutation to properly express β-globin or γ-globin; or the HSC may be contacted with a second particle or vector that contains or delivers the HDR template. The cells so contacted can be administered and optionally processed and expanded; see Cartier. In this regard, mention should be made of Cavazzana's publication "Outcomes of Gene Therapy for β-Thalassemia Major via Transplantation of Autologous Hematopoietic Stem Cells Transduced Ex Vivo with a Lentiviral β A-T87Q -Globin Vector."tif2014.org/abstractFiles/Jean%20Antoine%20Ribeil_Abstract.pdf; Cavazzana-Calvo "Transfusion independence and HMGA2 activation after gene therapy of human β-thalassaemia", Nature 467, 318-322 (16 September 2010) doi:10.1038/nature09328; Nienhuis "Development of Gene Therapy for Thalassemia, Cold Spring Harbor Perspectives in Medicine, doi: 10.1101/cshperspect.a011833 (2012), LentiGlobin BB305, a lentiviral vector containing an engineered β-globin gene (β A-T87Q ); and Xie et al. "Seamless gene correction of β-thalassaemia mutations in patient-specific iPSCs using CRISPR/Cas9 and piggyback" Genome Research gr.173427.114 (2014) http://www.genome.org/cgi/doi/10.1101/gr.173427.114 (Cold Spring Harbor Laboratory Press); which is the subject of Cavazzana's study, including human β-thalassemia, and the subject of Xie's study, all included in this document by reference, together with all documents listed or linked thereto. In the present invention, the HDR matrix may provide for the expression of an engineered β-globin gene (e.g., β A-T87Q ) or a β-globin as disclosed in Xie.
Xu et al. (Sci Rep. 2015 Jul 9;5:12065. doi: 10.1038/srep12065) разработали TALEN и CRISPR-Cas9 для непосредственного нацеливания на сайт IVS2-654 мутации интрона 2 в гене глобина. Xu et al. наблюдали различные частоты двунитевых разрывов (DSB) в локусах IVS2-654 при применении TALEN и CRISPR-Cas9, и TALEN опосредовали более высокую эффективность нацеливания на гомологичные гены по сравнению с CRISPR-Cas9 при комбинировании с донором транспозона piggyBac. Кроме того, более очевидные нецелевые события наблюдали в случае CRISPR-Cas9 по сравнению с TALEN. В конечном итоге, откорректированные с помощью TALEN клоны iPSC отбирали на предмет дифференциации эритробластов с помощью системы кокультивирования OP9 и выявляли относительно высокую транскрипцию HBB по сравнению с неоткорректированными клетками.Xu et al. (Sci Rep. 2015 Jul 9;5:12065. doi: 10.1038/srep12065) designed TALENs and CRISPR-Cas9 to directly target the IVS2-654 mutation site of intron 2 in the globin gene. Xu et al. observed different double-strand break (DSB) frequencies at the IVS2-654 loci between TALENs and CRISPR-Cas9, and TALENs mediated higher homologous gene targeting efficiency compared to CRISPR-Cas9 when combined with the piggyBac transposon donor. Furthermore, more obvious off-target events were observed with CRISPR-Cas9 compared to TALENs. Finally, TALEN-corrected iPSC clones were selected for erythroblast differentiation using the OP9 coculture system and revealed relatively high HBB transcription compared to uncorrected cells.
Song et al. (Stem Cells Dev. 2015 May 1;24(9):1053-65. doi: 10.1089/scd.2014.0347. Epub 2015 Feb 5) использовали систему CRISPR/ Cas9 для коррекции iPSC с β-Thal; клетки с откорректированными генами характеризовались нормальными кариотипами и полной плюрипотентностью, поскольку эмбриональные стволовые клетки человека (hESC) не проявляли нецелевых эффектов. Впоследствии Song et al. оценивали эффективность дифференцировки iPSC с β-Thal с откорректированными генами. Song et al. обнаружили, что во время дифференцировки гемопоэтических клеток iPSC с β-Thal с откорректированными генами характеризовались повышенным соотношением эмбриоидных телец и различными процентами гемопоэтических клеток-предшественников. Гораздо более важно, линии iPSC с β-Thal с откорректированными генами восстанавливали экспрессию HBB и снижали образование активных форм кислорода по сравнению с неоткорректированной группой. Исследование Song et al. свидетельствовало о том, что эффективность гемопоэтической дифференцировки iPSC с β-Thal была значительно повышена непосредственно после коррекции с помощью системы CRISPR-Cas9. Аналогичные способы могут осуществляться с помощью систем CRISPR-Cas9, описанных в данном документе, например, систем, содержащих эффекторные белки Cas9.Song et al. (Stem Cells Dev. 2015 May 1;24(9):1053-65. doi: 10.1089/scd.2014.0347. Epub 2015 Feb 5) used the CRISPR/Cas9 system to correct β-Thal gene-corrected iPSCs; the gene-corrected cells had normal karyotypes and were fully pluripotent, as human embryonic stem cells (hESCs) showed no off-target effects. Subsequently, Song et al. assessed the differentiation efficiency of β-Thal gene-corrected iPSCs. Song et al. found that during hematopoietic cell differentiation, β-Thal gene-corrected iPSCs had increased embryoid body ratios and variable percentages of hematopoietic progenitor cells. More importantly, β-Thal gene-corrected iPSC lines restored HBB expression and reduced reactive oxygen species generation compared to the uncorrected group. The study by Song et al. showed that the hematopoietic differentiation efficiency of β-Thal iPSCs was significantly increased immediately after correction with the CRISPR-Cas9 system. Similar approaches can be implemented using the CRISPR-Cas9 systems described herein, such as those containing Cas9 effector proteins.
Следует упомянуть WO 2015/148860, в идеях, изложенных в данном документе, настоящее изобретение подразумевает способы и материалы этих документов, применяемые в сочетании с идеями, изложенными в данном документе. В одном аспекте генная терапия заболеваний, связанных с кровеносной системой, способы и композиции для лечения бета-талассемии могут быть адаптированы к системе CRISPR-Cas по настоящему изобретению (см., например, WO 2015/148860). В одном варианте осуществления WO 2015/148860 предусматривает лечение или предупреждение бета-талассемии, или ее симптомов, например, с помощью изменения гена B-клеточного CLL/лимфомы 11A (BCL11A). Ген BCL11A также известен как ген B-клеточного CLL/лимфомы 11A, BCL11A -L, BCL11A -S, BCL11AXL, CTIP 1, HBFQTL5 и ZNF. BCL11A кодирует белок "цинковый палец", который участвует в регуляции экспрессии генов глобинов. При изменении гена BCL11A (например, одного или обоих аллелей гена BCL11A) уровни гамма-глобина могут повышаться. Гамма-глобин может замещать бета-глобин в гемоглобиновом комплексе и эффективно доставлять кислород к тканям, тем самым нормализуя фенотипы заболевания бета-талассемии.Reference should be made to WO 2015/148860, in the teachings set forth therein, the present invention contemplates the methods and materials of these documents used in combination with the teachings set forth herein. In one aspect, gene therapy for diseases associated with the blood system, methods and compositions for the treatment of beta-thalassemia can be adapted to the CRISPR-Cas system of the present invention (see, for example, WO 2015/148860). In one embodiment, WO 2015/148860 provides for the treatment or prevention of beta-thalassemia, or its symptoms, for example, by altering the B-cell CLL/lymphoma 11A (BCL11A) gene. The BCL11A gene is also known as B-cell CLL/lymphoma gene 11A, BCL11A-L, BCL11A-S, BCL11AXL, CTIP 1, HBFQTL5, and ZNF. BCL11A encodes a zinc finger protein that is involved in regulating globin gene expression. When the BCL11A gene is altered (e.g., one or both alleles of the BCL11A gene), gamma globin levels may increase. Gamma globin can replace beta globin in the hemoglobin complex and efficiently deliver oxygen to tissues, thereby normalizing the disease phenotypes of beta thalassemia.
Серповидноклеточная анемия представляет собой аутосомно-рецессивное наследственное заболевание, при котором красные кровяные тельца приобретают серповидную форму. Оно вызывается заменой одного основания в гене β-глобина, который локализован на коротком плече хромосомы 11. Как результат, валин продуцируется вместо глутаминовой кислоты, что вызывает продуцирование гемоглобина серповидных клеток (HbS). Это приводит к образованию искривленной формы эритроцитов. В связи с аномальной формой небольшие кровеносные сосуды могут блокироваться, вызывая серьезное повреждение кости, селезенки и тканей кожи. Это может приводить к приступам боли, частым инфекциям, ладонно-подошвенному синдрому или даже полиорганной недостаточности. Искривленные эритроциты также являются более восприимчивыми к гемолизу, что приводит к серьезной анемии. Как в случае β-талассемии, серповидноклеточную анемию можно корректировать путем модификации HSC с использованием системы CRISPR-Cas9. Данная система обеспечивает возможность специфического редактирования генома клетки путем разрезания ее ДНК с обеспечением после этого ее самовосстановления. Белок Cas9 вставляют и направляют направляющей РНК в точку мутации, а затем он разрезает ДНК в этой точке. Одновременно вставляют нормальный вариант последовательности. Данная система используется собственной системой репарации для исправления индуцированного разреза. В этом отношении система CRISPR-Cas9 обеспечивает возможность коррекции мутации в ранее полученных стволовых клетках. Специалист в данной области с использованием знаний в данной области и идей настоящего изобретения может корректировать HSC относительно серповидноклеточной анемии с применением системы CRISPR-Cas9, которая нацеливается на мутацию и корректирует ее (например, с помощью подходящей матрицы для HDR, которая доставляет кодирующую последовательность для β-глобина, преимущественно β-глобина не серповидных форм эритроцитов); в частности, направляющая РНК может осуществлять нацеливание на мутацию, которая приводит к серповидноклеточной анемии, и HDR может обеспечивать кодирование, приводящее к правильной экспрессии β-глобина. Направляющая РНК, которая нацеливается на мутацию и частицу, содержащую белок Cas9, контактирует с HSC, несущими мутацию. Частица также может содержать подходящую матрицу для HDR для коррекции мутации с целью надлежащей экспрессии β-глобина; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. Приведенные таким образом в контакт клетки можно вводить и необязательно обрабатывать и размножать; см. Cartier. Матрица для HDR может обеспечивать экспрессию HSC сконструированного гена β-глобина (например, βA-T87Q) или β-глобина, указанного у Xie.Sickle cell anemia is an autosomal recessive inherited disorder in which the red blood cells become sickle-shaped. It is caused by a single base substitution in the β-globin gene, which is located on the short arm of chromosome 11. As a result, valine is produced instead of glutamic acid, which causes the production of sickle cell hemoglobin (HbS). This results in the formation of a curved shape of red blood cells. Due to the abnormal shape, small blood vessels can become blocked, causing severe damage to the bone, spleen, and skin tissue. This can lead to bouts of pain, frequent infections, hand-foot syndrome, or even multiple organ failure. The curved red blood cells are also more susceptible to hemolysis, which leads to severe anemia. As in the case of β-thalassemia, sickle cell anemia can be corrected by modifying HSCs using the CRISPR-Cas9 system. This system allows for specific editing of the cell's genome by cutting its DNA and then ensuring its self-repair. The Cas9 protein is inserted and directed by a guide RNA to the point of mutation, and then it cuts the DNA at this point. At the same time, a normal variant of the sequence is inserted. This system is used by the intrinsic repair system to correct the induced cut. In this regard, the CRISPR-Cas9 system allows for the correction of a mutation in previously obtained stem cells. A person skilled in the art, using the knowledge in the art and the teachings of the present invention, can correct HSCs for sickle cell anemia using the CRISPR-Cas9 system, which targets the mutation and corrects it (e.g., using a suitable template for HDR that delivers a coding sequence for β-globin, preferably β-globin of non-sickled red blood cells); in particular, the guide RNA can target a mutation that causes sickle cell anemia, and HDR can provide encoding that results in proper expression of β-globin. The guide RNA that targets the mutation and the particle containing the Cas9 protein are contacted with HSCs bearing the mutation. The particle can also contain a suitable HDR template for correcting the mutation to properly express β-globin; or the HSCs can be contacted with a second particle or vector that contains or delivers the HDR template. The cells so contacted can be administered and optionally processed and expanded; see Cartier. The HDR template can provide for the expression by the HSCs of an engineered β-globin gene (e.g., βA-T87Q) or of the β-globin described in Xie.
Следует упомянуть WO 2015/148863, и в идеях, изложенных в данном документе, настоящее изобретение подразумевает способы и материалы этих документов, которые могут быть адаптированы к системе CRISPR-Cas по настоящему изобретению. В аспекте лечения или предупреждения серповидноклеточной анемии, которая представляет собой наследственное гематологическое заболевание крови, WO 2015/148863 предусматривает изменение гена BCL11A. При изменении гена BCL11A (например, одного или обоих аллелей гена BCL11A) уровни гамма-глобина могут повышаться. Гамма-глобин может замещать бета-глобин в гемоглобиновом комплексе и эффективно доставлять кислород к тканям, тем самым нормализуя фенотипы серповидноклеточной анемии.WO 2015/148863 should be mentioned, and in the teachings set forth in this document, the present invention contemplates the methods and materials of these documents, which can be adapted to the CRISPR-Cas system of the present invention. In an aspect of treating or preventing sickle cell anemia, which is an inherited hematological blood disorder, WO 2015/148863 provides for altering the BCL11A gene. By altering the BCL11A gene (for example, one or both alleles of the BCL11A gene), gamma globin levels can be increased. Gamma globin can replace beta globin in the hemoglobin complex and effectively deliver oxygen to tissues, thereby normalizing the phenotypes of sickle cell anemia.
В публикации Williams "Broadening the Indications for Hematopoietic Stem Cell Genetic Therapies," Cell Stem Cell 13:263-264 (2013), включенной в данный документ посредством ссылки вместе с документами, которые в ней перечислены, так, если бы были изложены в полном объеме, сообщается об опосредованном лентивирусами переносе генов в клетки HSC/P из пациентов с лизосомной болезнью накопления, метахроматической лейкодистрофией (MLD), наследственным заболеванием, вызванным дефицитом арилсульфатазы A (ARSA), приводящей к демиелинизации нервов; и опосредованном лентивирусами переносе генов в HSC пациентов с синдром Вискотта-Олдрича (WAS) (пациентов с дефектным белком WAS, эффектором малой ГТФазы CDC42, которая регулирует функцию цитоскелета в линиях клеток крови и, таким образом, они страдают от иммунодефицита при рецидивирующих инфекциях, симптомов аутоиммунных заболеваний и тромбоцитопении с аномально мелкими и функционально неэффективными тромбоцитами, что приводит к обильному кровотечению и повышенному риску возникновения лейкоза и лимфомы). В отличие от применения лентивируса специалист в данной области с использованием знаний в данной области и идей настоящего изобретения может корректировать HSC относительно MLD (недостаточность арилсульфатазы A (ARSA)) с применением системы CRISPR-Cas9, которая нацеливается на мутацию и корректирует ее (недостаточность арилсульфатазы A (ARSA)) (например, с помощью подходящей матрицы для HDR, которая доставляет кодирующую последовательность для ARSA); в частности, направляющая РНК может осуществлять нацеливание на мутацию, которая приводит к MLD (недостаточность ARSA), и HDR может обеспечивать кодирование, приводящее к надлежащей экспрессии ARSA. Направляющая РНК, которая нацеливается на мутацию и частицу, содержащую белок Cas9, контактирует с HSC, несущими мутацию. Частица также может содержать подходящую матрицу для HDR для коррекции мутации с целью надлежащей экспрессии ARSA; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. Приведенные таким образом в контакт клетки можно вводить и необязательно обрабатывать и размножать; см. Cartier. В отличие от применения лентивируса специалист в данной области с использованием знаний в данной области и идей настоящего изобретения может корректировать HSC относительно WAS с применением системы CRISPR-Cas9, которая нацеливается на мутацию и корректирует ее (недостаточность белка WAS) (например, с помощью подходящей матрицы для HDR, которая доставляет кодирующую последовательность для белка WAS); в частности, направляющая РНК может осуществлять нацеливание на мутацию, которая приводит к WAS (дефектный белок WAS), и HDR может обеспечивать кодирование, приводящее к надлежащей экспрессии белка WAS. Направляющая РНК, которая нацеливается на мутацию и частицу, содержащую белок Cas9, контактирует с HSC, несущими мутацию. Частица также может содержать подходящую матрицу для HDR для коррекции мутации с целью надлежащей экспрессии белка WAS; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. Приведенные таким образом в контакт клетки можно вводить и необязательно обрабатывать и размножать; см. Cartier.Williams, "Broadening the Indications for Hematopoietic Stem Cell Genetic Therapies," Cell Stem Cell 13:263-264 (2013), incorporated herein by reference along with the papers that would be cited therein if reported in full, reports lentiviral-mediated gene transfer into HSC/P cells from patients with the lysosomal storage disease metachromatic leukodystrophy (MLD), an inherited disorder caused by arylsulfatase A deficiency (ARSA) that results in nerve demyelination; and lentivirus-mediated gene transfer into HSCs of patients with Wiskott-Aldrich syndrome (WAS) (patients with a defective WAS protein, an effector of the small GTPase CDC42 that regulates cytoskeletal function in blood cell lines and thus suffer from immunodeficiency with recurrent infections, symptoms of autoimmune diseases and thrombocytopenia with abnormally small and functionally ineffective platelets, which leads to excessive bleeding and an increased risk of leukemia and lymphoma). In contrast to the use of lentivirus, a person skilled in the art, using the knowledge in the art and the teachings of the present invention, can correct HSCs for MLD (arylsulfatase A deficiency (ARSA)) using the CRISPR-Cas9 system that targets and corrects the mutation (arylsulfatase A deficiency (ARSA)) (e.g., using a suitable template for HDR that delivers the coding sequence for ARSA); in particular, the guide RNA may target a mutation that results in MLD (ARSA deficiency) and HDR may provide coding that results in proper expression of ARSA. The guide RNA that targets the mutation and the particle containing the Cas9 protein are contacted with HSCs bearing the mutation. The particle may also contain a suitable template for HDR to correct the mutation to result in proper expression of ARSA; or the HSCs may be contacted with a second particle or vector that contains or delivers a template for HDR. The cells thus contacted may be administered and optionally processed and expanded; see Cartier. In contrast to the use of a lentivirus, a person skilled in the art, using the knowledge in the art and the teachings of the present invention, can correct HSCs for WAS using a CRISPR-Cas9 system that targets and corrects a mutation (deficiency of the WAS protein) (e.g., using a suitable template for HDR that delivers a coding sequence for the WAS protein); in particular, the guide RNA can target a mutation that leads to WAS (defective WAS protein), and HDR can provide coding that leads to proper expression of the WAS protein. The guide RNA that targets the mutation and the particle containing the Cas9 protein are contacted with HSCs carrying the mutation. The particle can also contain a suitable template for HDR to correct the mutation in order to properly express the WAS protein; or the HSC can be contacted with a second particle or vector that contains or delivers a template for HDR. The cells thus brought into contact can be introduced and optionally processed and multiplied; see Cartier.
В одном аспекте настоящего изобретения способы и композиции, которые включают редактирование целевой последовательности нуклеиновой кислоты или модулирование экспрессии целевой последовательности нуклеиновой кислоты, и варианты их применения в связи с иммунотерапией рака понимают путем адаптации системы CRISPR-Cas по настоящему изобретению. Ссылаются на применение генной терапии в WO 2015/161276, который предусматривает способы и композиции, которые могут быть использованы для нарушения пролиферации, выживания и/или функции T-клеток в результате изменения одного или нескольких экспрессируемых T-клетками генов, например, одного или нескольких из генов FAS, BID, CTLA4, PDCD1, CBLB, PTPN6, TRAC и/или TRBC. В связанных аспектах пролиферация T-клеток может быть нарушена при изменении одного или нескольких экспрессируемых T-клетками генов, например, гена CBLB и/или PTPN6, гена FAS и/или BID, гена CTLA4, и/или PDCDI, и/или TRAC, и/или TRBC.In one aspect of the present invention, methods and compositions that involve editing a target nucleic acid sequence or modulating the expression of a target nucleic acid sequence and their uses in connection with cancer immunotherapy are understood by adapting the CRISPR-Cas system of the present invention. Reference is made to the use of gene therapy in WO 2015/161276, which provides methods and compositions that can be used to disrupt the proliferation, survival and/or function of T cells by altering one or more genes expressed by T cells, such as one or more of the FAS, BID, CTLA4, PDCD1, CBLB, PTPN6, TRAC and/or TRBC genes. In related aspects, T cell proliferation may be impaired by alteration of one or more genes expressed by T cells, such as the CBLB gene and/or PTPN6, the FAS gene and/or BID, the CTLA4 gene and/or PDCDI and/or TRAC and/or TRBC.
T-клетки с химерным антигенным рецептором (CAR)19 характеризуются антилейкозными эффектами в злокачественных образованиях пациентов. Однако пациенты с лейкозом часто имеют недостаточно T-клеток для сбора, следовательно, лечение должно включать модифицированные T-клетки от доноров. Соответственно, существует интерес создания банка донорских T-клеток. Qasim et al. ("First Clinical Application of Talen Engineered Universal CAR19 T Cells in B-ALL" ASH 57th Annual Meeting and Exposition, Dec. 5-8, 2015, Abstract 2046 (https://ash.confex.com/ash/2015/webprogram/Paper81653.html, опубликовано онлайн в ноябре 2015 г.) описывают модификацию T-клеток с CAR19 с целью устранения риска возникновения реакции "трансплантат против хозяина" посредством нарушения экспрессии T-клеточных рецепторов и нацеливания на CD52. Кроме того, клетки с CD52 были подвергнуты нацеливанию таким образом, что они стали невосприимчивыми к алемтузумабу, и, таким образом, способствовали тому, что алемтузумаб предупреждал опосредованное хозяином отторжение T-клеток с CAR19, несоответствующих лейкоцитарным антигенам человека (HLA). Исследователи использовали самоинактивирующийся лентивирусный вектор третьего поколения, кодирующий 4g7 CAR19 (CD19 scFv-4-1BB-CD3ζ), связанный с RQR8, затем электропорировали клетки с помощью двух пар мРНК TALEN для мультиплексного нацеливания на локус константной альфа-цепи T-клеточного рецептора (TCR) и локус гена CD52. Клетки, которые по-прежнему экспрессировали TCR после ex vivo разращения, подвергали истощению в результате истощения α/β TCR CliniMacs, приводя к образованию T-клеточного продукта (UCART19) с <1% экспрессией TCR, 85% которых приходились на CAR19, а 64% стали негативными по отношению к CD52. Модифицированные T-клетки с CAR19 вводили для лечения рецидивирующего острого лимфобластного лейкоза у пациентов. Идеи, предусмотренные в данном документе, предусматривают эффективные способы модифицирования клеток, например, для удаления и модулирования CD52 или других мишеней, таким образом, их можно применять в сочетании с модификацией введения T-клеток или других клеток пациентам для лечения злокачественных новообразований.Chimeric antigen receptor (CAR)19 T cells have been shown to have anti-leukemic effects in patients with malignancies. However, leukemia patients often have insufficient T cells to collect, so treatment must include modified T cells from donors. Accordingly, there is interest in establishing a donor T cell bank. Qasim et al. ("First Clinical Application of Talen Engineered Universal CAR19 T Cells in B-ALL," ASH 57th Annual Meeting and Exposition, Dec. 5-8, 2015, Abstract 2046 (https://ash.confex.com/ash/2015/webprogram/Paper81653.html, published online November 2015) describe the modification of CAR19 T cells to eliminate the risk of graft-versus-host disease by disrupting T cell receptor expression and targeting CD52. Furthermore, CD52 cells were targeted so that they were refractory to alemtuzumab, thereby contributing to alemtuzumab's ability to prevent host-mediated rejection of human leukocyte antigen (HLA)-mismatched CAR19 T cells. The researchers used a third-generation self-inactivating lentiviral vector encoding 4g7 CAR19 (CD19 scFv-4-1BB-CD3ζ) linked to RQR8, then electroporated the cells with two pairs of TALEN mRNAs to multiplexly target the T cell receptor (TCR) constant alpha chain locus and the CD52 gene locus. Cells that still expressed TCR after ex vivo expansion were depleted by CliniMacs α/β TCR depletion, resulting in a T cell product (UCART19) with <1% TCR expression, 85% of which were CAR19 and 64% were negative for CD52. The CAR19-modified T cells were administered to treat relapsed acute lymphoblastic leukemia in patients. The concepts provided herein provide efficient ways to modify cells, for example, to remove and modulating CD52 or other targets, thus they can be used in combination with modification of the administration of T cells or other cells to patients for the treatment of malignancies.
В публикации Watts "Hematopoietic Stem Cell Expansion and Gene Therapy" Cytotherapy 13(10):1164-1171. doi:10.3109/14653249.2011.620748 (2011), включенной в данный документ посредством ссылки вместе с документами, которые в ней перечислены, так, если бы были изложены в полном объеме, обсуждается генная терапия кроветворных стволовых клеток (HSC), например, опосредованная вирусами генная терапия HSC, как весьма перспективный вариант лечения многих нарушений, в том числе гематологических состояний, типов иммунодефицита, в том числе HIV/AIDS, и других наследственных нарушений, таких как лизосомные болезни накопления, в том числе SCID-X1, ADA-SCID, β-талассемия, сцепленная с Х-хромосомой CGD, синдром Вискотта-Олдрича, анемия Фанкони, адренолейкодистрофия (ALD) и метахроматическая лейкодистрофия (MLD).In Watts, “Hematopoietic Stem Cell Expansion and Gene Therapy,” Cytotherapy 13(10):1164–1171. doi:10.3109/14653249.2011.620748 (2011), incorporated by reference herein, together with the documents it lists, as if they were set out in full, discusses hematopoietic stem cell (HSC) gene therapy, such as viral-mediated HSC gene therapy, as a promising treatment option for many disorders, including hematological conditions, types of immunodeficiency including HIV/AIDS, and other inherited disorders such as lysosomal storage diseases including SCID-X1, ADA-SCID, X-linked β-thalassemia CGD, Wiskott-Aldrich syndrome, Fanconi anemia, adrenoleukodystrophy (ALD), and metachromatic leukodystrophy (MLD).
Публикации заявок на патенты США №№ 20110225664, 20110091441, 20100229252, 20090271881 и 20090222937, закрепленные за Cellectis, относятся к вариантам CREI, где по меньшей мере один из двух мономеров I-CreI имеет по меньшей мере две замены, по одной в каждом из двух функциональных субдоменов сердцевинного домена LAGLIDADG, расположенных соответственно в положениях 26-40 и 44-77 I-CreI, при этом указанный вариант способен расщеплять целевую последовательность ДНК гена гамма-цепи рецептора интерлейкина-2 человека (IL2RG), также называемого геном общей гамма-цепи рецепторов цитокинов или геном гамма-C. Целевые последовательности, указанные в публикациях заявок на патенты США №№ 20110225664, 20110091441, 20100229252, 20090271881 и 20090222937, могут быть использованы для системы нацеливания на нуклеиновую кислоту по настоящему изобретению.U.S. Patent Application Publication Nos. 20110225664, 20110091441, 20100229252, 20090271881, and 20090222937 assigned to Cellectis relate to CREI variants wherein at least one of the two I-CreI monomers has at least two substitutions, one in each of the two functional subdomains of the LAGLIDADG core domain located at positions 26-40 and 44-77 of I-CreI, respectively, wherein said variant is capable of cleaving a target DNA sequence of the human interleukin-2 receptor gamma chain gene (IL2RG), also referred to as the cytokine receptor common gamma chain gene or gamma-C gene. The target sequences disclosed in U.S. Patent Application Publication Nos. 20110225664, 20110091441, 20100229252, 20090271881, and 20090222937 can be used for the nucleic acid targeting system of the present invention.
Тяжелый комбинированный иммунодефицит (SCID) возникает в результате нарушения созревания T-лимфоцитов, во всех случаях ассоциированного с нарушением функционирования B-лимфоцитов (Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109). Общая заболеваемость по оценкам составляет 1 на 75 000 родившихся. Пациенты с нелеченым SCID подвержены множественным инфекциям, вызываемым условно-патогенными микроорганизмами, и живут, как правило, не более одного года. SCID можно лечить путем аллогенного переноса кроветворных стволовых клеток от донора-родственника. Степень гистосовместимости с донором может варьировать в широких пределах. В случае аденозиндезаминазной (ADA) недостаточности, одной из форм SCID, пациентов можно лечить с помощью инъекции рекомбинантного фермента аденозиндезаминазы.Severe combined immunodeficiency (SCID) results from defective T-lymphocyte maturation, in all cases associated with defective B-lymphocyte function (Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585–602; Fischer et al., Immunol. Rev., 2005, 203, 98–109). The overall incidence is estimated at 1 in 75,000 births. Patients with untreated SCID are susceptible to multiple opportunistic infections and typically survive for less than 1 year. SCID can be treated by allogeneic transfer of hematopoietic stem cells from a related donor. The degree of histocompatibility with the donor can vary widely. In cases of adenosine deaminase (ADA) deficiency, a form of SCID, patients can be treated with an injection of recombinant adenosine deaminase enzyme.
Поскольку было показано, что ген ADA у пациентов с SCID является мутированным (Giblett et al., Lancet, 1972, 2, 1067-1069), были идентифицированы некоторые другие гены, вовлеченные в SCID (Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109). Существуют четыре основные причины SCID. (i) Наиболее часто встречающуюся форму SCID, SCID-X1 (SCID, сцепленный с X-хромосомой, или X-SCID), вызывает мутация в гене IL2RG, которая приводит к отсутствию зрелых T-лимфоцитов и NK-клеток. IL2RG кодирует белок гамма-C (Noguchi, et al., Cell, 1993, 73, 147-157), общий компонент по меньшей мере пяти рецепторных комплексов интерлейкинов. Данные рецепторы активируют несколько мишеней с помощью киназы JAK3 (Macchi et al., Nature, 1995, 377, 65-68), инактивация которой приводит к возникновению того же синдрома, что и инактивация гамма-C. (ii) Мутация в гене ADA приводит к нарушению метаболизма пуринов, вызывающему гибель предшественников лимфоцитов, что, в свою очередь, приводит к кажущемуся отсутствию B-, T- и NK-клеток. (iii) V(D)J-рекомбинация является существенным этапом созревания иммуноглобулинов и рецепторов T-лимфоцитов (TCR). Мутации в генах, активирующих рекомбинацию, 1 и 2 (RAG1 и RAG2) и Artemis, трех генах, участвующих в этом процессе, приводят к отсутствию зрелых T- и B-лимфоцитов. (iv) Также сообщали о мутациях в других генах, таких как CD45, участвующих в специфичной передаче сигналов в T-клетках, хотя они представляют меньшинство случаев (Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109). С тех пор, как были идентифицированы их генетические основы, различные формы SCID стали модельными для подходов к генной терапии (Fischer et al., Immunol. Rev., 2005, 203, 98-109) по двум основным причинам. Во-первых, как и при всех заболеваниях крови, может быть предусмотрено лечение ex vivo. Можно выделить гемопоэтические стволовые клетки (HSC) из костного мозга и сохранять их свойства плюрипотентности в течение нескольких клеточных делений. Таким образом, их можно обрабатывать in vitro, а затем повторно инъецировать пациенту, где они повторно заселяют костный мозг. Во-вторых, поскольку созревание лимфоцитов у пациентов с SCID ухудшено, скорректированные клетки имеют селективное преимущество. Таким образом, небольшое количество скорректированных клеток может восстановить функционирование иммунной системы. Данную гипотезу подтверждали несколько раз (i) частичным восстановлением иммунных функций, связанным с реверсией мутаций у пациентов с SCID (Hirschhorn et al., Nat. Genet., 1996, 13, 290-295; Stephan et al., N. Engl. J. Med., 1996, 335, 1563-1567; Bousso et al., Proc. Natl., Acad. Sci. USA, 2000, 97, 274-278; Wada et al., Proc. Natl. Acad. Sci. USA, 2001, 98, 8697-8702; Nishikomori et al., Blood, 2004, 103, 4565-4572), (ii) коррекцией форм недостаточности SCID-X1 in vitro в гемапоэтических клетках (Candotti et al., Blood, 1996, 87, 3097-3102; Cavazzana-Calvo et al., Blood, 1996, Blood, 88, 3901-3909; Taylor et al., Blood, 1996, 87, 3103-3107; Hacein-Bey et al., Blood, 1998, 92, 4090-4097), (iii) коррекцией SCID-X1 (Soudais et al., Blood, 2000, 95, 3071-3077; Tsai et al., Blood, 2002, 100, 72-79), JAK-3 (Bunting et al., Nat. Med., 1998, 4, 58-64; Bunting et al., Hum. Gene Ther., 2000, 11, 2353-2364) и RAG2 (Yates et al., Blood, 2002, 100, 3942-3949) in vivo в животных моделях и (iv) результатом клинических испытаний генной терапии (Cavazzana-Calvo et al., Science, 2000, 288, 669-672; Aiuti et al., Nat. Med., 2002; 8, 423-425; Gaspar et al., Lancet, 2004, 364, 2181-2187).Since the ADA gene has been shown to be mutated in patients with SCID (Giblett et al., Lancet, 1972, 2, 1067-1069), several other genes involved in SCID have been identified (Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109). There are four main causes of SCID. (i) The most common form of SCID, SCID-X1 (X-linked SCID or X-SCID), is caused by a mutation in the IL2RG gene, resulting in the absence of mature T lymphocytes and NK cells. IL2RG encodes the gamma-C protein (Noguchi, et al., Cell, 1993, 73, 147-157), a common component of at least five interleukin receptor complexes. These receptors activate several targets via the kinase JAK3 (Macchi et al., Nature, 1995, 377, 65-68), whose inactivation results in the same syndrome as gamma-C inactivation. (ii) Mutation in the ADA gene results in defective purine metabolism, causing death of lymphocyte precursors, which in turn leads to the apparent absence of B, T, and NK cells. (iii) V(D)J recombination is an essential step in the maturation of immunoglobulins and T-lymphocyte receptors (TCRs). Mutations in recombination activating genes 1 and 2 (RAG1 and RAG2) and Artemis, three genes involved in this process, result in the absence of mature T and B lymphocytes. (iv) Mutations in other genes such as CD45, involved in T cell-specific signaling, have also been reported, although they represent a minority of cases (Cavazzana-Calvo et al., Annu. Rev. Med., 2005, 56, 585-602; Fischer et al., Immunol. Rev., 2005, 203, 98-109). Since their genetic basis was identified, the various forms of SCID have become model for gene therapy approaches (Fischer et al., Immunol. Rev., 2005, 203, 98-109) for two main reasons. First, as with all blood disorders, ex vivo treatment may be considered. Hematopoietic stem cells (HSCs) can be isolated from bone marrow and retained in their pluripotency properties for several cell divisions. They can then be processed in vitro and then reinjected into the patient, where they repopulate the bone marrow. Second, because lymphocyte maturation is impaired in SCID patients, corrected cells have a selective advantage. Thus, a small number of corrected cells may restore immune function. This hypothesis has been supported several times by (i) partial restoration of immune functions associated with reversion of mutations in SCID patients (Hirschhorn et al., Nat. Genet., 1996, 13, 290-295; Stephan et al., N. Engl. J. Med., 1996, 335, 1563-1567; Bousso et al., Proc. Natl., Acad. Sci. USA, 2000, 97, 274-278; Wada et al., Proc. Natl. Acad. Sci. USA, 2001, 98, 8697-8702; Nishikomori et al., Blood, 2004, 103, 4565-4572), (ii) correction of SCID-X1 deficiency forms in vitro in hematopoietic cells (Candotti et al., Blood, 1996, 87, 3097-3102; Cavazzana-Calvo et al., Blood, 1996, Blood, 88, 3901-3909; Taylor et al., Blood, 1996, 87, 3103-3107; Hacein-Bey et al., Blood, 1998, 92, 4090-4097), (iii) correction of SCID-X1 (Soudais et al., Blood, 2000, 95, 3071-3077; Tsai et al., Blood, 2002, 100, 72-79), JAK-3 (Bunting et al., Nat. Med., 1998, 4, 58-64; Bunting et al. Hum. Gene Ther., 2000, 11, 2353-2364) and RAG2 (Yates et al., Blood, 2002, 100, 3942-3949) in vivo in animal models and (iv) the result of clinical trials of gene therapy (Cavazzana-Calvo et al., Science, 2000, 288, 669-672; Aiuti et al., Nat. Med., 2002; 8, 423-425; Gaspar et al., Lancet, 2004, 364, 2181-2187).
Публикация заявки на патент США № 20110182867, закрепленная за Children's Medical Center Corporation и президентом и членами управляющего совета Гарвардского университета, относится к способам модулирования экспрессии фетального гемоглобина (HbF) и ее применениям в гемопоэтических клетках-предшественниках с помощью ингибиторов экспрессии или активности BCL11A, таких как средства для RNAi и антитела. Мишени, раскрытые в публикации заявки на патент США № 20110182867, такие как BCL11A, могут быть подвергнуты нацеливанию с помощью системы CRISPR Cas9 по настоящему изобретению для модулирования экспрессии фетального гемоглобина. См. также Bauer et al. (Science 11 October 2013: Vol. 342 no. 6155 pp. 253-257) и Xu et al. (Science 18 November 2011: Vol. 334 no. 6058 pp. 993-996) в отношении дополнительных мишеней BCL11A.U.S. Patent Application Publication No. 20110182867 assigned to Children's Medical Center Corporation and the President and Board of Governors of Harvard University relates to methods of modulating fetal hemoglobin (HbF) expression and uses thereof in hematopoietic progenitor cells using inhibitors of BCL11A expression or activity, such as RNAi agents and antibodies. The targets disclosed in U.S. Patent Application Publication No. 20110182867, such as BCL11A, can be targeted using the CRISPR Cas9 system of the present invention to modulate fetal hemoglobin expression. See also Bauer et al. (Science 11 October 2013: Vol. 342 no. 6155 pp. 253-257) and Xu et al. (Science 18 November 2011: Vol. 334 no. 6058 pp. 993-996) for additional targets of BCL11A.
При наличии знаний в данной области и идей настоящего изобретения специалист в данной области может корректировать HSC по отношению к наследственному гематологическому нарушению, например, β-талассемии, гемофилии или генетической лизосомной болезни накопления.Having knowledge in the art and the ideas of the present invention, a person skilled in the art can correct HSC in relation to an inherited hematological disorder, for example, β-thalassemia, hemophilia or a genetic lysosomal storage disease.
Лечение заболеваний мозга, центральной нервной системы и иммунной системыTreatment of diseases of the brain, central nervous system and immune system
Настоящее изобретение также предусматривает доставку системы CRISPR-Cas в головной мозг или нейроны. Например, РНК-интерференция (RNAi) предоставляет терапевтические возможности для лечения этого нарушения посредством уменьшения экспрессии HTT, гена, приводящего к развитию болезни Гентингтона (см., например, McBride et al., Molecular Therapy vol. 19 no. 12 Dec. 2011, pp. 2152-2162), следовательно, автор настоящего изобретения предполагает, что ее можно использовать с системой CRISPR-Cas и/или приспособить к ней. Систему CRISPR-Cas можно получить с использованием алгоритма для уменьшения возможности нецелевого воздействия антисмысловых последовательностей. Последовательности CRISPR-Cas могут целенаправленно воздействовать на последовательность в экзоне 52 гентингтина мыши, макака-резуса или человека и экспрессироваться вирусным вектором, например, на основе AAV. Животным, в том числе человеку, можно вводить путем приблизительно трех микроинъекций на полушарие (всего шесть инъекций): первая на 1 мм рострально от передней спайки (12 мкл) и две оставшиеся инъекции (12 мкл и 10 мкл соответственно) на расстоянии 3 и 6 мм каудально по отношению к первой инъекции, причем с 1e12 vg/мл AAV при скорости приблизительно 1 мкл/минута, при этом иглу оставляли на месте в течение дополнительных 5 минут для обеспечения диффузии вводимого вещества с наконечника иглы.The present invention also provides for the delivery of a CRISPR-Cas system to the brain or neurons. For example, RNA interference (RNAi) provides therapeutic options for the treatment of this disorder by reducing the expression of HTT, the gene that causes Huntington's disease (see, for example, McBride et al., Molecular Therapy vol. 19 no. 12 Dec. 2011, pp. 2152-2162), and therefore the inventor contemplates that it can be used with and/or adapted to a CRISPR-Cas system. The CRISPR-Cas system can be designed using an algorithm to reduce the possibility of off-target effects of antisense sequences. The CRISPR-Cas sequences can target a sequence in exon 52 of mouse, rhesus macaque, or human huntingtin and be expressed by a viral vector, such as an AAV-based one. Animals, including humans, can be administered by approximately three microinjections per hemisphere (six injections total): the first 1 mm rostral to the anterior commissure (12 μl) and two remaining injections (12 μl and 10 μl, respectively) 3 and 6 mm caudal to the first injection, with 1e12 vg/ml AAV at a rate of approximately 1 μl/minute, with the needle left in place for an additional 5 minutes to allow diffusion of the injected substance from the needle tip.
DiFiglia et al. (PNAS, October 23, 2007, vol. 104, no. 43, 17204-17209) наблюдали, что однократное введение в полосатое тело взрослого организма siRNA, целенаправленно воздействующей на Htt, может привести к сайленсингу мутированного Htt, ослаблению нейрональной патологии и задержке развития аномального поведенческого фенотипа, наблюдаемого в модели HD на трансгенных мышах, полученной с использованием вируса, с быстрым началом проявления. DiFiglia инъецировал мышам в полосатое тело 2 мкл Cy3-меченых cc-siRNA-Htt или неконъюгированных siRNA-Htt при 10 мкМ. Аналогичная доза CRISPR-Cas, нацеленной на Htt, может быть предусмотрена в настоящем изобретении для человека, например, приблизительно 5-10 мл 10 мкМ CRISPR-Cas, нацеленной на Htt, можно инъецировать в полосатое тело.DiFiglia et al. (PNAS, October 23, 2007, vol. 104, no. 43, 17204-17209) observed that a single intrastriatal injection of siRNA targeting Htt could silence mutated Htt, attenuate neuronal pathology, and delay the development of the abnormal behavioral phenotype observed in a rapid-onset virus-derived transgenic mouse model of HD. DiFiglia injected mice intrastriatally with 2 μl of Cy3-labeled cc-siRNA-Htt or unconjugated siRNA-Htt at 10 μM. A similar dose of Htt-targeting CRISPR-Cas can be provided in the present invention for a human, for example, approximately 5-10 ml of 10 μM Htt-targeting CRISPR-Cas can be injected into the striatum.
В другом примере Boudreau et al. (Molecular Therapy vol. 17 no. 6 june 2009) инъецировали в полосатое тело 5 мкл векторов на основе рекомбинантного AAV серотипа 2/1, экспрессирующих htt-специфичный вирус для RNAi (при 4 x 1012 вирусных геномов/мл). Аналогичная доза CRISPR-Cas, нацеленной на Htt, может быть предусмотрена в настоящем изобретении для человека, например, приблизительно 10-20 мл 4 x 1012 вирусных геномов/мл, причем CRISPR-Cas, нацеленную на Htt, можно инъецировать в полосатое тело.In another example, Boudreau et al. (Molecular Therapy vol. 17 no. 6 June 2009) injected 5 μl of recombinant AAV serotype 2/1 vectors expressing htt-specific virus for RNAi (at 4 x 10 12 viral genomes/ml) into the striatum. A similar dose of Htt-targeting CRISPR-Cas can be envisaged in the present invention for humans, for example, about 10-20 ml of 4 x 10 12 viral genomes/ml, wherein Htt-targeting CRISPR-Cas can be injected into the striatum.
В другом примере CRISPR-Cas, нацеленную на HTT, можно вводить непрерывно (см., например, Yu et al., Cell 150, 895-908, August 31, 2012). Yu et al. использовали доставку с помощью осмотических насосов, обеспечивающих скорость 0,25 мл/ч (модель 2004), для доставки 300 мг/день ss-siRNA или фосфатно-солевого буферного раствора (PBS) (Sigma Aldrich) в течение 28 дней и насосы, выполненные с возможностью доставки 0,5 мкл/ч (модель 2002), использовали для доставки 75 мг/день MOE ASO положительного контроля в течение 14 дней. Насосы (Durect Corporation) заполняли ss-siRNA или MOE, разведенным стерильным PBS, а затем инкубировали при 37 C в течение 24 или 48 (Model 2004) часов перед имплантацией. Мышей анестезировали 2,5% изофлураном и делали срединный разрез у основания черепа. Используя стереотаксические зонды имплантировали канюлю в боковой правый желудочек и закрепляли с помощью клея Loctite. Катетер, прикрепленный к осмотическому мининасосу Alzet, прикрепляли к канюле, и насос размещали подкожно между лопатками. Разрез закрывали швами, используя нейлон 5,0. Аналогичная доза CRISPR-Cas, целенаправленно воздействующей на Htt, может предусматриваться в настоящем изобретении для человека, например, можно вводить от приблизительно 500 до 1000 г/день CRISPR-Cas, целенаправленно воздействующей на Htt.In another example, CRISPR-Cas targeting HTT can be administered continuously (see, e.g., Yu et al., Cell 150, 895-908, August 31, 2012). Yu et al. used osmotic pumps capable of delivering 0.25 ml/h (model 2004) to deliver 300 mg/day of ss-siRNA or phosphate-buffered saline (PBS) (Sigma Aldrich) for 28 days, and pumps capable of delivering 0.5 μl/h (model 2002) were used to deliver 75 mg/day of MOE ASO positive control for 14 days. Pumps (Durect Corporation) were filled with ss-siRNA or MOE diluted with sterile PBS and then incubated at 37 C for 24 or 48 (Model 2004) hours prior to implantation. Mice were anesthetized with 2.5% isoflurane and a midline incision was made at the base of the skull. Using stereotaxic probes, a cannula was implanted into the lateral right ventricle and secured with Loctite glue. A catheter attached to an Alzet osmotic minipump was attached to the cannula and the pump was placed subcutaneously between the scapulae. The incision was closed with sutures using 5.0 nylon. A similar dose of Htt-targeting CRISPR-Cas can be envisaged in the present invention for humans, for example, about 500 to 1000 g/day of Htt-targeting CRISPR-Cas can be administered.
В другом примере непрерывной инфузии Stiles et al (Experimental Neurology 233 (2012) 463-471) имплантировали интрапаренхиматозный катетер с титановым наконечником иглы в правую скорлупу. Катетер подсоединяли к насосу SynchroMed® II (Medtronic Neurological, Миннеаполис, Миннесота), подкожно имплантированному в области живота. После 7 дней инфузии фосфатно-солевого буферного раствора при 6 мкл/день насосы повторно заполняли исследуемым препаратом и программировали на непрерывную доставку в течение 7 дней. От приблизительно 2,3 до 11,52 мг/день siRNA вводили путем инфузии при различных значениях скорости инфузии от приблизительно 0,1 до 0,5 мкл/мин. Аналогичная доза CRISPR-Cas, целенаправленно воздействующей на Htt, может предусматриваться в настоящем изобретении для человека, например, можно вводить от приблизительно 20 до 200 мг/день CRISPR-Cas, целенаправленно воздействующей на Htt. В другом примере способы согласно публикации патентного документа США № 20130253040 (WO2013130824), закрепленной за Sangamo, также можно адаптировать от TALES к системе CRISPR-Cas согласно настоящему изобретению для лечения болезни Гентингтона. WO2015089354 A1 от имени The Broad Institute (института Броада) et al., включенный в данном документ посредством ссылки, описывает мишени для болезни Гентингтона (HP). При болезни Гентингтона потенциальные гены-мишени для комплекса CRISPR: PRKCE; IGF1; EP300; RCOR1; PRKCZ; HDAC4 и TGM2.In another example of continuous infusion, Stiles et al (Experimental Neurology 233 (2012) 463–471) implanted an intraparenchymal catheter with a titanium needle tip into the right putamen. The catheter was connected to a SynchroMed® II pump (Medtronic Neurological, Minneapolis, MN) implanted subcutaneously in the abdomen. After 7 days of phosphate-buffered saline infusion at 6 μL/day, the pumps were refilled with study drug and programmed for continuous delivery for 7 days. Approximately 2.3 to 11.52 mg/day of siRNA were infused at varying infusion rates from approximately 0.1 to 0.5 μL/min. A similar dosage of Htt-targeted CRISPR-Cas may be provided in the present invention for humans, such as about 20 to 200 mg/day of Htt-targeted CRISPR-Cas may be administered. In another example, the methods of U.S. Patent Publication No. 20130253040 (WO2013130824) assigned to Sangamo may also be adapted from TALES to the CRISPR-Cas system of the present invention for the treatment of Huntington's disease. WO2015089354 A1 by The Broad Institute et al., incorporated herein by reference, describes targets for Huntington's disease (HP). In Huntington's disease, potential target genes for the CRISPR complex include PRKCE; IGF1; EP300; RCOR1; PRKCZ; HDAC4, and TGM2.
Соответственно, один или более из PRKCE; IGF1; EP300; RCOR1; PRKCZ; HDAC4 и TGM2 могут быть выбраны в качестве мишеней для болезни Гентингтона в некоторых вариантах осуществления по настоящему изобретению.Accordingly, one or more of PRKCE; IGF1; EP300; RCOR1; PRKCZ; HDAC4 and TGM2 may be selected as targets for Huntington's disease in some embodiments of the present invention.
Другие нарушения тринуклеотидных повторов. Они могут включать любое из следующего. Категория I включает болезнь Гентингтона (HD) и спиноцеребеллярные атаксии; экспансии категории II являются фенотипически разнообразными с гетерогенными экспансиями, которые, как правило, являются небольшими по величине, но также встречаются в экзонах генов; и категория III включает синдром ломкой X-хромосомы, миотоническую дистрофию, две из спиноцеребеллярных атаксий, ювенильную миоклонус-эпилепсию и атаксию Фридрейха.Other trinucleotide repeat disorders. These may include any of the following. Category I includes Huntington's disease (HD) and the spinocerebellar ataxias; category II expansions are phenotypically diverse with heterogeneous expansions that are typically small in size but also occur in gene exons; and category III includes fragile X syndrome, myotonic dystrophy, two of the spinocerebellar ataxias, juvenile myoclonus epilepsy, and Friedreich's ataxia.
Дополнительный аспект настоящего изобретения относится к использованию системы CRISPR-Cas для корригирования дефектов в генах EMP2A и EMP2B, которые, как было обнаружено, ассоциированы с болезнью Лафора. Болезнь Лафора представляет собой аутосомно-рецессивное состояние, которое характеризуется прогрессирующей миоклонус-эпилепсией, которая может начинаться в виде эпилептических приступов в подростковом возрасте. Некоторые случаи заболевания могут быть вызваны мутациями в генах, которые уже были идентифицированы. Заболевание вызывает приступы, мышечные спазмы, затрудненную ходьбу, слабоумие и, в конечном итоге, смерть. В настоящее время не существует терапии, которая показала эффективность при прогрессировании заболевания. На другие генетические расстройства, ассоциированные с эпилепсией, также можно целенаправленно воздействовать с помощью системы CRISPR-Cas, и лежащие в основе генетические механизмы дополнительно описаны в Genetics of Epilepsy and Genetic Epilepsies, edited by Giuliano Avanzini, Jeffrey L. Noebels, Mariani Foundation Paediatric Neurology:20; 2009).An additional aspect of the present invention relates to the use of the CRISPR-Cas system to correct defects in the EMP2A and EMP2B genes that have been found to be associated with Lafora disease. Lafora disease is an autosomal recessive condition characterized by progressive myoclonus epilepsy that may begin with epileptic seizures in adolescence. Some cases of the disease may be caused by mutations in genes that have already been identified. The disease causes seizures, muscle spasms, difficulty walking, dementia, and ultimately death. There is currently no therapy that has shown efficacy in the progression of the disease. Other genetic disorders associated with epilepsy can also be targeted using the CRISPR-Cas system, and the underlying genetic mechanisms are further described in Genetics of Epilepsy and Genetic Epilepsies, edited by Giuliano Avanzini, Jeffrey L. Noebels, Mariani Foundation Paediatric Neurology:20; 2009).
Способы согласно публикации патентного документа США № 20110158957, закрепленного за Sangamo BioSciences, Inc., связанные с инактивацией генов T-клеточного рецептора (TCR), также можно модифицировать для применения с системой CRISPR-Cas согласно настоящему изобретению. В другом примере способы согласно публикации заявки на патент США № 20100311124, закрепленной за Sangamo BioSciences, Inc., и публикации заявки на патент США № 20110225664, закрепленной за Cellectis, оба из которых связаны с инактивацией экспрессии гена глутаминсинтетазы, также можно модифицировать для применения с системой CRISPR-Cas согласно настоящему изобретению.The methods of U.S. Patent Publication No. 20110158957 assigned to Sangamo BioSciences, Inc., related to the inactivation of T cell receptor (TCR) genes, can also be modified for use with the CRISPR-Cas system of the present invention. In another example, the methods of U.S. Patent Application Publication No. 20100311124 assigned to Sangamo BioSciences, Inc. and U.S. Patent Application Publication No. 20110225664 assigned to Cellectis, both of which relate to the inactivation of glutamine synthetase gene expression, can also be modified for use with the CRISPR-Cas system of the present invention.
Лечение заболеваний, связанных со слухомTreatment of hearing related diseases
Настоящее изобретение также предусматривает доставку системы CRISPR-Cas в одно ухо или оба уха.The present invention also provides for delivery of the CRISPR-Cas system to one ear or both ears.
Исследователи рассматривают вопрос о том, можно ли применять генную терапию для содействия существующим способам лечения глухоты - а именно, применению кохлеарных имплантатов. Глухоту часто вызывают утрата или повреждение волосковых клеток, которые не могут передавать сигналы слуховым нейронам. В таких случаях можно применять кохлеарные имплантаты для обеспечения реакции на звук и передачи электрических сигналов нервным клеткам. Однако эти нейроны часто дегенерируют и подвергаются ретракции отростков в улитке, поскольку пораженные волосковые клетки высвобождают меньше факторов роста.Researchers are considering whether gene therapy could be used to support existing treatments for deafness, namely cochlear implants. Deafness is often caused by loss or damage of hair cells, which fail to transmit signals to auditory neurons. In such cases, cochlear implants can be used to provide a response to sound and transmit electrical signals to nerve cells. However, these neurons often degenerate and experience retraction of processes in the cochlea because the damaged hair cells release fewer growth factors.
В заявке на патент США 20120328580 описана инъекция фармацевтической композиции в ухо (например, путем ушного введения), как, например, в просветы улитки (например, в проток улитки, лестницу преддверия и барабанную лестницу улитки), например, с помощью шприца, например, шприца c однократной дозой. Например, одно или несколько соединений, описанных в данном документе, можно вводить путем интратимпанальной инъекции (например, в среднее ухо) и/или инъекций в наружное, среднее и/или внутреннее ухо. Такие способы регулярно применяются в данной области, например, для введения стероидов и антибиотиков в уши людей. Инъекцию можно осуществлять, например, через круглое окно уха или через капсулу улитки. Из уровня техники известны и другие способы введения во внутреннее ухо (см., например, Salt and Plontke, Drug Discovery Today, 10:1299-1306, 2005). US Patent Application 20120328580 describes injection of a pharmaceutical composition into the ear (e.g., by aural administration), such as into the lumens of the cochlea (e.g., the cochlear duct, scala vestibuli, and scala tympani), for example, using a syringe, such as a single dose syringe. For example, one or more compounds described herein can be administered by intratympanic injection (e.g., into the middle ear) and/or injections into the outer, middle, and/or inner ear. Such methods are routinely used in the art, for example, to administer steroids and antibiotics into the ears of humans. The injection can be performed, for example, through the round window of the ear or through the cochlear capsule. Other methods of administration into the inner ear are known in the art (see, for example, Salt and Plontke, Drug Discovery Today, 10:1299-1306, 2005).
В другом способе введения фармацевтическую композицию можно вводить in situ с помощью катетера или насоса. Катетер или насос могут, например, направлять фармацевтическую композицию в просветы улитки, или круглое окно уха, и/или просвет толстой кишки. Иллюстративный аппарат для доставки лекарственных средств и способы, подходящие для введения одного или нескольких соединений, описанных в данном документе, в ухо, например, в ухо человека, описаны McKenna et al. (публикация заявки на патент США № 2006/0030837) и Jacobsen et al. (патент США № 7206639). В некоторых вариантах осуществления катетер или насос могут быть расположены, например, в ухе (например, в наружном, среднем и/или внутреннем ухе) пациента во время хирургического вмешательства. В некоторых вариантах осуществления катетер или насос могут быть расположены, например, в ухе (например, в наружном, среднем и/или внутреннем ухе) пациента без необходимости в хирургическом вмешательстве.In another method of administration, the pharmaceutical composition can be administered in situ using a catheter or pump. The catheter or pump can, for example, direct the pharmaceutical composition into the lumen of the cochlea, or the round window of the ear, and/or the lumen of the colon. An exemplary drug delivery apparatus and methods suitable for administering one or more compounds described herein to an ear, such as a human ear, are described by McKenna et al. (U.S. Patent Application Publication No. 2006/0030837) and Jacobsen et al. (U.S. Patent No. 7,206,639). In some embodiments, the catheter or pump can be positioned, for example, in an ear (e.g., an outer, middle, and/or inner ear) of a patient during surgery. In some embodiments, the catheter or pump can be positioned, for example, in an ear (e.g., an outer, middle, and/or inner ear) of a patient without the need for surgery.
Альтернативно или в дополнение, одно или несколько соединений, описанных в данном документе, можно вводить в сочетании с механическим устройством, таким как кохлеарный имплантат или слуховой аппарат, которое носят в наружном ухе. Иллюстративный кохлеарный имплантат, подходящий для применения в настоящем изобретении, описан Edge et al. (публикация заявки на патент США № 2007/0093878).Alternatively or in addition, one or more of the compounds described herein can be administered in combination with a mechanical device, such as a cochlear implant or a hearing aid, that is worn in the outer ear. An exemplary cochlear implant suitable for use in the present invention is described by Edge et al. (US Patent Application Publication No. 2007/0093878).
В некоторых вариантах осуществления способы введения, описанные выше, можно комбинировать в любом порядке и можно применять одновременно или попеременно.In some embodiments, the routes of administration described above may be combined in any order and may be administered simultaneously or alternately.
Альтернативно или в дополнение, настоящее изобретение можно применять согласно любому из способов, одобренных Управлением по контролю качества пищевых продуктов и лекарственных средств, например, описанных в справочнике стандартов CDER, версия номер 004 (доступном по адресу fda.give/cder/dsm/DRG/drg00301.htm).Alternatively or in addition, the present invention can be used in accordance with any of the methods approved by the Food and Drug Administration, such as those described in CDER Standards Handbook, Version 004 (available at fda.give/cder/dsm/DRG/drg00301.htm).
В целом, способы клеточной терапии, описанные в заявке на патент США 20120328580, можно применять для стимуляции полной или частичной дифференцировки клеток в определенный тип зрелых клеток внутреннего уха (например, в волосковые клетки) или в его направлении in vitro. Клетки, полученные в результате осуществления таких способов, можно затем трансплантировать или имплантировать пациенту, нуждающемуся в таком лечении. Способы культивирования клеток, необходимые для осуществления на практике этих способов, включающие способы идентификации и отбора подходящих типов клеток, способы стимуляции полной или частичной дифференцировки выбранных клеток, способы идентификации полностью или частично дифференцированных типов клеток и способы имплантации полностью или частично дифференцированных клеток, описаны ниже.In general, the cell therapy methods described in U.S. Patent Application 20120328580 can be used to stimulate complete or partial differentiation of cells into or toward a particular mature inner ear cell type (e.g., hair cells) in vitro. The cells obtained from such methods can then be transplanted or implanted into a patient in need of such treatment. Cell culture methods necessary for practicing these methods, including methods for identifying and selecting suitable cell types, methods for stimulating complete or partial differentiation of selected cells, methods for identifying fully or partially differentiated cell types, and methods for implanting fully or partially differentiated cells, are described below.
Клетки, подходящие для применения в настоящем изобретении, включают без ограничения клетки, способные к полной или частичной дифференцировке в зрелые клетки внутреннего уха, например, в волосковые клетки (например, внутренние и/или наружные волосковые клетки), при контакте, например, in vitro, с одним или несколькими соединениями, описанными в данном документе. Иллюстративные клетки, способные к дифференцировке в волосковые клетки, включают без ограничения стволовые клетки (например, стволовые клетки внутреннего уха, взрослые стволовые клетки, стволовые клетки, полученные из костного мозга, эмбриональные стволовые клетки, мезенхимальные стволовые клетки, стволовые клетки кожи, iPS-клетки и стволовые клетки, полученные из жировой ткани), клетки-предшественники (например, клетки-предшественники внутреннего уха), поддерживающие клетки (например, клетки Дейтерса, столбовые клетки, внутренние фаланговые клетки, тектальные клетки и клетки Гензена) и/или зародышевые клетки. Применение стволовых клеток для замещения чувствительных клеток внутреннего уха описано Li et al. (публикация заявки на патент США № 2005/0287127) и Li et al. (патент США с регистрационным № 11/953797). Применение стволовых клеток, полученных из костного мозга, для замещения чувствительных клеток внутреннего уха описано Edge et al. в PCT/US2007/084654. iPS-клетки описаны, например, в Takahashi et al., Cell, Volume 131, Issue 5, Pages 861-872 (2007); Takahashi and Yamanaka, Cell 126, 663-76 (2006); Okita et al., Nature 448, 260-262 (2007); Yu, J. et al., Science 318(5858):1917-1920 (2007); Nakagawa et al., Nat. Biotechnol. 26:101-106 (2008); и Zaehres and Scholer, Cell 131(5):834-835 (2007). Такие подходящие клетки можно идентифицировать путем анализа (например, качественного или количественного) наличия одного или нескольких тканеспецифичных генов. Например, экспрессию гена можно выявить путем выявления белкового продукта одного или нескольких тканеспецифичных генов. Методики выявления белков включают окрашивание белков (например, с использованием клеточных экстрактов или цельных клеток) с помощью антител к соответствующему антигену. В данном случае соответствующий антиген является белковым продуктом экспрессии тканеспецифичного гена. Хотя, в принципе, меченым может быть первое антитело (т.е. антитело, связывающее антиген), более распространенным (и улучшающим визуализацию) является применение второго антитела, направленного против первого (например, антитела к IgG). Данное второе антитело конъюгируют с флуорохромами, или соответствующими ферментами для колориметрических реакций, или гранулами золота (для электронной микроскопии), или с системой биотин-авидин, так что можно определить местоположение первичного антитела и, следовательно, антигена.Cells suitable for use in the present invention include, but are not limited to, cells capable of completely or partially differentiating into mature inner ear cells, such as hair cells (e.g., inner and/or outer hair cells), when contacted, such as in vitro, with one or more of the compounds described herein. Exemplary cells capable of differentiating into hair cells include, but are not limited to, stem cells (e.g., inner ear stem cells, adult stem cells, bone marrow-derived stem cells, embryonic stem cells, mesenchymal stem cells, skin stem cells, iPS cells, and adipose-derived stem cells), progenitor cells (e.g., inner ear progenitor cells), support cells (e.g., Deiters cells, pillar cells, inner phalangeal cells, tectal cells, and Hensen cells), and/or germ cells. The use of stem cells to replace inner ear sensory cells is described by Li et al. (U.S. Patent Application Publication No. 2005/0287127) and Li et al. (U.S. Patent Serial No. 11/953797). The use of bone marrow-derived stem cells to replace inner ear sensory cells is described by Edge et al. in PCT/US2007/084654. iPS cells are described, for example, in Takahashi et al., Cell, Volume 131, Issue 5, Pages 861–872 (2007); Takahashi and Yamanaka, Cell 126, 663–76 (2006); Okita et al., Nature 448, 260–262 (2007); Yu, J. et al., Science 318(5858):1917–1920 (2007); Nakagawa et al., Nat. Biotechnol. 26:101–106 (2008); and Zaehres and Scholer, Cell 131(5):834–835 (2007). Such suitable cells can be identified by analyzing (e.g., qualitatively or quantitatively) the presence of one or more tissue-specific genes. For example, gene expression can be detected by detecting the protein product of one or more tissue-specific genes. Protein detection techniques involve staining proteins (e.g., using cell extracts or whole cells) with antibodies to the relevant antigen. In this case, the relevant antigen is the protein product of tissue-specific gene expression. Although in principle the primary antibody (i.e. the antibody that binds the antigen) can be labeled, more common (and improves visualization) is the use of a second antibody directed against the first (e.g. an antibody to IgG). This second antibody is conjugated to fluorochromes, or to appropriate enzymes for colorimetric reactions, or to gold beads (for electron microscopy), or to the biotin-avidin system, so that the location of the primary antibody and hence the antigen can be determined.
Молекулы CRISPR-Cas по настоящему изобретению можно доставлять в ухо путем непосредственного нанесения фармацевтической композиции на наружное ухо с применением модифицированных композиций из опубликованной заявки на патент США 20110142917. В некоторых вариантах осуществления фармацевтическую композицию вносят в наружный слуховой проход. Доставка в ухо может также называться внутриушной или ушной доставкой.The CRISPR-Cas molecules of the present invention can be delivered to the ear by directly applying the pharmaceutical composition to the outer ear using modified compositions of published U.S. Patent Application 20110142917. In some embodiments, the pharmaceutical composition is applied to the outer ear canal. Delivery to the ear may also be referred to as intra-aural or aural delivery.
В некоторых вариантах осуществления молекулы РНК по настоящему изобретению доставляют в липосомных составах или составах на основе Lipofectin и им подобных, и их можно получить с помощью способов, хорошо известных специалистам в данной области. Такие способы описаны, например, в патентах США №№ 5593972, 5589466 и 5580859, включенных в данный документ посредством ссылки.In some embodiments, the RNA molecules of the present invention are delivered in liposomal or Lipofectin-based formulations and the like, and can be prepared using methods well known to those skilled in the art. Such methods are described, for example, in U.S. Patent Nos. 5,593,972, 5,589,466, and 5,580,859, incorporated herein by reference.
Были разработаны системы доставки, специально предназначенные для повышения эффективности и улучшения доставки siRNA в клетки млекопитающих (см., например, Shen et al FEBS Let. 2003, 539:111-114; Xia et al., Nat. Biotech. 2002, 20:1006-1010; Reich et al., Mol. Vision. 2003, 9: 210-216; Sorensen et al., J. Mol. Biol. 2003, 327: 761-766; Lewis et al., Nat. Gen. 2002, 32: 107-108 и Simeoni et al., NAR 2003, 31, 11: 2717-2724), и их можно применять в настоящем изобретении. Недавно siRNA успешно применяли для ингибирования экспрессии генов у приматов (см., например, Tolentino et al., Retina 24(4):660, которая также может быть применена по отношению к настоящему изобретению).Delivery systems specifically designed to enhance the efficiency and improve the delivery of siRNA into mammalian cells have been developed (see, for example, Shen et al FEBS Let. 2003, 539:111-114; Xia et al., Nat. Biotech. 2002, 20:1006-1010; Reich et al., Mol. Vision. 2003, 9: 210-216; Sorensen et al., J. Mol. Biol. 2003, 327: 761-766; Lewis et al., Nat. Gen. 2002, 32: 107-108 and Simeoni et al., NAR 2003, 31, 11: 2717-2724), and they can be used in the present invention. Recently, siRNA has been successfully used to inhibit gene expression in primates (see, e.g., Tolentino et al., Retina 24(4):660, which may also be applicable to the present invention).
Qi et al. раскрывают способы эффективного введения siRNA во внутреннее ухо через неповрежденное круглое окно путем трансфекции с помощью новой технологии доставки протеидов, которая может быть применена по отношению к системе нацеливания на нуклеиновую кислоту по настоящему изобретению (см., например, Qi et al., Gene Therapy (2013), 1-9). В частности, успешным было применение доменов TAT, связывающих двухнитевую РНК (TAT-DRBD), с помощью которых можно трансфицировать меченную Cy3 siRNA в клетки внутреннего уха, в том числе внутренние и наружные волосковые клетки, ампулярный гребешок, пятно эллиптического мешочка и пятно сферического мешочка, посредством проникновения через неповрежденное круглое окно, для доставки двухнитевых siRNA in vivo для лечения различных болезней внутреннего уха и сохранения слуховой функции. Приблизительно 40 мкл 10 мМ РНК может быть предусмотрено в качестве дозы для введения в ухо.Qi et al. disclose methods for efficiently delivering siRNA into the inner ear through an intact round window by transfection using a novel protein delivery technology that can be applied to the nucleic acid targeting system of the present invention (see, e.g., Qi et al., Gene Therapy (2013), 1-9). In particular, the use of TAT double-stranded RNA binding domains (TAT-DRBDs) that can transfect Cy3-labeled siRNA into inner ear cells, including inner and outer hair cells, crista ampullae, maculae ellipticae, and maculae sphericae, by penetrating through the intact round window was successful in delivering double-stranded siRNA in vivo for the treatment of various inner ear diseases and preserving auditory function. About 40 μl of 10 mM RNA can be provided as a dose for administration to the ear.
В соответствии с Rejali et al. (Hear Res. 2007 Jun;228(1-2):180-7), функционирование кохлеарных имплантатов можно улучшить путем надлежащего сохранения нейронов спирального ганглия, которые являются мишенью для электростимуляции имплантатом, и ранее было показано, что нейротрофический фактор головного мозга (BDNF) повышает выживаемость спирального ганглия в ушах с экспериментально индуцированной глухотой. Rejali et al. тестировали модифицированную конструкцию электрода кохлеарного имплантата, имеющего покрытие из клеток-фибробластов, трансдуцированных вирусным вектором со вставкой гена BDNF. Для осуществления данного типа переноса генов ex vivo Rejali et al. трансдуцировали фибробласты морской свинки аденовирусом со вставкой кассеты с геном BDNF, и определили, что эти клетки секретируют BDNF, а затем прикрепили клетки, секретирующие BDNF, к электроду кохлеарного имплантата с помощью агарозного геля и имплантировали электрод в барабанную лестницу улитки. Rejali et al. определили, что электроды с экспрессией BDNF были способны обеспечивать сохранение значительно большего количества нейронов спирального ганглия в базальных витках улитки через 48 дней после имплантации по сравнению с контрольными электродами и демонстрировали возможность осуществления терапии с применением кохлеарных имплантатов в комбинации с переносом генов ex vivo для повышения выживаемости нейронов спирального ганглия. Такую систему можно применять для доставки системы нацеливания на нуклеиновую кислоту по настоящему изобретению в ухо.According to Rejali et al. (Hear Res. 2007 Jun;228(1-2):180-7), the performance of cochlear implants can be improved by properly preserving the spiral ganglion neurons that are the target of the implant's electrical stimulation, and brain-derived neurotrophic factor (BDNF) has previously been shown to enhance spiral ganglion survival in ears with experimentally induced deafness. Rejali et al. tested a modified cochlear implant electrode design coated with fibroblast cells transduced with a viral vector containing the BDNF gene insert. To achieve this type of ex vivo gene transfer, Rejali et al. transduced guinea pig fibroblasts with an adenovirus inserting a BDNF gene cassette and found that these cells secreted BDNF, then attached the BDNF-secreting cells to a cochlear implant electrode using an agarose gel and implanted the electrode into the scala tympani of the cochlea. Rejali et al. found that BDNF-expressing electrodes were able to preserve significantly more spiral ganglion neurons in the basal turns of the cochlea 48 days after implantation compared to control electrodes and demonstrated the feasibility of cochlear implant therapy in combination with ex vivo gene transfer to enhance the survival of spiral ganglion neurons. Such a system can be used to deliver the nucleic acid targeting system of the present invention to the ear.
Mukherjea et al. (Antioxidants & Redox Signaling, Volume 13, Number 5, 2010) документально подтверждают, что нокдаун NOX3 с помощью короткой интерферирующей (si) РНК нейтрализовал ототоксичность цисплатина, о чем свидетельствует защита OHC от повреждения и снижение величин сдвига порогов слуховых вызванных потенциалов ствола мозга (ABR). Крысам вводили различные дозы siNOX3 (0,3, 0,6 и 0,9 мкг) и экспрессию NOX3 оценивали с помощью RT-PCR в режиме реального времени. Наименьшая применяемая доза siRNA для NOX3 (0,3 мкг) не демонстрировала какого-либо ингибирования мРНК NOX3 по сравнению с транстимпанальным введением скремблированной siRNA или отсутствием обработки улиток. Однако введение более высоких доз siRNA для NOX3 (0,6 и 0,9 мкг) снижало экспрессию NOX3 по сравнению с контрольной скремблированной siRNA. Такую систему можно применять для транстимпанального введения системы CRISPR-Cas по настоящему изобретению в дозе от приблизительно 2 мг до приблизительно 4 мг CRISPR-Cas для введения человеку.Mukherjea et al. (Antioxidants & Redox Signaling, Volume 13, Number 5, 2010) document that knockdown of NOX3 using short interfering (si)RNA abrogated cisplatin ototoxicity as evidenced by protection of OHCs from injury and reduction in threshold shifts in brainstem auditory evoked potentials (ABRs). Rats were treated with different doses of siNOX3 (0.3, 0.6, and 0.9 μg) and NOX3 expression was assessed by real-time RT-PCR. The lowest dose of NOX3 siRNA used (0.3 μg) did not show any inhibition of NOX3 mRNA compared to transtympanic administration of scrambled siRNA or no cochlea treatment. However, administration of higher doses of siRNA for NOX3 (0.6 and 0.9 μg) reduced NOX3 expression compared to the control scrambled siRNA. Such a system can be used for transtympanic administration of the CRISPR-Cas system of the present invention at a dose of about 2 mg to about 4 mg of CRISPR-Cas for administration to a human.
Jung et al. (Molecular Therapy, vol. 21 no. 4, 834-841 apr. 2013) демонстрируют, что уровни Hes5 в эллиптическом мешочке снижались после внесения siRNA и что количество волосковых клеток в этих эллиптических мешочках было значительно большим, чем после контрольной обработки. Данные позволяют предположить, что технология siRNA может быть применимой для индукции восстановления и регенерации во внутреннем ухе и что сигнальный путь Notch является потенциально применимой мишенью для ингибирования экспрессии конкретного гена. Jung et al. инъецировали 8 мкг siRNA для Hes5 в объеме 2 мкл, полученном путем добавления стерильного нормального физиологического раствора к лиофилизированной siRNA, в вестибулярный эпителий уха. Такую систему можно применять для введения системы, нацеленной на нуклеиновую кислоту, по настоящему изобретению в вестибулярный эпителий уха в дозе от приблизительно 1 до приблизительно 30 мг CRISPR-Cas для введения человеку.Jung et al. (Molecular Therapy, vol. 21 no. 4, 834-841 Apr. 2013) demonstrate that Hes5 levels in the utricle were reduced after siRNA treatment and that the number of hair cells in these utricles was significantly greater than after control treatment. The data suggest that siRNA technology may be useful for inducing repair and regeneration in the inner ear and that the Notch signaling pathway is a potentially useful target for inhibiting specific gene expression. Jung et al. injected 8 μg of Hes5 siRNA in a 2 μl volume, prepared by adding sterile normal saline to lyophilized siRNA, into the vestibular epithelium of the ear. Such a system can be used to administer the nucleic acid targeting system of the present invention to the vestibular epithelium of the ear at a dose of from about 1 to about 30 mg CRISPR-Cas for administration to a human.
Лечение заболеваний глазаTreatment of eye diseases
Настоящее изобретение также предусматривает доставку системы CRISPR-Cas9 в один глаз или оба глаза.The present invention also provides for delivery of the CRISPR-Cas9 system to one eye or both eyes.
В еще одном аспекте настоящего изобретения систему CRISPR-Cas9 можно использовать для коррекции дефектов глаз, которые являются результатом нескольких генетических мутаций, дополнительно описанных в Genetic Diseases of the Eye, Second Edition, edited by Elias I. Traboulsi, Oxford University Press, 2012.In another aspect of the present invention, the CRISPR-Cas9 system can be used to correct eye defects that result from several genetic mutations, further described in Genetic Diseases of the Eye, Second Edition, edited by Elias I. Traboulsi, Oxford University Press, 2012.
Для введения в глаз особенно предпочтительными являются лентивирусные векторы, в частности, вирусы инфекционной анемии лошадей (EIAV).Lentiviral vectors, particularly equine infectious anemia virus (EIAV), are particularly preferred for ocular administration.
В другом варианте осуществления также предусмотрены минимальные лентивирусные векторы для отличных от приматов организмов на основе вируса инфекционной анемии лошадей (EIAV), особенно для генной терапии заболеваний глаз (см., например, Balagaan, J Gene Med 2006; 8: 275 - 285, опубликовано онлайн 21 ноября 2005 г. в Wiley InterScience (www.interscience.wiley.com). DOI: 10.1002/jgm.845). Предусмотрено, что векторы имеют промотор цитомегаловируса (CMV), управляющий экспрессией целевого гена. Также предусмотрена любая из внутрикамерной, субретинальной, внутриглазной и интравитреальной инъекций (см., например, Balagaan, J Gene Med 2006; 8: 275 - 285, опубликовано онлайн 21 ноября 2005 г. в Wiley InterScience (www.interscience.wiley.com). DOI: 10.1002/jgm.845). Внутриглазные инъекции можно осуществлять с помощью операционного микроскопа. В случае субретинальной и интравитреальной инъекций можно выпятить глаза путем осторожного надавливания пальцами и визуализировать глазное дно с помощью системы контактных линз, состоящей из капли раствора контактной среды на роговице, накрытой покровным стеклом для микропрепаратов. При субретинальных инъекциях наконечник иглы 34 калибра на 10 мм, закрепленной на 5-мкл шприце Hamilton, можно при непосредственной визуализации продвигать через экваториальную область верхней части склеры тангенциально к заднему полюсу глазного яблока, пока в субретинальном пространстве не будет видна апертура иглы. Затем можно инъецировать 2 мкл суспензии вектора, вызывая буллезное верхнее отслоение сетчатки, что, таким образом, подтверждает субретинальное введение вектора. В данном подходе производят самогерметизирующийся разрез склеры, позволяющий суспензии вектора удерживаться в субретинальном пространстве до поглощения ее RPE, обычно в течение 48 ч. после процедуры. Эту процедуру можно повторить в нижнем полушарии, вызывая нижнее отслоение сетчатки. Данная методика обуславливает воздействие суспензии вектора на приблизительно 70% нейросенсорной части сетчатки и RPE. В случае интравитреальных инъекций можно продвигать наконечник иглы через склеру на 1 мм кзади от корнеосклерального лимба и инъецировать 2 мкл суспензии вектора в полость стекловидного тела. В случае внутрикамерных инъекций можно продвигать наконечник иглы через парацентез корнеосклерального лимба в направлении центральной части роговицы и можно инъецировать 2 мкл суспензии вектора. В случае внутрикамерных инъекций можно продвигать наконечник иглы через парацентез корнеосклерального лимба в направлении центральной части роговицы и можно инъецировать 2 мкл суспензии вектора. Эти векторы можно инъецировать в титрах 1,0-1,4 × 1010 или 1,0-1,4 × 109 трансдуцирующих единиц (ТЕ)/мл.In another embodiment, minimal lentiviral vectors for non-primate organisms based on equine infectious anemia virus (EIAV) are also provided, especially for gene therapy of eye diseases (see, for example, Balagaan, J Gene Med 2006; 8: 275-285, published online November 21, 2005 in Wiley InterScience (www.interscience.wiley.com). DOI: 10.1002/jgm.845). It is envisaged that the vectors have a cytomegalovirus (CMV) promoter driving expression of a target gene. Any of the intracameral, subretinal, intraocular, and intravitreal injections are also included (see, e.g., Balagaan, J Gene Med 2006; 8: 275–285, published online November 21, 2005, in Wiley InterScience (www.interscience.wiley.com). DOI: 10.1002/jgm.845). Intraocular injections can be performed using an operating microscope. For subretinal and intravitreal injections, the eyes can be bulged by gentle digital pressure and the fundus can be visualized using a contact lens system consisting of a drop of contact medium solution on the cornea covered with a slide cover slip. For subretinal injections, the tip of a 34-gauge 10-mm needle attached to a 5-μl Hamilton syringe can be advanced through the equatorial region of the superior sclera tangentially toward the posterior pole of the globe under direct visualization until the needle aperture is visible in the subretinal space. 2 μl of vector suspension can then be injected, causing a bullous superior retinal detachment, thus confirming subretinal injection of the vector. This approach creates a self-sealing scleral incision that allows the vector suspension to remain in the subretinal space until it is absorbed by the RPE, usually within 48 h after the procedure. This procedure can be repeated in the inferior hemisphere, causing an inferior retinal detachment. This technique results in exposure of approximately 70% of the neurosensory retina and the RPE to the vector suspension. For intravitreal injections, the needle tip can be advanced through the sclera 1 mm posterior to the corneoscleral limbus and 2 μl of the vector suspension can be injected into the vitreous cavity. For intracameral injections, the needle tip can be advanced through the paracentesis of the corneoscleral limbus towards the central cornea and 2 μl of the vector suspension can be injected. For intracameral injections, the needle tip can be advanced through the paracentesis of the corneoscleral limbus towards the central cornea and 2 μl of the vector suspension can be injected. These vectors can be injected at titers of 1.0-1.4 x 10 10 or 1.0-1.4 x 10 9 transducing units (TU)/ml.
В другом варианте осуществления также предусмотрен RetinoStat®, лентивирусный вектор на основе вируса инфекционной анемии лошадей для генной терапии, экспрессирующий ангиостатические белки эндостатин и ангиостатин, который доставляют посредством субретинальной инъекции для лечения влажной формы возрастной дегенерации желтого пятна (см., например, Binley et al., HUMAN GENE THERAPY 23:980-991 (September 2012)). Такой вектор может быть модифицирован для системы CRISPR-Cas9 по настоящему изобретению. Каждый глаз можно обрабатывать любым RetinoStat® в дозе, составляющей 1,1 x 105 трансдуцирующих единиц на глаз (ТЕ/глаз), в общем объеме 100 мкл.Another embodiment also provides RetinoStat®, an equine infectious anemia virus-based lentiviral gene therapy vector expressing the angiostatic proteins endostatin and angiostatin, which is delivered by subretinal injection for the treatment of wet age-related macular degeneration (see, e.g., Binley et al., HUMAN GENE THERAPY 23:980-991 (September 2012)). Such a vector can be modified for the CRISPR-Cas9 system of the present invention. Each eye can be treated with any RetinoStat® at a dose of 1.1 x 10 5 transducing units per eye (TU/eye), in a total volume of 100 μl.
В одном варианте осуществления следует упомянуть WO 2015/153780, который предусматривает лечение или предупреждение первичной остроугольной глаукомы (POAG) с помощью нацеливания на кодирующую последовательность гена MYOC. Некоторые из целевых мутаций, которые приводят к POAG, включают без ограничения P370 (например, P370L); I477 (например, I477N или I477S); T377 (например, TE77R); Q368 (Q368stop) -- все в гене MYOC. Целевая мутация также может включать горячую точку мутагенеза между положениями аминокислотных последовательностей 246-252 в гене MYOC. В одном варианте осуществления целевая мутация представляет собой горячую точку мутагенеза между положениями аминокислотных последовательностей, например, аминокислотами 368-380, аминокислотами 368-370 + 377-380, аминокислотами 364-380 или аминокислотами 347-380 в гене MYOC. В одном варианте осуществления целевая мутация представляет собой горячую точку мутагенеза между положениями аминокислотных последовательностей 423-437 (например, аминокислотами 423-426, аминокислотами 423-427 и аминокислотами 423-437) в гене MYOC. В одном варианте осуществления целевая мутация представляет собой горячую точку мутагенеза между положениями аминокислотных последовательностей 477-502 в гене MYOC (см., например, WO 2015/153780).In one embodiment, reference should be made to WO 2015/153780, which provides for the treatment or prevention of primary acute-angle glaucoma (POAG) by targeting the coding sequence of the MYOC gene. Some of the target mutations that lead to POAG include, but are not limited to, P370 (e.g., P370L); I477 (e.g., I477N or I477S); T377 (e.g., TE77R); Q368 (Q368stop) -- all in the MYOC gene. The target mutation may also include a mutagenesis hotspot between amino acid sequence positions 246-252 in the MYOC gene. In one embodiment, the target mutation is a mutagenesis hotspot between amino acid sequence positions, such as amino acids 368-380, amino acids 368-370 + 377-380, amino acids 364-380, or amino acids 347-380 in the MYOC gene. In one embodiment, the target mutation is a mutagenesis hotspot between amino acid sequence positions 423-437 (e.g., amino acids 423-426, amino acids 423-427, and amino acids 423-437) in the MYOC gene. In one embodiment, the target mutation is a mutagenesis hotspot between amino acid sequence positions 477-502 in the MYOC gene (see, e.g., WO 2015/153780).
В другом варианте осуществления может быть предусмотрен аденовирусный вектор с делецией E1 и частичной делецией E3 и E4 для доставки в глаз. Двадцать восемь пациентов с неоваскулярной возрастной дегенерацией желтого пятна на поздней стадии (AMD) получали однократную интравитреальную инъекцию аденовирусного вектора с делецией E1 и частичной делецией E3 и E4, экспрессирующего фактор пигментного эпителия человека (AdPEDF.ll) (см., например, Campochiaro et al., Human Gene Therapy 17:167-176 (February 2006)). Исследовали дозы, варьирующие в диапазоне от 106 до 109,5 единичных частиц (PU), и не наблюдали серьезных нежелательных событий, связанных с AdPEDF.ll, и дозолимитирующей токсичности (см., например, Campochiaro et al., Human Gene Therapy 17:167-176 (February 2006)). Опосредованный аденовирусными векторами перенос генов в глаза, по-видимому, является действенным подходом для лечения нарушений со стороны органов зрения и может быть применен по отношению к системе CRISPR Cas9.In another embodiment, an adenoviral vector with a deletion of E1 and a partial deletion of E3 and E4 can be provided for delivery to the eye. Twenty-eight patients with advanced neovascular age-related macular degeneration (AMD) received a single intravitreal injection of an adenoviral vector with a deletion of E1 and a partial deletion of E3 and E4 expressing human pigment epithelial factor (AdPEDF.ll) (see, e.g., Campochiaro et al., Human Gene Therapy 17:167-176 (February 2006)). Doses ranging from 106 to 109.5 unit particles (PU) were studied and no AdPEDF.ll-related serious adverse events or dose-limiting toxicity were observed (see, e.g., Campochiaro et al., Human Gene Therapy 17:167-176 (February 2006)). Adenoviral vector-mediated gene transfer to the eye appears to be a viable approach for the treatment of ocular disorders and may be applicable to the CRISPR Cas9 system.
В другом варианте осуществления систему sd-rxRNA® от RXi Pharmaceuticals можно применять для доставки CRISPR Cas9 в глаз и/или приспосабливать к ней. В этой системе однократное интравитреальное введение 3 мкг sd-rxRNA приводит к специфичному относительно последовательности снижению уровней мРНК PPIB в течение 14 дней. Систему sd-rxRNA® можно применять по отношению к системе нацеливания на нуклеиновую кислоту по настоящему изобретению, предусматривая введение человеку дозы CRISPR, составляющей приблизительно 3-20 мг.In another embodiment, the sd-rxRNA® system from RXi Pharmaceuticals can be used to deliver CRISPR Cas9 to the eye and/or adapted thereto. In this system, a single intravitreal administration of 3 μg of sd-rxRNA results in a sequence-specific reduction in PPIB mRNA levels for 14 days. The sd-rxRNA® system can be used in relation to the nucleic acid targeting system of the present invention, involving the administration to a human of a CRISPR dose of about 3-20 mg.
Millington-Ward et al. (Molecular Therapy, vol. 19 no. 4, 642-649 apr. 2011) описывают векторы на основе аденоассоциированного вируса (AAV) для доставки супрессора родопсина, функционирующего на основе РНК-интерференции (RNAi), и замещающего гена родопсина с модифицированными кодонами, устойчивого к супрессии в связи с нуклеотидными изменениями в вырожденных положениях в целевом сайте для RNAi. Осуществляли субретинальную инъекцию либо 6,0 x 108 vp, либо 1,8 x 1010 vp AAV в глаза согласно Millington-Ward et al. Векторы на основе AAV согласно Millington-Ward et al. можно применять в отношении системы CRISPR Cas9 по настоящему изобретению, предусматривая введение человеку дозы от приблизительно 2 x 1011 до приблизительно 6 x 1013 vp.Millington-Ward et al. (Molecular Therapy, vol. 19 no. 4, 642-649 April 2011) describe adeno-associated virus (AAV) vectors for delivery of a rhodopsin suppressor that functions by RNA interference (RNAi) and a codon-engineered rhodopsin replacement gene that is resistant to suppression due to nucleotide changes at degenerate positions within the RNAi target site. Subretinal injection of either 6.0 x 10 8 vp or 1.8 x 10 10 vp AAV was performed into eyes according to Millington-Ward et al. The AAV vectors according to Millington-Ward et al. can be used in relation to the CRISPR Cas9 system of the present invention, providing for administration to a human of a dose of from about 2 x 10 11 to about 6 x 10 13 vp.
Dalkara et al. (Sci Transl Med 5, 189ra76 (2013)) также обращаются к направленной эволюции in vivo для конструирования вектора на основе AAV, доставляющего варианты дефектных генов дикого типа по всей сетчатке после безвредной инъекции в жидкую часть стекловидного тела глаза. Dalkara описывает дисплейную библиотеку 7-мерных пептидов и библиотеку AAV, сконструированную посредством ДНК-шаффлинга генов cap AAV1, 2, 4, 5, 6, 8 и 9. Упаковывали библиотеки rcAAV и векторы на основе rAAV, экспрессирующие GFP под контролем промотора CAG или Rho, и с помощью количественной ПЦР получали титры геномов, устойчивых к действию дезоксирибонуклеаз. Библиотеки объединяли, и проводили два цикла эволюции, каждый из которых состоял из диверсификации исходной библиотеки с последующими тремя этапами отбора in vivo. На каждом таком этапе мышам P30, экспрессирующим rho-GFP, интравитреально инъецировали 2 мл очищенной йодиксанолом и подвергнутой диализу против фосфатно-солевого буфера (PBS) библиотеки с титром геномов приблизительно 1 × 1012 vg/мл. Векторы на основе AAV согласно Dalkara et al. можно применять по отношению системы нацеливания на нуклеиновые кислоты по настоящему изобретению, предусматривая введение человеку дозы, составляющей от приблизительно 1 x 1015 до приблизительно 1 x 1016 vg/мл.Dalkara et al. (Sci Transl Med 5, 189ra76 (2013)) also turn to in vivo directed evolution to construct an AAV-based vector that delivers wild-type variants of defective genes throughout the retina after harmless injection into the aqueous humor of the eye. Dalkara describes a 7-mer peptide display library and an AAV library constructed by DNA shuffling the cap genes of AAV1, 2, 4, 5, 6, 8, and 9. rcAAV libraries and rAAV-based vectors expressing GFP under the control of the CAG or Rho promoter were packaged and titers of DNase-resistant genomes were generated using qPCR. Libraries were pooled and two rounds of evolution were performed, each consisting of diversification of the initial library followed by three rounds of in vivo selection. At each such step, rho-GFP-expressing P30 mice were injected intravitreally with 2 ml of the iodixanol-purified, phosphate-buffered saline (PBS)-dialyzed library at a genome titer of approximately 1 x 10 12 vg/ml. The AAV-based vectors of Dalkara et al. can be used with the nucleic acid targeting system of the present invention, providing for administration to a human of a dose of from about 1 x 10 15 to about 1 x 10 16 vg/ml.
В другом варианте осуществления можно нацеливаться на ген родопсина для лечения пигментного ретинита (RP), где систему согласно публикации заявки на патент США № 20120204282, закрепленной за Sangamo BioSciences, Inc., можно модифицировать по образу системы CRISPR Cas9 по настоящему изобретению.In another embodiment, the rhodopsin gene can be targeted for the treatment of retinitis pigmentosa (RP), wherein the system of U.S. Patent Application Publication No. 20120204282 assigned to Sangamo BioSciences, Inc. can be modified in the image of the CRISPR Cas9 system of the present invention.
В другом варианте осуществления способы согласно публикации заявки на патент США № 20130183282, закрепленной за Cellectis, направленной на способы расщепления целевой последовательности гена родопсина человека, можно также модифицировать для системы нацеливания на нуклеиновую кислоту по настоящему изобретению.In another embodiment, the methods of U.S. Patent Application Publication No. 20130183282 assigned to Cellectis, directed to methods for cleaving a target sequence of the human rhodopsin gene, may also be modified for the nucleic acid targeting system of the present invention.
Публикация заявки на патент США № 20130202678, закрепленная за Academia Sinica, относится к способам лечения форм ретинопатии и офтальмологических нарушений с угрозой потери зрения, относящимся к доставке гена Puf-A (экспрессируемого в ганглиозных и пигментных клетках сетчатки в тканях глаза и проявляющего уникальную антиапоптотическую активность) в субретинальное или интравитреальное пространство глаза. В частности, желаемые мишени представляют собой zgc:193933, prdm1a, spata2, tex10, rbb4, ddx3, zp2.2, Blimp-1 и HtrA2, на все из которых можно нацеливаться с помощью системы нацеливания на нуклеиновую кислоту по настоящему изобретению.U.S. Patent Application Publication No. 20130202678 assigned to Academia Sinica relates to methods for treating forms of retinopathy and vision-threatening ophthalmologic disorders relating to the delivery of the Puf-A gene (expressed in retinal ganglion and pigment cells in ocular tissues and exhibiting unique anti-apoptotic activity) to the subretinal or intravitreal space of the eye. Specifically, desired targets are zgc:193933, prdm1a, spata2, tex10, rbb4, ddx3, zp2.2, Blimp-1, and HtrA2, all of which can be targeted using the nucleic acid targeting system of the present invention.
Wu (Cell Stem Cell,13:659-62, 2013) разработал направляющую РНК, которая нацеливает Cas9 на местоположение мутации в одной паре оснований, вызывающей формы катаракты у мышей, где он индуцирует расщепление ДНК. Затем с помощью другого аллеля дикого типа или олигонуклеотидов, вводимых в зиготы, механизмы репарации корректируют последовательность поврежденного аллеля и корректируют генетический дефект, вызывающий катаракту, у мутантной мыши.Wu (Cell Stem Cell, 13:659–62, 2013) developed a guide RNA that targets Cas9 to the location of a single base pair mutation that causes forms of cataracts in mice, where it induces DNA cleavage. Then, using another wild-type allele or oligonucleotides introduced into zygotes, repair mechanisms correct the sequence of the damaged allele and correct the genetic defect that causes cataracts in the mutant mouse.
В публикации заявки на патент США № 20120159653 описывается применение нуклеаз с "цинковыми пальцами" для генетической модификации клеток, животных и белков, ассоциированных с дегенерацией желтого пятна (MD). Дегенерация желтого пятна (MD) является основной причиной ухудшения зрения у лиц пожилого возраста, однако также является характерным симптомом детских заболеваний, таких как болезнь Штаргардта, дистрофия глазного дна Сорсби и летальные детские нейродегенеративные заболевания, при этом начало заболеваний проявляется уже в младенческом возрасте. Дегенерация желтого пятна приводит к потере зрения в центре поля зрения (желтом пятне) по причине поражения сетчатки. Существующие в настоящее время животные модели не воспроизводят основные отличительные признаки заболевания, как это наблюдается у людей. В доступных животных моделях, содержащих мутантные гены, кодирующие белки, ассоциированные с MD, также получают крайне изменчивые фенотипы, переходя к проблематике заболевания человека и разработке способов терапии.U.S. Patent Application Publication No. 20120159653 describes the use of zinc finger nucleases to genetically modify cells, animals, and proteins associated with macular degeneration (MD). Macular degeneration (MD) is a leading cause of visual impairment in the elderly, but is also a hallmark of childhood diseases such as Stargardt disease, Sorsby ocular dystrophy, and fatal childhood neurodegenerative diseases, with onset occurring in infancy. Macular degeneration results in vision loss in the center of the visual field (the macula) due to damage to the retina. Currently available animal models do not reproduce the key hallmarks of the disease as seen in humans. Available animal models containing mutant genes encoding proteins associated with MD also produce highly variable phenotypes, moving toward understanding the human disease and developing therapeutics.
Один аспект публикации заявки на патент США № 20120159653 относится к редактированию любых хромосомных последовательностей, которые кодируют белки, ассоциированные с MD, что можно применять в отношении системы нацеливания на нуклеиновую кислоту по настоящему изобретению. Белки, ассоциированные с MD, как правило, выбирают, исходя из экспериментально установленной взаимосвязи белка, ассоциированного с MD, при нарушении MD. Например, скорость образования или циркулирующая концентрация белка, связанного с MD, может быть повышенной или пониженной в популяции с нарушением с MD по сравнению с популяцией без нарушения с MD. Различия по уровням белка можно оценить с помощью протеомных методик, в том числе без ограничения вестерн-блоттинга, иммуногистохимического окрашивания, твердофазного иммуноферментного анализа (ELISA) и масс-спектрометрии. Альтернативно белки, ассоциированные с MD, можно идентифицировать путем получения профилей экспрессии генов для генов, кодирующих белки, с помощью методик геномного анализа, в том числе без ограничения микроматричного анализа ДНК, последовательного анализа экспрессии генов (SAGE) и количественной полимеразной цепной реакции в режиме реального времени (Q-PCR).One aspect of U.S. Patent Application Publication No. 20120159653 relates to editing any chromosomal sequences that encode proteins associated with MD, which may be used with respect to the nucleic acid targeting system of the present invention. Proteins associated with MD are typically selected based on an experimentally established relationship of the MD-associated protein to the MD disorder. For example, the rate of production or circulating concentration of a protein associated with MD may be increased or decreased in a population with an MD disorder compared to a population without an MD disorder. Differences in protein levels may be assessed using proteomic techniques, including, but not limited to, Western blotting, immunohistochemical staining, enzyme-linked immunosorbent assay (ELISA), and mass spectrometry. Alternatively, proteins associated with MD can be identified by obtaining gene expression profiles for protein-coding genes using genomic analysis techniques, including but not limited to DNA microarray analysis, sequence-based analysis of gene expression (SAGE), and quantitative real-time polymerase chain reaction (Q-PCR).
В качестве неограничивающего примера белки, ассоциированные с MD, включают без ограничения следующие белки: представитель 4 (ABCA4) подсемейства A (ABC1) АТФ-связывающей кассеты, ACHM1 - белок 1, ассоциированный с ахроматопсией (палочковым монохроматизмом), ApoE - аполипопротеин E (ApoE), C1QTNF5 (CTRP5) - C1q/белок 5, родственный фактору некроза опухолей (C1QTNF5), C2 - компонент 2 системы комплемента (C2), компонент C3 системы комплемента (C3), CCL2 - хемокиновый лиганд 2 (с мотивом C-C) (CCL2), CCR2 - рецептор хемокина 2 (с мотивом C-C) (CCR2), CD36 - кластер дифференцировки 36, CFB - фактор B системы комплемента, CFH - фактор H системы комплемента (CFH), CFHR1 - белок 1, родственный фактору H системы комплемента, CFHR3 - белок 3, родственный фактору H системы комплемента, CNGB3 - бета-3-субъединица ионного канала, регулируемого циклическими нуклеотидами, CP - церулоплазмин (CP), CRP - C-реактивный белок (CRP) CST3 - цистатин C или цистатин 3 (CST3), CTSD - катепсин D (CTSD), CX3CR1 - рецептор хемокина 1 (с мотивом C-X3-C), ELOVL4 - белок 4, отвечающий за удлинение жирных кислот с очень длинной цепью, ERCC6 - белок эксцизионной репарации, вступающий в перекрестную комплементацию, корректирующий дефицит репарации у грызунов, комплементационная группа 6, FBLN5 - фибулин-5, FBLN5 - фибулин 5, FBLN6 - фибулин 6, FSCN2 - фасцин (FSCN2), HMCN1 - гемицентрин 1, HMCN1 - гемицентрин 1, HTRA1 - сериновая пептидаза HtrA 1 (HTRA1), HTRA1 - сериновая пептидаза HtrA 1, IL-6 - интерлейкин 6, IL-8 - интерлейкин 8, LOC387715 - гипотетический белок, PLEKHA1 - белок, содержащий плекстрин-гомологичный домен, представитель 1 семейства A (PLEKHA1), PROM1 - проминин 1 (PROM1 или CD133), PRPH2 - периферин-2, RPGR - регулятор ГТФазы, ассоциированный с пигментным ретинитом, SERPING1 - ингибитор сериновой пептидазы, представитель 1 клады G (C1-ингибитор), TCOF1 - Treacle, TIMP3 - ингибитор 3 металлопротеиназ (TIMP3), TLR3 - Toll-подобный рецептор 3.By way of non-limiting example, proteins associated with MD include, but are not limited to, the following proteins: ATP-binding cassette subfamily A (ABC1) member 4 (ABCA4), ACHM1 - achromatopsia (rod monochromatism)-associated protein 1, ApoE - apolipoprotein E (ApoE), C1QTNF5 (CTRP5) - C1q/tumor necrosis factor-related protein 5 (C1QTNF5), C2 - complement component 2 (C2), complement component C3 (C3), CCL2 - chemokine ligand 2 (CCL2), CCR2 - chemokine receptor 2 (CCR2), CD36 - cluster of differentiation 36, CFB - complement factor B, CFH - complement factor H complement (CFH), CFHR1 - complement factor H-related protein 1, CFHR3 - complement factor H-related protein 3, CNGB3 - cyclic nucleotide-regulated ion channel beta-3, CP - ceruloplasmin (CP), CRP - C-reactive protein (CRP) CST3 - cystatin C or cystatin 3 (CST3), CTSD - cathepsin D (CTSD), CX3CR1 - receptor for chemokine 1 (with a C-X3-C motif), ELOVL4 - very long-chain fatty acid elongation protein 4, ERCC6 - excision repair cross-complementing protein correcting rodent excision repair deficiency, complementation group 6, FBLN5 - fibulin-5, FBLN5 - fibulin 5, FBLN6 - fibulin 6, FSCN2 - fascin (FSCN2), HMCN1 - hemicentrin 1, HMCN1 - hemicentrin 1, HTRA1 - serine peptidase HtrA 1 (HTRA1), HTRA1 - serine peptidase HtrA 1, IL-6 - interleukin 6, IL-8 - interleukin 8, LOC387715 - hypothetical protein, PLEKHA1 - pleckstrin homology domain-containing protein, family A member 1 (PLEKHA1), PROM1 - prominin 1 (PROM1 or CD133), PRPH2 - peripherin-2, RPGR - retinitis pigmentosa-associated GTPase regulator, SERPING1 - serine peptidase inhibitor, clade G member 1 (C1-inhibitor), TCOF1 - Treacle, TIMP3 - inhibitor of metalloproteinase 3 (TIMP3), TLR3 - Toll-like receptor 3.
Идентичность белка, ассоциированного с MD, редактирование хромосомной последовательности которого осуществляют, может и будет варьировать. В предпочтительном варианте осуществления белки, ассоциированные с MD, редактирование хромосомных последовательностей которых осуществляют, могут представлять собой белок представитель 4 (ABCA4) подсемейства A (ABC1) АТФ-связывающей кассеты, кодируемый геном ABCR, белок аполипопротеин E (APOE), кодируемый геном APOE, белок хемокиновый лиганд 2 (с мотивом C-C) (CCL2), кодируемый геном CCL2, белок рецептор хемокина 2 (с мотивом C-C) (CCR2), кодируемый геном CCR2, белок церулоплазмин (CP), кодируемый геном CP, белок катепсин D (CTSD), кодируемый геном CTSD, или белок ингибитор 3 металлопротеиназ (TIMP3), кодируемый геном TIMP3. В иллюстративном варианте осуществления генетически модифицированное животное представляет собой крысу, и редактируемые хромосомные последовательности, кодирующие белок, ассоциированный с MD, могут быть следующими: NM_000350 (ABCA4) для представителя 4 подсемейства A (ABC1) АТФ-связывающей кассеты, NM_138828 (APOE) для аполипопротеина E APOE, NM_031530 (CCL2) для хемокинового лиганда 2 (с мотивом C-C) CCL2, NM_021866 (CCR2) для рецептора хемокина 2 (с мотивом C-C) CCR2, NM_012532 (CP) для церулоплазмина CP, NM_134334 (CTSD) для катепсина D CTSD, NM_012886 (TIMP3) для ингибитора 3 металлопротеиназ TIMP3. Животное или клетка могут содержать 1, 2, 3, 4, 5, 6, 7 или более хромосомных последовательностей с нарушенной структурой, кодирующих белок, ассоциированный с MD, и ноль, 1, 2, 3, 4, 5, 6, 7 или более интегрированных в хромосомы последовательностей, кодирующих белок с нарушенной структурой, ассоциированный с MD.The identity of the MD-associated protein whose chromosomal sequence is edited can and will vary. In a preferred embodiment, the MD-associated proteins whose chromosomal sequences are edited can be the ATP-binding cassette subfamily A (ABC1) member 4 (ABCA4) protein encoded by the ABCR gene, the apolipoprotein E (APOE) protein encoded by the APOE gene, the chemokine (C-C motif) ligand 2 (CCL2) protein encoded by the CCL2 gene, the chemokine (C-C motif) receptor 2 (CCR2) protein encoded by the CCR2 gene, the ceruloplasmin (CP) protein encoded by the CP gene, the cathepsin D (CTSD) protein encoded by the CTSD gene, or the metalloproteinase inhibitor 3 (TIMP3) protein encoded by the TIMP3 gene. In an exemplary embodiment, the genetically modified animal is a rat and the edited chromosomal sequences encoding a protein associated with MD may be the following: NM_000350 (ABCA4) for ATP-binding cassette subfamily A member 4 (ABC1), NM_138828 (APOE) for APOE apolipoprotein E, NM_031530 (CCL2) for CCL2 chemokine (C-C motif) ligand 2, NM_021866 (CCR2) for CCR2 chemokine (C-C motif) receptor 2, NM_012532 (CP) for CP ceruloplasmin, NM_134334 (CTSD) for CTSD cathepsin D, NM_012886 (TIMP3) for a TIMP3 inhibitor of 3 metalloproteinases. The animal or cell may contain 1, 2, 3, 4, 5, 6, 7 or more chromosomal sequences with a disrupted structure encoding a protein associated with MD, and zero, 1, 2, 3, 4, 5, 6, 7 or more chromosomally integrated sequences encoding a protein with a disrupted structure associated with MD.
Отредактированную или интегрированную хромосомную последовательность можно модифицировать так, чтобы она кодировала измененный белок, ассоциированный с MD. Некоторые мутации в хромосомных последовательностях, связанных с MD, были ассоциированы с MD. Неограничивающие примеры мутаций в хромосомных последовательностях, ассоциированных с MD, включают те мутации, которые могут вызывать MD, в том числе в белке ABCR - E471K (т.е. глутамат в положении 471 заменен на лизин), R1129L (т.е. аргинин в положении 1129 заменен на лейцин), T1428M (т.е. треонин в положении 1428 заменен на метионин), R1517S (т.е. аргинин в положении 1517 заменен на серин), I1562T (т.е. изолейцин в положении 1562 заменен на треонин) и G1578R (т.е. глицин в положении 1578 заменен на аргинин); в белке CCR2 - V64I (т.е. валин в положении 192 заменен на изолейцин); в белке CP - G969B (т.е. глицин в положении 969 заменен на аспарагин или аспартат); в белке TIMP3 - S156C (т.е. серин в положении 156 заменен на цистеин), G166C (т.е. глицин в положении 166 заменен на цистеин), G167C (т.е. глицин в положении 167 заменен на цистеин), Y168C (т.е. тирозин в положении 168 заменен на цистеин), S170C (т.е. серин в положении 170 заменен на цистеин), Y172C (т.е. тирозин в положении 172 заменен на цистеин) и S181C (т.е. серин в положении 181 заменен на цистеин). Из уровня техники известны и другие взаимосвязи генных вариантов генов, ассоциированных с MD, и заболевания.The edited or integrated chromosomal sequence can be modified to encode an altered protein associated with MD. Several mutations in chromosomal sequences associated with MD have been associated with MD. Non-limiting examples of mutations in chromosomal sequences associated with MD include those mutations that can cause MD, including in the ABCR protein - E471K (i.e., glutamate at position 471 is replaced by lysine), R1129L (i.e., arginine at position 1129 is replaced by leucine), T1428M (i.e., threonine at position 1428 is replaced by methionine), R1517S (i.e., arginine at position 1517 is replaced by serine), I1562T (i.e., isoleucine at position 1562 is replaced by threonine), and G1578R (i.e., glycine at position 1578 is replaced by arginine); in the CCR2 protein - V64I (i.e., valine at position 192 is replaced by isoleucine); in the CP protein - G969B (i.e. glycine at position 969 is replaced by asparagine or aspartate); in the TIMP3 protein - S156C (i.e. serine at position 156 is replaced by cysteine), G166C (i.e. glycine at position 166 is replaced by cysteine), G167C (i.e. glycine at position 167 is replaced by cysteine), Y168C (i.e. tyrosine at position 168 is replaced by cysteine), S170C (i.e. serine at position 170 is replaced by cysteine), Y172C (i.e. tyrosine at position 172 is replaced by cysteine) and S181C (i.e. serine at position 181 is replaced by cysteine). Other relationships between gene variants of genes associated with MD and the disease are known from the prior art.
Лечение сердечно-сосудистых и мышечных заболеванийTreatment of cardiovascular and muscular diseases
Настоящее изобретение также предусматривает доставку системы CRISPR-Cas, описанной в данном документе, например, систем эффекторного белка Cas9, в сердце. Для сердца предпочтительным является тропный к миокарду аденоассоциированный вирус (AAVM), в частности, AAVM41, при использовании которого продемонстрирован преимущественный перенос генов в сердце (см., например, Lin-Yanga et al., PNAS, March 10, 2009, vol. 106, no. 10). Введение может быть системным или местным. Доза приблизительно 1-10 x 1014 векторных геномов предусматривается для системного введения. См. также, например, Eulalio et al. (2012) Nature 492: 376 и Somasuntharam et al. (2013) Biomaterials 34: 7790.The present invention also provides for delivery of the CRISPR-Cas system described herein, such as the Cas9 effector protein systems, to the heart. Preferred for the heart is a myocardial-tropic adeno-associated virus (AAVM), particularly AAVM41, which has been shown to preferentially transfer genes to the heart (see, e.g., Lin-Yanga et al., PNAS, March 10, 2009, vol. 106, no. 10). Administration may be systemic or local. A dose of about 1-10 x 10 14 vector genomes is contemplated for systemic administration. See also, e.g., Eulalio et al. (2012) Nature 492: 376 and Somasuntharam et al. (2013) Biomaterials 34: 7790.
Например, в публикации заявки на патент США № 20110023139 описывается применение нуклеаз с "цинковыми пальцами" для генетической модификации клеток, животных и белков, ассоциированных с сердечно-сосудистым заболеванием. Сердечно-сосудистые заболевания, как правило, включают высокое кровяное давление, сердечные приступы, сердечную недостаточность и инсульт, а также TIA. Любую хромосомную последовательность, связанную с сердечно-сосудистым заболеванием, или белок, кодируемый любой хромосомной последовательностью, связанной с сердечно-сосудистым заболеванием, можно использовать в способах, описанных в настоящем изобретении. Белки, связанные с сердечно-сосудистым заболеванием, как правило, выбирают на основании экспериментально установленной ассоциации белка, связанного с сердечно-сосудистым заболеванием, с развитием сердечно-сосудистого заболевания. Например, скорость образования или концентрация в кровотоке белка, связанного с сердечно-сосудистым заболеванием, может быть повышенной или пониженной в популяции с сердечно-сосудистым заболеванием по сравнению с популяцией без сердечно-сосудистого заболевания. Различия по уровням белка можно оценить с помощью протеомных методик, в том числе без ограничения вестерн-блоттинга, иммуногистохимического окрашивания, твердофазного иммуноферментного анализа (ELISA) и масс-спектрометрии. Альтернативно белки, связанные с сердечно-сосудистым заболеванием, можно идентифицировать путем получения профилей генной экспрессии для генов, кодирующих белки, с помощью методик геномного анализа, в том числе без ограничения микроматричного анализа ДНК, последовательного анализа экспрессии генов (SAGE) и количественной полимеразной цепной реакции в режиме реального времени (Q-PCR).For example, U.S. Patent Application Publication No. 20110023139 describes the use of zinc finger nucleases to genetically modify cells, animals, and proteins associated with cardiovascular disease. Cardiovascular diseases typically include high blood pressure, heart attacks, heart failure, and stroke, as well as TIA. Any chromosomal sequence associated with cardiovascular disease, or a protein encoded by any chromosomal sequence associated with cardiovascular disease, can be used in the methods described herein. Proteins associated with cardiovascular disease are typically selected based on an experimentally established association of a protein associated with cardiovascular disease with the development of cardiovascular disease. For example, the rate of production or circulating concentration of a protein associated with cardiovascular disease may be increased or decreased in a population with cardiovascular disease compared to a population without cardiovascular disease. Differences in protein levels can be assessed using proteomic techniques, including but not limited to Western blotting, immunohistochemical staining, enzyme-linked immunosorbent assay (ELISA), and mass spectrometry. Alternatively, proteins associated with cardiovascular disease can be identified by generating gene expression profiles for the genes encoding the proteins using genomic analysis techniques, including but not limited to DNA microarray analysis, sequence-based analysis of gene expression (SAGE), and quantitative real-time polymerase chain reaction (Q-PCR).
В качестве примера хромосомная последовательность может включать без ограничения IL1B (интерлейкин 1, бета), XDH (ксантиндегидрогеназу), TP53 (опухолевый белок p53), PTGIS (простагландин 12 (простациклин) синтазу), MB (миоглобин), IL4 (интерлейкин 4), ANGPT1 (ангиопоэтин 1), ABCG8 (АТФ-связывающую кассету, подсемейство G (WHITE), представитель 8), CTSK (катепсин K), PTGIR (рецептор простангландина 12 (простациклина) (IP)), KCNJ11 (калиевый канал внутреннего выпрямления, подсемейство J, представитель 11), INS (инсулин), CRP (C-реактивный белок, связанный с пентраксином), PDGFRB (тромбоцитарный фактор роста, бета-полипептид), CCNA2 (циклин A2), PDGFB (гомолог онкогена бета-полипептида тромбоцитарного фактора роста (вируса саркомы обезьян (v-sis))), KCNJ5 (калиевый канал внутреннего выпрямления, подсемейство J, представитель 5), KCNN3 (калиевый, активируемый кальцием канал, промежуточного/низкого проведения, подсемейство N, представитель 3), CAPN10 (кальпаин 10), PTGES (простагландин E синтаза), ADRA2B (альфа-2B-адренергический рецептор), ABCG5 (АТФ-связывающую кассету, подсемейство G (WHITE), представитель 5), PRDX2 (пероксиредоксин 2), CAPN5 (кальпаин 5), PARP14 (семейство поли (АДФ-рибозо) полимераз, представитель 14), MEX3C (гомолог C mex-3 (C. elegans)), ACE ангиотензин I-конвертирующий фермент (пептидил-дипептидазу A) 1), TNF (фактор некроза опухоли (суперсемейство TNF, представитель 2)), IL6 (интерлейкин 6 (интерферон, бета 2)), STN (статин), SERPINE1 (ингибитор серпинпептидазы, клада E (нексин, ингибитор активатора плазминогена 1 типа), представитель 1), ALB (альбумин), ADIPOQ (адипонектин, содержащий C1Q и коллагеновый домен), APOB (аполипопротеин B (в том числе антиген Ag(x))), APOE (аполипопротеин E), LEP (лептин), MTHFR (5,10-метилентетрагидрофолатредуктаза (NADPH)), APOA1 (аполипопротеин A-I), EDN1 (эндотелин 1), NPPB (предшественник натрийуретического пептида B), NOS3 (синтазу оксида азота 3 типа (эндотелиальная клетка)), PPARG (гамма-рецептор, активируемый пролифератором пероксисом), PLAT (активатор плазминогена, тканевой), PTGS2 (простагландин-эндопероксидсинтазу 2 типа (простагландин G/H синтазу и циклооксигеназу)), CETP (транспортный белок холестериновых эфиров, плазменный), AGTR1 (рецептор антиотензина II, 1 тип), HMGCR (3-гидрокси-3-метилглутарил-кофермент A редуктазу), IGF1 (инсулинподобный фактор роста 1 (соматомедин C)), SELE (селектин E), REN (ренин), PPARA (альфа-рецептор, активируемый пролифератором пероксисом), PON1 (параоксоназу 1), KNG1 (кининоген 1), CCL2 (хемокиновый лиганд 2 (с мотивом C-C)), LPL (липопротеинлипазу), VWF (фактор фон Виллебранда), F2 (фактор коагуляции II (тромбин)), ICAM1 (молекулу межклеточной адгезии 1), TGFB1 (трансформирующий фактор роста, бета 1), NPPA (предшественник натрийуретического пептида A), IL10 (интерлейкин 10), EPO (эритропоэтин), SOD1 (супероксиддисмутазу 1, растворимую), VCAM1 (молекулу адгезии эндотелия сосудов 1 типа), IFNG (интерферон, гамма), LPA (липопротеин, Lp(a)), MPO (миелопероксидазу), ESR1 (эстрогеновый рецептор 1), MAPK1 (митоген-активируемую протеинкиназу 1), HP (гаптоглобин), F3 (фактор коагуляции III (тромбопластин, тканевой фактор)), CST3 (цистатин C), COG2 (компонент олигомерного комплекса Гольджи 2 типа), MMP9 (матриксную металлопептидазу 9 (желатиназу B, желатиназу размером 92 кДа, коллагеназу IV типа размером 92 кДа)), SERPINC1 (ингибитор серпинпептидазы, клада C (антитромбин), представитель 1), F8 (фактор коагуляции VIII, прокоагулянтный компонент), HMOX1 (гемоксигеназу (дециклическую) 1 типа), APOC3 (аполипопротеин C-III), IL8 (интерлейкин 8), PROK1 (прокинетицин 1), CBS (цистатионин-бета-синтазу), NOS2 (синтазу оксида натрия 2 типа, индуцируемую), TLR4 (toll-подобный рецептор 4 типа), SELP (селектин P (гранульный мембранный белок размером 140 кДа, антиген CD62)), ABCA1 (АТФ-связывающую кассету, подсемейство A (ABC1), представитель 1), AGT (ангиотензин (ингибитор серпинпептидазы, клада A, представитель 8)), LDLR (рецептор липопротеина низкой плотности), GPT (глутамат-пируваттрансаминазу (аланинаминотрансферазу)), VEGFA (фактор роста эндотелия сосудов A), NR3C2 (ядерный рецептор, подсемейство 3, группа C, представитель 2), IL18 (интерлейкин 18 (фактор индукции интерферона гамма)), NOS1 (синтазу оксида азота 1 типа (нейрональную)), NR3C1 (ядерный рецептор, подсемейство 3, группа C, представитель 1 (глюкокортикоидный рецептор)), FGB (бета-цепь фибриногена), HGF (фактор роста гепатоцитов (гепатопоэтин A; рассеивающий фактор)), IL1A (интерлейин 1, альфа), RETN (резистин), AKT1 (гомолог онкогена вируса тимомы мышей 1 типа v-akt), LIPC (липазу, печеночную), HSPD1 (белок теплового шока 1 типа размером 60 кДА (шаперонин)), MAPK14 (митоген-активируемую протеинкиназу 14), SPP1 (секретируемый фосфопротеин 1), ITGB3 (интегрин, бета 3 (тромбоцитарный гликопротеин 111a, антиген CD61)), CAT (каталазу), UTS2 (уротензин 2), THBD (тромбомодулин), F10 (фактор коагуляции X), CP (церулоплазмин (ферроксидазу)), TNFRSF11B (суперсемейство фактора некроза опухоли, представитель 11b), EDNRA (рецептор эндотелина типа A), EGFR (рецептор эпидермального фактора роста (гомолог онкогена вируса эритробластического лейкоза (v-erb-b), птичьего)), MMP2 (матриксную металлопептидазу 2 (желатиназу A, желатиназу с массой 72 кДа, коллагеназу IV типа размером 72 кДа)), PLG (плазминоген), NPY (нейропептид Y), RHOD (семейство генов гомологов ras, представитель D), MAPK8 (митоген-активируемую протеинкиназу 8), MYC (гомолог онкогена вируса миелоцистоматоза v-myc (птичьего)), FN1 (фибронектин 1), CMA1 (химазу 1, тучная клетка), PLAU (активатор плазминогена, урокиназу), GNB3 (гуанин-нуклеотид-связывающий белок (G-белок), бета-полипептид 3 типа), ADRB2 (адренергический бета-2-рецептор, поверхностный), APOA5 (аполипопротеин A-V), SOD2 (супероксиддисмутазу 2, митохондриальную), F5 (фактор коагуляции V (проакселерин, лабильный фактор)), VDR (рецептор витамина D (1,25-дигидроксивитамина D3), ALOX5 (арахидонат 5-липооксигеназу), HLA-DRB1 (главный комплекс гистосовместимости, класс II, DR бета 1), PARP1 (поли (АДФ-рибозо) полимеразу 1 типа), CD40LG (лиганд CD40), PON2 (параоксоназу 2), AGER (рецептор, специфичный к конечным продуктам дополнительного гликозилирования), IRS1 (субстрат для инсулинового рецептора 1 типа), PTGS1 (простагландин-эндопероксидсинтазу 1 типа (простагландин G/H синтазу и циклооксигеназу)), ECE1 (эндотелин-превращающий фермент 1 типа), F7 (фактор коагуляции VII (сывороточный ускоритель превращения тромбина)), URN (антагонист рецептора интерлейкина 1), EPHX2 (эпоксидгидролазу 2 типа, цитоплазматическую), IGFBP1 (связывающий белок инсулинподобного фактора роста 1 типа), MAPK10 (митоген-активируемую протеинкиназу 10), FAS (Fas (суперсемейство рецепторов TNF, представитель 6)), ABCB1 (АТФ-связывающую кассету, подсемейство B (MDR/TAP), представитель 1), JUN (онкоген jun), IGFBP3 (связывающий белок инсулинподобного фактора роста 3 типа), CD14 (молекулу CD14), PDE5A (фосфодиэстеразу 5A, cGMP-специфичную), AGTR2 (рецептор ангиотензина II, 2 тип), CD40 (молекулу CD40, представитель 5 суперсемейства рецепторов TNF), LCAT (лецитин-холестерин-ацилтрансферазу), CCR5 (хемокиновый рецептор 5 типа (с мотивом C-C)), MMP1 (матриксную металлопептидазу 1 (интерстициальную коллагеназу)), TIMP1 (ингибитор металлопептидазы TIMP 1 типа), ADM (адреномедуллин), DYT10 (дистонию 10), STAT3 (передатчик сигнала и активатор транскрипции 3 типа (фактор ответа острой фазы)), MMP3 (матриксную металлопептидазу 3 (стромелизин 1, прожелатиназу)), ELN (эластин), USF1 (фактор транскрипции, связывающийся перед сайтом инициации транскрипции 1), CFH (фактор комплемента H), HSPA4 (белок теплового шока 4 размером 70 кДа), MMP12 (матриксную металлопептидазу 12 (макрофагальную эластазу)), MME (мембранную металлоэндопептидазу), F2R (рецептор фактора коагуляции II (тромбина)), SELL (селектин L), CTSB (катепсин B), ANXA5 (аннексин A5), ADRB1 (адренергический бета-1-рецептор), CYBA (цитохром b-245, альфа-пептид), FGA (альфа-цепь фибриногена), GGT1 (гамма-глутамилтрансферазу 1), LIPG (липазу, эндотелиальную), HIF1A (фактор, индуцируемый гипоксией 1, альфа-субъединицу (фактор транскрипции основной структуры спираль-петля-спираль)), CXCR4 (хемокиновый рецептор 4 (с мотивом C-X-C)), PROC (белок C (инактиватор факторов коагуляции Va и VIIIa)), SCARB1 (фагоцитарный рецептор, класс B, представитель 1), CD79A (молекулу CD79a, иммуноглобулин-ассоциированную альфа), PLTP (белок переноса фосфолипидов), ADD1 (аддуцин 1 (альфа)), FGG (гамма-цепь фибриногена), SAA1 (сывороточный амилоид A1), KCNH2 (калиевый потенциалзависимый канал, семейство H (eag-связанный), представитель 2), DPP4 (дипептидилпептидазу 4), G6PD (глюкозо-6-фосфатдегидрогеназу), NPR1 (натрийуретический пептидный рецептор A/гуанилатциклазу A (атрионатрийуретический пептидный рецептор A)), VTN (витронектин), KIAA0101 (KIAA0101), FOS (гомолог онкогена вируса остеосаркомы мышей FBJ), TLR2 (toll-подобный рецептор 2), PPIG (пептидилпролинизомеразу G (циклопролин G)), IL1R1 (рецептор интерлейкина I типа), AR (андрогеновый рецептор), CYP1A1 (цитохром P450, семейство 1, подсемейство A, полипептид 1), SERPINA1 (ингибитор серпинпептидазы, клада A (альфа-1 антипротеиназу, антитрипсин), представитель 1), MTR (5-метилтетрагидрофолат-госоцистеинметилтрансферазу), RBP4 (ретинол-связывающий белок 4 типа, плазменный), APOA4 (аполипопротеин A-IV), CDKN2A (циклин-зависимый ингибитор киназы 2A (меланома, p16, ингибирует CDK4)), FGF2 (фактор роста фибробластов 2 (основной)), EDNRB (эндотелиновый рецептор B типа), ITGA2 (интегрин, альфа 2 (CD49B, альфа 2 субъединицу VLA-2 рецептора)), CABIN1 (кальцинейрин-связывающий белок 1), SHBG (глобулин, связывающийся с половыми гормонами), HMGB1 (группу белков с высокой подвижностью 1 типа), HSP90B2P (белок теплового шока размером 90 кДА, бета (Grp94), представитель 2 (псевдоген)), CYP3A4 (цитохром P450, семейство 3, подсемейство A, полипептид 4), GJA1 (белок межклеточных щелевых контактов, альфа 1, 43 кДа), CAV1 (кавеолин 1, белок кавеол, 22 кДа), ESR2 (эстрогеновый рецептор 2 (ER бета)), LTA (лимфотоксин альфа (суперсемейство TNF, представитель 1)), GDF15 (фактор роста и дифференцировки 15), BDNF (нейротрофический фактор головного мозга), CYP2D6 (цитохром P450, семейство 2, подсемейство D, полипептид 6), NGF (фактор роста нервов (бета-полипептид)), SP1 (фактор транкрипции Sp1), TGIF1 (TGFB-индуцируемый фактор гомеобокс 1), SRC (гомолог онкогена вируса саркомы v-src (Schmidt-Ruppin A-2) (птичьего)), EGF (эпидермальный фактор роста (бета-урогастрон)), PIK3CG (фосфоинозитид-3-киназу, каталитическую, гамма-полипептид), HLA-A (основной комплекс гистосовместимости, класс I, A), KCNQ1 (калиевый потенциалзависимый канал, KQT-подобное семейство, представитель 1), CNR1 (каннабиноидный рецептор 1 (головной мозг)), FBN1 (фибриллин 1), CHKA (холинкиназу альфа), BEST1 (бестрофин 1), APP (белок-предшественник амилоида бета (A4)), CTNNB1 (катенин (кадгерин-ассоциированный беок), бета 1, 88 кДа), IL2 (интерлейкин 2), CD36 (молекулу CD36 (тромбоспондиновый рецептор)), PRKAB1 (протеинкиназу, AMФ-активируемую, бета 1 некаталитическую субъединицу), TPO (тиреоидную перокидазу), ALDH7A1 (семейство альдегиддегидрогеназы 7, представитель A1), CX3CR1 (хемокиновый рецептор 1 (с мотивом C-X3-C)), TH (тирозингидроксилазу), F9 (фактор коагуляции IX), GH1 (гормон роста 1), TF (трансферрин), HFE (гемохроматоз), IL17A (интерлейкин 17A), PTEN (гомолог фосфатазы и тензина), GSTM1 (глутатион S-трансферазу мю 1), DMD (дистрофин), GATA4 (GATA связывающий белок 4 типа), F13A1 (фактор коагуляции XIII, полипептид A1), TTR (транстиретин), FABP4 (связывающий белок жирных кислот 4 типа, адипоцитарный), PON3 (параоксоназу 3), APOC1 (аполипопротеин C-I), INSR (инсулиновый рецептор), TNFRSF1B (суперсемейство рецепторов фактора некроза опухоли, представитель 1B), HTR2A (5-гидрокситриптаминовый (серотониновый) рецептор 2A), CSF3 (колониестимулирующий фактор 3 (гранулоцитарный)), CYP2C9 (цитохром P450, семейство 2, подсемейство C, полипептид 9), TXN (тиоредоксин), CYP11B2 (цитохром P450, семейство 11, подсемейство B, полипептид 2), PTH (паратиреоидный гормон), CSF2 (колониестимулирующий фактор 2 (гранулоцитарно-макрофагальный)), KDR (рецептор, содержащий домен вставки киназы (рецептор тирозинкиназы III типа)), PLA2G2A (фосфолипазу A2, группа IIA (тромбоциты, синовиальная жидкость)), B2M (бета-2-микроглобулин), THBS1 (тромбоспондин 1), GCG (глюкагон), RHOA (семейство генов гомологов ras, представитель A), ALDH2 (семейство альдегиддегидрогеназы 2 (митохондриальной)), TCF7L2 (фактор транскрипции 7, подобный фактору 2 (специфичный по отношению к T-клеткам, HMG-бокс)), BDKRB2 (брадикининовый рецептор B2), NFE2L2 (фактор 2, подобный ядерному фактору (эритроидный 2)), NOTCH1 (гомолог Notch 1, ассоциированный с транслокациями (дрозофилиный)), UGT1A1 (UDP-глюкуронилтрансферазу семейства 1, полипипетид A1), IFNA1 (интерферон, альфа 1), PPARD (дельта-рецептор, активируемый пролифератором пероксисом), SIRT1 (сиртуин 1 (гомолог 2 регуляции молчащей информации совпадающего типа) (S. cerevisiae)), GNRH1 (гонадотропин-рилизинг гормон 1 (лютеинизирующий-рилизинг гормон)), PAPPA (ассоциированный с беременностью белок A плазмы, папализин 1), ARR3 (аррестин 3, ретинальный (X-аррестин)), NPPC (предшественник натрийуретического пептида C), AHSP (альфа-гемоглобин-стабилизирующий белок), PTK2 (протеинтирозинкиназу 2 типа PTK2), IL13 (интерлейкин 13), MTOR (мишень механизма действия рапамицина (серин/треоринкиназу)), ITGB2 (интергрин, бета 2 (субъединицу рецептора 3 и 4 компонента 3 комплемента)), GSTT1 (глутатион-S-трансферазу тета 1), IL6ST (передатчик сигнала интерлейкина 6 (gp130, рецептор онкостатина М)), CPB2 (карбоксипептидазу B2 (плазменную)), CYP1A2 (цитохром P450, семейство 1, подсемейство A, полипептид 2), HNF4A (ядерный фактор гепатоцитов 4, альфа), SLC6A4 (семейство переносчиков растворенных веществ 6 (переносчик нейромедиаторов, серотонина), представитель 4), PLA2G6 (фосфолипазу A2, группа VI (цитозольную, кальций-независимую)), TNFSF11 (суперсемейство фактора роста опухоли (лиганд), представитель 11), SLC8A1 (семейство переносчиков растворенных веществ 8 (натрий-кальциевый антипортер), представитель 1), F2RL1 (рецептор-подобный фактор коагуляции II 1 (тромбин)), AKR1A1 (семейство альдокеторедуктаз 1, представитель A1 (алдегидредуктазу)), ALDH9A1 (семейство альдегиддегирогензы 9, представитель A1), BGLAP (белок гамма-карбоксиглутамата (gla)), MTTP (микросомальный белок переноса триглицеридов), MTRR (редуктаза 5-метилтетрагидрофолат-гомоцистеинметилтрансферазы), SULT1A3 (семейство сульфотрансфераз, цитозолоный, 1A, фенол-предпочтительный, представитель 3), RAGE (антиген опухоли почек), C4B (компонент 4В комплемента (группа крови Chido), P2RY12 (пуринергический рецептор P2Y, связанный с G-белком, 12), RNLS (реналазу, FAD-зависимую аминооксидазу), CREB1 (белок 1, связывающий чувствительный к cAMP элемент), POMC (проопиомеланокортин), RAC1 (связанный с ras субстрат 1 ботулотоксина C3 (семейство rho, малый GTP связывающий белок Rac1)), LMNA (ламин NC), CD59 (молекулу CD59, регуляторный белок комплемента), SCN5A (натриевый канал, потенциалзависимый, V типа, альфа-субъединицу), CYP1B1 (цитохром P450, семейство 1, подсемейство B, полипептид 1), MIF (фактор ингибирования миграции макрофагов (фактор, ингибирующий гликозилирование)), MMP13 (матриксную метталлопептидазу 13 (коллагеназу 3)), TIMP2 (ингибитор металлопептидазы 2 TIMP), CYP19A1 (цитохром P450, семейство 19, подсемейство A, полипептид 1), CYP21A2 (цитохром P450, семейство 21, подсемейство A, полипептид 2), PTPN22 (протеинтирозинфосфатазу, нерецепторную, 22 типа (лимфоидную)), MYH14 (миозин, тяжелую цепь 14, немышечный), MBL2 (маннозо-связывающий лектин (белок C) 2, растворимый (дефект опсонина)), SELPLG (лиганд селектина P), AOC3 (аминоксидазу, медь-содержащую 3 (белок 1 адгезии сосудов)), CTSL1 (катепсин L1), PCNA (ядерный антиген пролиферирующих клеток), IGF2 (инсулинподобный фактор роста 2 (соматомедин A)), ITGB1 (интегрин, бета 1 (фибронектиновый рецептор, бета-полипептид, антиген CD29 включает MDF2, MSK12)), CAST (кальпастатин), CXCL12 (хемокиновый лиганд 12 (с мотивом C-X-C) (стромальный клеточный фактор 1)), IGHE (константную область тяжелой эпсилон-цепи иммуноглобулина), KCNE1 (калиевый потенциалзависимый канал, Isk-связанное семейство, представитель 1), TFRC (трансферриновый рецептор (p90, CD71)), COL1A1 (коллаген 1 типа, альфа 1), COL1A2 (коллаген, I типа, альфа 2), IL2RB (рецептор интерлейкина 2, бета), PLA2G10 (фрсфолипидазу A2, группа X), ANGPT2 (ангиопоэтин 2), PROCR (рецептор протеина C, эндотелиальный (EPCR)), NOX4 (NADPH-оксидазу 4), HAMP (гепцидиновый антимикробный пептид), PTPN11 (протеинтирозинфосфатазу, нерецепторную, 11 типа), SLC2A1 (семейство переносчиков растворенных веществ 2 (переносчик глюкозы посредством облегченной диффузии), представитель 1), IL2RA (рецептор интерлейкина 2, альфа), CCL5 (хемокиновый лиганд 5 (с мотивом C-C)), IRF1 (регуляторный фактор интерферона 1), CFLAR (CASP8 и FADD-подобный регулятор апоптоза), CALCA (кальцитонин-связанный полипептид альфа), EIF4E (фактор инициации трансляции эукариот 4E), GSTP1 (пи-1-глутатин-S-трансферазу), JAK2 (Янус-киназу 2), CYP3A5 (цитохром P450, семейство 3, подсемейство A, полипептид 5), HSPG2 (гепаринсульфатпротеогликан 2), CCL3 (хемокиновый лиганд 3 (с мотивом C-C)), MYD88 (ген первичного ответа миелоидной дифференциации (88)), VIP (вазоактивный пептид кишечника), SOAT1 (стерол-O-ацилтрансферазу 1), ADRBK1 (адренергическую, бета, рецепторную киназу 1), NR4A2 (подсемейство ядерных рецепторов 4, группа A, представитель 2), MMP8 (матриксную металлопептидазу 8 (нейтрофильную коллагеназу)), NPR2 (рецептор натрийуретического пептида B/гуанилатциклазу B (рецептор атрионатрийуретического пептида B)), GCH1 (GTP гидролазу 1), EPRS (глутамил-пропил-тРНК-синтетазу), PPARGC1A (гамма-рецептор, активируемый пролифератором пероксисом, коактиватор 1 альфа), F12 (фактор коагуляции XII (фактор Хагемана)), PECAM1 (молекулу адгезии тромбоцитов/эндотелиальных клеток), CCL4 (хемокиновый лиганд 4 (с мотивом C-C)), SERPINA3 (ингибитор серпинпептидазы, клада A (альфа-1-антипротеиназу, антитрипсин), представитель 3), CASR (кальций-чувствительный рецептор), GJA5 (белок межклеточных щелевых контактов, альфа 5, 40 кДа), FABP2 (связывающий белок жирных кислот 2 типа, кишечный), TTF2 (фактор терминации транскрипции, РНК-полимеразу II), PROS1 (белок S (альфа)), CTF1 (кардиотропин 1), SGCB (саркогликан, бета (дистрофин-ассоциированный гликопротеин размером 43 кДа)), YME1L1 (YME1-подобный фактор 1 (S. cerevisiae)), CAMP (кателицидиновый антимикробный пептид), ZC3H12A (содержащий фактор типа CCCH с цинковыми пальцами 12A), AKR1B1 (семейство альдокеторедуктазы 1, представитель B1 (альдоредуктазу)), DES (десмин), MMP7 (матриксную металлопептидазу 7 (матрилизин, маточный)), AHR (арил-углеводородный рецептор), CSF1 (колониестимулирующий фактор 1 (макрофагальный)), HDAC9 (гистон-деацетилазу 9), CTGF (фактор роста соединительной ткани), KCNMA1 (калиевый, активируемый кальцием канал высокого проведения, подсемейство M, альфа, представитель 1), UGT1A (UDP-глюкуронилтрансферазу семейства 1, локус комплекса полипептида A), PRKCA (протеинкиназу C, альфа), COMT (катехол-бета-метилтрансферазу), S100B (S100 кальций-связывающий белок B), EGR1 (фактор роста раннего ответа 1), PRL (пролактин), IL15 (интерлейкин 15), DRD4 (дофаминовый рецептор D4), CAMK2G (кальций/кальмодулинзависимую протеинкиназу II гамма), SLC22A2 (семейство переносчиков растворенных веществ 22 (переносчик органических катионов), представитель 2), CCL11 (хемокиновый лиганд 11 (с мотивом C-C)), PGF (плацентартный фактор роста B321), THPO (тромбопоэтин), GP6 (гликопротеин VI (тромбоцитарный)), TACR1 (тахикиновый рецептор 1), NTS (нейротензин), HNF1A (HNF1 гомеобокс A), SST (соматостатин), KCND1 (калиевый потенциалзависимый канал, связанное с Shal подсемейство, представитель 1), LOC646627 (ингибитор фосфолипазы), TBXAS1 (тромбоксан A синтазу 1 (тромбоцитарную)), CYP2J2 (цитохром P450, семейство 2, подсемейство J, полипептид 2), TBXA2R (рецептор тромбоксана A2), ADH1C (алкогольдегидрогеназу 1C (класс I), гамма-полипептид), ALOX12 (арахидонат 12-липогеназу), AHSG (альфа-2-HS-гликопротеин), BHMT (бетаин-гомоцистеинметилтрансферазу), GJA4 (белок щелевых межклеточных контактов, альфа 4, 37 кДа), SLC25A4 (семейство переносчиков растворенных веществ 25 (митохондриальный переносчик; аденин-нуклеотид транслокатор), представитель 4), ACLY (АТФ-цитратлиазу), ALOX5AP (белок, активирующий арахидонат-5-липооксигеназу), NUMA1 (ядерный белок митотического аппарата 1), CYP27B1 (цитохром P450, семейство 27, подсемейство B, полипептид 1), CYSLTR2 (цистеинил-лейкотриеновый рецептор 2), SOD3 (супероксиддисмутазу 3, внеклеточную), LTC4S (лейкотриен C4-синтазу), UCN (урокортин), GHRL (препропептид грелина/обестатина), APOC2 (аполипопротеин C-II), CLEC4A (семейство 4 домена лектина C-типа, представитель A), KBTBD10 (содержащий kelch-повтор и домен BTB (POZ) 10), TNC (тенаскин C), TYMS (тимидилатсинтетазу), SHCl (SHC-трансформирующий белок 1 (содержащий домен 2 с Src-гомологией)), LRP1 (белок 1, связанный с рецепторами липопротеина низкой плотности), SOCS3 (супрессор 3 передачи сигнала с участием цитокинов), ADH1B (алкогольдегидрогеназу 1B (I класс), бета-полипептид), KLK3 (связанную с калликреином пептидазу 3), HSD11B1 (гидроксистероид (11-бета) дегидрогеназу 1), VKORC1 (витамин K эпоксид-редуктазный комплекс, субъединица 1), SERPINB2 (ингибитор серпинпептидазы, клада B (овальбумин), представитель 2), TNS1 (тензин 1), RNF19A (белок "цинковый палец" типа ring 19A), EPOR (эритропоэтиновый рецептор), ITGAM (интегрин, альфа M (субъединицу рецептора 3 компонента 3 комплемента)), PITX2 (подобный парному гомеодомен 2), MAPK7 (митоген-активированную протеинкиназу 7), FCGR3A (Fc-фрагмент IgG, с низкой аффинностью 111a, рецептор (CD16a)), LEPR (лептиновый рецептор), ENG (эндоглин), GPX1 (глутатионпероксидазу 1), GOT2 (щавелево-уксусную трансаминазу глутаминовой кислоты 2 типа, митохондриальную (аспартатаминотрансферазу 2 типа)), HRH1 (гистаминовый рецептор H1), NR112 (семейство ядерных рецепторов 1, I группа, представитель 2), CRH (кортикотропин-рилизинг гормон), HTR1A (5-гидрокситриптаминовый (серотониновый) рецептор 1A), VDAC1 (потенциалзависимый анионный канал 1), HPSE (гепараназу), SFTPD (поверхностно-активный белок D), TAP2 (переносчик 2, АТФ-связывающая кассета, подсемейство B (MDR/TAP)), RNF123 (белок "цинковый палец" типа ring 123), PTK2B (PTK2B протеинтирозинкиназу 2 бета), NTRK2 (нейротрофическую тирозинкиназу, рецептор, 2 тип), IL6R (рецептор интерлейкина 6), ACHE (ацетилхолинэстеразу (группу крови Yt)), GLP1R (рецептор глюкагон-подобного пептида 1), GHR (рецептор гормона роста), GSR (глутатионредуктазу), NQO1 (NAD(P)H-дегидрогеназу, хинон 1), NR5A1 (семейство ядерных рецепторов 5, группа A, представитель 1), GJB2 (белок межклеточных щелевых контактов, бета 2, 26 кДа), SLC9A1 (семейство переносчиков растворенных веществ 9 (натрий-водородный антипортер), представитель 1), MAOA (моноаминоксидазу A), PCSK9 (пропротеинконвертазу субтилизин-кексинового 9 типа), FCGR2A (Fc-фрагмент IgG, с низкой аффинностью IIa, рецептор (CD32)), SERPINF1 (ингибитор серпинпептидазы, клада F (альфа-2-антиплазмин, фактор пигментного эпителия), представитель 1), EDN3 (эндотелин 3), DHFR (дигидрофолатредуктазу), GAS6 (специфичный к задержке роста фактор 6), SMPD1 (сфингомиелинфосфодиэстеразу 1, кислую лизосомальную), UCP2 (неспаренный белок 2 (митохондриальный, переносчик протонов)), TFAP2A (транспортный фактор AP-2 альфа (активирующий энхансер связывающий белок 2 альфа)), C4BPA (связывающий белок 4 компонента комплемента, альфа), SERPINF2 (ингибитор серпинпептидазы, клада F (альфа-2-антилазмин, фактор пигментного эпителия), представитель 2), TYMP (тимидинфосфорилазу), ALPP (щелочную фосфатазу, плацентарную (изозим Регана)), CXCR2 (хемокиновый рецептор 2 (с мотивом C-X-C)), SLC39A3 (семейство переносчиков растворенных веществ 39 (переносчик цинка), представитель 3), ABCG2 (АТФ-связывающую кассету, подсемейство G (WHITE), представитель 2), ADA (аденозиндезаминазу), JAK3 (Янус-киназу 3), HSPA1A (белок теплового шока 1А размером 70 кДа), FASN (синтазу жирных кислот), FGF1 (фактор роста фибробластов 1 (кислотный)), F11 (фактор коагуляции XI), ATP7A (АТФазу, транспортирование Cu++, альфа-полипептид), CR1 (рецептор 1 компонента комплемента (3b/4b) (группы крови Knops)), GFAP (глиофибриллярный щелочной белок), ROCK1 (Rho-ассоциированную содержащую двуспиральную протеинкиназу 1), MECP2 (метил CpG-связывающий белок 2 (синдром Ретта)), MYLK (легкую цепь миозина), BCHE (бутирилхолинэстеразу), LIPE (липазу, гормончувствительную), PRDX5 (пероксиредоксин 5), ADORA1 (рецептор аденозина A1), WRN (синдром Вернера, RecQ, подобный хеликазе), CXCR3 (хемокиновый рецептор 3 (с мотивом C-X-C)), CD81 (молекулу CD81), SMAD7 (семейство SMAD, представитель 7), LAMC2 (ламинин, гамма 2), MAP3K5 (митоген-активируемую протеинкиназу киназы 5), CHGA (хромогранин A (паратиреоридный секреторный белок 1)), IAPP (островковый амилоидный пептид), RHO (родопсин), ENPP1 (эктонуклеотидпирофосфатазу/фосфодиэстеразу 1), PTHLH (подобный паратиреоидному гормону гормон), NRG1 (нейрегулин 1), VEGFC (фактор роста эндотелия сосудов C), ENPEP (глутамиламинопептидазу (аминопептидазу A)), CEBPB (CCAAT/энхансерный связывающий белок (C/EBP), бета), NAGLU (N-ацетилглюкозаминидазу, альфа-), F2RL3 (фактор коагуляции II (тромбин), рецептор-подобный 3), CX3CL1 (хемокиновый лиганд 1 (с мотивом C-X3-C)), BDKRB1 (брадикиновый рецептор B1), ADAMTS13 (ADAM металлопептидазу с тромбоспондиновым мотивом 1 типа, 13), ELANE (эластазу, экспрессируемую в нейтрофилах), ENPP2 (эктонуклеотидпирофосфатазу/фосфодиэстеразу 2), CISH (индуцируемый цитокином SH2-содержащий белок), GAST (гастрин), MYOC (миоцилин, индуцируемый трабекулярной сетью глюкокортикоидный ответ), ATP1A2 (АТФазу, Na+/K+ транспорт, альфа 2 полипептид), NF1 (нейрофибромин 1), GJB1 (белок межклеточных щелевых контактов, бета 1, 32 кДа), MEF2A (миоцитарный энхансорный фактор 2A), VCL (винкулин), BMPR2 (рецептор костного морфогенетического белка, тип II (серин/треонинкиназу)), TUBB (тубулин, бета), CDC42 (фактор клеточного цикла 42 (GTP-связывающий белок, 25 кДа)), KRT18 (кератин 18), HSF1 (фактор транскрипции белка теплового шока 1), MYB (гомолог онкогена вируса миелобластоза v-myb (птичьего)), PRKAA2 (протеинкиназу, AMP-активируемую, каталитическую субъединицу альфа 2), ROCK2 (Rho-ассоциированную содержащую двуспиральную протеинкиназу 2), TFPI (ингибитор пути тканевого фактора (липопротеин-ассоциированный ингибитор коагуляции)), PRKG1 (протеинкиназу, cGMP-зависимую, I тип), BMP2 (костный морфогенетический белок 2), CTNND1 (катенин (кадгерин-ассоциированный белок), дельта 1), CTH (цистатионазу (цистатионин-гамма-лиазу)), CTSS (катепсин S), VAV2 (фактор обмена гуаниновых нуклеотидов vav 2), NPY2R (рецептор Y2 нейропептида Y), IGFBP2 (связывающий белок 2 инсулин-подобного фактора роста, 36 кДа), CD28 (молекулу CD28), GSTA1 (глутатион-S-трансферазу, альфа 1), PPIA (пептидилпролилизомеразу A (циклофилин A)), APOH (аполипопротеин H (бета-2-гликопротеин I)), S100A8 (S100 кальций-связывающий белок A8), IL11 (интерлейкин 11), ALOX15 (арахидонат-15-липоксигеназу), FBLN1 (фибулин 1), NR1H3 (семейство ядерных рецепторов 1, группа H, представитель 3), SCD (стеароил-CoA десатуразу (дельта-9-десатуразу)), GIP (желудочный ингибиторный пептид), CHGB (хромогранин B (секретогранин 1)), PRKCB (протеинкиназу C, бета), SRD5A1 (стероид-5-альфа-редуктазу, альфа-полипептид 1 (3-оксо-5 альфа-стероид дельта-4-дегидрогеназу альфа 1)), HSD11B2 (гидроксистероид (11-бета) дегидрогеназу 2), CALCRL (подобный кальцитониновому рецептору), GALNT2 (UDP-N-ацетил-альфа-D-галактозамин:полипептид N-ацетилгалактозаминилтрансферазу 2 (GalNAc-T2)), ANGPTL4 (ангиопоэтинподобный 4), KCNN4 (калиевый, активируемый кальцием канал, промежуточного/низкого проведения, подсемейство N, представитель 4), PIK3C2A (фосфоинозитидин-3-киназу, класс 2, альфа-полипептид), HBEGF (гепарин-связывающий EGF-подобный фактор роста), CYP7A1 (цитохром P450, семейство 7, подсемейство A, полипептид 1), HLA-DRB5 (главный комплекс гистосовместимости, класс II, DR бета 5), BNIP3 (белок 3 с массой 19 кДа, взаимодействующий с BCL2/аденовирусом E1B), GCKR (регулятор глюкокиназы (гексокиназы 4)), S100A12 (S100 кальций-связывающий белок A12), PADI4 (пептидиларгининдеиминазу, тип IV), HSPA14 (белок 14 теплового шока с массой 70 кДа), CXCR1 (хемокиновый рецептор 1 (с мотивом C-X-C)), H19 (H19, экспрессируемый пептид, импринтированный со стороны матери (некодирующий белок)), KRTAP19-3 (кератин-ассоциированный белок 19-3), IDDM2 (фактор инсулин-зависимого сахарного диабета 2 типа), RAC2 (ras-связанный субстрат 2 ботулотоксина C3 (семейство rho, малый GTP связывающий белок Rac2)), RYR1 (рианодиновый рецептор 1 (мышечный)), CLOCK (гомолог гена (мышиный)), NGFR (рецептор фактора роста нервов (суперсемейство TNFR, представитель 16)), DBH (дофамин бета-гидроксилазу (дофамин бета-монооксигеназу)), CHRNA4 (холинергический рецептор, никотиновый, альфа 4), CACNA1C (кальциевый канал, потенциалзависимый, типа L, субъединицу альфа 1C), PRKAG2 (протеинкиназу, AMP-активированную, гамма 2 некаталическую субъединицу), CHAT (холинацетилтрансферазу), PTGDS (простагландин D2 синтазу размером 21 кДа (головного мозга)), NR1H2 (семейство 1 ядерных рецепторов, группа H, представитель 2), TEK (TEK тирозинкиназу, эндотелиальную), VEGFB (фатор роста эндотелия сосудов B), MEF2C (миоцитарный энхансерный фактор 2C), MAPKAPK2 (протеинкиназу 2, активированную митоген-активированной протеинкиназой), TNFRSF11A (суперсемейство рецепторов фактора некроза опухоли, представитель 11a, активатор NFKB), HSPA9 (белок 9 теплового шока размером 70 кДа (морталин)), CYSLTR1 (цистеинил-лейкотриеновый рецептор 1), MAT1A (метионинаденозилтрансферазу I, альфа), OPRL1 (подобный опиатному рецептору 1), IMPA1 (инизитол(мио)-1(или 4)-монофосфатазу 1), CLCN2 (канал-переносчик для ионов хлора 2), DLD (дигидролипоамиддегидрогеназу), PSMA6 (протеасомную субъединицу (просому, макропаин), тип альфа, 6), PSMB8 (протеасомную субъединицу (просому, макропаин), тип бета, 8 (большую мультифункциональную пептидазу 7)), CHI3L1 (фактор 1, подобный хитиназе 3 (хрящевой гликопротеин 39)), ALDH1B1 (альдегиддегидрогеназу, семейство 1, представитель B1), PARP2 (поли (АДФ-рибозо) полимеразу 2), STAR (стероидогенный острый регуляторный белок), LBP (липополисахарид-связывающий белок), ABCC6 (АТФ-связывающую кассету, подсемейство C (CFTR/MRP), представитель 6), RGS2 (регулятор передачи сигнала с участием G-белка 2, 24 кДа), EFNB2 (эфрин-B2), GJB6 (белок межклеточных щелевых контактов, бета 6, 30 кДа), APOA2 (аполипопротеин A-II), AMPD1 (аденозинмонофосфатдезаминазу 1), DYSF (дисферлин, тазо-плечевая мышечная дистрофия 2B (аутосомно-рецессивная)), FDFT1 (фарнезил-дифосфатфарнелизтрансферазу 1), EDN2 (эндотелин 2), CCR6 (хемокиновый рецептор 6 (с мотивом C-C)), GJB3 (белок межклеточных щелевых контактов, бета 3, 31 кДа), IL1RL1 (фактор 1, подобный рецептору интерлейкина 1), ENTPD1 (эктонуклеозидтрифосфат-дифосфогидролазу 1), BBS4 (фактор 4 синдром Барде-Бидля), CELSR2 (кадгерин, семиканальный рецептор 2 G-типа EGF LAG (гомолог flamingo, дрозофилиный)), F11R (рецептор F11), RAPGEF3 (фактор обмена гуаниновых нуклеотидов Rap (GEF) 3), HYAL1 (гиалуроноглюкозаминидазу 1), ZNF259 (белок "цинковый палец" 259), ATOX1 (гомолог антиоксидантного белка 1 ATX1 (дрожжевой)), ATF6 (фактор активации транскрипции 6), KHK (кетогексокиназу (фруктокиназу)), SAT1 (спермидин/спермин N1-ацетилтрансферазу 1), GGH (гамма-глутамилгидролазу (конъюгазу, фолилполигаммаглутамингидролазу)), TIMP4 (ингибитор TIMP металлопептидазы 4), SLC4A4 (семейство переносчиков растворенных белков 4, бикарбонат-натриевый контранспортер, представитель 4), PDE2A (фосфодиэстеразу 2A, cGMP-стимулированную), PDE3B (фосфодиэстеразу 3B, cGMP-ингибированную), FADS1 (десатуразу 1 жирных кислот), FADS2 (десатуразу 2 жирных кислот), TMSB4X (тимозин бета 4, X-сцепленный), TXNIP (белок, взаимодействующий с тиоредоксином), LIMS1 (домены 1, подобные LIM и антигену стареющих клеток), RHOB (семейство генов гомологов ras, представитель B), LY96 (лимфоцитарный антиген 96), FOXO1 (forkhead-бокс О1), PNPLA2 (фактор 2, содержащий домен пататин-подобной фосфолипидазы), TRH (тиротропин-рилизинг гормон), GJC1 (белок межклеточных щелевых контактов, гамма 1, 45 кДа), SLC17A5 (семейство переносчиков растворенных веществ 17 (переносчик анионов и сахаров), представитель 5), FTO (фактор, ассоциированный с жировой массой и ожирением), GJD2 (белок межклеточных щелевых контактов, дельта 2, 36 кДа), PSRC1 (двуспиральный фактор с высоким содержанием пролина и серина 1), CASP12 (каспазу 12 (ген/псевдоген)), GPBAR1 (рецептор 1 желчных кислот, связанный с G-белком), PXK (серин/треонинкиназу, содержащую домен PX), IL33 (интерлейкин 33), TRIB1 (гомолог tribbles 1 (дрозофилиный)), PBX4 (гомеобокс 4 пре-B-клеточного лейкоза), NUPR1 (ядерный белок, регулятор транскрипции, 1), 15-Sep (селенопротеин размером 15 кДа), CILP2 (белок промежуточного слоя хряща 2), TERC (РНК-компонент теломеразы), GGT2 (гамма-глутамилтрансферазу 2), MT-CO1 (цитохром c оксидазу I, кодируемую митохондриальным геномом) и UOX (уратоксидазу, псевдоген). Любая из данных последовательностей может быть мишенью для системы CRISPR-Cas, например, для изучения мутации.As an example, the chromosomal sequence may include, but is not limited to, IL1B (interleukin 1, beta), XDH (xanthine dehydrogenase), TP53 (p53 tumor protein), PTGIS (prostaglandin 12 (prostacyclin) synthase), MB (myoglobin), IL4 (interleukin 4), ANGPT1 (angiopoietin 1), ABCG8 (ATP-binding cassette, subfamily G (WHITE), member 8), CTSK (cathepsin K), PTGIR (prostacyclin 12 (IP) receptor), KCNJ11 (inward rectifier potassium channel, subfamily J, member 11), INS (insulin), CRP (pentraxin-related C-reactive protein), PDGFRB (platelet-derived growth factor, beta polypeptide), CCNA2 (cyclin A2), PDGFB (platelet-derived growth factor beta polypeptide oncogene homolog (simian sarcoma virus (v-sis))), KCNJ5 (inward-rectifying potassium channel, subfamily J, member 5), KCNN3 (intermediate/low-conducting calcium-activated potassium channel, subfamily N, member 3), CAPN10 (calpain 10), PTGES (prostaglandin E synthase), ADRA2B (alpha-2B-adrenergic receptor), ABCG5 (ATP-binding cassette, subfamily G (WHITE), member 5), PRDX2 (peroxiredoxin 2), CAPN5 (calpain 5), PARP14 (poly (ADP-ribose) polymerase family, member 14), MEX3C (C mex-3 homolog C (C. elegans)), ACE angiotensin I-converting enzyme (peptidyl dipeptidase A) 1), TNF (tumor necrosis factor (TNF superfamily, member 2)), IL6 (interleukin 6 (interferon, beta 2)), STN (statin), SERPINE1 (serpin peptidase inhibitor, clade E (nexin, plasminogen activator inhibitor type 1), member 1), ALB (albumin), ADIPOQ (adiponectin containing C1Q and collagen domain), APOB (apolipoprotein B (including Ag(x))), APOE (apolipoprotein E), LEP (leptin), MTHFR (5,10-methylenetetrahydrofolate reductase (NADPH)), APOA1 (apolipoprotein A-I), EDN1 (endothelin 1), NPPB (precursor natriuretic peptide B), NOS3 (synthase nitric oxide type 3 (endothelial cell)), PPARG (peroxisome proliferator-activated receptor gamma), PLAT (tissue plasminogen activator), PTGS2 (prostaglandin endoperoxide synthase type 2 (prostaglandin G/H synthase and cyclooxygenase)), CETP (plasma cholesteryl ester transport protein), AGTR1 (anti-otensin II receptor type 1), HMGCR (3-hydroxy-3-methylglutaryl-coenzyme A reductase), IGF1 (insulin-like growth factor 1 (somatomedin C)), SELE (selectin E), REN (renin), PPARA (peroxisome proliferator-activated receptor alpha), PON1 (paraoxonase 1), KNG1 (kininogen 1), CCL2 (chemokine ligand 2 (with C-C motif)), LPL (lipoprotein lipase), VWF (von Willebrand factor), F2 (coagulation factor II (thrombin)), ICAM1 (intercellular adhesion molecule 1), TGFB1 (transforming growth factor, beta 1), NPPA (precursor natriuretic peptide A), IL10 (interleukin 10), EPO (erythropoietin), SOD1 (superoxide dismutase 1, soluble), VCAM1 (vascular endothelial adhesion molecule type 1), IFNG (interferon, gamma), LPA (lipoprotein, Lp(a)), MPO (myeloperoxidase), ESR1 (estrogen receptor 1), MAPK1 (mitogen-activated protein kinase 1), HP (haptoglobin), F3 (coagulation factor III (thromboplastin, tissue factor)), CST3 (cystatin C), COG2 (component of the oligomeric Golgi complex type 2), MMP9 (matrix metallopeptidase 9 (gelatinase B, 92 kDa gelatinase, 92 kDa collagenase type IV)), SERPINC1 (serpin peptidase inhibitor, clade C (antithrombin), member 1), F8 (coagulation factor VIII, procoagulant component), HMOX1 (heme oxygenase (decyclic) type 1), APOC3 (apolipoprotein C-III), IL8 (interleukin 8), PROK1 (prokineticin 1), CBS (cystathionine beta synthase), NOS2 (sodium oxide synthase type 2, inducible), TLR4 (toll-like receptor type 4), SELP (selectin P (140 kDa granule membrane protein, CD62 antigen)), ABCA1 (ATP-binding cassette, subfamily A (ABC1), member 1), AGT (angiotensin (serpin peptidase inhibitor, clade A, member 8)), LDLR (low-density lipoprotein receptor), GPT (glutamate-pyruvate transaminase (alanine aminotransferase)), VEGFA (vascular endothelial growth factor A), NR3C2 (nuclear receptor, subfamily 3, group C, member 2), IL18 (interleukin 18 (interferon gamma inducing factor)), NOS1 (nitric oxide synthase type 1 (neuronal)), NR3C1 (nuclear receptor, subfamily 3, group C, member 1 (glucocorticoid receptor)), FGB (fibrinogen beta chain), HGF (hepatocyte growth factor (hepatopoietin A; scattering factor)), IL1A (interleuin 1, alpha), RETN (resistin), AKT1 (murine thymoma virus oncogene homolog type 1 v-akt), LIPC (lipase, liver), HSPD1 (heat shock protein type 1 of 60 kDa (chaperonin)), MAPK14 (mitogen-activated protein kinase 14), SPP1 (secreted phosphoprotein 1), ITGB3 (integrin, beta 3 (platelet glycoprotein 111a, CD61 antigen)), CAT (catalase), UTS2 (urotensin 2), THBD (thrombomodulin), F10 (coagulation factor X), CP (ceruloplasmin (ferroxidase)), TNFRSF11B (tumor necrosis factor superfamily, member 11b), EDNRA (endothelin receptor type A), EGFR (epidermal growth factor receptor (v-erb-b oncogene homolog, avian)), MMP2 (matrix metallopeptidase 2 (gelatinase A, 72-kDa gelatinase, 72-kDa collagenase type IV)), PLG (plasminogen), NPY (neuropeptide Y), RHOD (ras homolog gene family, member D), MAPK8 (mitogen-activated protein kinase 8), MYC (v-myc myelocystomatosis virus oncogene homolog, avian)), FN1 (fibronectin 1), CMA1 (chymase 1, mast cell), PLAU (plasminogen activator, urokinase), GNB3 (guanine nucleotide-binding protein (G protein), beta polypeptide type 3), ADRB2 (adrenergic beta-2 receptor, surface), APOA5 (apolipoprotein A-V), SOD2 (superoxide dismutase 2, mitochondrial), F5 (coagulation factor V (proaccelerin, labile factor)), VDR (vitamin D receptor (1,25-dihydroxyvitamin D3), ALOX5 (arachidonate 5-lipoxygenase), HLA-DRB1 (major histocompatibility complex, class II, DR beta 1), PARP1 (poly (ADP-ribose) polymerase type 1), CD40LG (CD40 ligand), PON2 (paraoxonase 2), AGER (receptor for advanced glycation end products), IRS1 (insulin receptor substrate type 1), PTGS1 (prostaglandin endoperoxide synthase type 1 (prostaglandin G/H synthase and cyclooxygenase)), ECE1 (endothelin-converting enzyme type 1), F7 (coagulation factor VII (serum thrombin converting accelerator)), URN (interleukin 1 receptor antagonist), EPHX2 (epoxide hydrolase type 2, cytoplasmic), IGFBP1 (insulin-like growth factor binding protein type 1), MAPK10 (mitogen-activated protein kinase 10), FAS (Fas (TNF receptor superfamily, member 6)), ABCB1 (ATP-binding cassette, subfamily B (MDR/TAP), member 1), JUN (jun oncogene), IGFBP3 (insulin-like growth factor binding protein type 3), CD14 (CD14 molecule), PDE5A (phosphodiesterase 5A, cGMP-specific), AGTR2 (receptor angiotensin II, type 2), CD40 (CD40 molecule, member of the TNF receptor superfamily 5), LCAT (lecithin-cholesterol acyltransferase), CCR5 (chemokine receptor type 5 (with a C-C motif)), MMP1 (matrix metallopeptidase 1 (interstitial collagenase)), TIMP1 (TIMP inhibitor of metallopeptidase type 1), ADM (adrenomedullin), DYT10 (dystonia 10), STAT3 (signal transducer and activator of transcription type 3 (acute phase response factor)), MMP3 (matrix metallopeptidase 3 (stromelysin 1, progelatinase)), ELN (elastin), USF1 (transcription factor binding upstream of the transcription initiation site 1), CFH (complement factor H), HSPA4 (warm shock protein 4 of 70 kDa), MMP12 (matrix metallopeptidase 12 (macrophage elastase)), MME (membrane metalloendopeptidase), F2R (coagulation factor II (thrombin) receptor), SELL (selectin L), CTSB (cathepsin B), ANXA5 (annexin A5), ADRB1 (adrenergic beta-1 receptor), CYBA (cytochrome b-245, alpha peptide), FGA (fibrinogen alpha chain), GGT1 (gamma-glutamyl transferase 1), LIPG (lipase, endothelial), HIF1A (hypoxia-inducible factor 1, alpha subunit (helix-loop-helix basic structure transcription factor)), CXCR4 (chemokine receptor 4 (with C-X-C motif)), PROC (protein C (coagulation factor Va and VIIIa inactivator)), SCARB1 (phagocytic receptor, class B, member 1), CD79A (CD79a molecule, immunoglobulin-associated alpha), PLTP (phospholipid transfer protein), ADD1 (adducin 1 (alpha)), FGG (fibrinogen gamma chain), SAA1 (serum amyloid A1), KCNH2 (potassium voltage-gated channel, family H (eag-related), member 2), DPP4 (dipeptidyl peptidase 4), G6PD (glucose-6-phosphate dehydrogenase), NPR1 (natriuretic peptide receptor A/guanylate cyclase A (atrionatriuretic peptide receptor A)), VTN (vitronectin), KIAA0101 (KIAA0101), FOS (homolog murine osteosarcoma virus oncogene FBJ), TLR2 (toll-like receptor 2), PPIG (peptidylproline isomerase G (cycloproline G)), IL1R1 (interleukin I receptor), AR (androgen receptor), CYP1A1 (cytochrome P450, family 1, subfamily A, polypeptide 1), SERPINA1 (serpin peptidase inhibitor, clade A (alpha-1 antiproteinase, antitrypsin), member 1), MTR (5-methyltetrahydrofolate-hexacysteine methyltransferase), RBP4 (retinol-binding protein type 4, plasma), APOA4 (apolipoprotein A-IV), CDKN2A (cyclin-dependent kinase inhibitor 2A (melanoma, p16, inhibits CDK4)), FGF2 (fibroblast growth factor 2 (basic)), EDNRB (endothelin receptor type B), ITGA2 (integrin, alpha 2 (CD49B, alpha 2 subunit of the VLA-2 receptor)), CABIN1 (calcineurin-binding protein 1), SHBG (sex hormone-binding globulin), HMGB1 (high-mobility group 1 protein), HSP90B2P (heat shock protein 90 kDa beta (Grp94), member 2 (pseudogene)), CYP3A4 (cytochrome P450, family 3, subfamily A, polypeptide 4), GJA1 (gap junction protein, alpha 1, 43 kDa), CAV1 (caveolin 1, caveolae protein, 22 kDa), ESR2 (estrogen receptor 2 (ER beta)), LTA (lymphotoxin alpha (TNF superfamily, member 1)), GDF15 (growth and differentiation factor 15), BDNF (brain-derived neurotrophic factor), CYP2D6 (cytochrome P450, family 2, subfamily D, polypeptide 6), NGF (nerve growth factor (beta polypeptide)), SP1 (transcription factor Sp1), TGIF1 (TGFB-inducible factor homeobox 1), SRC (sarcoma virus oncogene homolog v-src (Schmidt-Ruppin A-2) (avian)), EGF (epidermal growth factor (beta-urogastron)), PIK3CG (phosphoinositide 3-kinase, catalytic, gamma polypeptide), HLA-A (major histocompatibility complex, class I, A), KCNQ1 (potassium voltage-gated channel, KQT-like family, member 1), CNR1 (cannabinoid receptor 1 (brain)), FBN1 (fibrillin 1), CHKA (choline kinase alpha), BEST1 (bestrophin 1), APP (amyloid precursor protein beta (A4)), CTNNB1 (catenin (cadherin-associated protein), beta 1, 88 kDa), IL2 (interleukin 2), CD36 (CD36 molecule (thrombospondin receptor)), PRKAB1 (protein kinase, AMP-activated, beta 1 non-catalytic subunit), TPO (thyroid peroxidase), ALDH7A1 (aldehyde dehydrogenase family 7, member A1), CX3CR1 (chemokine receptor 1 (with C-X3-C motif)), TH (tyrosine hydroxylase), F9 (coagulation factor IX), GH1 (growth hormone 1), TF (transferrin), HFE (hemochromatosis), IL17A (interleukin 17A), PTEN (phosphatase tensin homolog), GSTM1 (glutathione S-transferase mu 1), DMD (dystrophin), GATA4 (GATA binding protein type 4), F13A1 (coagulation factor XIII, polypeptide A1), TTR (transthyretin), FABP4 (fatty acid binding protein type 4, adipocyte), PON3 (paraoxonase 3), APOC1 (apolipoprotein C-I), INSR (insulin receptor), TNFRSF1B (tumor necrosis factor receptor superfamily, member 1B), HTR2A (5-hydroxytryptamine (serotonin) receptor 2A), CSF3 (colony stimulating factor 3 (granulocyte)), CYP2C9 (cytochrome P450, family 2, subfamily C, polypeptide 9), TXN (thioredoxin), CYP11B2 (cytochrome P450, family 11, subfamily B, polypeptide 2), PTH (parathyroid hormone), CSF2 (colony stimulating factor 2 (granulocyte-macrophage)), KDR (receptor kinase insertion domain-containing (receptor tyrosine kinase type III)), PLA2G2A (phospholipase A2, group IIA (platelets, synovial fluid)), B2M (beta-2-microglobulin), THBS1 (thrombospondin 1), GCG (glucagon), RHOA (ras homolog gene family, member A), ALDH2 (aldehyde dehydrogenase 2 family (mitochondrial)), TCF7L2 (transcription factor 7, factor 2-like (T-cell-specific, HMG-box)), BDKRB2 (bradykinin receptor B2), NFE2L2 (nuclear factor 2-like (erythroid 2)), NOTCH1 (Notch 1 homolog, translocation-associated (Drosophila)), UGT1A1 (UDP-glucuronyl transferase family 1, polypipeline A1), IFNA1 (interferon, alpha 1), PPARD (peroxisome proliferator-activated receptor delta), SIRT1 (sirtuin 1 (silent information regulation homolog 2) (S. cerevisiae)), GNRH1 (gonadotropin-releasing hormone 1 (luteinizing-releasing hormone)), PAPPA (pregnancy-associated plasma protein A, papalysin 1), ARR3 (arrestin 3, retinal (X-arrestin)), NPPC (precursor natriuretic peptide C), AHSP (alpha-hemoglobin-stabilizing protein), PTK2 (protein tyrosine kinase type 2 PTK2), IL13 (interleukin 13), MTOR (mechanism of action target of rapamycin (serine/threorine kinase)), ITGB2 (intergreen, beta 2 (subunit of complement component 3 receptor 3 and 4)), GSTT1 (glutathione-S-transferase theta 1), IL6ST (interleukin 6 signal transducer (gp130, oncostatin M receptor)), CPB2 (carboxypeptidase B2 (plasma)), CYP1A2 (cytochrome P450, family 1, subfamily A, polypeptide 2), HNF4A (hepatocyte nuclear factor 4, alpha), SLC6A4 (solute carrier family 6 (neurotransmitter transporter, serotonin), member 4), PLA2G6 (phospholipase A2, group VI (cytosolic, calcium-independent)), TNFSF11 (tumor growth factor superfamily (ligand), member 11), SLC8A1 (solute carrier family 8 (sodium-calcium antiporter), member 1), F2RL1 (coagulation factor II receptor-like 1 (thrombin)), AKR1A1 (aldoketo reductase family 1, member A1 (aldehyde reductase)), ALDH9A1 (aldehyde dehydrogenase family 9, member A1), BGLAP (gamma-carboxyglutamate (gla) protein), MTTP (microsomal triglyceride transfer protein), MTRR (5-methyltetrahydrofolate-homocysteine methyltransferase reductase), SULT1A3 (sulfotransferase family, cytosolic, 1A, phenol-preferred, member 3), RAGE (renal tumor antigen), C4B (complement component 4B (Chido blood group), P2RY12 (P2RY purinergic receptor G protein-coupled 12), RNLS (renalase, FAD-dependent amine oxidase), CREB1 (cAMP-responsive element-binding protein 1), POMC (pro-opiomelanocortin), RAC1 (ras-related botulinum toxin substrate 1) C3 (rho family, small GTP binding protein Rac1)), LMNA (lamin NC), CD59 (CD59 molecule, complement regulatory protein), SCN5A (sodium channel, voltage-gated, type V, alpha subunit), CYP1B1 (cytochrome P450, family 1, subfamily B, polypeptide 1), MIF (macrophage migration inhibitory factor (glycosylation inhibitory factor)), MMP13 (matrix metallopeptidase 13 (collagenase 3)), TIMP2 (TIMP inhibitor of metallopeptidase 2), CYP19A1 (cytochrome P450, family 19, subfamily A, polypeptide 1), CYP21A2 (cytochrome P450, family 21, subfamily A, polypeptide 2), PTPN22 (protein tyrosine phosphatase, non-receptor, 22 type (lymphoid)), MYH14 (myosin, heavy chain 14, non-muscle), MBL2 (mannose-binding lectin (protein C) 2, soluble (opsonin defect)), SELPLG (selectin P ligand), AOC3 (amine oxidase, copper-containing 3 (vascular adhesion protein 1)), CTSL1 (cathepsin L1), PCNA (proliferating cell nuclear antigen), IGF2 (insulin-like growth factor 2 (somatomedin A)), ITGB1 (integrin, beta 1 (fibronectin receptor, beta polypeptide, CD29 antigen includes MDF2, MSK12)), CAST (calpastatin), CXCL12 (chemokine ligand 12 (with C-X-C motif) (stromal cell factor 1)), IGHE (heavy epsilon chain), KCNE1 (potassium voltage-gated channel, Isk-related family, member 1), TFRC (transferrin receptor (p90, CD71)), COL1A1 (collagen type 1, alpha 1), COL1A2 (collagen type I, alpha 2), IL2RB (interleukin 2 receptor, beta), PLA2G10 (pro-phospholipidase A2, group X), ANGPT2 (angiopoietin 2), PROCR (protein C receptor, endothelial (EPCR)), NOX4 (NADPH oxidase 4), HAMP (hepcidin antimicrobial peptide), PTPN11 (protein tyrosine phosphatase, non-receptor, type 11), SLC2A1 (solute carrier family 2 (facilitated diffusion glucose transporter), member 1), IL2RA (interleukin 2 receptor, alpha), CCL5 (chemokine ligand 5 (with C-C motif)), IRF1 (interferon regulatory factor 1), CFLAR (CASP8 and FADD-like regulator of apoptosis), CALCA (calcitonin-related polypeptide alpha), EIF4E (eukaryotic translation initiation factor 4E), GSTP1 (pi-1-glutathione S-transferase), JAK2 (Janus kinase 2), CYP3A5 (cytochrome P450, family 3, subfamily A, polypeptide 5), HSPG2 (heparin sulfate proteoglycan 2), CCL3 (chemokine ligand 3 (with C-C motif)), MYD88 (myeloid differentiation primary response gene (88)), VIP (vasoactive intestinal peptide), SOAT1 (sterol O-acyltransferase 1), ADRBK1 (adrenergic beta receptor kinase 1), NR4A2 (nuclear receptor subfamily 4, group A, member 2), MMP8 (matrix metallopeptidase 8 (neutrophil collagenase)), NPR2 (natriuretic peptide receptor B/guanylate cyclase B (atrionatriuretic peptide receptor B)), GCH1 (GTP hydrolase 1), EPRS (glutamyl propyl-tRNA synthetase), PPARGC1A (peroxisome proliferator-activated receptor gamma coactivator 1 alpha), F12 (coagulation factor XII (Hageman factor)), PECAM1 (platelet/endothelial cell adhesion molecule), CCL4 (chemokine (C-C motif) ligand 4), SERPINA3 (serpin peptidase inhibitor, clade A (alpha-1-antiproteinase, antitrypsin), member 3), CASR (calcium-sensing receptor), GJA5 (gap junction protein, alpha 5, 40 kDa), FABP2 (fatty acid binding protein 2, intestinal), TTF2 (transcription termination factor, RNA polymerase II), PROS1 (protein S (alpha)), CTF1 (cardiotropin 1), SGCB (sarcoglycan, beta (dystrophin-associated glycoprotein of 43 kDa)), YME1L1 (YME1-like factor 1 (S. cerevisiae)), CAMP (cathelicidin antimicrobial peptide), ZC3H12A (containing zinc finger factor CCCH-type 12A), AKR1B1 (aldo-keto reductase family 1, member B1 (aldose reductase)), DES (desmin), MMP7 (matrix metallopeptidase 7 (matrilysin, uterine)), AHR (aryl hydrocarbon receptor), CSF1 (colony stimulating factor 1 (macrophage)), HDAC9 (histone deacetylase 9), CTGF (connective tissue growth factor), KCNMA1 (high-conductance calcium-activated potassium channel, subfamily M, alpha, member 1), UGT1A (UDP-glucuronyl transferase family 1, polypeptide complex locus A), PRKCA (protein kinase C, alpha), COMT (catechol-beta-methyltransferase), S100B (S100 calcium-binding protein B), EGR1 (early response growth factor 1), PRL (prolactin), IL15 (interleukin 15), DRD4 (dopamine D4 receptor), CAMK2G (calcium/calmodulin-dependent protein kinase II gamma), SLC22A2 (solute carrier family 22 (organic cation transporter), member 2), CCL11 (chemokine ligand 11 (C-C motif)), PGF (placental growth factor B321), THPO (thrombopoietin), GP6 (glycoprotein VI (platelet)), TACR1 (tachykine receptor 1), NTS (neurotensin), HNF1A (HNF1 homeobox A), SST (somatostatin), KCND1 (potassium voltage-gated channel, Shal-related subfamily, member 1), LOC646627 (phospholipase inhibitor), TBXAS1 (thromboxane A synthase 1 (platelet ), CYP2J2 (cytochrome P450, family 2, subfamily J, polypeptide 2), TBXA2R (thromboxane A2 receptor), ADH1C (alcohol dehydrogenase 1C (class I), gamma polypeptide), ALOX12 (arachidonate 12-lipogenase), AHSG (alpha-2-HS-glycoprotein), BHMT (betaine-homocysteine methyltransferase), GJA4 (gap junction protein, alpha 4, 37 kDa), SLC25A4 (solute carrier family 25 (mitochondrial transporter; adenine nucleotide translocator), member 4), ACLY (ATP citrate lyase), ALOX5AP (arachidonate-5-lipoxygenase activating protein), NUMA1 (nuclear protein of the mitotic apparatus 1), CYP27B1 (cytochrome P450, family 27, subfamily B, polypeptide 1), CYSLTR2 (cysteinyl leukotriene receptor 2), SOD3 (superoxide dismutase 3, extracellular), LTC4S (leukotriene C4 synthase), UCN (urocortin), GHRL (ghrelin/obestatin prepropeptide), APOC2 (apolipoprotein C-II), CLEC4A (C-type lectin domain family 4, member A), KBTBD10 (kelch repeat and BTB domain-containing (POZ) 10), TNC (tenaskin C), TYMS (thymidylate synthetase), SHCl (SHC-transforming protein 1 (Src-homology domain-containing 2)), LRP1 (low-density lipoprotein receptor-related protein 1), SOCS3 (suppressor of cytokine signaling 3), ADH1B (alcohol dehydrogenase 1B (class I), beta polypeptide), KLK3 (kallikrein-related peptidase 3), HSD11B1 (hydroxysteroid (11-beta) dehydrogenase 1), VKORC1 (vitamin K epoxide reductase complex, subunit 1), SERPINB2 (serpin peptidase inhibitor, clade B (ovalbumin), member 2), TNS1 (tensin 1), RNF19A (ring zinc finger protein 19A), EPOR (erythropoietin receptor), ITGAM (integrin, alpha M (subunit of complement component 3 receptor 3)), PITX2 (paired homeodomain-like 2), MAPK7 (mitogen-activated protein kinase 7), FCGR3A (Fc fragment of IgG, low affinity 111a, receptor (CD16a)), LEPR (leptin receptor), ENG (endoglin), GPX1 (glutathione peroxidase 1), GOT2 (oxaloacetic transaminase glutamic acid type 2, mitochondrial (aspartate aminotransferase type 2)), HRH1 (histamine H1 receptor), NR112 (nuclear receptor family 1, group I, member 2), CRH (corticotropin-releasing hormone), HTR1A (5-hydroxytryptamine (serotonin) receptor 1A), VDAC1 (voltage-gated anion channel 1), HPSE (heparanase), SFTPD (surface-active protein D), TAP2 (ATP-binding cassette transporter 2, subfamily B (MDR/TAP)), RNF123 (ring 123 zinc finger protein), PTK2B (PTK2B protein tyrosine kinase 2 beta), NTRK2 (neurotrophic tyrosine kinase receptor, type 2), IL6R (interleukin 6 receptor), ACHE (acetylcholinesterase (blood group Yt)), GLP1R (glucagon-like peptide 1 receptor), GHR (growth hormone receptor), GSR (glutathione reductase), NQO1 (NAD(P)H dehydrogenase, quinone 1), NR5A1 (nuclear receptor family 5, group A, member 1), GJB2 (gap junction protein, beta 2, 26 kDa), SLC9A1 (solute carrier family 9 (sodium hydrogen antiporter), member 1), MAOA (monoamine oxidase A), PCSK9 (proprotein convertase subtilisin-kexin type 9), FCGR2A (Fc fragment of IgG, low affinity IIa, receptor (CD32)), SERPINF1 (serpin peptidase inhibitor, clade F (alpha-2-antiplasmin, pigment epithelial factor), member 1), EDN3 (endothelin 3), DHFR (dihydrofolate reductase), GAS6 (growth arrest-specific factor 6), SMPD1 (sphingomyelin phosphodiesterase 1, acidic lysosomal), UCP2 (unpaired protein 2 (mitochondrial, proton transporter)), TFAP2A (transport factor AP-2 alpha (activating enhancer binding protein 2 alpha)), C4BPA (complement component 4 binding protein alpha), SERPINF2 (serpin peptidase inhibitor, clade F (alpha-2-antilasmin, pigment epithelial factor), member 2), TYMP (thymidine phosphorylase), ALPP (alkaline phosphatase, placental (Regan isozyme)), CXCR2 (chemokine receptor 2 (with C-X-C motif)), SLC39A3 (solute carrier family 39 (zinc transporter), member 3), ABCG2 (ATP-binding cassette, subfamily G (WHITE), member 2), ADA (adenosine deaminase), JAK3 (Janus kinase 3), HSPA1A (70 kDa heat shock protein 1A), FASN (fatty acid synthase), FGF1 (fibroblast growth factor 1 (acidic)), F11 (coagulation factor XI), ATP7A (ATPase, Cu++ transporter, alpha polypeptide), CR1 (complement component receptor 1 (3b/4b) (Knops blood groups)), GFAP (glial fibrillary alkaline protein), ROCK1 (Rho-associated double-stranded protein kinase 1), MECP2 (methyl CpG-binding protein 2 (Rett syndrome)), MYLK (myosin light chain), BCHE (butyrylcholinesterase), LIPE (lipase, hormone-sensitive), PRDX5 (peroxiredoxin 5), ADORA1 (adenosine A1 receptor), WRN (Werner syndrome, RecQ helicase-like), CXCR3 (chemokine receptor 3 (with C-X-C motif)), CD81 (CD81 molecule), SMAD7 (SMAD family, member 7), LAMC2 (laminin, gamma 2), MAP3K5 (mitogen-activated protein kinase kinase 5), CHGA (chromogranin A (parathyroid secretory protein 1)), IAPP (islet amyloid peptide), RHO (rhodopsin), ENPP1 (ectonucleotide pyrophosphatase/phosphodiesterase 1), PTHLH (parathyroid hormone-like hormone), NRG1 (neuregulin 1), VEGFC (vascular endothelial growth factor C), ENPEP (glutamyl aminopeptidase (aminopeptidase A)), CEBPB (CCAAT/enhancer binding protein (C/EBP) beta), NAGLU (N-acetylglucosaminidase alpha), F2RL3 (coagulation factor II (thrombin) receptor-like 3), CX3CL1 (chemokine (C-X3-C motif) ligand 1), BDKRB1 (bradykine receptor B1), ADAMTS13 (ADAM metallopeptidase with thrombospondin motif type 1, 13), ELANE (neutrophil-expressed elastase), ENPP2 (ectonucleotide pyrophosphatase/phosphodiesterase 2), CISH (cytokine-inducible SH2-containing protein), GAST (gastrin), MYOC (myocilin, trabecular meshwork-inducible glucocorticoid response), ATP1A2 (ATPase, Na+/K+ transport, alpha 2 polypeptide), NF1 (neurofibromin 1), GJB1 (gap junction protein, beta 1, 32 kDa), MEF2A (myocyte enhancer factor 2A), VCL (vinculin), BMPR2 (bone morphogenetic protein receptor, type II (serine/threonine kinase)), TUBB (tubulin, beta), CDC42 (cell cycle factor 42 (GTP-binding protein, 25 kDa)), KRT18 (keratin 18), HSF1 (heat shock protein transcription factor 1), MYB (myeloblastosis virus oncogene homolog v-myb (avian)), PRKAA2 (protein kinase, AMP-activated, catalytic subunit alpha 2), ROCK2 (Rho-associated double-stranded protein kinase 2), TFPI (tissue factor pathway inhibitor (lipoprotein-associated inhibitor of coagulation)), PRKG1 (protein kinase, cGMP-dependent, type I), BMP2 (bone morphogenetic protein 2), CTNND1 (catenin (cadherin-associated protein), delta 1), CTH (cystathionase (cystathionine gamma-lyase)), CTSS (cathepsin S), VAV2 (guanine nucleotide exchange factor vav 2), NPY2R (neuropeptide Y receptor Y2), IGFBP2 (insulin-like growth factor binding protein 2, 36 kDa), CD28 (CD28 molecule), GSTA1 (glutathione S-transferase, alpha 1), PPIA (peptidylprolyl isomerase A (cyclophilin A)), APOH (apolipoprotein H (beta-2-glycoprotein I)), S100A8 (S100 calcium-binding protein A8), IL11 (interleukin 11), ALOX15 (arachidonate 15-lipoxygenase), FBLN1 (fibulin 1), NR1H3 (nuclear receptor family 1, group H, member 3), SCD (stearoyl-CoA desaturase (delta-9-desaturase)), GIP (gastric inhibitory peptide), CHGB (chromogranin B (secretogranin 1)), PRKCB (protein kinase C, beta), SRD5A1 (steroid-5-alpha-reductase, alpha polypeptide 1 (3-oxo-5 alpha-steroid delta-4-dehydrogenase alpha 1)), HSD11B2 (hydroxysteroid (11-beta) dehydrogenase 2), CALCRL (calcitonin receptor-like), GALNT2 (UDP-N-acetyl-alpha-D-galactosamine:N-acetylgalactosaminyltransferase 2 polypeptide (GalNAc-T2)), ANGPTL4 (angiopoietin-like 4), KCNN4 (calcium-activated potassium channel, intermediate/low conduction, subfamily N, member 4), PIK3C2A (phosphoinositidine 3-kinase, class 2, alpha polypeptide), HBEGF (heparin-binding EGF-like growth factor), CYP7A1 (cytochrome P450, family 7, subfamily A, polypeptide 1), HLA-DRB5 (major histocompatibility complex, class II, DR beta 5), BNIP3 (19-molecular-weight protein 3), kDa, interacting with BCL2/adenovirus E1B), GCKR (glucokinase (hexokinase) regulator 4), S100A12 (S100 calcium-binding protein A12), PADI4 (peptidylarginine deiminase, type IV), HSPA14 (70 kDa heat shock protein 14), CXCR1 (chemokine receptor 1 (with a C-X-C motif)), H19 (H19, maternally expressed peptide imprinted (non-coding protein)), KRTAP19-3 (keratin-associated protein 19-3), IDDM2 (insulin-dependent diabetes mellitus type 2 factor), RAC2 (ras-related botulinum toxin C3 substrate 2 (rho family, small GTP binding protein Rac2)), RYR1 (ryanodine receptor 1 (muscle)), CLOCK (gene homolog (mouse)), NGFR (nerve growth factor receptor (TNFR superfamily, member 16)), DBH (dopamine beta-hydroxylase (dopamine beta-monooxygenase)), CHRNA4 (cholinergic receptor, nicotinic, alpha 4), CACNA1C (calcium channel, voltage-gated, type L, subunit alpha 1C), PRKAG2 (protein kinase, AMP-activated, gamma 2 noncatalytic subunit), CHAT (choline acetyltransferase), PTGDS (prostaglandin D2 synthase 21 kDa (brain)), NR1H2 (nuclear receptor family 1, group H, member 2), TEK (TEK tyrosine kinase, endothelial), VEGFB (vascular endothelial growth factor B), MEF2C (myocyte enhancer factor 2C), MAPKAPK2 (mitogen-activated protein kinase-activated protein kinase 2), TNFRSF11A (tumor necrosis factor receptor superfamily member 11a, NFKB activator), HSPA9 (70 kDa heat shock protein 9 (mortalin)), CYSLTR1 (cysteinyl leukotriene receptor 1), MAT1A (methionine adenosyltransferase I alpha), OPRL1 (opiate receptor-like 1), IMPA1 (insitol (myo)-1 (or 4)-monophosphatase 1), CLCN2 (chloride ion transporter channel 2), DLD (dihydrolipoamide dehydrogenase), PSMA6 (proteasome subunit (prosome, macropain), alpha type 6), PSMB8 (proteasome subunit (prosome, macropain), beta type 8 (large multifunctional peptidase 7)), CHI3L1 (chitinase 3-like factor 1 (cartilage glycoprotein 39)), ALDH1B1 (aldehyde dehydrogenase, family 1, member B1), PARP2 (poly (ADP-ribose) polymerase 2), STAR (steroidogenic acute regulatory protein), LBP (lipopolysaccharide-binding protein), ABCC6 (ATP-binding cassette, subfamily C (CFTR/MRP), member 6), RGS2 (regulator of G protein-mediated signaling 2, 24 kDa), EFNB2 (ephrin-B2), GJB6 (gap junction protein, beta 6, 30 kDa), APOA2 (apolipoprotein A-II), AMPD1 (adenosine monophosphate deaminase 1), DYSF (dysferlin, hip-shoulder muscular dystrophy 2B (autosomal recessive)), FDFT1 (farnesyl-diphosphate farnelystransferase 1), EDN2 (endothelin 2), CCR6 (chemokine receptor 6 (with a C-C motif)), GJB3 (gap junction protein, beta 3, 31 kDa), IL1RL1 (interleukin 1 receptor-like factor 1), ENTPD1 (ectonucleoside triphosphate diphosphohydrolase 1), BBS4 (Bardet-Biedl syndrome factor 4), CELSR2 (cadherin, seven-channel G-type receptor 2 EGF LAG (flamingo homolog, Drosophila)), F11R (F11 receptor), RAPGEF3 (Rap guanine nucleotide exchange factor (GEF) 3), HYAL1 (hyaluronoglycosaminidase 1), ZNF259 (zinc finger protein 259), ATOX1 (ATX1 antioxidant protein 1 homolog (yeast)), ATF6 (transcription activating factor 6), KHK (ketohexokinase (fructokinase)), SAT1 (spermidine/spermine N1-acetyltransferase 1), GGH (gamma-glutamyl hydrolase (conjugase, folylpolygamma-glutamyl hydrolase)), TIMP4 (TIMP inhibitor of metallopeptidase 4), SLC4A4 (solute carrier family 4, sodium bicarbonate cotransporter, member 4), PDE2A (phosphodiesterase 2A, cGMP-stimulated), PDE3B (phosphodiesterase 3B, cGMP-inhibited), FADS1 (fatty acid desaturase 1), FADS2 (fatty acid desaturase 2), TMSB4X (thymosin beta 4, X-linked), TXNIP (thioredoxin-interacting protein), LIMS1 (LIM-like and senescent cell antigen-like domains 1), RHOB (ras homolog gene family, member B), LY96 (lymphocyte antigen 96), FOXO1 (forkhead box O1), PNPLA2 (patatin-like phospholipidase domain-containing factor 2), TRH (thyrotropin-releasing hormone), GJC1 (gap junction protein gamma 1, 45 kDa), SLC17A5 (solute carrier family 17 (anion and sugars), member 5), FTO (fat mass and obesity-associated factor), GJD2 (gap junctional protein delta 2, 36 kDa), PSRC1 (proline-serine-rich double-stranded factor 1), CASP12 (caspase 12 (gene/pseudogene)), GPBAR1 (G protein-coupled bile acid receptor 1), PXK (PX domain-containing serine/threonine kinase), IL33 (interleukin 33), TRIB1 (tribbles homolog 1 (Drosophila)), PBX4 (pre-B-cell leukemia homeobox 4), NUPR1 (nuclear transcriptional regulator protein 1), 15-Sep (15 kDa selenoprotein), CILP2 (cartilage intermediate layer protein 2), TERC (RNA component of telomerase), GGT2 (gamma-glutamyl transferase 2), MT-CO1 (cytochrome c oxidase I, encoded by the mitochondrial genome) and UOX (urate oxidase, a pseudogene). Any of these sequences can be targeted by the CRISPR-Cas system, for example, to study mutation.
В дополнительном варианте осуществления хромосомная последовательность также может быть выбрана из следующих: Pon1 (параоксоназа 1), LDLR (рецептор LDL), ApoE (аполипопротеин E), Apo B-100 (аполипопротеин B-100), ApoA (аполипопротеин(a)), ApoA1 (аполипопротеин A1), CBS (цистатион-B-синтаза), гликопротеин IIb/IIb, MTHRF (5,10-метилентетрагидрофолатредуктаза (NADPH) и их комбинаций. В одном случае хромосомные последовательности и белки, кодируемые хромосомными последовательностями, связанные с сердечно-сосудистым заболеванием, могут быть выбраны из Cacna1C, Sod1, Pten, Ppar(альфа), Apo E, лептина и их комбинаций в качестве мишени(мишеней) для системы CRISPR-Cas.In a further embodiment, the chromosomal sequence may also be selected from the following: Pon1 (paraoxonase 1), LDLR (LDL receptor), ApoE (apolipoprotein E), Apo B-100 (apolipoprotein B-100), ApoA (apolipoprotein(a)), ApoA1 (apolipoprotein A1), CBS (cystathionine B synthase), glycoprotein IIb/IIb, MTHRF (5,10-methylenetetrahydrofolate reductase (NADPH) and combinations thereof. In one case, the chromosomal sequences and proteins encoded by the chromosomal sequences associated with cardiovascular disease may be selected from Cacna1C, Sod1, Pten, Ppar(alpha), Apo E, leptin and combinations thereof as the target(s) for the CRISPR-Cas system.
Лечение заболеваний печени и почекTreatment of liver and kidney diseases
Настоящее изобретение также предусматривает доставку системы CRISPR-Cas, описанной в данном документе, например, систем эффекторного белка Cas9, в печень и/или почки. Стратегии доставки для индукции поглощения клетками терапевтической нуклеиновой кислоты предусматривают использование физических сил или векторных систем, например доставку с использованием вирусов, липидов, или комплексов, или наноносителей. Исходя из первоначальных вариантов применения, имеющих незначительную возможную клиническую значимость, в случае доставки нуклеиновых кислот в клетки почки с помощью гидродинамической системной инъекции с созданием высокого давления, широкий диапазон вирусных терапевтических носителей и носителей, отличных от вирусных, уже применяется для нацеливания на посттранскрипционные события в различных животных моделях заболевания почек in vivo (Csaba Révész and Péter Hamar (2011). Delivery Methods to Target RNAs in the Kidney, Gene Therapy Applications, Prof. Chunsheng Kang (Ed.), ISBN: 978-953-307-541-9, InTech, доступно по ссылке: http://www.intechopen.com/books/gene-therapy-applications/delivery-methods-to-target-rnas-inthe-kidney). Способы доставки в почки могут включать таковые в Yuan et al. (Am J Physiol Renal Physiol 295: F605-F617, 2008) исследовали, может ли in vivo доставка малых интерферирующих РНК (siRNA), целенаправленно воздействующих на 12/15-липоксигеназный (12/15-LO) путь метаболизма арахидоновой кислоты, приводить к уменьшению повреждения почек и диабетической нефропатии (DN) в модели диабета 1 типа на мышах, которым вводили стрептозотоцин путем инъекции. Для достижения большей in vivo доступности и экспрессии siRNA в почке Yuan et al. использовали двухнитевые олигонуклеотиды siRNA к 12/15-LO, конъюгированные с холестерином. Приблизительно 400 мкг siRNA вводили мышам путем подкожной инъекции. Способ согласно Yuang et al. можно применять по отношению к системе CRISPR-Cas по настоящему изобретению, что предусматривает подкожную инъекцию человеку 1-2 г CRISPR-Cas, конъюгированной с холестерином, для доставки в почки.The present invention also provides for the delivery of the CRISPR-Cas system described herein, such as the Cas9 effector protein systems, to the liver and/or kidneys. Delivery strategies for inducing cellular uptake of a therapeutic nucleic acid include the use of physical forces or vector systems, such as delivery using viruses, lipids, or complexes, or nanocarriers. From initial applications of little potential clinical relevance in the case of nucleic acid delivery into kidney cells via high-pressure hydrodynamic systemic injection, a wide range of viral and non-viral therapeutic carriers have already been used to target post-transcriptional events in various animal models of kidney disease in vivo (Csaba Révész and Péter Hamar (2011). Delivery Methods to Target RNAs in the Kidney, Gene Therapy Applications, Prof. Chunsheng Kang (Ed.), ISBN: 978-953-307-541-9, InTech, available at: http://www.intechopen.com/books/gene-therapy-applications/delivery-methods-to-target-rnas-inthe-kidney). Kidney delivery methods may include those of Yuan et al. (Am J Physiol Renal Physiol 295: F605–F617, 2008) investigated whether in vivo delivery of small interfering RNA (siRNA) targeting the 12/15-lipoxygenase (12/15-LO) pathway of arachidonic acid metabolism could result in attenuated renal injury and diabetic nephropathy (DN) in a streptozotocin-injected mouse model of type 1 diabetes. To achieve greater in vivo availability and expression of siRNA in the kidney, Yuan et al. used cholesterol-conjugated double-stranded siRNA oligonucleotides to 12/15-LO. Approximately 400 μg of siRNA was administered to mice by subcutaneous injection. The method according to Yuang et al. can be applied to the CRISPR-Cas system of the present invention, which involves subcutaneous injection into a human of 1-2 g of CRISPR-Cas conjugated to cholesterol for delivery to the kidneys.
Molitoris et al. (J Am Soc Nephrol 20: 1754-1764, 2009) использовали клетки проксимальных канальцев (PTC) в качестве сайта реабсорбции олигонуклеотидов в почке для исследования эффективности siRNA, целенаправленно воздействующей на p53, ключевой белок в апоптическом пути, для предупреждения повреждения почки. "Оголенная" синтетическая siRNA к p53, которую вводили путем внутривенной инъекции через 4 ч после ишемического повреждения, обеспечивала максимальную защиту как PTC, так и функции почки. Данные Molitoris et al. указывают, что после внутривенного введения следует быстрая доставка siRNA в клетки проксимальных канальцев. Для анализа зависимости эффекта от дозы крысам инъецировали дозы siP53 0,33; 1, 3 или 5 мг/кг, которые вводили в те же четыре момента времени, что давало в результате суммарные дозы 1,32, 4, 12 и 20 мг/кг соответственно. Все протестированные дозы siRNA приводили к эффекту снижения SCr, в день один, причем более высокие дозы являлись эффективными в течение приблизительно пяти дней по сравнению с обработанными PBS контрольными крысами с ишемией. Суммарные дозы 12 и 20 мг/кг обеспечивали наилучший защитный эффект. Способ согласно Molitoris et al. можно применять по отношению к системе нацеливания на нуклеиновую кислоту по настоящему изобретению, что предусматривает введение человеку суммарных доз 12 и 20 мг/кг для доставки в почки.Molitoris et al. (J Am Soc Nephrol 20: 1754–1764, 2009) used proximal tubular cells (PTCs) as a site of oligonucleotide reabsorption in the kidney to investigate the efficacy of siRNA targeting p53, a key protein in the apoptotic pathway, in preventing kidney injury. Naked synthetic siRNA to p53, administered by intravenous injection 4 h after ischemic injury, provided maximal protection of both PTCs and kidney function. The data of Molitoris et al. indicate that intravenous administration is followed by rapid delivery of siRNA to proximal tubular cells. For dose-response analysis, rats were injected with siP53 doses of 0.33; 1, 3 or 5 mg/kg administered at the same four time points, resulting in total doses of 1.32, 4, 12 and 20 mg/kg, respectively. All siRNA doses tested resulted in a SCr lowering effect on day one, with higher doses being effective for approximately five days compared to PBS-treated ischemic control rats. Total doses of 12 and 20 mg/kg provided the best protective effect. The method of Molitoris et al. can be applied to the nucleic acid targeting system of the present invention, which provides for total doses of 12 and 20 mg/kg to be administered to humans for delivery to the kidney.
Thompson et al. (Nucleic Acid Therapeutics, Volume 22, Number 4, 2012) сообщили о токсикологических и фармакокинетических свойствах синтетических малых интерферирующих РНК I5NP после внутривенного введения грызунам и приматам, отличным от человека. I5NP разработан так, чтобы действовать посредством пути РНК-интерференции (RNAi) для временного ингибирования экспрессии проапоптического белка p53 и создан для защиты клеток от повреждений, связанных с острой ишемией/реперфузией, как, например, острое повреждение почки, которое может возникать при обширной операции на сердце, и отсроченная функция трансплантата, которая может возникать после пересадки почки. Дозы 800 мг/кг I5NP для грызунов и 1000 мг/кг I5NP для приматов, отличных от человека, требовались для того, чтобы вызвать нежелательные эффекты, которые у обезьян сводились к непосредственному воздействию на кровь, чтовключало бессимптомную активацию комплемента и несколько увеличенное время свертывания крови. У крыс не наблюдали дополнительных нежелательных эффектов при использовании аналога I5NP, предназначенного для крыс, что указывало на то, что эти эффекты, вероятно, представляют собой эффекты, связанные с классом синтетических РНК-дуплексов, а не с токсичностью, обусловленной целевой фармакологической активностью I5NP. Взятые вместе, эти данные согласуются с клиническим исследованием с внутривенным введением I5NP для сохранения функции почек после повреждения, связанного с острой ишемией/реперфузией. Уровень, при котором не наблюдали нежелательных эффектов (NOAEL) у обезьян, составлял 500 мг/кг. Не наблюдали эффектов в отношении параметров сердечно-сосудистой, дыхательной и нервной системы у обезьян после внутривенного введения при уровнях дозы до 25 мг/кг. Следовательно, аналогичная доза может предусматриваться для внутривенного введения CRISPR-Cas в почки человека.Thompson et al. (Nucleic Acid Therapeutics, Volume 22, Number 4, 2012) reported the toxicological and pharmacokinetic properties of the synthetic small interfering RNA I5NP following intravenous administration to rodents and non-human primates. I5NP is designed to act via the RNA interference (RNAi) pathway to transiently inhibit expression of the pro-apoptotic protein p53 and is designed to protect cells from acute ischemia/reperfusion-related injury, such as acute kidney injury that may occur following major cardiac surgery and delayed graft function that may occur following kidney transplantation. Doses of 800 mg/kg I5NP in rodents and 1000 mg/kg I5NP in non-human primates were required to produce adverse effects, which in monkeys were limited to direct effects on the blood, including asymptomatic complement activation and slightly prolonged clotting times. No additional adverse effects were observed in rats with the rat analogue of I5NP, indicating that these effects likely represent effects related to the class of synthetic RNA duplexes rather than toxicity due to the targeted pharmacologic activity of I5NP. Taken together, these data are consistent with a clinical study using intravenous I5NP to preserve renal function after acute ischemia/reperfusion injury. The no observed adverse effect level (NOAEL) in monkeys was 500 mg/kg. No effects on cardiovascular, respiratory, or neuronal parameters were observed in monkeys following intravenous administration at dose levels up to 25 mg/kg. Therefore, a similar dose could be envisaged for intravenous administration of CRISPR-Cas to the human kidney.
Shimizu et al. (J Am Soc Nephrol 21: 622-633, 2010) разработали систему для целенаправленной доставки siRNA в клубочки с помощью средств на основе поли(этиленгликоля) и поли(L-лизина). Диаметр комплекса siRNA/наноноситель составлял от приблизительно 10 до 20 нм, причем данный размер будет позволять ему проходить через окончатый эндотелий для того, чтобы попасть в мезангий. После интраперитонеальной инъекции флуоресцентно меченых комплексов siRNA/наноноситель Shimizu et al. выявляли siRNA в кровотоке в течение длительного времени. Повторное интраперитонеальное введение комплекса siRNA к митоген-активируемой протеинкиназе 1 (MAPK1)/наноноситель подавляло экспрессию мРНК и белка MAPK1 в клубочках в мышиной модели гломерулонефрита. Для исследования накопления siRNA Cy5-меченые siRNA в комплексе с PIC наноносителями (0,5 мл, содержание siRNA 5 нмоль), "оголенные" Cy5-меченые siRNA (0,5 мл, 5 нмоль) или Cy5-меченые siRNA, инкапсулированные в HVJ-E (0,5 мл, содержание 5 нмоль siRNA), вводили мышам BALBc. Способ согласно Shimizu et al. можно применять по отношению к системе нацеливания на нуклеиновую кислоту по настоящему изобретению, что предусматривает дозу приблизительно 10-20 мкмоль CRISPR-Cas в комплексе с наноносителями на приблизительно 1-2 литра для интраперитонеального введения человеку и доставки в почки.Shimizu et al. (J Am Soc Nephrol 21: 622–633, 2010) developed a system for targeted delivery of siRNA to glomeruli using poly(ethylene glycol) and poly(L-lysine)-based vehicles. The diameter of the siRNA/nanocarrier complex was approximately 10 to 20 nm, a size that would allow it to pass through the fenestrated endothelium to enter the mesangium. Following intraperitoneal injection of fluorescently labeled siRNA/nanocarrier complexes, Shimizu et al. detected siRNA in the circulation for a prolonged period. Repeated intraperitoneal administration of mitogen-activated protein kinase 1 (MAPK1) siRNA/nanocarrier complex suppressed MAPK1 mRNA and protein expression in glomeruli in a mouse model of glomerulonephritis. To study the accumulation of siRNA, Cy5-labeled siRNA complexed with PIC nanocarriers (0.5 ml, 5 nmol siRNA content), naked Cy5-labeled siRNA (0.5 ml, 5 nmol) or Cy5-labeled siRNA encapsulated in HVJ-E (0.5 ml, 5 nmol siRNA content) were administered to BALBc mice. The method of Shimizu et al. can be applied to the nucleic acid targeting system of the present invention, which provides a dose of about 10-20 μmol CRISPR-Cas complexed with nanocarriers per about 1-2 liters for intraperitoneal administration to humans and delivery to the kidneys.
Лечение заболеваний эпителия и легкихTreatment of epithelial and lung diseases
Настоящее изобретение также предусматривает доставку системы CRISPR-Cas, описанной в данном документе, например, систем Cas9, в одно легкое или в оба легких.The present invention also provides for delivery of a CRISPR-Cas system described herein, such as Cas9 systems, to one lung or both lungs.
Несмотря на то, что векторы на основе AAV-2 были изначально предложены для доставки CFTR в дыхательные пути при CF, другие серотипы, например AAV-1, AAV-5, AAV-6 и AAV-9, демонстрировали улучшенную эффективность переноса генов в ряде моделей эпителия легких (см., например, Li et al., Molecular Therapy, vol. 17 no. 12, 2067-2077 Dec 2009). Было продемонстрировано, что AAV-1 являлся в ~100 раз более эффективным, чем AAV-2 и AAV-5 при трансдукции эпителиальных клеток дыхательных путей человека in vitro, хотя эффективность трансдукции эпителия воздухоносных путей трахеи мышей in vivo при использовании помощи AAV-1 была равной таковой для AAV-5. Другие исследования продемонстрировали, что AAV-5 являлся в 50 раз более эффективным, чем AAV-2, при доставке генов в эпителий дыхательных путей человека (HAE) in vitro и значительно более эффективным в эпителии воздухоносных путей легких мышей in vivo. Также было продемонстрировано, что AAV-6 являлся более эффективным, чем AAV-2, в эпителиальных клетках дыхательных путей человека in vitro и дыхательных путях мышей in vivo. Как было показано, изолят, обнаруженный позже, AAV-9, продемонстрировал большую эффективность переноса генов, чем AAV-5, в назальном и альвеолярном эпителии мышей in vivo, причем экспрессию гена выявляли в течение более 9 месяцев, что позволяет предположить, что AAV может обеспечивать длительную экспрессию генов in vivo, являющуюся необходимым свойством для вектора для доставки гена CFTR. Более того, было продемонстрировано, что AAV-9 можно повторно вводить в легкие мышей без потери экспрессии CFTR и с минимальными последствиями, связанными с иммунной системой. Культуры HAE с CF и без CF можно инокулировать на апикальной поверхности с использованием 100 мкл векторов на основе AAV в течение нескольких часов (см., например, Li et al., Molecular Therapy, vol. 17 no. 12, 2067-2077 Dec 2009). MOI может варьировать от 1 × 103 до 4 × 105 векторных геномов/клетка, в зависимости от концентрации вируса и целей экспериментов. Упомянутые выше векторы предусматриваются для доставки и/или введения согласно настоящему изобретению.Although AAV-2-based vectors were initially proposed for delivery of CFTR to the CF airway, other serotypes, such as AAV-1, AAV-5, AAV-6, and AAV-9, have demonstrated improved gene transfer efficiency in a number of lung epithelial models (see, e.g., Li et al., Molecular Therapy, vol. 17 no. 12, 2067-2077 Dec 2009). AAV-1 was shown to be ~100-fold more efficient than AAV-2 and AAV-5 in transducing human airway epithelial cells in vitro, although the transduction efficiency of murine tracheal airway epithelium in vivo using AAV-1 was equal to that of AAV-5. Other studies have demonstrated that AAV-5 was 50-fold more efficient than AAV-2 at delivering genes into human airway epithelium (HAE) in vitro and significantly more efficient in mouse lung airway epithelium in vivo. AAV-6 was also shown to be more efficient than AAV-2 in human airway epithelial cells in vitro and mouse airways in vivo. A more recently discovered isolate, AAV-9, was shown to exhibit greater gene transfer efficiency than AAV-5 in mouse nasal and alveolar epithelium in vivo, with gene expression detectable for over 9 months, suggesting that AAV can provide long-lasting gene expression in vivo, a necessary property for a CFTR gene delivery vector. Furthermore, it was demonstrated that AAV-9 could be repeatedly administered into mouse lungs without loss of CFTR expression and with minimal immune-related sequelae. CF and non-CF HAE cultures can be inoculated at the apical surface with 100 μl of AAV-based vectors for several hours (see, e.g., Li et al., Molecular Therapy, vol. 17 no. 12, 2067-2077 Dec 2009). The MOI can range from 1 x 10 3 to 4 x 10 5 vector genomes/cell, depending on the virus concentration and the experimental goals. The above-mentioned vectors are contemplated for delivery and/or administration according to the present invention.
Zamora et al. (Am J Respir Crit Care Med Vol 183. pp 531-538, 2011) представили пример применения терапевтического средства на основе РНК-интерференции для лечения инфекционных заболеваний человека, а также рандомизированного исследования противовирусного лекарственного средства у реципиентов трансплантата легкого, инфицированного респираторным синцитиальным вирусом (RSV). Zamora et al. провели рандомизированное, двойное слепое, плацебо-контролируемое исследование у реципиентов LTX с инфекцией дыхательных путей RSV. Пациентам давали возможность получать стандартное лечение против RSV. ALN-RSV01 в форме аэрозоля (0,6 мг/кг) или плацебо вводили ежедневно в течение 3 дней. Это исследование продемонстрировало, что терапевтическое средство на основе RNAi, целенаправленно воздействующее на RSV, можно вводить без риска реципиентам LTX с инфекцией RSV. Три ежедневные дозы ALN-RSV01 не приводили в результате к какому-либо обострению симптомов в дыхательных путях или к нарушению функции легких и не проявляли каких-либо системных провоспалительных эффектов, таких как индукция цитокинов или CRP. Фармакокинетические исследования продемонстрировали только низкий уровень временного системного воздействия после ингаляции, что согласуется с данными доклинических исследований на животных, демонстрирующих, что ALN-RSV01, вводимый внутривенно или путем ингаляции, подвергается быстрому клиренсу из кровотока с помощью опосредованного экзонуклеазами расщепления и почечной экскреции. Способ согласно Zamora et al. можно применять в отношении системы нацеливания на нуклеиновую кислоту по настоящему изобретению, и при этом CRISPR-Cas в форме аэрозоля, например, при дозе 0,6 мг/кг, может предусматриваться в соответствии с настоящим изобретением.Zamora et al. (Am J Respir Crit Care Med Vol 183. pp 531-538, 2011) presented an example of the use of RNAi-based therapeutics to treat human infectious diseases, as well as a randomized trial of an antiviral drug in lung transplant recipients infected with respiratory syncytial virus (RSV). Zamora et al. conducted a randomized, double-blind, placebo-controlled trial in LTX recipients with RSV respiratory tract infection. Patients were given the option of receiving standard of care anti-RSV treatment. ALN-RSV01 aerosol (0.6 mg/kg) or placebo was administered daily for 3 days. This study demonstrated that an RNAi-based therapeutic targeting RSV can be safely administered to LTX recipients with RSV infection. Three daily doses of ALN-RSV01 did not result in any exacerbation of airway symptoms or impairment of lung function and did not exhibit any systemic pro-inflammatory effects such as cytokine or CRP induction. Pharmacokinetic studies demonstrated only low-level transient systemic exposure following inhalation, consistent with preclinical animal studies demonstrating that ALN-RSV01 administered intravenously or by inhalation undergoes rapid clearance from the bloodstream via exonuclease-mediated cleavage and renal excretion. The method according to Zamora et al. can be used in relation to the nucleic acid targeting system of the present invention, and wherein CRISPR-Cas in the form of an aerosol, for example at a dose of 0.6 mg/kg, can be provided according to the present invention.
Schwank et al. (Cell Stem Cell, 13:653-58, 2013) использовали CRISPR-Cas9 для коррекции дефекта, ассоциированного с муковисцидозом, в стволовых клетках человека. Целью исследователей являлся ген ионного канала, рецептора трансмембранной проводимости при муковисцидозе (CFTR). Делеция в CFTR приводит к неправильной укладке белка у пациентов с муковисцидозом. С использованием культивируемых стволовых клеток кишечника, полученных из образцов клеток от двух детей с муковисцидозом, Schwank et al. смогли скорректировать дефект с использованием CRISPR вместе с донорной плазмидой, содержащей репаративную последовательность, подлежащую вставке. Исследователи затем вырастили клетки до "органоидов" кишечника или кишок небольшого размера и продемонстрировали, что они нормально функционировали. В этом случае приблизительно половина клональных органоидов подвергалась надлежащей коррекции наследственного материала.Schwank et al. (Cell Stem Cell, 13:653–58, 2013) used CRISPR-Cas9 to correct a defect associated with cystic fibrosis in human stem cells. The researchers targeted the ion channel gene cystic fibrosis transmembrane conductance receptor (CFTR). A deletion in CFTR results in misfolding of the protein in patients with cystic fibrosis. Using cultured intestinal stem cells derived from cell samples from two children with cystic fibrosis, Schwank et al. were able to correct the defect using CRISPR along with a donor plasmid containing the repair sequence to be inserted. The researchers then grew the cells into small intestinal or gut “organoids” and demonstrated that they functioned normally. In this case, approximately half of the clonal organoids had the proper correction of their hereditary material.
Лечение заболеваний мышечной системыTreatment of diseases of the muscular system
Настоящее изобретение также предусматривает доставку системы CRISPR-Cas, описанной в данном документе, например, систем Cas9, в мышцу(мышцы).The present invention also provides for delivery of a CRISPR-Cas system described herein, such as Cas9 systems, to muscle(s).
Bortolanza et al. (Molecular Therapy vol. 19 no. 11, 2055-2064 Nov. 2011) продемонстрировали, что системная доставка кассет экспрессии для РНК-интерференции у мышей FRG1 после начала проявления плече-лопаточно-лицевой мышечной дистрофии (FSHD) приводила к дозозависимому длительному нокдауну FRG1 без симптомов токсичности. Bortolanza et al. обнаружили, что однократная внутривенная инъекция 5 × 1012 vg (векторных геномов) rAAV6-sh1FRG1 восстанавливает гистопатологические характеристики мышц и функцию мышц у мышей FRG1. Более подробно, 200 мкл, содержащие 2 × 1012 или 5 × 1012 vg вектора в физиологическом растворе, вводили путем инъекции в хвостовую вену с использованием шприца Terumo с иглой 25-ого калибра. Способ согласно Bortolanza et al. можно применять в отношении AAV, экспрессирующему CRISPR Cas, и вводить его человеку путем инъекции в дозе приблизительно 2 × 1015 или 2 × 1016 vg вектора.Bortolanza et al. (Molecular Therapy vol. 19 no. 11, 2055-2064 Nov. 2011) demonstrated that systemic delivery of RNAi expression cassettes to FRG1 mice after the onset of facioscapulohumeral muscular dystrophy (FSHD) resulted in dose-dependent, long-term knockdown of FRG1 without toxicity symptoms. Bortolanza et al. found that a single intravenous injection of 5 × 10 12 vg (vector genomes) of rAAV6-sh1FRG1 rescued muscle histopathology and muscle function in FRG1 mice. In more detail, 200 μl containing 2 × 10 12 or 5 × 10 12 vg of vector in saline was injected into the tail vein using a Terumo syringe with a 25-gauge needle. The method according to Bortolanza et al. can be applied to AAV expressing CRISPR Cas and administered to a human by injection at a dose of approximately 2 × 10 15 or 2 × 10 16 vg of vector.
Dumonceaux et al. (Molecular Therapy vol. 18 no. 5, 881-887 May 2010) осуществляли ингибирование пути миостатина с применением методики РНК-интерференции, направленной против мРНК рецептора миостатина AcvRIIb (sh-AcvRIIb). Восстановление квази-дистрофина было опосредовано методикой направленного U7 пропуска экзона (U7-DYS). Векторы на основе аденоассоциированных вирусов, несущие либо только конструкцию sh-AcvrIIb, либо только конструкцию U7-DYS, или комбинацию обоих конструкций, вводили путем инъекции в переднюю большеберцовую (TA) мышцу мышей mdx с дистрофией. Инъекции осуществляли с использованием 1011 геномов вируса AAV. Способ согласно Dumonceaux et al. можно применять в отношении AAV, экспрессирующему CRISPR Cas, и вводить его человеку путем инъекции, например, в дозе от приблизительно 1014 до приблизительно 1015 vg вектора.Dumonceaux et al. (Molecular Therapy vol. 18 no. 5, 881-887 May 2010) inhibited the myostatin pathway using RNA interference directed against the myostatin receptor AcvRIIb mRNA (sh-AcvRIIb). Quasi-dystrophin restoration was mediated by targeted U7 exon skipping (U7-DYS). Adeno-associated virus vectors carrying either the sh-AcvrIIb construct alone, the U7-DYS construct alone, or a combination of both constructs were injected into the tibialis anterior (TA) muscle of dystrophic mdx mice. Injections were performed using 10 11 AAV genomes. The method is according to Dumonceaux et al. can be used with respect to an AAV expressing CRISPR Cas and administered to a human by injection, for example, at a dose of from about 10 14 to about 10 15 vg of the vector.
Kinouchi et al. (генная терапия (2008) 15, 1126-1130) сообщили об эффективности доставки siRNA in vivo в скелетные мышцы нормальных или больных мышей посредством образования наночастиц из химически не модифицированных siRNA с ателоколлагеном (ATCOL). ATCOL-опосредованное местное применение siRNA, целенаправленно воздействующей на миостатин, отрицательный регулятор роста скелетных мышц, при введении в скелетные мышцы мышей или внутривенно приводило к существенному увеличению мышечной массы в течение нескольких недель после применения. Эти результаты указывают на то, что ATCOL-опосредованное применение siRNA является мощным инструментом для дальнейшего терапевтического применения для лечения заболеваний, в том числе мышечной атрофии. Mst-siRNA (конечная концентрация, 10 мМ) смешивали с ATCOL (конечная концентрация для местного введения, 0,5%) (AteloGene, Kohken, Токио, Япония) в соответствии с инструкциями производителя. После проведения анестезии мышей (самцы C57BL/6 в возрасте 20 недель) с помощью нембутала (25 мг/кг, интраперитонеально) комплекс Mst-siRNA/ATCOL инъецировали в жевательные мышцы и двуглавую мышцу бедра. Способ согласно Kinouchi et al. можно применять в отношении CRISPR-Cas и вводить ее человеку путем инъекции, например, в дозе от приблизительно 500 до 1000 мл 40 мкМ раствора в мышцу. Hagstrom et al. (Molecular Therapy Vol. 10, No. 2, August 2004) описывали интраваскулярную методику без использования вируса, которая обеспечивает эффективную и воспроизводимую доставку нуклеиновых кислот в мышечные клетки (мышечные волокна) мышц конечности млекопитающих. Методика включает инъекцию "оголенной" плазмидной ДНК или siRNA в вену дистальной части конечности, временно изолированную с помощью жгута или пневматической манжеты. Доставка нуклеиновой кислоты в мышечные волокна обеспечивается посредством ее быстрого введения путем инъекции при объеме, достаточном для обеспечения просачивания раствора нуклеиновой кислоты в мышечную ткань. Высокие уровни экспрессии трансгена в скелетной мышце достигались как у мелких, так и у крупных животных при минимальной токсичности. Также были получены доказательства доставки siRNA в мышцу конечности. Для внутривенной инъекции плазмидной ДНК макаку-резусу трехходовый кран присоединяли к двум шприцевым насосам (Model PHD 2000; Harvard Instruments), в каждый из которых помещали один шприц. Через пять минут после инъекции папаверина вводили путем инъекции pDNA (15,5-25,7 мг в 40-100 мл физиологического раствора) при скорости 1,7 или 2,0 мл/с. Это можно воспроизводить в увеличенном масштабе для плазмидной ДНК, экспрессирующей CRISPR Cas согласно настоящему изобретению, причем с инъекцией человеку от приблизительно 300 до 500 мг в 800-2000 мл физиологического раствора. Для инъекции аденовирусного вектора крысе 2 x 109 инфекционных частиц в 3 мл физиологического солевого раствора (NSS) вводили путем инъекции. Это можно воспроизводить в увеличенном масштабе для аденовирусного вектора, экспрессирующего CRISPR Cas согласно настоящему изобретению, причем с инъекцией человеку приблизительно 1 x 1013 инфекционных частиц в 10 литрах NSS. Что касается siRNA, крысе вводили путем инъекции в большую подкожную вену 12,5 мкг siRNA, а примату вводили путем инъекции в большую подкожную вену 750 мкг siRNA. Это можно воспроизводить в увеличенном масштабе для CRISPR Cas согласно настоящему изобретению, например, путем инъекции от приблизительно 15 до приблизительно 50 мг в большую подкожную вену человека.Kinouchi et al. (Gene Therapy (2008) 15, 1126–1130) reported the efficacy of in vivo siRNA delivery to skeletal muscle of normal or diseased mice via the formation of nanoparticles from chemically unmodified atelocollagen-coated siRNA (ATCOL). ATCOL-mediated local application of siRNA targeting myostatin, a negative regulator of skeletal muscle growth, resulted in significant increases in muscle mass within weeks of administration when injected into mouse skeletal muscle or intravenously. These results indicate that ATCOL-mediated siRNA delivery is a powerful tool for further therapeutic application in diseases including muscle atrophy. Mst-siRNA (final concentration, 10 mM) was mixed with ATCOL (final concentration for local administration, 0.5%) (AteloGene, Kohken, Tokyo, Japan) according to the manufacturer's instructions. After anesthetizing mice (male C57BL/6, 20 weeks old) with Nembutal (25 mg/kg, i.p.), the Mst-siRNA/ATCOL complex was injected into the masseter and biceps femoris muscles. The method of Kinouchi et al. can be applied to CRISPR-Cas and administered to humans by injection, for example, at a dose of approximately 500 to 1000 mL of a 40 μM solution into the muscle. Hagstrom et al. (Molecular Therapy Vol. 10, No. 2, August 2004) described a virus-free intravascular technique that provides efficient and reproducible delivery of nucleic acids into muscle cells (muscle fibers) of mammalian limb muscles. The technique involves injection of naked plasmid DNA or siRNA into a distal limb vein temporarily isolated by a tourniquet or pneumatic cuff. Delivery of nucleic acid to muscle fibers is achieved by rapid injection of the nucleic acid in a volume sufficient to allow leakage of the nucleic acid solution into the muscle tissue. High levels of transgene expression in skeletal muscle were achieved in both small and large animals with minimal toxicity. Evidence of siRNA delivery to limb muscle was also obtained. For intravenous injection of plasmid DNA into a rhesus macaque, a three-way stopcock was attached to two syringe pumps (Model PHD 2000; Harvard Instruments), each holding one syringe. Five minutes after injection, papaverine was administered by injection of pDNA (15.5-25.7 mg in 40-100 ml of saline) at a rate of 1.7 or 2.0 ml/s. This can be scaled up for plasmid DNA expressing the CRISPR Cas of the present invention, with injection into humans of approximately 300 to 500 mg in 800-2000 ml of saline. For injection of adenoviral vector into a rat, 2 x 10 9 infectious particles in 3 ml of normal saline (NSS) were injected. This can be scaled up for an adenoviral vector expressing the CRISPR Cas of the present invention, with an injection of approximately 1 x 10 13 infectious particles in 10 liters of NSS into a human. For siRNA, 12.5 μg of siRNA was injected into the great saphenous vein in a rat, and 750 μg of siRNA was injected into the great saphenous vein in a primate. This can be scaled up for the CRISPR Cas of the present invention, for example, by injecting approximately 15 to approximately 50 mg into the great saphenous vein in a human.
См. также, например, опубликованную заявку Duke University WO2013163628 A2 "Генетическая коррекция мутированных генов", в которой описаны попытки коррекции, например, мутации по типу сдвига рамки считывания, которая вызывает появление преждевременного стоп-кодона и усечение продукта гена, которую можно откорректировать посредством опосредованного нуклеазами негомологичного соединения концов, как, например, обуславливающей мышечную дистрофию Дюшенна ("DMD"), рецессивное смертельное сцепленное с X-хромосомой нарушение, приводящее к мышечной дегенерации в связи с мутациями гена дистрофина. Большинство мутаций гена дистрофина, вызывающих DMD, представляют собой делеции экзонов, нарушающие рамку считывания и вызывающие преждевременную терминацию трансляции гена дистрофина. Дистрофин представляет собой цитоплазматический белок, обеспечивающий стабильность структуры дистрогликанового комплекса клеточной мембраны, отвечающего за регуляцию целостности и функционирования мышечных клеток. Ген дистрофина или "ген DMD", как взаимозаменяемо используется в данном документе, образован 2,2 миллионами пар оснований в локусе Xp21. Размер первичного транскрипта составляет приблизительно 2400 т.п.о., при этом размер зрелой мРНК составляет приблизительно 14 т.п.о. 79 экзонов кодируют белок, образованный более 3500 аминокислотами. Экзон 51 часто является смежным с положениями делеций, нарушающих рамку считывания, у пациентов с DMD, и в клинических испытаниях на него был направлен пропуск экзона, основанный на применении олигонуклеотидов. Недавно в клиническом испытании с пропуском экзона 51 с помощью соединения этерлипсена сообщали о значительном положительном функциональном эффекте в течение 48 недель со средним количеством дистрофин-положительных волокон 47% по сравнению с исходным уровнем. Мутации в экзоне 51 идеально подходят для устойчивой коррекции посредством редактирования генома на основе NHEJ.See also, e.g., Duke University published application WO2013163628 A2, "Genetic Correction of Mutated Genes," which describes attempts to correct, e.g., a frameshift mutation that causes a premature stop codon and truncation of the gene product, which can be corrected by nuclease-mediated non-homologous end joining, such as that causing Duchenne muscular dystrophy ("DMD"), a recessive, lethal, X-linked disorder resulting in muscle degeneration associated with mutations in the dystrophin gene. Most of the dystrophin gene mutations that cause DMD are exon deletions that disrupt the reading frame and cause premature termination of translation of the dystrophin gene. Dystrophin is a cytoplasmic protein that provides structural stability to the cell membrane dystroglycan complex responsible for regulating muscle cell integrity and function. The dystrophin gene, or "DMD gene" as used interchangeably herein, spans 2.2 million base pairs at the Xp21 locus. The primary transcript is approximately 2,400 kb in size, with the mature mRNA being approximately 14 kb. 79 exons encode a protein of over 3,500 amino acids. Exon 51 is frequently adjacent to out-of-frame deletions in patients with DMD and has been targeted by oligonucleotide-based exon skipping in clinical trials. Recently, a clinical trial using exon 51 skipping with the compound eterlipsen reported a significant functional benefit over 48 weeks with a mean dystrophin-positive fiber count of 47% compared to baseline. Mutations in exon 51 are ideal for durable correction via NHEJ-based genome editing.
Способы согласно публикации заявки на патент США № 20130145487, закрепленной за Cellectis, которые относятся к вариантам мегануклеаз для расщепления целевой последовательности гена дистрофина человека (DMD), также можно модифицировать для системы нацеливания на нуклеиновую кислоту по настоящему изобретению.The methods of U.S. Patent Application Publication No. 20130145487 assigned to Cellectis, which relate to meganuclease variants for cleaving a target sequence of the human dystrophin gene (DMD), may also be modified for the nucleic acid targeting system of the present invention.
Лечение заболеваний кожиTreatment of skin diseases
Настоящее изобретение также предусматривает доставку системы CRISPR-Cas, описанной в данном документе, например, систем эффекторного белка Cas9, в кожу.The present invention also provides for delivery of the CRISPR-Cas system described herein, such as the Cas9 effector protein systems, to the skin.
Hickerson et al. (Molecular Therapy-Nucleic Acids (2013) 2, e129) обращаются к снабженному приводом устройству с матрицей микроигл для доставки в кожу, предназначенному для самостоятельной (sd) доставки siRNA в кожу человека и мыши. Основной проблемой, связанной с переносом терапевтических средств на основе siRNA для кожи в клиническую практику, является разработка эффективных систем доставки. Значительные усилия были приложены к созданию ряда методик доставки в кожу, причем с ограниченным успехом. В клиническом исследовании, в котором кожу обрабатывали siRNA, острая боль, связанная с инъекцией с помощью иглы для подкожных инъекций, препятствовала включению дополнительных пациентов в исследование, что придает большое значение потребности в улучшенных, более "удобных для пациента" (т.е. причиняющих слабую боль или не причиняющих ее) средствах доставки. Микроиглы представляют эффективный способ доставки крупных заряженных молекул-карго, включающих siRNA, через первичный барьер, роговой слой, и, как правило, считаются причиняющими меньшую боль, чем обычные иглы для подкожных инъекций. Снабженные приводом устройства "штамповочного типа" с микроиглами, в том числе снабженное приводом устройство с сеткой микроигл (MMNA), используемое Hickerson et al., как было продемонстрировано, были безопасными в исследованиях на бесшерстных мышах и причиняли слабую боль или не причиняли боли, о чем свидетельствует (i) широкое применение в косметологии и (ii) ограниченное тестирование, в котором практически все добровольцы считали применение устройства причиняющим намного меньшую боль, чем при вакцинации против гриппа, что позволяет предположить, что доставка siRNA с применением этого устройства будет намного менее болезненной, чем испытываемая в предшествующих клинических исследованиях с применением игл для подкожных инъекций. Устройство MMNA (имеющееся в продаже как Triple-M или Tri-M от Bomtech Electronic Co, Сеул, Южная Корея) адаптировали для доставки siRNA в кожу мыши и человека. Раствор sd-siRNA (до 300 мкл 0,1 мг/мл РНК) вводили в камеру одноразового инъекционного картриджа с иглами Tri-M (Bomtech), которые устанавливали на глубину 0,1 мм. Для обработки кожи человека деидентифицированную кожу (полученную непосредственно после хирургических вмешательств) растягивали вручную и прикалывали к пробковому столу перед обработкой. Все интрадермальные инъекции осуществляли с помощью инсулинового шприца с 0,5-дюймовой иглой 28 калибра. Устройство MMNA и способ согласно Hickerson et al. можно применять и/или приспосабливать для доставки CRISPR-Cas согласно настоящему изобретению, например, в дозе до 300 мкл 0,1 мг/мл CRISPR-Cas, в кожу.Hickerson et al. (Molecular Therapy-Nucleic Acids (2013) 2, e129) address a powered microneedle array device for skin delivery designed for self-directed (sd) delivery of siRNA into human and mouse skin. A major challenge in translating siRNA-based skin therapeutics into clinical practice is the development of efficient delivery systems. Considerable effort has been devoted to developing a number of skin delivery techniques, with limited success. In a clinical trial in which skin was treated with siRNA, the acute pain associated with hypodermic needle injection prevented the enrollment of additional patients, highlighting the need for improved, more “patient-friendly” (i.e., causing little or no pain) delivery systems. Microneedles provide an efficient means of delivering large charged cargo molecules, including siRNA, across the primary barrier, the stratum corneum, and are generally considered to be less painful than conventional hypodermic needles. Powered "punch-type" microneedle devices, including the powered microneedle array (MMNA) device used by Hickerson et al., have been shown to be safe in nude mouse studies, causing little or no pain, as evidenced by (i) widespread use in cosmetics and (ii) limited testing in which virtually all volunteers rated the device as much less painful than influenza vaccination, suggesting that siRNA delivery using this device will be much less painful than that experienced in previous clinical studies using hypodermic needles. The MMNA device (commercially available as Triple-M or Tri-M from Bomtech Electronic Co, Seoul, South Korea) was adapted for siRNA delivery into mouse and human skin. The sd-siRNA solution (up to 300 μl of 0.1 mg/ml RNA) was injected into the chamber of a disposable injection cartridge with Tri-M needles (Bomtech) that were set at a depth of 0.1 mm. For human skin processing, de-identified skin (obtained immediately after surgical procedures) was manually stretched and pinned to a cork table prior to processing. All intradermal injections were performed using an insulin syringe with a 0.5-inch, 28-gauge needle. The MMNA device and method are according to Hickerson et al. can be used and/or adapted to deliver CRISPR-Cas according to the present invention, for example at a dose of up to 300 µl of 0.1 mg/ml CRISPR-Cas, into the skin.
В Leachman et al. (Molecular Therapy, vol. 18 no. 2, 442-446 Feb. 2010) изложено клиническое исследование фазы Ib, направленное на лечение редкого нарушения кожи врожденной пахионихии (PC), аутосомно-доминантного синдрома, которое предусматривает блокирование подошвенной кератодермии, с использованием первого терапевтического средства на основе короткой интерферирующей РНК (siRNA) для кожи. Эта siRNA, под названием TD101, специфично и эффективно целенаправленно воздействует на мРНК мутантного кератина 6a (K6a) N171K, не оказывая влияния на мРНК K6a дикого типа.Leachman et al. (Molecular Therapy, vol. 18 no. 2, 442-446 Feb. 2010) report a phase Ib clinical trial targeting the rare skin disorder pachyonychia congenita (PC), an autosomal dominant syndrome that involves blocking plantar keratoderma, using the first short interfering RNA (siRNA) therapeutic for the skin. This siRNA, called TD101, specifically and efficiently targets mutant keratin 6a (K6a) N171K mRNA without affecting wild-type K6a mRNA.
Zheng et al. (PNAS, July 24, 2012, vol. 109, no. 30, 11975-11980) продемонстрировали, что конъюгаты сферических наночастиц с нуклеиновой кислотой (SNA-NC), являющиеся ядрами из золота окружеными плотной оболочкой из строго ориентированных, ковалентно иммобилизованных siRNA, свободно проникают практически в 100% кератиноцитов in vitro, в кожу мыши и в эпидермис человека в течение нескольких часов после применения. Zheng et al. продемонстрировали, что однократное применение 25 нМ SNA-NC к рецептору эпидермального фактора роста (EGFR) в течение 60 ч. продемонстрировало эффективный нокдаун гена в коже человека. Аналогичная доза может предусматриваться для CRISPR-Cas, иммобилизованной в SNA-NC для введения в кожу.Zheng et al. (PNAS, July 24, 2012, vol. 109, no. 30, 11975-11980) demonstrated that spherical nanoparticle nucleic acid conjugates (SNA-NCs), which are gold cores surrounded by a dense shell of tightly oriented, covalently immobilized siRNA, readily penetrate nearly 100% of keratinocytes in vitro, mouse skin, and human epidermis within hours of application. Zheng et al. demonstrated that a single application of 25 nM SNA-NCs to the epidermal growth factor receptor (EGFR) for 60 h demonstrated efficient gene knockdown in human skin. A similar dose could be envisaged for CRISPR-Cas immobilized in SNA-NCs for delivery to the skin.
Общие положения генной терапииGeneral provisions of gene therapy
Примеры ассоциированных с заболеваниями генов и полинуклеотидов и конкретная информация в отношении заболеваний доступна от Института генетической медицины МакКьюсика-Натанса (McKusick-Nathans Institute of Genetic Medicine) при Университете Джонса Хопкинса (Johns Hopkins University) (Балтимор, Мэриленд) и Национального центра биотехнологической информации (National Center for Biotechnology Information), Национальной библиотеки медицины (National Library of Medicine) (Бетесда, Мэриленд), доступных во всемирной сети Интернет.Examples of disease-associated genes and polynucleotides and specific disease-related information are available from the McKusick-Nathans Institute of Genetic Medicine at Johns Hopkins University (Baltimore, MD) and the National Center for Biotechnology Information, National Library of Medicine (Bethesda, MD), both available on the World Wide Web.
Мутации в этих генах и путях могут приводить к продуцированию несоответствующих белков или белков в несоответствующих количествах, которые воздействуют на функцию. Дополнительные примеры генов, заболеваний и белков, таким образом, включены с помощью ссылки из предварительной заявки на патент США 61/736527, поданной 12 декабря 2012 г. Такие гены, белки и пути могут быть целевым полинуклеотидом для комплекса CRISPR по настоящему изобретению.Mutations in these genes and pathways can result in the production of inappropriate proteins or proteins in inappropriate amounts that affect function. Additional examples of genes, diseases, and proteins are hereby incorporated by reference from U.S. Provisional Patent Application No. 61/736,527, filed December 12, 2012. Such genes, proteins, and pathways can be a target polynucleotide for the CRISPR complex of the present invention.
Варианты осуществления настоящего изобретения также относятся к способам и композициям, связанным с нокаутированием генов, амплифицированием генов и репарацией конкретных мутаций, ассоциированных с нестабильностью ДНК-повторов и неврологическими нарушениями (Robert D. Wells, Tetsuo Ashizawa, Genetic Instabilities and Neurological заболевания, Second Edition, Academic Press, Oct 13, 2011 - Medical). Как было обнаружено, определенные аспекты последовательностей тандемных повторов ответственны за более чем двадцать заболеваний человека (New insights into repeat instability: role of RNA•DNA hybrids. McIvor EI, Polak U, Napierala M. RNA Biol. 2010 Sep-Oct;7(5):551-8). Системы эффекторного белка по настоящему изобретению могут быть приспособлены для коррекции таких дефектов геномной нестабильности.Embodiments of the present invention also relate to methods and compositions related to gene knockout, gene amplification, and repair of specific mutations associated with DNA repeat instability and neurological disorders (Robert D. Wells, Tetsuo Ashizawa, Genetic Instabilities and Neurological Diseases, Second Edition, Academic Press, Oct 13, 2011 - Medical). Certain aspects of tandem repeat sequences have been found to be responsible for more than twenty human diseases (New insights into repeat instability: role of RNA•DNA hybrids. McIvor EI, Polak U, Napierala M. RNA Biol. 2010 Sep-Oct;7(5):551-8). The effector protein systems of the present invention can be adapted to correct such genomic instability defects.
Некоторые дополнительные аспекты настоящего изобретения касаются коррекции дефектов, ассоциированных с широким спектром наследственных заболеваний, которые дополнительно описаны на веб-сайте Национальных институтов здравоохранения (National Institutes of Health) в тематическом подразделе "Наследственные заболевания" ("Genetic Disorders") (веб-сайт по адресу health.nih.gov/topic/GeneticDisorders). Наследственные заболевания головного мозга могут включать без ограничения адренолейкодистрофию, агенезию мозолистого тела, синдром Айкарди, синдром Альперса, болезнь Альцгеймера, синдром Барта, болезнь Баттена, CADASIL, мозжечковую дегенерацию, болезнь Фабри, синдром Герстмана-Штраусслера-Шейнкера, болезнь Гентингтона и другие связанные с триплетными повторами нарушения, болезнь Лея, синдром Леша-Найхана, болезнь Менкеса, типы митохондриальной миопатии и кольпоцефалию по критериям NINDS. Такие заболевания дополнительно описаны на веб-сайте Национальных институтов здравоохранения (National Institutes of Health) в тематическом подразделе "Наследственные заболевания головного мозга" ("Genetic Brain Disorders").Certain additional aspects of the present invention relate to the correction of defects associated with a wide range of inherited disorders, which are further described on the National Institutes of Health website under the topic heading "Genetic Disorders" (website at health.nih.gov/topic/GeneticDisorders). Inherited brain disorders may include, but are not limited to, adrenoleukodystrophy, agenesis of the corpus callosum, Aicardi syndrome, Alpers syndrome, Alzheimer's disease, Barth syndrome, Batten disease, CADASIL, cerebellar degeneration, Fabry disease, Gerstmann-Straussler-Scheinker syndrome, Huntington's disease and other triplet repeat-related disorders, Leigh disease, Lesch-Nyhan syndrome, Menkes disease, NINDS types of mitochondrial myopathy, and colpocephaly. These disorders are further described on the National Institutes of Health website under the topic "Genetic Brain Disorders."
Иллюстративные способы применения системы CRISPR CasIllustrative applications of the CRISPR Cas system
Настоящее изобретение относится к не встречающейся в природе или сконструированной композиции, или одному или нескольким полинуклеотидам, кодирующим компоненты указанной композиции, или вектору или системам доставки, содержащим один или несколько полинуклеотидов, кодирующих компоненты указанной композиции, для применения при модификации целевой клетки in vivo, ex vivo или in vitro, и они могут быть выполнены при помощи способа, который изменяет клетку таким образом, что после модификации потомство или линия клеток клетки, модифицированной при помощи CRISPR, сохраняет измененный фенотип. Модифицированные клетки и потомство могут быть частью многоклеточного организма, такого как растение или животное, с применением ex vivo или in vivo системы CRISPR по отношению к желаемым типам клеток. Изобретение CRISPR может представлять собой терапевтический способ лечения. Терапевтический способ лечения может включать редактирование гена или генома или генную терапию.The present invention relates to a non-naturally occurring or engineered composition, or one or more polynucleotides encoding components of said composition, or a vector or delivery systems comprising one or more polynucleotides encoding components of said composition, for use in modifying a target cell in vivo, ex vivo or in vitro, and they can be made using a method that alters the cell such that after modification, the progeny or cell line of the cell modified by CRISPR retains the altered phenotype. The modified cells and progeny can be part of a multicellular organism, such as a plant or an animal, using an ex vivo or in vivo CRISPR system against desired cell types. The CRISPR invention can be a therapeutic method of treatment. The therapeutic method of treatment can include gene or genome editing or gene therapy.
Модификация мишени с помощью системы или комплекса CRISPR-CasModification of a target using the CRISPR-Cas system or complex
В одном аспекте настоящее изобретение относится к способам модификации целевого полинуклеотида в эукариотической клетке, что может происходить in vivo, ex vivo или in vitro. В некоторых вариантах осуществления способ включает отбор клетки или популяции клеток у человека или отличного от человека животного и модификацию клетки или клеток. Культивирование можно осуществлять на любой стадии ex vivo. Клетку или клетки можно даже повторно вводить отличному от человека животному или в растение. Что касается повторно вводимых клеток, особенно предпочтительно, чтобы эти клетки являлись стволовыми клетками.In one aspect, the present invention relates to methods for modifying a target polynucleotide in a eukaryotic cell, which may occur in vivo, ex vivo or in vitro. In some embodiments, the method comprises selecting a cell or a population of cells from a human or non-human animal and modifying the cell or cells. The culturing may be performed at any stage ex vivo. The cell or cells may even be reintroduced into a non-human animal or into a plant. With respect to the cells reintroduced, it is particularly preferred that these cells are stem cells.
В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с целевым полинуклеотидом для осуществления расщепления указанного целевого полинуклеотида, за счет чего обеспечивается модифицирование целевого полинуклеотида, где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, которая гибридизируется или способна к гибридизации с целевой последовательностью в указанном целевом полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью.In some embodiments, the method includes providing binding of a CRISPR complex to a target polynucleotide to effect cleavage of said target polynucleotide, thereby providing modification of the target polynucleotide, wherein the CRISPR complex comprises a CRISPR enzyme complexed with a guide sequence that hybridizes or is capable of hybridizing with a target sequence in said target polynucleotide, wherein said guide sequence is associated with a mate tracr sequence that, in turn, hybridizes with the tracr sequence.
В одном аспекте настоящего изобретения предусмотрен способ модифицирования экспрессии полинуклеотида в эукариотической клетке. В некоторых вариантах осуществления способ включает обеспечение связывания комплекса CRISPR с полинуклеотидом так, что указанное связывание приводит к повышенной или пониженной экспрессии указанного полинуклеотида; где комплекс CRISPR содержит фермент CRISPR, образующий комплекс с направляющей последовательностью, которая гибридизируется или способна к гибридизации с целевой последовательностью в указанном полинуклеотиде, где указанная направляющая последовательность связана с парной tracr-последовательностью, которая, в свою очередь, гибридизируется с tracr-последовательностью. Аналогичные факторы и условия распространяются на способы модификации целевого полинуклеотида, изложенные выше. Фактически, эти варианты отбора образцов, культивирования и повторного введения охватываются аспектами настоящего изобретения.In one aspect of the present invention, there is provided a method for modifying the expression of a polynucleotide in a eukaryotic cell. In some embodiments, the method comprises causing a CRISPR complex to bind to the polynucleotide such that said binding results in increased or decreased expression of said polynucleotide; wherein the CRISPR complex comprises a CRISPR enzyme complexed with a guide sequence that hybridizes or is capable of hybridizing to a target sequence in said polynucleotide, wherein said guide sequence is linked to a tracr mate sequence that in turn hybridizes to the tracr sequence. Similar factors and conditions apply to the methods for modifying a target polynucleotide set forth above. Indeed, these sampling, culturing, and reintroduction options are encompassed by aspects of the present invention.
Действительно, в любом аспекте настоящего изобретения комплекс CRISPR может содержать фермент CRISPR, образующий комплекс с направляющей последовательностью, гибридизируеющейся или способной к гибридизации с целевой последовательностью, где указанная направляющая последовательность может быть связана с парной tracr-последовательностью, которая, в свою очередь, может гибридизироваться с tracr-последовательностью.Indeed, in any aspect of the present invention, the CRISPR complex may comprise a CRISPR enzyme complexed with a guide sequence that hybridizes or is capable of hybridizing to a target sequence, wherein said guide sequence may be associated with a mate tracr sequence that, in turn, may hybridize to the tracr sequence.
Аналогичные факторы и условия распространяются на способы модификации целевого полинуклеотида, изложенные выше. Таким образом, в любом из не встречающихся в природе ферментов CRISPR, описанных в данном документе, содержится по меньшей мере одна модификация, и тем самым фермент характеризуется определенными улучшенными свойствами. В частности, любой из ферментов способен образовывать комплекс CRISPR с направляющей РНК. При образовании такого комплекса направляющая РНК способна связываться с целевой полинуклеотидной последовательностью, и фермент способен модифицировать целевой локус. Кроме того, фермент в комплексе CRISPR характеризуется сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом.Similar factors and conditions apply to the methods of modifying a target polynucleotide described above. Thus, any of the non-naturally occurring CRISPR enzymes described herein contain at least one modification, and thus the enzyme is characterized by certain improved properties. In particular, any of the enzymes is capable of forming a CRISPR complex with a guide RNA. When such a complex is formed, the guide RNA is capable of binding to a target polynucleotide sequence, and the enzyme is capable of modifying the target locus. In addition, the enzyme in the CRISPR complex is characterized by a reduced ability to modify one or more non-target loci compared to the unmodified enzyme.
Кроме того, модифицированные ферменты CRISPR, описанные в данном документе, охватывают ферменты, где в комплексе CRISPR фермент характеризуется повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом. Такая функция может быть предусмотрена отдельно или предусмотрена в сочетании с вышеописанной функцией сниженной способности модифицировать один или несколько нецелевых локусов. Любые такие ферменты могут быть предусмотрены с одной из дополнительных модификаций фермента CRISPR, как описано в данном документе, например, в сочетании с активностью, обеспечиваемой одним или несколькими ассоциированными гетерологичными функциональными доменами, любыми дополнительными мутациями с целью снижения нуклеазной активности и т.п.In addition, the modified CRISPR enzymes described herein include enzymes wherein in a CRISPR complex the enzyme is characterized by an increased ability to modify one or more target loci compared to an unmodified enzyme. Such functionality may be provided alone or provided in combination with the above-described functionality of reduced ability to modify one or more off-target loci. Any such enzymes may be provided with one of the additional modifications of the CRISPR enzyme as described herein, such as in combination with the activity provided by one or more associated heterologous functional domains, any additional mutations to reduce nuclease activity, etc.
В предпочтительных вариантах осуществления настоящего изобретения предусмотрен модифицированный фермент CRISPR со сниженной способностью модифицировать один или несколько нецелевых локусов по сравнению с немодифицированным ферментом и повышенной способностью модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом. В сочетании с дополнительными модификациями фермента можно достичь существенно повышенной специфичности. Например, предусмотрена комбинация таких предпочтительных вариантов осуществления с одной или несколькими дополнительными мутациями, где одна или несколько дополнительных мутаций находятся в одном или нескольких каталитически активных доменах. Такие дополнительные каталитические мутации могут придавать функциональные свойства никаз, как описано подробно в других частях данного документа. В таких ферментах повышенная специфичность может быть достигнута за счет повышенной специфичности с точки зрения ферментативной активности.In preferred embodiments of the present invention, a modified CRISPR enzyme is provided with a reduced ability to modify one or more off-target loci compared to an unmodified enzyme and an increased ability to modify one or more target loci compared to an unmodified enzyme. In combination with additional modifications of the enzyme, significantly increased specificity can be achieved. For example, a combination of such preferred embodiments with one or more additional mutations is provided, wherein the one or more additional mutations are in one or more catalytically active domains. Such additional catalytic mutations can confer nickase functionality, as described in detail elsewhere herein. In such enzymes, increased specificity can be achieved by increased specificity in terms of enzymatic activity.
Модификации для снижения нецелевых эффектов и/или повышения целевых эффектов, как описано выше, могут быть выполнены с аминокислотными остатками, расположенными в положительно заряженной области/бороздке, находящейся между доменами RuvC-III и HNH. Предполагается, что любой из функциональных эффектов, описанных выше, может быть достигнут с помощью модификации аминокислот в вышеупомянутой бороздке, однако также с помощью модификации аминокислот вблизи бороздки или за ее пределами.Modifications to reduce off-target effects and/or enhance on-target effects as described above can be performed on amino acid residues located in the positively charged region/groove located between the RuvC-III and HNH domains. It is expected that any of the functional effects described above can be achieved by modifying amino acids in the aforementioned groove, but also by modifying amino acids near or outside the groove.
Дополнительные функциональные свойства, которые могут быть сконструированы в модифицированных ферментах CRISPR, как описано в данном документе, могут включать следующее. 1. Модифицированные ферменты CRISPR, которые нарушают взаимодействие ДНК и белка без нарушения третичной или вторичной структуры белков. Это включает остатки, которые контактируют с любой частью дуплекса РНК:ДНК. 2. Модифицированные ферменты CRISPR, которые ослабляют взаимодействия между белками, удерживающими Cas9 в конформации, необходимой для разрезания нуклеазами в ответ на связывание с ДНК (целевые или нецелевые). Например: модификация, которая незначительно ингибирует, но по-прежнему обеспечивает конформацию нуклеазы домена HNH (располагается в поддающемся разрезанию фосфате). 3. Модифицированные ферменты CRISPR, которые усиливают взаимодействия между белками, удерживающими Cas9 в конформации, ингибирующей активность в ответ на связывание с ДНК (целевые или нецелевые). Например: модификация, которая стабилизирует домен HNH в конформации за пределами поддающегося разрезанию фосфата. Любое такое дополнительное функциональное усиление может быть предусмотрено в комбинации с любой другой модификацией фермента CRISPR, как описано подробно в других местах данного документа.Additional functional properties that can be engineered into modified CRISPR enzymes as described herein may include the following. 1. Modified CRISPR enzymes that disrupt DNA-protein interactions without disrupting the tertiary or secondary structure of the proteins. This includes residues that contact any part of the RNA:DNA duplex. 2. Modified CRISPR enzymes that weaken interactions between proteins that hold Cas9 in a conformation required for nuclease cleavage in response to DNA binding (on-target or off-target). For example, a modification that slightly inhibits but still allows the nuclease conformation of the HNH domain (located at the cleavable phosphate). 3. Modified CRISPR enzymes that strengthen interactions between proteins that hold Cas9 in a conformation that inhibits activity in response to DNA binding (on-target or off-target). For example: a modification that stabilizes the HNH domain in a conformation beyond the scissile phosphate. Any such additional functional enhancement may be provided in combination with any other modification of the CRISPR enzyme, as described in detail elsewhere in this document.
Любые из описанных в данном документе улучшенных функциональных свойств могут быть выполнены по отношению к любому ферменту CRISPR, такому как фермент Cas9. Ферменты Cas9, описанные в данном документе, получают из ферментов Cas9 от S. pyogenes и S. aureus. Однако предполагается, что любое из функциональных свойств, описанных в данном документе, может быть сконструировано в ферментах Cas9 от других ортологов, в том числе химерных ферментов, содержащих фрагменты из нескольких ортологов.Any of the improved functional properties described herein may be performed with respect to any CRISPR enzyme, such as a Cas9 enzyme. The Cas9 enzymes described herein are derived from Cas9 enzymes from S. pyogenes and S. aureus. However, it is contemplated that any of the functional properties described herein may be engineered into Cas9 enzymes from other orthologs, including chimeric enzymes containing fragments from multiple orthologs.
Нуклеиновые кислоты, аминокислоты и белки, регуляторные последовательности, векторы и прочиеNucleic acids, amino acids and proteins, regulatory sequences, vectors and others
В настоящем изобретении нуклеиновые кислоты используются для связывания целевых последовательностей ДНК. Это является преимущественным, поскольку получать нуклеиновые кислоты намного легче и дешевле, чем белки, и специфичность может варьировать в зависимости от длины фрагмента, если необходима гомология. Например, не требуется сложное 3-D определение положений многочисленных доменов. Термин "полинуклеотид", "нуклеотид", "нуклеотидная последовательность", "нуклеиновая кислота" и "олигонуклеотид" используют взаимозаменяемо. Они обозначают полимерную форму нуклеотидов любой длины, как дезоксирибонуклеотидов, так и рибонуклеотидов или их аналогов. Полинуклеотиды могут обладать любой пространственной структурой и могут выполнять любую функцию, известную или неизвестную. Неограничивающими примерами полинуклеотидов являются следующие: кодирующие или некодирующие участки гена или фрагмента гена, локусы(локус), определенные(ый) в результате анализа сцепления, экзоны, интроны, матричная РНК (мРНК), транспортная РНК, рибосомная РНК, короткая интерферирующая РНК (siRNA), короткая шпилечная РНК (shRNA), микроРНК (miRNA), рибозимы, кДНК, рекомбинантные полинуклеотиды, разветвленные полинуклеотиды, плазмиды, векторы, выделенные ДНК любой последовательности, выделенные РНК любой последовательности, нуклеиновые кислоты-зонды и праймеры. Термин также охватывает структуры, подобные нуклеиновым кислотам с синтетическими каркасами, см., например, Eckstein, 1991; Baserga et al., 1992; Milligan, 1993; WO 97/03211; WO 96/39154; Mata, 1997; Strauss-Soukup, 1997 и Samstag, 1996. Полинуклеотид может содержать один или несколько модифицированных нуклеотидов, как, например, метилированные нуклеотиды и аналоги нуклеотидов. При наличии, модификации в нуклеотидную структуру могут быть внесены до или после сборки полимера. Последовательность нуклеотидов может прерываться отличными от нуклеотидов компонентами. Полинуклеотид можно дополнительно модифицировать после полимеризации, как, например, путем соединения с компонентом для мечения. Используемый в данном документе термин "дикий тип" является термином из данной области, понятным специалисту в данной области, и означает типичную форму организма, штамма, гена или характеристики, которая встречаются в природе в отличие от мутантных или вариантных форм. "Дикий тип" представляет основу. Используемый в данном документе термин "вариант" следует понимать как означающее проявление качеств, которые характеризуются паттерном, который отличается от встречающегося в природе. Выражение "не встречающийся в природе" или "сконструированный" используют взаимозаменяемо, и оно указывает на вмешательство человека. Выражения, в тех случаях, когда они касаются молекул нуклеиновых кислот или полипептидов, означают, что молекула нуклеиновой кислоты или полипептид по меньшей мере практически не содержат по меньшей мере один иной компонент, с которым они естественным образом связаны в природе и встречаются в природе. "Комплементарность" означает способность нуклеиновой кислоты образовывать водородную(ые) связь(и) с другой последовательностью нуклеиновой кислоты с помощью либо традиционного образования пар по Уотсону-Крику, либо других нетрадиционных типов. Процент комплементарности показывает процентную долю остатков в молекуле нуклеиновой кислоты, которые могут образовывать водородные связи (к примеру, образование пар по Уотсону-Крику) со второй последовательностью нуклеиновой кислоты (к примеру, при этом 5, 6, 7, 8, 9, 10 из 10 будут на 50%, 60%, 70%, 80%, 90% и 100% комплементарны). "Точная комплементарность" означает, что все непрерывные остатки последовательности нуклеиновой кислоты будут связаны водородными связями с таким же количеством непрерывных остатков во второй последовательности нуклеиновой кислоты. Используемое в данном документе выражение "практически комплементарный" означает степень комплементарности, которая составляет по меньшей мере 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% или 100% в пределах участка из 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 или более нуклеотидов, или относится к двум нуклеиновым кислотам, которые гибридизируются при жестких условиях. Используемое в данном документе выражение"жесткие условия" в отношении гибридизации означают условия, при которых нуклеиновая кислота с комплементарностью к целевой последовательности преимущественно гибридизируется с целевой последовательностью и практически не гибридизируется с не подвергаемыми нацеливанию последовательностями. Жесткие условия, как правило, являются зависимыми от последовательности и изменяются в зависимости от ряда факторов. В целом, чем длиннее последовательность, тем выше температура, при которой последовательность специфично гибридизируется со своей целевой последовательностью. Неограничивающие примеры жестких условий описаны подробно в Tijssen (1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, N.Y. Если предполагается полинуклеотидная последовательность, то также предусматриваются комплементарные или частично комплементарные последовательности. Эти последовательности предпочтительно способны гибридизироваться с эталонной последовательностью при условиях высокой жесткости. Как правило, для доведения скорости гибридизации до максимума, выбирают условия гибридизации относительно низкой жесткости: температура на приблизительно 20-25°C ниже температуры точки плавления (Tm). Tm представляет собой температуру, при которой 50% специфичной целевой последовательности гибридизируется с точно комплементарным зондом в растворе при определенной ионной силе и pH. Как правило, если требуется по меньшей мере приблизительно 85% нуклеотидная комплементарность гибридизированных последовательностей, выбирают очень жесткие условия отмывки с температурой на приблизительно 5-15°C ниже, чем Tm. Если требуется по меньшей мере приблизительно 70% нуклеотидная комплементарность гибридизированных последовательностей, выбирают умеренно жесткие условия отмывки с температурой на приблизительно 15-30°C ниже, чем Tm. Высоко пермиссивные (очень низкой жесткости) условия отмывки могут характеризоваться наименьшей температурой на 50°C ниже Tm, что допускает высокий уровень несовпадений между гибридизированными последовательностями. Специалисты в данной области поймут, что другие физические и химические параметры на стадиях гибридизации и отмывки также можно изменять для того, чтобы повлиять на получаемый в результате выявляемый сигнал гибридизации исходя из конкретного уровня гомологии между целевой последовательностью и последовательностью зонда. Предпочтительные условия высокой жесткости предусматривают инкубацию в 50% формамиде, 5×SSC и 1% SDS при 42°C, или инкубацию при 5×SSC и 1% SDS при 65°C с отмывкой в 0,2×SSC и 0,1% SDS при 65°C. "Гибридизация" относится к реакции, в которой один или несколько полинуклеотидов вступают в реакцию с образованием комплекса, который стабилизирован посредством образования водородных связей между основаниями остатков нуклеотидов. Образование водородных связей может происходить по принципу образования пар по Уотсону-Крику, Хугстиновского связывания или посредством любого другого специфичного к последовательности способа. Комплекс может содержать две нити, образующие дуплексную структуру, три или более нитей, образующих многонитевой комплекс, одиночную самогибридизирующуюся нить или любую их комбинацию. Реакция гибридизации может представлять собой стадию в более обширном способе, такую как начальная стадия ПЦР или расщепление полинуклеотида с помощью фермента. Последовательность, способную к гибридизации с данной последовательностью, называют "комплементарной последовательностью" для данной последовательности. Используемый в данном документе термин "локус генома" или "локус" (форма множественного числа локусы) представляет собой конкретное положение гена или последовательности ДНК на хромосоме. "Ген" относится к фрагментам ДНК или РНК, которые кодируют цепь полипептида или РНК, которые играют функциональную роль в организме, и, следовательно, он представляет собой молекулярную единицу наследственности в живых организмах. Для цели настоящего изобретения может считаться, что гены содержат участки, которые регулируют образование продукта гена, независимо от того являются ли регуляторные последовательности смежными с кодирующими и/или транскрибируемыми последовательностями или нет. Соответственно, ген содержит, но без обязательного ограничения, промоторные последовательности, терминаторы, регуляторные последовательности трансляции, например, сайты связывания рибосомы и сайты внутренней посадки рибосомы, энхансеры, сайленсеры, инсуляторы, граничные элементы, точки начала репликации, сайты прикрепления к матриксу и регуляторные участки локуса. Используемый в данном документе термин "экспрессия локуса генома" или "экспрессия гена" относится к процессу, в ходе которого информация гена используется в синтезе функционального продукта гена. Продукты экспрессии генов часто представляют собой белки, но у генов, не кодирующих белки, например генов rRNA или генов tRNA, продукт представляет собой функциональную РНК. Процесс экспрессии генов используется всеми известными живыми организмами - эукариотами (в том числе многоклеточными организмами), прокариотами (бактериями и археями) и вирусами для образования функциональных продуктов, необходимых для выживания. Как используется в данном документе, "экспрессия" гена или нуклеиновой кислоты охватывает не только экспрессию генов в клетках, но также транскрипцию и трансляцию нуклеиновой(нуклеиновых) кислоты(кислот) в системах клонирования и в любом другом контексте. Используемый в данном документе термин "экспрессия" также означает процесс, посредством которого полинуклеотид транскрибируется с ДНК-матрицы (как, например, с образованием мРНК или другого РНК-транскрипта), и/или процесс, с помощью которого транскрибированная мРНК далее транслируется с образованием пептидов, полипептидов или белков. Транскрипты и закодированные полипептиды можно в совокупности называть "продуктом гена". Если полинуклеотид получен из геномной ДНК, то экспрессия может включать сплайсинг мРНК в эукариотической клетке. Термины "полипептид", "пептид" и "белок" используются в данном документе взаимозаменяемо для обозначения полимеров из аминокислот любой длины. Полимер может быть линейным или разветвленным, он может содержать модифицированные аминокислоты, и его структура может прерываться отличными от аминокислот компонентами. Термины также охватывают полимер из аминокислот, который был модифицирован; например, образованием дисульфидных связей, гликозилированием, липидизацией, ацетилированием, фосфорилированием или любой другой манипуляцией, как, например, соединением с компонентом для мечения. Используемое в данном документе выражение "аминокислота" включает природные и/или отличные от природных или синтетические аминокислоты, в том числе глицин и как D-, так и L-оптические изомеры, и аналоги аминокислот, и пептидомиметики. Используемое в данном документе выражение "домен" или "белковый домен" относится к части последовательности белка, которая может существовать и функционировать независимо от остальной части белковой цепи. Как описано в аспектах согласно настоящему изобретению, идентичность последовательности относится к гомологии последовательности. Сравнения гомологии можно проводить на глаз или, что делается чаще, с помощью легко доступных программ для сравнения последовательностей. С помощью этих коммерчески доступных компьютерных программ можно рассчитывать процент (%) гомологии между двумя или более последовательностями, а также можно рассчитывать идентичность последовательности между двумя или более аминокислотными последовательностями или последовательностями нуклеиновых кислот.In the present invention, nucleic acids are used to bind target DNA sequences. This is advantageous because nucleic acids are much easier and cheaper to produce than proteins, and the specificity can vary with fragment length if homology is desired. For example, complex 3-D determination of the positions of multiple domains is not required. The terms "polynucleotide", "nucleotide", "nucleotide sequence", "nucleic acid" and "oligonucleotide" are used interchangeably. They denote a polymeric form of nucleotides of any length, both deoxyribonucleotides and ribonucleotides or their analogs. Polynucleotides can have any spatial structure and can perform any function, known or unknown. Non-limiting examples of polynucleotides are: coding or non-coding regions of a gene or gene fragment, loci(s) determined by linkage analysis, exons, introns, messenger RNA (mRNA), transfer RNA, ribosomal RNA, short interfering RNA (siRNA), short hairpin RNA (shRNA), microRNA (miRNA), ribozymes, cDNAs, recombinant polynucleotides, branched polynucleotides, plasmids, vectors, isolated DNA of any sequence, isolated RNA of any sequence, nucleic acid probes and primers. The term also encompasses nucleic acid-like structures with synthetic backbones, see, for example, Eckstein, 1991; Baserga et al., 1992; Milligan, 1993; WO 97/03211; WO 96/39154; Mata, 1997; Strauss-Soukup, 1997 and Samstag, 1996. A polynucleotide may contain one or more modified nucleotides, such as methylated nucleotides and nucleotide analogs. If present, modifications to the nucleotide structure may be introduced before or after assembly of the polymer. The nucleotide sequence may be interrupted by components other than nucleotides. The polynucleotide may be further modified after polymerization, such as by coupling with a labeling component. As used herein, the term "wild type" is a term of art understood by one skilled in the art and means the typical form of an organism, strain, gene or characteristic that occurs in nature, as distinguished from mutant or variant forms. "Wild type" represents the backbone. As used herein, the term "variant" is to be understood to mean the expression of properties that are characterized by a pattern that differs from that found in nature. The expressions "non-naturally occurring" and "engineered" are used interchangeably and indicate human intervention. The expressions, when applied to nucleic acid molecules or polypeptides, mean that the nucleic acid molecule or polypeptide is at least substantially free of at least one other component with which it is naturally associated and found in nature. "Complementarity" means the ability of a nucleic acid to form hydrogen bond(s) with another nucleic acid sequence, either by conventional Watson-Crick pairing or other non-conventional types. Percent complementarity indicates the percentage of residues in a nucleic acid molecule that can form hydrogen bonds (e.g., Watson-Crick pairing) with a second nucleic acid sequence (e.g., 5, 6, 7, 8, 9, 10 out of 10 would be 50%, 60%, 70%, 80%, 90%, and 100% complementary). "Perfect complementarity" means that all contiguous residues in the nucleic acid sequence will hydrogen bond with the same number of contiguous residues in the second nucleic acid sequence. As used herein, the term "substantially complementary" means a degree of complementarity that is at least 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, or 100% within a region of 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 or more nucleotides, or refers to two nucleic acids that hybridize under stringent conditions. As used herein, the term "stringent conditions" in relation to hybridization means conditions under which a nucleic acid with complementarity to a target sequence preferentially hybridizes to the target sequence and substantially does not hybridize to non-targeted sequences. Stringent conditions are generally sequence dependent and vary depending on a number of factors. In general, the longer the sequence, the higher the temperature at which the sequence specifically hybridizes to its target sequence. Non-limiting examples of stringent conditions are described in detail in Tijssen (1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, NY If a polynucleotide sequence is envisaged, complementary or partially complementary sequences are also envisaged. These sequences are preferably capable of hybridizing to the reference sequence under conditions of high stringency. Typically, to maximize the hybridization rate, hybridization conditions of relatively low stringency are selected: a temperature of approximately 20-25°C below the melting point temperature ( Tm ). Tm is the temperature at which 50% of a specific target sequence hybridizes to a perfectly complementary probe in solution at a given ionic strength and pH. Typically, if at least about 85% nucleotide complementarity of the hybridized sequences is desired, very stringent wash conditions are selected with a temperature of approximately 5-15°C lower than Tm . If at least about 70% nucleotide complementarity of the hybridized sequences is desired, moderately stringent wash conditions are selected with a temperature of approximately 15-30°C lower than Tm . Highly permissive (very low stringency) wash conditions may have a lowest temperature of 50°C below Tm , which allows a high level of mismatches between the hybridized sequences. Those skilled in the art will appreciate that other physical and chemical parameters during the hybridization and wash steps may also be varied to influence the resulting detectable hybridization signal based on the particular level of homology between the target and probe sequences. Preferred high stringency conditions include incubation in 50% formamide, 5x SSC, and 1% SDS at 42°C, or incubation in 5x SSC and 1% SDS at 65°C with a wash of 0.2x SSC and 0.1% SDS at 65°C. "Hybridization" refers to a reaction in which one or more polynucleotides react to form a complex that is stabilized by hydrogen bonding between the bases of the nucleotide residues. Hydrogen bonding may occur via Watson-Crick base pairing, Hoogsteen bonding, or any other sequence-specific method. The complex may comprise two strands forming a duplex structure, three or more strands forming a multistrand complex, a single self-hybridizing strand, or any combination thereof. The hybridization reaction may be a step in a larger process, such as the initial step of PCR or the cleavage of a polynucleotide by an enzyme. A sequence capable of hybridizing to a given sequence is called a "complementary sequence" for the sequence. As used herein, the term "genomic locus" or "locus" (plural loci) is a specific position of a gene or DNA sequence on a chromosome. "Gene" refers to fragments of DNA or RNA that encode a polypeptide chain or RNA that plays a functional role in an organism, and therefore it is the molecular unit of heredity in living organisms. For the purpose of the present invention, genes may be considered to contain regions that regulate the formation of a gene product, whether the regulatory sequences are adjacent to coding and/or transcribed sequences or not. Accordingly, a gene includes, but is not necessarily limited to, promoter sequences, terminators, translational regulatory sequences, such as ribosome binding sites and internal ribosome entry sites, enhancers, silencers, insulators, boundary elements, origins of replication, matrix attachment sites, and locus regulatory regions. As used herein, the term "expression of a genomic locus" or "gene expression" refers to the process by which the information of a gene is used in the synthesis of a functional gene product. Gene expression products are often proteins, but for non-protein-coding genes, such as rRNA genes or tRNA genes, the product is functional RNA. The process of gene expression is used by all known living organisms - eukaryotes (including multicellular organisms), prokaryotes (bacteria and archaea), and viruses - to produce functional products necessary for survival. As used herein, "expression" of a gene or nucleic acid encompasses not only the expression of genes in cells, but also the transcription and translation of nucleic acid(s) in cloning systems and in any other context. As used herein, the term "expression" also refers to the process by which a polynucleotide is transcribed from a DNA template (such as to form an mRNA or other RNA transcript) and/or the process by which transcribed mRNA is further translated to form peptides, polypeptides, or proteins. The transcripts and encoded polypeptides may be referred to collectively as the "gene product." If the polynucleotide is derived from genomic DNA, expression may involve splicing of mRNA in a eukaryotic cell. The terms "polypeptide,""peptide," and "protein" are used interchangeably herein to refer to polymers of amino acids of any length. The polymer may be linear or branched, it may contain modified amino acids, and its structure may be interrupted by non-amino acid components. The terms also encompass a polymer of amino acids that has been modified; for example, by disulfide bonding, glycosylation, lipidation, acetylation, phosphorylation, or any other manipulation such as coupling to a labeling component. As used herein, the term "amino acid" includes natural and/or non-natural or synthetic amino acids, including glycine and both D- and L-optical isomers, and amino acid analogs and peptidomimetics. As used herein, the term "domain" or "protein domain" refers to a portion of a protein sequence that can exist and function independently of the rest of the protein chain. As described in aspects of the present invention, sequence identity refers to sequence homology. Homology comparisons can be made by eye or, more commonly, using readily available sequence comparison programs. These commercially available computer programs can calculate the percentage (%) of homology between two or more sequences, and can also calculate the sequence identity between two or more amino acid sequences or nucleic acid sequences.
В аспектах по настоящему изобретению термин "направляющая РНК" относится к полинуклеотидной последовательности, содержащей одну или несколько предположительных или идентифицированных tracr-последовательностей или предположительных или выявленных последовательностей crRNA или направляющих последовательностей. В конкретных вариантах осуществления "направляющая РНК" содержит предположительную или идентифицированную последовательность crRNA или направляющую последовательность. В дополнительных вариантах осуществления направляющая РНК не содержит предположительной или идентифицированной tracr-последовательности.In aspects of the present invention, the term "guide RNA" refers to a polynucleotide sequence comprising one or more putative or identified tracr sequences or putative or identified crRNA sequences or guide sequences. In particular embodiments, the "guide RNA" comprises a putative or identified crRNA sequence or guide sequence. In further embodiments, the guide RNA does not comprise a putative or identified tracr sequence.
Используемый в данном документе термин "дикий тип" является термином из данной области, понятным специалисту в данной области, и означает типичную форму организма, штамма, гена или характеристики, которая встречаются в природе в отличие от мутантных или вариантных форм. "Дикий тип" представляет основу.As used herein, the term "wild type" is a term of art understood by one skilled in the art and refers to the typical form of an organism, strain, gene, or characteristic that occurs in nature, as distinguished from mutant or variant forms. "Wild type" represents the base.
Используемый в данном документе термин "вариант" следует понимать как означающее проявление качеств, которые характеризуются паттерном, который отличается от встречающегося в природе.As used in this document, the term "variant" should be understood to mean the manifestation of qualities that are characterized by a pattern that differs from that found in nature.
Выражение "не встречающийся в природе" или "сконструированный" используют взаимозаменяемо, и оно указывает на вмешательство человека. Выражения, в тех случаях, когда они касаются молекул нуклеиновых кислот или полипептидов, означают, что молекула нуклеиновой кислоты или полипептид по меньшей мере практически не содержат по меньшей мере один иной компонент, с которым они естественным образом связаны в природе и встречаются в природе. Во всех аспектах и вариантах осуществления, вне зависимости от того, включают ли они эти выражения, ясно, что предпочтительно они могут быть необязательными и, таким образом, предпочтительно включены или не предпочтительно не включены. Кроме того, выражения "не встречающийся в природе" и "сконструированный" можно употреблять взаимозаменяемо, и, таким образом, можно использовать по отдельности или в сочетании, и одно или другое может замещать упоминание обоих совместно. В частности, "сконструированный" является предпочтительным вместо "не встречающийся в природе" или "не встречающийся в природе и/или сконструированный".The expression "non-naturally occurring" or "engineered" are used interchangeably and indicate human intervention. The expressions, when they relate to nucleic acid molecules or polypeptides, mean that the nucleic acid molecule or polypeptide is at least substantially free of at least one other component with which it is naturally associated in nature and occurs in nature. In all aspects and embodiments, whether or not they include these expressions, it is clear that they may preferably be optional and thus are preferably included or not preferably not included. Furthermore, the expressions "non-naturally occurring" and "engineered" may be used interchangeably and thus may be used alone or in combination, and one or the other may replace the reference to both together. In particular, "engineered" is preferred over "non-naturally occurring" or "non-naturally occurring and/or engineered".
Значения гомологии последовательности можно получить с помощью любой из ряда компьютерных программ, известных из уровня техники, например, BLAST или FASTA и т.д. Подходящей компьютерной программой для осуществления такого выравнивания является пакет программ GCG Wisconsin Bestfit (Университет Висконсина, США; Devereux et al., 1984, Nucleic Acids Research 12:387). Примеры другого программного обеспечения, с помощью которого можно осуществлять сравнения последовательностей, включают без ограничения пакет программ BLAST (см. Ausubel et al., 1999 ibid - Chapter 18), FASTA (Atschul et al., 1990, J. Mol. Biol., 403-410) и пакет программ GENEWORKS в качестве средств для сравнения. Как в BLAST, так и в FASTA доступны оффлайн- и онлайн-поиск (см. Ausubel et al., 1999 ibid, pages 7-58 - 7-60). Однако, предпочтительным является использование программы GCG Bestfit. Процентное значение (%) гомологии последовательности можно рассчитывать для непрерывных последовательностей, т.е. одну последовательность выравнивают с другой последовательностью и каждую аминокислоту или нуклеотид в одной последовательности непосредственно сравнивают с соответствующей аминокислотой или нуклеотидом в другой последовательности, один остаток за один раз. Это называется выравниванием "без гэпов". Как правило, такие выравнивания без гэпов осуществляют только для относительно малого числа остатков. Несмотря на то, что этот способ является очень простым и последовательным, при его применении не учитывается то, что, например, в паре последовательностей, которые в остальном являются идентичными, одна вставка или делеция может привести к тому, что следующие за ней аминокислотные остатки не будут учитываться при выравнивании, что, таким образом, потенциально приводит в результате к значительному уменьшению % гомологии при осуществлении глобального выравнивания. Следовательно, большинство способов сравнения последовательностей разработаны для получения оптимальных выравниваний, в которых учитываются возможные вставки и делеции без наложения чрезмерного штрафа на общую гомологию или балл идентичности. Это достигается путем вставки "гэпов" в выравнивание последовательностей в попытке доведения до максимума локальной гомологии или идентичности. Однако в этих более сложных способах назначаются "штрафы за внесения гэпа" для каждого гэпа, который встречается при выравнивании, таким образом, для одинакового количества идентичных аминокислот выравнивание последовательностей с наименьшим возможным количеством гэпов, что отражает более высокую степень родства между двумя сравниваемыми последовательностями, может привести в результате к более высокому баллу, чем выравнивание с большим количеством гэпов. Как правило, используют "значения аффинного штрафа за внесение гэпа для родственных последовательностей", с использованием которых начисляют относительно высокое значение за существование гэпа и меньший штраф за каждый последующий остаток в гэпе. Это наиболее часто используемая система оценки гэпов. Конечно, высокие штрафы за внесение гэпа могут привести к оптимизированным выравниваниям с меньшим количеством гэпов. В большинстве программ выравнивания допускается изменение штрафов за внесение гэпа. Однако предпочтительно использовать значения по умолчанию при использовании такого программного обеспечения для сравнений последовательностей. Например, при использовании пакета программ GCG Wisconsin Bestfit штраф за внесение гэпа по умолчанию для аминокислотных последовательностей составляет -12 для гэпа и -4 за каждый остаток его продолжения. Для расчета максимального % гомологии, следовательно, изначально требуется получение оптимального выравнивания с учетом штрафов за внесение гэпа. Подходящая компьютерная программа для осуществления такого выравнивания представляет собой пакет программ GCG Wisconsin Bestfit (Devereux et al., 1984 Nuc. Acids Research 12 p387). Примеры другого программного обеспечения, с помощью которого можно осуществлять сравнения последовательностей, включают без ограничения пакет программ BLAST (cм. Ausubel et al., 1999 Short Protocols in Molecular Biology, 4th Ed. - Chapter 18), FASTA (Altschul et al., 1990 J. Mol. Biol. 403-410) и пакет программ GENEWORKS в качестве инструментов для сравнения. Как в BLAST, так и в FASTA доступны оффлайн- и онлайн-поиск (см. Ausubel et al., 1999, Short Protocols in Molecular Biology, pages 7-58 - 7-60). Однако для некоторых задач предпочтительно использовать программу GCG Bestfit. Новый инструмент под названием BLAST 2 Sequences также доступен для сравнения белковых и нуклеотидных последовательностей (см. FEMS Microbiol Lett. 1999 174(2): 247-50; FEMS Microbiol Lett. 1999 177(1): 187-8 и веб-сайт Национального центра биотехнологической информации на веб-сайте Национальных институтов здравоохранения). Несмотря на то, что конечный % гомологии можно измерять в единицах идентичности, способ выравнивания сам по себе, как правило, не основывается на сравнении пар по типу "все или ничего". Вместо этого, как правило, используется матрица замен со шкалой сходства, с использованием которой назначаются баллы для каждого попарного сравнения на основании химического сходства или эволюционного расстояния. Примером такой матрицы, используемой чаще всего, является матрица BLOSUM62 - матрица по умолчанию для набора программ BLAST. В программах GCG Wisconsin, как правило, используются либо общедоступные значения по умолчанию, либо специальные таблицы сравнения символов, если предоставляются (дополнительные подробности см. в руководстве пользователя). Для некоторых задач предпочтительным является применение общедоступных значений по умолчанию для пакета программ GCG или, в случае другого программного обеспечения, матрицы по умолчанию, например BLOSUM62. Альтернативно процентные значения гомологии можно рассчитывать с использованием функции множественного выравнивания в DNASIS™ (Hitachi Software) с применением алгоритма, аналогичного CLUSTAL (Higgins DG & Sharp PM (1988), Gene 73(1), 237-244). После того, как программное обеспечение предоставит оптимальное выравнивание, возможно рассчитать % гомологии, предпочтительно % идентичности последовательности. Программное обеспечение, как правило, осуществляет это в ходе сравнения последовательностей и выдает численный результат. Последовательности также могут иметь делеции, вставки или замены аминокислотных остатков, которые приводят к молчащему изменению и приводят в результате к функционально эквивалентному веществу. Преднамеренные аминокислотные замены могут быть сделаны исходя из сходства свойств аминокислот (например, полярность, заряд, растворимость, гидрофобность, гидрофильность и/или амфипатическая природа остатков) и, следовательно, они являются применимыми для того, чтобы сгруппировать аминокислоты в функциональные группы. Аминокислоты можно сгруппировать исходя из свойств только их боковых цепей. Однако, также более полезно включить данные о мутациях. Группы аминокислот, полученные таким образом, вероятно, будут консервативными по структурным причинам. Эти группы могут быть описаны в форме диаграммы Венна (Livingstone C.D. and Barton G.J. (1993) "Protein sequence alignments: a strategy for the hierarchical analysis of residue conservation" Comput. Appl. Biosci. 9: 745-756) (Taylor W.R. (1986) "The classification of amino acid conservation" J. Theor. Biol. 119; 205-218). Консервативные замены могут быть сделаны, например, в соответствии с таблицей, представленной ниже, в которой описывается общепринятая группировка аминокислот в форме диаграммы Венна. Sequence homology values can be obtained using any of a number of computer programs known in the art, such as BLAST or FASTA, etc. A suitable computer program for performing such alignments is the GCG Wisconsin Bestfit software package (University of Wisconsin, USA; Devereux et al., 1984, Nucleic Acids Research 12:387). Examples of other software that can perform sequence comparisons include, but are not limited to, the BLAST software package (see Ausubel et al., 1999 ibid - Chapter 18), FASTA (Atschul et al., 1990, J. Mol. Biol., 403-410), and the GENEWORKS software package as comparison tools. Offline and online searching is available in both BLAST and FASTA (see Ausubel et al., 1999 ibid, pages 7-58 - 7-60). However, the GCG Bestfit program is preferred. Percentage (%) sequence homology can be calculated for contiguous sequences, i.e. one sequence is aligned with another sequence and each amino acid or nucleotide in one sequence is directly compared to the corresponding amino acid or nucleotide in the other sequence, one residue at a time. This is called a "gapless" alignment. Typically, such gapless alignments are only performed for a relatively small number of residues. Although this method is very simple and consistent, it does not take into account the fact that, for example, in a pair of otherwise identical sequences, a single insertion or deletion may cause the following amino acid residues to be ignored in the alignment, thus potentially resulting in a significant decrease in % homology when the global alignment is performed. Therefore, most sequence comparison methods are designed to produce optimal alignments that take into account possible insertions and deletions without unduly penalizing the overall homology or identity score. This is achieved by inserting "gaps" into the sequence alignment in an attempt to maximize local homology or identity. However, these more sophisticated methods assign "gap penalties" to each gap that occurs in the alignment, so that for the same number of identical amino acids, a sequence alignment with the fewest possible gaps, reflecting the higher degree of relatedness between the two sequences being compared, may result in a higher score than an alignment with a larger number of gaps. Typically, "affine gap penalty values for related sequences" are used, which assign a relatively high value for the existence of a gap and a lower penalty for each subsequent residue in the gap. This is the most commonly used gap scoring system. Of course, high gap penalties may result in optimized alignments with fewer gaps. Most alignment programs allow gap penalties to be varied. However, it is preferable to use the default values when using such software for sequence comparisons. For example, when using the GCG Wisconsin Bestfit software package, the default gap penalty for amino acid sequences is -12 for a gap and -4 for each residue in its continuation. Calculating the maximum % homology therefore requires initially obtaining an optimal alignment that takes the gap penalties into account. A suitable computer program for performing such an alignment is the GCG Wisconsin Bestfit software package (Devereux et al., 1984 Nuc. Acids Research 12 p387). Examples of other software that can perform sequence comparisons include, but are not limited to, the BLAST package (see Ausubel et al., 1999 Short Protocols in Molecular Biology, 4th Ed. - Chapter 18), FASTA (Altschul et al., 1990 J. Mol. Biol. 403-410), and the GENEWORKS package as comparison tools. Both BLAST and FASTA offer offline and online searching (see Ausubel et al., 1999, Short Protocols in Molecular Biology, pages 7-58 - 7-60). However, for some tasks, the GCG Bestfit program may be preferable. A new tool called BLAST 2 Sequences is also available for comparing protein and nucleotide sequences (see FEMS Microbiol Lett. 1999 174(2): 247-50; FEMS Microbiol Lett. 1999 177(1): 187-8 and the National Center for Biotechnology Information web site at the National Institutes of Health web site). Although the final % homology can be measured in units of identity, the alignment method itself is typically not based on an all-or-none comparison of pairs. Instead, a substitution matrix with a similarity scale is typically used, assigning scores to each pairwise comparison based on chemical similarity or evolutionary distance. An example of such a matrix most commonly used is the BLOSUM62 matrix, the default matrix for the BLAST suite of programs. The GCG Wisconsin programs generally use either publicly available defaults or custom character comparison tables if provided (see the user manual for further details). For some purposes it is preferable to use the publicly available defaults for the GCG package or, in the case of other software, a default matrix such as BLOSUM62. Alternatively, percent homology values can be calculated using the multiple alignment function in DNASIS™ (Hitachi Software) using an algorithm similar to CLUSTAL (Higgins DG & Sharp PM (1988) Gene 73(1), 237-244). Once the software has provided an optimal alignment, % homology, preferably % sequence identity, can be calculated. The software generally does this as part of the sequence comparison and provides a numerical result. Sequences may also have deletions, insertions or substitutions of amino acid residues that result in a silent change and result in a functionally equivalent substance. Intentional amino acid substitutions can be made based on similarities in amino acid properties (e.g. polarity, charge, solubility, hydrophobicity, hydrophilicity and/or amphipathic nature of residues) and are therefore useful for grouping amino acids into functional groups. Amino acids can be grouped based on the properties of their side chains alone. However, it is also more useful to include mutation data. The amino acid groups obtained in this way are likely to be conservative for structural reasons. These groups can be described in the form of a Venn diagram (Livingstone CD and Barton GJ (1993) "Protein sequence alignments: a strategy for the hierarchical analysis of residue conservation" Comput. Appl. Biosci. 9: 745-756) (Taylor WR (1986) "The classification of amino acid conservation" J. Theor. Biol. 119; 205-218). Conservative substitutions can be made, for example, according to the table below, which describes the generally accepted grouping of amino acids in the form of a Venn diagram.
Термины "субъект", "индивидуум" и "пациент" используются в данном документе взаимозаменяемо для обозначения позвоночного, предпочтительно млекопитающего, более предпочтительно человека. Млекопитающие включают без ограничения мышей, обезьян, людей, сельскохозяйственных животных, животных для спорта и домашних животных. Также охватываются ткани, клетки и их потомство биологического организма, полученные in vivo или культивированные in vitro.The terms "subject," "individual," and "patient" are used interchangeably herein to refer to a vertebrate, preferably a mammal, more preferably a human. Mammals include, but are not limited to, mice, monkeys, humans, farm animals, sport animals, and pets. Also included are tissues, cells, and progeny thereof, of a biological organism, whether obtained in vivo or cultured in vitro.
Термины "терапевтическое средство", "оказывающее терапевтический эффект средство" или "средство для лечения" используются взаимозаменяемо, и они означают молекулу или соединение, которые оказывают некоторое благоприятное воздействие при введении субъекту. Благоприятное воздействие включает возможность осуществления диагностических определений; облегчение заболевания, симптома, нарушения или патологического состояния; ослабление или предупреждение начала проявления заболевания, симптома, нарушения или состояния; а также общее противодействие заболеванию, симптому, нарушению или патологическому состоянию.The terms "therapeutic agent," "agent producing a therapeutic effect," or "agent for treating" are used interchangeably and mean a molecule or compound that produces some beneficial effect when administered to a subject. Beneficial effects include the ability to make diagnostic determinations; alleviate a disease, symptom, disorder, or condition; reduce or prevent the onset of a disease, symptom, disorder, or condition; and generally counteract a disease, symptom, disorder, or condition.
Как используется в данном документе, "лечение", или "осуществление лечения", или "временное ослабление", или "облегчение" используются взаимозаменяемо. Эти термины обозначают подход для получения благоприятных или требуемых результатов, в том числе без ограничения терапевтического эффекта и/или профилактического эффекта. Под терапевтическим эффектом понимают любое терапевтически значимое улучшение или воздействие в отношении одного или нескольких заболеваний, состояний или симптомов, лечение которых осуществляют. Для профилактического эффекта композиции можно вводить субъекту с риском развития конкретного заболевания, состояния или симптома или субъекту, который сообщает об одном или нескольких физиологических симптомах заболевания, даже если заболевание, состояние или симптом могли еще не проявиться.As used herein, "treating" or "treating" or "alleviating" or "alleviating" are used interchangeably. These terms refer to an approach to obtaining beneficial or desired results, including but not limited to a therapeutic effect and/or a prophylactic effect. A therapeutic effect is understood to mean any therapeutically significant improvement or effect with respect to one or more diseases, conditions or symptoms being treated. For a prophylactic effect, the compositions may be administered to a subject at risk of developing a particular disease, condition or symptom or to a subject who reports one or more physiological symptoms of the disease, even though the disease, condition or symptom may not have manifested yet.
Термин "эффективное количество" или "терапевтически эффективное количество" означает количество средства, которого достаточно для обеспечения благоприятных или желательных результатов. Терапевтически эффективное количество может изменяться в зависимости от одного или нескольких из: субъекта и болезненного состояния, которые подлежат лечению, веса и возраста субъекта, тяжести болезненного состояния, способа введения и подобного, что специалист в данной области легко может определить. Термин также применим к дозе, с помощью которой можно получить изображение для определения любым одним из способов визуализации, описанных в данном документе. Конкретная доза может изменяться в зависимости от одного или нескольких из: конкретного выбранного средства, режима дозирования, которому следуют, того, вводят ли его в комбинации с другими средствами, выбора времени введения, визуализируемой ткани и физической системы доставки, в которой оно заключено.The term "effective amount" or "therapeutically effective amount" means an amount of an agent that is sufficient to provide favorable or desired results. A therapeutically effective amount may vary depending on one or more of: the subject and disease state being treated, the weight and age of the subject, the severity of the disease state, the route of administration, and the like, as one of skill in the art can readily determine. The term also applies to a dose that can be imaged for determination by any one of the imaging methods described herein. The specific dose may vary depending on one or more of: the particular agent selected, the dosing regimen followed, whether it is administered in combination with other agents, the timing of administration, the tissue being imaged, and the physical delivery system in which it is contained.
Практическое осуществление настоящего изобретения предусматривает, если не указано иное, традиционные методики иммунологии, биохимии, химии, молекулярной биологии, микробиологии, клеточной биологии, геномики и технологию рекомбинантной ДНК, которые находятся в пределах квалификации специалиста в данной области. См. Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. eds., (1987)); серия METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL и ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987)).The practice of the present invention will employ, unless otherwise indicated, conventional techniques of immunology, biochemistry, chemistry, molecular biology, microbiology, cell biology, genomics, and recombinant DNA technology, all of which are within the skill of the art. See Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. eds., (1987)); METHODS IN ENZYMOLOGY series (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL and ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987)).
Некоторые аспекты настоящего изобретения касаются векторных систем, содержащих один или несколько векторов, или векторов как таковых. Векторы могут быть разработаны для экспрессии транскриптов CRISPR (к примеру, транскриптов нуклеиновых кислот, белков или ферментов) в прокариотических или эукариотических клетках. Например, транскрипты CRISPR могут экспрессироваться в бактериальных клетках, например Escherichia coli, клетках насекомых (с использованием бакуловирусных векторов экспрессии), клетках дрожжей или клетках млекопитающих. Подходящие клетки-хозяева дополнительно рассматриваются в Goeddel, GENE экспрессия TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Альтернативно рекомбинантный вектор экспрессии может транскрибироваться и транслироваться in vitro, например, с помощью регуляторных последовательностей промотора T7 и полимеразы T7.Some aspects of the present invention relate to vector systems comprising one or more vectors, or vectors per se. Vectors can be designed to express CRISPR transcripts (e.g., nucleic acid, protein, or enzyme transcripts) in prokaryotic or eukaryotic cells. For example, CRISPR transcripts can be expressed in bacterial cells, such as Escherichia coli, insect cells (using baculovirus expression vectors), yeast cells, or mammalian cells. Suitable host cells are further discussed in Goeddel, GENE expression TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Alternatively, a recombinant expression vector can be transcribed and translated in vitro, such as with the aid of T7 promoter and T7 polymerase regulatory sequences.
Варианты осуществления согласно настоящему изобретению охватывают последовательности (как полинуклеотидные, так и полипептидные), которые могут содержать гомологичную замену (используемые в данном документе как замена, так и замещение означают обмен существующего аминокислотного остатка или нуклеотида на альтернативный остаток или нуклеотид), которая может происходить, т.е., в случае аминокислот, замену на аналогичную, например, основной на основную, кислой на кислую, полярной на полярную и т.д. Также может происходить негомологичная замена, т.е. остатка из одного класса на остаток из другого или, в альтернативном случае, связанная с включением аминокислот, отличных от природных, например, орнитина (далее в данном документе называемого Z), орнитиндиаминомасляной кислоты (далее в данном документе называемой B), норлейцинорнитина (далее в данном документе называемого O), пиридилаланина, тиенилаланина, нафтилаланина и фенилглицина. Вариантные аминокислотные последовательности могут содержать подходящие спейсерные группы, которые могут быть вставлены между любыми двумя аминокислотными остатками последовательности, в том числе алкильные группы, например, метильную, этильную или пропильную группы, в дополнение к аминокислотным спейсерам, таким как глициновые или β-аланиновые остатки. Другая форма вариации, которая включает присутствие одного или нескольких аминокислотных остатков в пептоидной форме, может быть хорошо понятна специалистам в данной области. Для того, чтобы избежать неопределенности, "пептоидная форма" используется для обозначения вариантных аминокислотных остатков, где замещающая группа для α-углерода расположена на атоме азота остатка, а не на α-углероде. Способы получения пептидов в пептоидной форме известны из уровня техники, например, Simon RJ et al., PNAS (1992) 89(20), 9367-9371 и Horwell DC, Trends Biotechnol. (1995) 13(4), 132-134.Embodiments of the present invention encompass sequences (both polynucleotide and polypeptide) that may comprise a homologous substitution (as used herein, both substitution and replacement mean the exchange of an existing amino acid residue or nucleotide for an alternative residue or nucleotide), which may occur, i.e., in the case of amino acids, a like-for-like substitution, such as basic for basic, acidic for acidic, polar for polar, etc. Non-homologous substitution may also occur, i.e., a residue from one class for a residue from another, or, alternatively, involving the inclusion of amino acids other than naturally occurring, such as ornithine (hereinafter referred to as Z), ornithinediaminobutyric acid (hereinafter referred to as B), norleucineornithine (hereinafter referred to as O), pyridylalanine, thienylalanine, naphthylalanine, and phenylglycine. Variant amino acid sequences may contain suitable spacer groups that can be inserted between any two amino acid residues of the sequence, including alkyl groups, for example, methyl, ethyl or propyl groups, in addition to amino acid spacers such as glycine or β-alanine residues. Another form of variation, which involves the presence of one or more amino acid residues in peptoid form, may be well understood by those skilled in the art. For the avoidance of doubt, "peptoid form" is used to refer to variant amino acid residues wherein the substituent group for the α-carbon is located on the nitrogen atom of the residue rather than on the α-carbon. Methods for producing peptides in peptoid form are known in the art, for example, Simon RJ et al., PNAS (1992) 89(20), 9367-9371 and Horwell DC, Trends Biotechnol. (1995) 13(4), 132-134.
Моделирование гомологии. Соответствующие остатки в других ортологах Cas9 можно идентифицировать с помощью способов Zhang et al., 2012 (Nature; 490(7421): 556-60) и Chen et al., 2015 (PLoS Comput Biol; 11(5): e1004248)-компьютерного способа взаимодействия белок-белок (PPI) для прогнозирования взаимодействий, опосредованных границами домен-мотив. PrePPI (прогнозируемое PPI), структура на основе способа прогнозирования PPI, объединяет структурные доказательства с неструктурными доказательствами с использованием концепции байесовой статистики. Способ включает взятие пары белков и применение структурного выравнивания с целью выявления структурных элементов, которые соответствуют либо по своим экспериментально определенным структурам, либо по гомологичным моделям. Структурное выравнивание дополнительно используют для выявления как расположенных вблизи, так и удаленных структурных соседствующих элементов посредством общих и локальных геометрических связей. Во всех случаях, когда два соседствующих элемента из структурных элементов образуют комплекс, описанный в Protein Data Bank, он определяет матрицу для моделирования взаимодействия между двумя исследуемыми белками. Модели комплекса создают с помощью накладывания структур элементов на их соответствующий структурный соседствующий элемент в матрице. Этот подход дополнительно описан в Dey et al., 2013 (Prot Sci; 22: 359-66).Homology modeling. Corresponding residues in other Cas9 orthologs can be identified using the methods of Zhang et al., 2012 (Nature; 490(7421): 556–60) and Chen et al., 2015 (PLoS Comput Biol; 11(5): e1004248)—the protein–protein interaction (PPI) computational method for predicting interactions mediated by domain–motif boundaries. PrePPI (predicted PPI), a framework based on the PPI prediction method, combines structural evidence with non-structural evidence using the concept of Bayesian statistics. The method involves taking a pair of proteins and applying a structural alignment to identify structural elements that match either their experimentally determined structures or homology models. Structural alignment is further used to identify both nearby and distant structural neighbors through global and local geometric relationships. Whenever two neighboring structural elements form a complex described in the Protein Data Bank, it defines a matrix for modeling the interaction between the two proteins of interest. Models of the complex are created by superimposing the element structures onto their corresponding structural neighbor in the matrix. This approach is further described in Dey et al., 2013 (Prot Sci; 22: 359-66).
Для целей настоящего изобретения амплификация означает любой способ с использованием праймера и полимеразы, способной обеспечивать репликацию целевой последовательности с достаточной точностью. Амплификацию можно осуществлять с помощью природных или рекомбинантных ДНК-полимераз, таких как TaqGold™, ДНК-полимераза T7, фрагмент Кленова ДНК-полимеразы E. coli и обратная транскриптаза. Предпочтительным способом амплификации является ПЦР.For the purposes of the present invention, amplification means any method using a primer and a polymerase capable of replicating the target sequence with sufficient fidelity. Amplification can be accomplished using natural or recombinant DNA polymerases, such as TaqGold™, T7 DNA polymerase, the Klenow fragment of E. coli DNA polymerase, and reverse transcriptase. The preferred amplification method is PCR.
В определенных аспектах настоящее изобретение охватывает векторы. Как используется в данном документе, "вектор" представляет собой инструмент, который позволяет или облегчает перенос объекта из одной среды в другую. Он представляет собой репликон, такой как плазмида, фаг или космида, в который может быть встроен другой сегмент ДНК для осуществления таким образом репликации встроенного сегмента. Как правило, вектор способен к репликации, если ассоциирован с соответствующими элементами контроля. В целом, термин "вектор" относится к молекуле нуклеиновой кислоты, способной переносить другую нуклеиновую кислоту, с которой она связана. Векторы включают без ограничения молекулы нуклеиновой кислоты, которые являются однонитевыми, двухнитевыми или частично двухнитевыми; молекулы нуклеиновой кислоты, которые содержат один или несколько свободных концов, не содержат свободных концов (например, кольцевые); молекулы нуклеиновой кислоты, которые содержат ДНК, РНК или и ту, и другую; и другие разновидности полинуклеотидов, известные из уровня техники. Одним типом вектора является "плазмида", которая означает кольцевую петлю двухнитевой ДНК, в которую можно встраивать дополнительные сегменты ДНК, как, например, с помощью стандартных методик молекулярного клонирования. Другим типом вектора является вирусный вектор, где полученные из вируса последовательности ДНК или РНК присутствуют в векторе для упаковки в вирус (например, ретровирусы, ретровирусы с дефектной системой репликации, аденовирусы, аденовирусы с дефектной системой репликации и аденоассоциированные вирусы (AAV)). Вирусные векторы также включают полинуклеотиды, переносимые вирусом для трансфекции в клетку-хозяина. Определенные векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы с бактериальной точкой начала репликации и эписомные векторы для млекопитающих). Другие векторы (например, векторы для млекопитающих, отличные от эписомных) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и, таким образом, реплицируются вместе с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы в данном документе обозначены как "векторы экспрессии". Общепринятые пригодные для методик рекомбинантной ДНК векторы экспрессии часто находятся в форме плазмид.In certain aspects, the present invention encompasses vectors. As used herein, a "vector" is a vehicle that enables or facilitates the transfer of an entity from one environment to another. It is a replicon, such as a plasmid, phage, or cosmid, into which another segment of DNA can be inserted to thereby effect replication of the inserted segment. Typically, a vector is capable of replication if associated with appropriate control elements. In general, the term "vector" refers to a nucleic acid molecule capable of transferring another nucleic acid to which it has been linked. Vectors include, but are not limited to, nucleic acid molecules that are single-stranded, double-stranded, or partially double-stranded; nucleic acid molecules that contain one or more free ends, no free ends (e.g., circular); nucleic acid molecules that contain DNA, RNA, or both; and other varieties of polynucleotides known in the art. One type of vector is a "plasmid," which refers to a circular loop of double-stranded DNA into which additional DNA segments can be inserted, such as by standard molecular cloning techniques. Another type of vector is a viral vector, where virally derived DNA or RNA sequences are present in the vector for packaging into the virus (e.g., retroviruses, replication-defective retroviruses, adenoviruses, replication-defective adenoviruses, and adeno-associated viruses (AAV)). Viral vectors also include polynucleotides carried by the virus for transfection into a host cell. Certain vectors are capable of autonomous replication within the host cell into which they are introduced (e.g., bacterial vectors with a bacterial origin of replication and mammalian episomal vectors). Other vectors (e.g., mammalian vectors other than episomal vectors) integrate into the host cell genome upon introduction into the host cell and are thus replicated along with the host genome. Moreover, certain vectors are capable of directing the expression of genes to which they are functionally linked. Such vectors are referred to herein as "expression vectors". Common expression vectors suitable for recombinant DNA techniques are often in the form of plasmids.
Рекомбинантные векторы экспрессии могут содержать нуклеиновую кислоту по настоящему изобретению в форме, подходящей для экспрессии нуклеиновой кислоты в клетке-хозяине, что означает, что рекомбинантные векторы экспрессии включают один или несколько регуляторных элементов, которые могут быть выбраны с учетом клеток-хозяев, которые предполагается применять для экспрессии, которые функционально связаны с последовательностью нуклеиновой кислоты, экспрессия которой предполагается. В контексте рекомбинантного вектора экспрессии предполагается, что выражение "функционально связанный" обозначает то, что представляющая интерес нуклеотидная последовательность связана с регуляторным(регуляторными) элементом(элементами), так что обеспечивается возможность экспрессии нуклеотидной последовательности (например, в системе транскрипции/трансляции in vitro или в клетке-хозяине при введении вектора в клетку-хозяина). Что касается способов рекомбинации и клонирования, следует упомянуть заявку на патент США № 10/815730, опубликованную 2 сентября 2004 г. как US 2004-0171156 A1, содержание которой включено в данный документ посредством ссылки в полном объеме.Recombinant expression vectors may comprise a nucleic acid of the present invention in a form suitable for expression of the nucleic acid in a host cell, which means that the recombinant expression vectors comprise one or more regulatory elements, which may be selected taking into account the host cells that are intended to be used for expression, which are operably linked to the nucleic acid sequence that is intended to be expressed. In the context of a recombinant expression vector, the term "operably linked" is intended to mean that the nucleotide sequence of interest is linked to the regulatory element(s) such that expression of the nucleotide sequence is allowed (e.g. in an in vitro transcription/translation system or in a host cell upon introduction of the vector into the host cell). With respect to recombination and cloning methods, reference should be made to U.S. Patent Application No. 10/815,730, published September 2, 2004 as US 2004-0171156 A1, the contents of which are incorporated herein by reference in their entirety.
Аспекты настоящего изобретения относятся к бицистронным векторам для химерной РНК и Cas9. Бицистронные векторы экспрессии для химерной РНК и Cas9 являются предпочтительными. В целом и конкретно в данном варианте осуществления Cas9 предпочтительно управляется промотором CBh. Химерная РНК предпочтительно может управляться промотором Pol III, таким как промотор U6. Оптимальным является их сочетание. Химерная направляющая РНК, как правило, состоит из направляющей последовательности (Ns) из 20 п. о., которая может быть соединена с tracr-последовательностью (проходящей от первого "U" в нижней нити к концу транскрипта). В разных указанных положениях tracr-последовательность может быть усечена. Направляющие и tracr-последовательности разделены парной tracr-последовательностью, которая может представлять собой GUUUUAGAGCUA. За ней может следовать показанная последовательность петли GAAA. Обе из них являются предпочтительными примерами. Авторы настоящего изобретения продемонстрировали Cas9-опосредованные вставки/делеции в локусах EMX1 и PVALB человека с помощью анализов с использованием нуклеазы SURVEYOR. ChiRNA показаны путем обозначения их "+n", а crRNA относится к гибридной РНК, в которой направляющие и tracr-последовательности экспрессируются в виде отдельных транскриптов. По всей данной заявке химерная РНК также может называться одиночной направляющей или синтетической направляющей РНК (sgRNA).Aspects of the present invention relate to bicistronic vectors for chimeric RNA and Cas9. Bicistronic expression vectors for chimeric RNA and Cas9 are preferred. In general, and particularly in this embodiment, Cas9 is preferably driven by the CBh promoter. The chimeric RNA may preferably be driven by a Pol III promoter, such as the U6 promoter. Optimally, a combination of both. The chimeric guide RNA typically consists of a 20 bp guide sequence (Ns), which may be linked to a tracr sequence (extending from the first "U" in the lower strand to the end of the transcript). The tracr sequence may be truncated at various indicated positions. The guide and tracr sequences are separated by a tracr pair sequence, which may be GUUUUAGAGCUA. This may be followed by the shown GAAA loop sequence. Both of these are preferred examples. The present inventors demonstrated Cas9-mediated insertions/deletions at the human EMX1 and PVALB loci using SURVEYOR nuclease assays. ChiRNAs are indicated by their "+n" designation, and crRNA refers to a hybrid RNA in which the guide and tracr sequences are expressed as separate transcripts. Throughout this application, chimeric RNA may also be referred to as single guide or synthetic guide RNA (sgRNA).
В некоторых вариантах осуществления предусмотрена петля в направляющей РНК. Она может представлять собой петлю на стебле или тетра-петлю. Петля предпочтительно представляет собой GAAA, но не ограничивается этой последовательностью, или действительно ее длина составляет только 4 п.о. Действительно, предпочтительные петлеобразующие последовательности для использования в "шпилечных" структурах имеют длину четыре нуклеотида и наиболее предпочтительно имеют последовательность GAAA. Однако, можно применять более длинные или более короткие последовательности петли, а также альтернативные последовательности. Последовательности предпочтительно включают нуклеотидный триплет (например, AAA) и дополнительный нуклеотид (например, C или G). Примеры петлеобразующих последовательностей включают CAAA и AAAG. При осуществлении на практике любых способов, раскрытых в данном документе, подходящий вектор можно вводить в клетку или эмбрион посредством одного или нескольких способов, известных из уровня техники, в том числе без ограничения микроинъекции, электропорации, сонопорации, баллистической трансфекции, трансфекции, опосредованной фосфатом кальция, трансфекции с помощью катионных липидных частиц, липосомной трансфекции, трансфекции с помощью дендримеров, трансфекции посредством теплового шока, трансфекции посредством нуклеофекции, магнитофекции, липофекции, импалефекции, оптической трансфекции, поглощения нуклеиновых кислот, стимулируемого проприетарным средством, и доставки с помощью липосом, иммунолипосом, виросом или искусственных вирионов. В некоторых способах вектор вводят в эмбрион посредством микроинъекции. Можно осуществлять микроинъекцию вектора или векторов в ядро или цитоплазму эмбриона. В некоторых способах вектор или векторы можно вводить в клетку посредством нуклеофекции.In some embodiments, a loop is provided in the guide RNA. This may be a stem loop or a tetra-loop. The loop is preferably GAAA, but is not limited to this sequence, or indeed only 4 bp in length. Indeed, preferred loop-forming sequences for use in hairpin structures are four nucleotides in length, and most preferably have the sequence GAAA. However, longer or shorter loop sequences, as well as alternative sequences, may be used. The sequences preferably include a nucleotide triplet (e.g., AAA) and an additional nucleotide (e.g., C or G). Examples of loop-forming sequences include CAAA and AAAG. In practicing any of the methods disclosed herein, a suitable vector can be introduced into a cell or embryo by one or more methods known in the art, including but not limited to microinjection, electroporation, sonoporation, ballistic transfection, calcium phosphate-mediated transfection, cationic lipid particle transfection, liposome transfection, dendrimer transfection, heat shock transfection, nucleofection transfection, magnetofection, lipofection, impalefection, optical transfection, proprietary agent-stimulated nucleic acid uptake, and liposome, immunoliposome, virosome, or artificial virion delivery. In some methods, the vector is introduced into the embryo by microinjection. The vector or vectors can be microinjected into the nucleus or cytoplasm of the embryo. In some methods, the vector or vectors can be introduced into the cell by nucleofection.
Термин "регуляторный элемент" предназначен для охвата промоторов, энхансеров, сайтов внутренней посадки рибосомы (IRES) и других контролирующих экспрессию элементов (к примеру, сигналы терминации транскрипции, такие как сигналы полиаденилирования и поли-U-последовательности). Такие регуляторные элементы описаны, например, в Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Регуляторные элементы включают такие элементы, которые управляют конститутивной экспрессией нуклеотидной последовательности во многих типах клеток-хозяев, и такие элементы, которые управляют экспрессией нуклеотидной последовательности только в определенных клетках-хозяевах (например, тканеспецифичные регуляторные последовательности). Тканеспецифичный промотор может управлять экспрессией преимущественно в представляющей интерес целевой ткани, такой как мышца, нейрон, кость, кожа, кровь, конкретных органах (к примеру, печени, поджелудочной железе) или определенных типах клеток (к примеру, лимфоцитах). Регуляторные элементы также могут управлять экспрессией зависимым от времени образом, как, например, зависимым от клеточного цикла или зависимым от стадии развития образом, который также может быть или может не быть тканеспецифичным или специфичным к типу клеток. В некоторых вариантах осуществления вектор содержит один или несколько промоторов pol III (к примеру, 1, 2, 3, 4, 5 или более промоторов pol III), один или несколько промоторов pol II (к примеру, 1, 2, 3, 4, 5 или более промоторов pol II), один или несколько промоторов pol I (к примеру, 1, 2, 3, 4, 5 или более промоторов pol I) или их комбинации. Примеры промоторов pol III включают без ограничения промоторы U6 и H1. Примеры промоторов pol II включают без ограничения ретровирусный промотор LTR вируса саркомы Рауса (RSV) (необязательно с энхансером RSV), промотор цитомегаловируса (CMV) (необязательно с энхансером CMV) [см., например, Boshart et al, Cell, 41:521-530 (1985)], промотор SV40, промотор гена дигидрофолатредуктазы, промотор гена β-актина, промотор гена глицерофосфаткиназы (PGK) и промотор EF1α. Также термином "регуляторный элемент" охватываются энхансерные элементы, такие как энхансеры WPRE; CMV; сегмент R-U5' в LTR из HTLV-I (Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988); энхансер SV40; а также интронная последовательность между экзонами 2 и 3 гена β-глобина кролика (Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981). Специалистам в данной области техники будет понятно, что конфигурация вектора экспрессии может зависеть от таких факторов, как выбор клетки-хозяина, подлежащей трансформации, требуемый уровень экспрессии и т.п. Вектор можно вводить в клетки-хозяева с получением, таким образом, транскриптов, белков или пептидов, в том числе слитых белков или пептидов, кодируемых нуклеиновыми кислотами, которые описаны в данном документе (например, транскриптов коротких палиндромных повторов, регулярно расположенных группами (CRISPR), белков, ферментов, их мутантных форм, их слитых белков и т.п.). По отношению к регуляторным последовательностям следует упомянуть заявку на патент США № 10/491026, содержание которой включено в данный документ посредством ссылки в полном объеме. По отношению к промоторам следует упомянуть PCT-публикацию WO 2011/028929 и заявку на патент США № 12/511940, содержание которых включено в данный документ посредством ссылки во их полноте.The term "regulatory element" is intended to encompass promoters, enhancers, internal ribosome entry sites (IRES), and other expression control elements (e.g., transcription termination signals such as polyadenylation signals and poly-U sequences). Such regulatory elements are described, for example, in Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Regulatory elements include those that direct constitutive expression of a nucleotide sequence in many types of host cells and those that direct expression of a nucleotide sequence only in certain host cells (e.g., tissue-specific regulatory sequences). A tissue-specific promoter may direct expression preferentially in a target tissue of interest, such as muscle, neuron, bone, skin, blood, specific organs (e.g., liver, pancreas), or specific cell types (e.g., lymphocytes). Regulatory elements may also direct expression in a time-dependent manner, such as in a cell cycle-dependent or developmental stage-dependent manner, which may or may not also be tissue-specific or cell type-specific. In some embodiments, the vector comprises one or more pol III promoters (e.g., 1, 2, 3, 4, 5 or more pol III promoters), one or more pol II promoters (e.g., 1, 2, 3, 4, 5 or more pol II promoters), one or more pol I promoters (e.g., 1, 2, 3, 4, 5 or more pol I promoters), or combinations thereof. Examples of pol III promoters include, but are not limited to, the U6 and H1 promoters. Examples of pol II promoters include, but are not limited to, the retroviral Rous sarcoma virus (RSV) LTR promoter (optionally with the RSV enhancer), the cytomegalovirus (CMV) promoter (optionally with the CMV enhancer) [see, e.g., Boshart et al, Cell, 41:521-530 (1985)], the SV40 promoter, the dihydrofolate reductase gene promoter, the β-actin gene promoter, the glycerophosphate kinase (PGK) gene promoter, and the EF1α promoter. Also encompassed by the term "regulatory element" are enhancer elements such as the WPRE; CMV; the R-U5' segment of the LTR of HTLV-I (Mol. Cell. Biol., Vol. 8(1), pp. 466-472, 1988); the SV40 enhancer; and the intronic sequence between exons 2 and 3 of the rabbit β-globin gene (Proc. Natl. Acad. Sci. USA., Vol. 78(3), pp. 1527-31, 1981). Those skilled in the art will appreciate that the configuration of the expression vector may depend on factors such as the choice of host cell to be transformed, the desired expression level, etc. The vector can be introduced into host cells to thereby produce transcripts, proteins or peptides, including fusion proteins or peptides, encoded by nucleic acids described herein (e.g., clustered regularly interspaced short palindromic repeats (CRISPR) transcripts, proteins, enzymes, mutant forms thereof, fusion proteins thereof, etc.). With respect to regulatory sequences, reference is made to U.S. Patent Application No. 10/491,026, the contents of which are incorporated herein by reference in their entirety. With respect to promoters, reference is made to PCT Publication WO 2011/028929 and U.S. Patent Application No. 12/511,940, the contents of which are incorporated herein by reference in their entireties.
Векторы могут быть разработаны для экспрессии транскриптов CRISPR (к примеру, транскриптов нуклеиновых кислот, белков или ферментов) в прокариотических или эукариотических клетках. Например, транскрипты CRISPR могут экспрессироваться в бактериальных клетках, например, Escherichia coli, клетках насекомых (с использованием бакуловирусных векторов экспрессии), клетках дрожжей или клетках млекопитающих. Подходящие клетки-хозяева дополнительно рассматриваются в Goeddel, GENE экспрессия TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Альтернативно рекомбинантный вектор экспрессии может транскрибироваться и транслироваться in vitro, например, с помощью регуляторных последовательностей промотора T7 и полимеразы T7.Vectors can be designed to express CRISPR transcripts (e.g., nucleic acid, protein, or enzyme transcripts) in prokaryotic or eukaryotic cells. For example, CRISPR transcripts can be expressed in bacterial cells such as Escherichia coli, insect cells (using baculovirus expression vectors), yeast cells, or mammalian cells. Suitable host cells are further discussed in Goeddel, GENE expression TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990). Alternatively, the recombinant expression vector can be transcribed and translated in vitro, for example, using the regulatory sequences of the T7 promoter and T7 polymerase.
Векторы можно вводить и размножать в прокариоте или прокариотической клетке. В некоторых вариантах осуществления прокариота используют для амплификации копий вектора, который предполагается вводить в эукариотическую клетку, или в качестве промежуточного вектора при получении вектора, который предполагается вводить в эукариотическую клетку (к примеру, путем амплификации плазмиды как части системы упаковки вирусного вектора). В некоторых вариантах осуществления прокариота используют для амплификации копий вектора и экспрессии одной или нескольких нуклеиновых кислот, как, например, для обеспечения источника одного или нескольких белков для доставки в клетку-хозяина или организм-хозяина. Экспрессию белков в прокариотах наиболее часто осуществляют в Escherichia coli с помощью векторов, содержащих конститутивные или индуцируемые промоторы, управляющие экспрессией либо слитых белков, либо белков, отличных от слитых белков. В слитых векторах добавляют некоторое количество аминокислот к белку, закодированному в них, как, например, к амино-концу рекомбинантного белка. Такие слитые векторы могут служить для одной или нескольких целей, как, например: (i) для повышения экспрессии рекомбинантного белка; (ii) для повышения растворимости рекомбинантного белка и (iii) для содействия очистке рекомбинантного белка путем функционирования в качестве лиганда при аффинной очистке. Часто в слитые векторы экспрессии сайт протеолитического расщепления вводят в место соединения слитого фрагмента и рекомбинантного белка для облегчения отделения рекомбинантного белка от слитого фрагмента после очистки слитого белка. Такие ферменты и их когнатные распознающие последовательности включают фактор Xa, тромбин и энтерокиназу. Иллюстративные слитые векторы экспрессии включают pGEX (Pharmacia Biotech Inc; Smith and Johnson, 1988. Gene 67: 31-40), pMAL (New England Biolabs, Беверли, Массачусетс) и pRIT5 (Pharmacia, Пискатауэй, Нью-Джерси), в которых соответственно глутатион-S-трансфераза (GST), мальтоза-связывающий белок E или белок A слиты с целевым рекомбинантным белком. Примеры подходящих индуцируемых не являющихся слитыми векторов экспрессии для E. coli включают pTrc (Amrann et al., (1988) Gene 69:301-315) и pET 11d (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89). В некоторых вариантах осуществления вектор является дрожжевым вектором экспрессии. Примеры векторов для экспрессии в дрожжах Saccharomyces cerivisae включают pYepSec1 (Baldari, et al., 1987. EMBO J. 6: 229-234), pMFa (Kuijan and Herskowitz, 1982. Cell 30: 933-943), pJRY88 (Schultz et al., 1987. Gene 54: 113-123), pYES2 (Invitrogen Corporation, Сан-Диего, Калифорния) и picZ (InVitrogen Corp, Сан-Диего, Калифорния). В некоторых вариантах осуществления вектор управляет экспрессией белка в клетках насекомых с помощью бакуловирусных векторов экспрессии. Бакуловирусные векторы, доступные для экспрессии белков в культивируемых клетках насекомых (к примеру, клетках SF9), включают группу pAc (Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165) и группу pVL (Lucklow and Summers, 1989. Virology 170: 31-39).Vectors can be introduced and propagated in a prokaryote or a prokaryotic cell. In some embodiments, the prokaryote is used to amplify copies of a vector that is to be introduced into a eukaryotic cell, or as an intermediate vector in the preparation of a vector that is to be introduced into a eukaryotic cell (e.g., by amplifying a plasmid as part of a viral vector packaging system). In some embodiments, the prokaryote is used to amplify copies of a vector and express one or more nucleic acids, such as to provide a source of one or more proteins for delivery to a host cell or host organism. Expression of proteins in prokaryotes is most often accomplished in Escherichia coli using vectors containing constitutive or inducible promoters that direct the expression of either fusion proteins or proteins other than fusion proteins. Fusion vectors add a number of amino acids to the protein encoded therein, such as to the amino terminus of a recombinant protein. Such fusion vectors may serve one or more purposes, such as: (i) to enhance expression of the recombinant protein; (ii) to enhance the solubility of the recombinant protein; and (iii) to aid in purification of the recombinant protein by functioning as a ligand in affinity purification. Often, a proteolytic cleavage site is introduced into fusion expression vectors at the junction of the fusion fragment and the recombinant protein to facilitate separation of the recombinant protein from the fusion fragment after purification of the fusion protein. Such enzymes and their cognate recognition sequences include factor Xa, thrombin, and enterokinase. Illustrative fusion expression vectors include pGEX (Pharmacia Biotech Inc; Smith and Johnson, 1988. Gene 67:31-40), pMAL (New England Biolabs, Beverly, MA), and pRIT5 (Pharmacia, Piscataway, NJ), in which glutathione S-transferase (GST), maltose-binding protein E, or protein A, respectively, are fused to the target recombinant protein. Examples of suitable inducible non-fusion expression vectors for E. coli include pTrc (Amrann et al., (1988) Gene 69:301-315) and pET 11d (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89). In some embodiments, the vector is a yeast expression vector. Examples of vectors for expression in the yeast Saccharomyces cerivisae include pYepSec1 (Baldari, et al., 1987. EMBO J. 6: 229-234), pMFa (Kuijan and Herskowitz, 1982. Cell 30: 933-943), pJRY88 (Schultz et al., 1987. Gene 54: 113-123), pYES2 (Invitrogen Corporation, San Diego, CA), and picZ (InVitrogen Corp, San Diego, CA). In some embodiments, the vector directs protein expression in insect cells using baculovirus expression vectors. Baculovirus vectors available for expression of proteins in cultured insect cells (e.g., SF9 cells) include the pAc group (Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165) and the pVL group (Lucklow and Summers, 1989. Virology 170: 31-39).
В некоторых вариантах осуществления вектор способен управлять экспрессией одной или нескольких последовательностей в клетках млекопитающих с помощью вектора экспрессии для млекопитающих. Примеры векторов экспрессии для млекопитающих включают pCDM8 (Seed, 1987. Nature 329: 840) и pMT2PC (Kaufman, et al., 1987. EMBO J. 6: 187-195). При использовании в клетках млекопитающих функции контроля вектора экспрессии, как правило, обеспечиваются одним или несколькими регуляторными элементами. Например, широко используемые промоторы получают из вируса полиомы, аденовируса 2, цитомегаловируса, обезьяньего вируса 40 и других, раскрытых в данном документе и известных из уровня техники. Что касается других подходящих систем экспрессии как для прокариотических, так и для эукариотических клеток, см., к примеру, главы 16 и 17 в Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989.In some embodiments, the vector is capable of directing the expression of one or more sequences in mammalian cells using a mammalian expression vector. Examples of mammalian expression vectors include pCDM8 (Seed, 1987. Nature 329:840) and pMT2PC (Kaufman, et al., 1987. EMBO J. 6:187-195). When used in mammalian cells, the control functions of the expression vector are typically provided by one or more regulatory elements. For example, commonly used promoters are derived from polyoma virus, adenovirus 2, cytomegalovirus, simian virus 40, and others disclosed herein and known in the art. For other suitable expression systems for both prokaryotic and eukaryotic cells, see, for example, Chapters 16 and 17 of Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989.
В некоторых вариантах осуществления рекомбинантные векторы экспрессии для млекопитающих способны управлять экспрессией нуклеиновой кислоты преимущественно в определенном типе клеток (к примеру, тканеспецифичные регуляторные элементы используют для экспрессии нуклеиновой кислоты). Тканеспецифичные регуляторные элементы известны из уровня техники. Неограничивающие примеры подходящих тканеспецифичных промоторов включают промотор гена альбумина (специфичный к печени; Pinkert, et al., 1987. Genes Dev. 1: 268-277), специфичные к лимфоидной ткани промоторы (Calame and Eaton, 1988. Adv. Immunol. 43: 235-275), в частности, промоторы рецепторов T-клеток (Winoto and Baltimore, 1989. EMBO J. 8: 729-733) и иммуноглобулины (Baneiji, et al., 1983. Cell 33: 729-740; Queen and Baltimore, 1983. Cell 33: 741-748), нейрон-специфичные промоторы (к примеру, промотор гена нейрофиламента; Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477), специфичные к клеткам поджелудочной железы промоторы (Edlund, et al., 1985. Science 230: 912-916) и специфичные к клеткам молочной железы промоторы (к примеру, промотор молочной сыворотки; патент США № 4873316 и публикация европейской заявки № 264166). Регулируемые стадией развития промоторы также охвачены, к примеру, промоторы генов hox мыши (Kessel and Gruss, 1990. Science 249: 374-379) и промотор гена α-фетопротеина (Campes and Tilghman, 1989. Genes Dev. 3: 537-546). Что касается этих прокариотических и эукариотических векторов, следует упомянуть патент США № 6750059, содержание которого включено в данный документ посредством ссылки во всей его полноте. Другие варианты осуществления по настоящему изобретению могут относиться к вирусным векторам, которые упоминаются в заявке на патент США № 13/092085, содержание которой включено в данный документ посредством ссылки во всей ее полноте. Тканеспецифичные регуляторные элементы известны из уровня техники и, в связи с этим, следует упомянуть патент США № 7776321, содержание которого включено в данный документ посредством ссылки во всей его полноте. В некоторых вариантах осуществления регуляторный элемент является функционально связанным с одним или несколькими элементами системы CRISPR так, чтобы управлять экспрессией одного или нескольких элементов системы CRISPR. В целом, CRISPR (короткие палиндромные повторы, регулярно расположенные группами), также известные как SPIDR (прерываемые спейсерами прямые повторы), составляют семейство локусов ДНК, которые, как правило, специфичны для определенного вида бактерий. Локус CRISPR включает определенный класс чередующихся коротких повторов последовательностей (SSR), которые были обнаружены у E. coli (Ishino et al., J. Bacteriol., 169:5429-5433 [1987]; и Nakata et al., J. Bacteriol., 171:3553-3556 [1989]), и ассоциированные гены. Подобные чередующиеся SSR были идентифицированы у Haloferax mediterranei, Streptococcus pyogenes, Anabaena и Mycobacterium tuberculosis (см. Groenen et al., Mol. Microbiol., 10:1057-1065 [1993]; Hoe et al., Emerg. Infect. Dis., 5:254-263 [1999]; Masepohl et al., Biochim. Biophys. Acta 1307:26-30 [1996]; и Mojica et al., Mol. Microbiol., 17:85-93 [1995]). Локусы CRISPR, как правило, отличаются от других SSR по структуре повторов, которые были названы короткими повторами с регулярными интервалами (SRSR) (Janssen et al., OMICS J. Integ. Biol., 6:23-33 [2002]; и Mojica et al., Mol. Microbiol., 36:244-246 [2000]). В целом, повторы являются короткими элементами, которые встречаются группами, которые регулярно разделены уникальными вставочными последовательностями с практически постоянной длинной (Mojica et al., [2000], выше). Несмотря на то, что последовательности повторов высоко консервативны между штаммами, некоторое количество чередующихся повторов и последовательностей спейсерных участков, как правило, отличаются от штамма к штамму (van Embden et al., J. Bacteriol., 182:2393-2401 [2000]). Локусы CRISPR идентифицировали у более чем 40 прокариотов (см., например, Jansen et al., Mol. Microbiol., 43:1565-1575 [2002]; и Mojica et al., [2005]), в том числе без ограничения Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus, Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium, Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella, Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pasteurella, Photobacterium, Salmonella, Xanthomonas, Yersinia, Treponema и Thermotoga.In some embodiments, recombinant mammalian expression vectors are capable of directing expression of a nucleic acid preferentially in a particular cell type (e.g., tissue-specific regulatory elements are used to express the nucleic acid). Tissue-specific regulatory elements are known in the art. Non-limiting examples of suitable tissue-specific promoters include the albumin gene promoter (liver-specific; Pinkert, et al., 1987. Genes Dev. 1: 268-277), lymphoid tissue-specific promoters (Calame and Eaton, 1988. Adv. Immunol. 43: 235-275), particularly the T-cell receptor promoters (Winoto and Baltimore, 1989. EMBO J. 8: 729-733) and immunoglobulins (Baneiji, et al., 1983. Cell 33: 729-740; Queen and Baltimore, 1983. Cell 33: 741-748), neuron-specific promoters (e.g., the neurofilament gene promoter; Byrne and Ruddle, 1989). Proc. Natl. Acad. Sci. USA 86: 5473-5477), pancreatic cell-specific promoters (Edlund, et al., 1985. Science 230: 912-916), and mammary cell-specific promoters (e.g., the whey promoter; U.S. Patent No. 4,873,316 and European Patent Application Publication No. 264,166). Developmental stage-regulated promoters are also included, e.g., the mouse hox gene promoters (Kessel and Gruss, 1990. Science 249: 374-379) and the alpha-fetoprotein gene promoter (Campes and Tilghman, 1989. Genes Dev. 3: 537-546). With respect to these prokaryotic and eukaryotic vectors, reference should be made to U.S. Patent No. 6,750,059, the contents of which are incorporated herein by reference in their entirety. Other embodiments of the present invention may relate to viral vectors, which are mentioned in U.S. Patent Application Ser. No. 13/092,085, the contents of which are incorporated herein by reference in their entirety. Tissue-specific regulatory elements are known in the art and, in this regard, reference should be made to U.S. Patent No. 7,776,321, the contents of which are incorporated herein by reference in their entirety. In some embodiments, the regulatory element is operably linked to one or more elements of the CRISPR system so as to direct the expression of one or more elements of the CRISPR system. In general, CRISPR (clustered regularly interspaced short palindromic repeats), also known as SPIDR (spacer-interrupted direct repeats), constitute a family of DNA loci that are typically specific to a particular bacterial species. The CRISPR locus includes a particular class of interspersed short sequence repeats (SSRs) that were discovered in E. coli (Ishino et al., J. Bacteriol., 169:5429–5433 [1987]; and Nakata et al., J. Bacteriol., 171:3553–3556 [1989]) and associated genes. Similar alternating SSRs have been identified in Haloferax mediterranei, Streptococcus pyogenes, Anabaena, and Mycobacterium tuberculosis (see Groenen et al., Mol. Microbiol., 10:1057–1065 [1993]; Hoe et al., Emerg. Infect. Dis., 5:254–263 [1999]; Masepohl et al., Biochim. Biophys. Acta 1307:26–30 [1996]; and Mojica et al., Mol. Microbiol., 17:85–93 [1995]). CRISPR loci are typically distinguished from other SSRs by the structure of repeats, which have been termed regularly interspaced short repeats (SRSRs) (Janssen et al., OMICS J. Integ. Biol., 6:23–33 [2002]; and Mojica et al., Mol. Microbiol., 36:244–246 [2000]). In general, repeats are short elements that occur in groups that are regularly separated by unique intervening sequences of nearly constant length (Mojica et al., [2000], supra). Although the repeat sequences are highly conserved between strains, a number of interspersed repeats and spacer region sequences typically differ between strains (van Embden et al., J. Bacteriol., 182:2393–2401 [2000]). CRISPR loci have been identified in over 40 prokaryotes (see, e.g., Jansen et al., Mol. Microbiol., 43:1565–1575 [2002]; and Mojica et al., [2005]), including but not limited to Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus, Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium, Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella, Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pasteurella, Photobacterium, Salmonella, Xanthomonas, Yersinia, Treponema and Thermotoga.
В целом, "система нацеливания на нуклеиновую кислоту", как используется в настоящей заявке, относится собирательно к транскриптам и другим элементам, участвующим в экспрессии или управляющих активностью CRISPR-ассоциированных ("Cas") генов нацеливания на нуклеиновую кислоту (также называемых в данном документе эффекторный белок), в том числе последовательностям, кодирующим белок Cas (эффекторный) нацеливания на нуклеиновую кислоту и направляющую РНК (содержащую последовательность crRNA и последовательность транс-активирующей РНК (tracrRNA) системы CRISPR/Cas), или другим последовательностям и транскриптам из локуса CRISPR нацеливания на нуклеиновую кислоту. В некоторых вариантах осуществления один или несколько элементов системы нацеливания на нуклеиновую кислоту получены из системы CRISPR типа V/типа VI нацеливания на нуклеиновую кислоту. В некоторых вариантах осуществления один или несколько элементов системы нацеливания на нуклеиновую кислоту получены из конкретного организма, содержащего эндогенную систему CRISPR нацеливания на нуклеиновую кислоту. В целом, система нацеливания на нуклеиновую кислоту характеризуется элементами, которые способствуют образованию комплекса нацеливания на нуклеиновую кислоту в сайте целевой последовательности. В контексте образования комплекса нацеливания на нуклеиновую кислоту "целевая последовательность" относится к последовательности, по отношению к которой направляющая последовательность сконструирована так, чтобы обладать комплементарностью, где гибридизация между целевой последовательностью и направляющей РНК способствует образованию комплекса нацеливания на ДНК или РНК. Полная комплементарность не обязательна при условии, что имеет место достаточная комплементарность для осуществления гибридизации и способствования образованию комплекса нацеливания на нуклеиновую кислоту. Целевая последовательность может содержать полинуклеотиды РНК. В некоторых вариантах осуществления целевая последовательность расположена в ядре или цитоплазме клетки. В некоторых вариантах осуществления целевая последовательность может находиться в органелле эукариотической клетки, например, митохондрии или хлоропласте. Последовательность или матрицу, которую можно применять для рекомбинации в целевом локусе, содержащем целевые последовательности, называют "матрицей редактирования", или "РНК для редактирования" или "последовательностью для редактирования". В аспектах настоящего изобретения экзогенную матричную ДНК можно называть матрицей редактирования. В одном аспекте настоящего изобретения рекомбинация является гомологичной рекомбинацией.In general, "nucleic acid targeting system" as used herein refers collectively to transcripts and other elements involved in the expression or control of the activity of CRISPR-associated ("Cas") nucleic acid targeting genes (also referred to herein as effector protein), including sequences encoding a nucleic acid targeting Cas (effector) protein and a guide RNA (comprising a crRNA sequence and a trans-activating RNA (tracrRNA) sequence of the CRISPR/Cas system), or other sequences and transcripts from a nucleic acid targeting CRISPR locus. In some embodiments, one or more elements of the nucleic acid targeting system are derived from a type V/type VI nucleic acid targeting CRISPR system. In some embodiments, one or more elements of the nucleic acid targeting system are derived from a particular organism that contains an endogenous nucleic acid targeting CRISPR system. In general, the nucleic acid targeting system is characterized by elements that facilitate the formation of a nucleic acid targeting complex at the site of a target sequence. In the context of forming a nucleic acid targeting complex, a "target sequence" refers to a sequence to which a guide sequence is designed to have complementarity, wherein hybridization between the target sequence and the guide RNA facilitates the formation of a DNA or RNA targeting complex. Perfect complementarity is not required, so long as there is sufficient complementarity to allow hybridization and facilitate the formation of a nucleic acid targeting complex. The target sequence may comprise RNA polynucleotides. In some embodiments, the target sequence is located in the nucleus or cytoplasm of a cell. In some embodiments, the target sequence may be in an organelle of a eukaryotic cell, such as a mitochondrion or a chloroplast. A sequence or template that can be used for recombination at a target locus containing target sequences is called an "editing template" or "editing RNA" or "editing sequence". In aspects of the present invention, exogenous template DNA may be called an editing template. In one aspect of the present invention, the recombination is homologous recombination.
Как правило, в контексте эндогенной системы нацеливания на нуклеиновую кислоту образование комплекса нацеливания на нуклеиновую кислоту (содержащего направляющую РНК, гибридизирующуюся с целевой последовательностью и образующую комплекс с одним или несколькими эффекторными белками для нацеливания на нуклеиновую кислоту) приводит к расщеплению одной или обеих нитей РНК в (к примеру, в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар оснований) целевой последовательности или рядом с ней. В некоторых вариантах осуществления один или несколько векторов, управляющих экспрессией одного или нескольких элементов системы нацеливания на нуклеиновую кислоту, вводят в клетку-хозяина, так что экспрессия элементов системы нацеливания на нуклеиновую кислоту управляет образованием комплекса нацеливания на нуклеиновую кислоту на одном или нескольких целевых сайтах. Например, и эффекторный белок для нацеливания на нуклеиновую кислоту, и направляющая РНК могут быть функционально связаны с отдельными регуляторными элементами на отдельных векторах. Альтернативно два или более элементов, экспрессируемых с одних и тех же или различных регуляторных элементов, можно объединять в одном векторе, при этом один или несколько дополнительных векторов обеспечивают любые компоненты системы нацеливания на нуклеиновую кислоту, не включенные в первый вектор. Элементы системы нацеливания на нуклеиновую кислоту, которые объединены в одном векторе, могут быть размещены в любой подходящей ориентации, как, например, один элемент, расположенный с 5'-конца ("выше") относительно второго элемента или 3'-конца ("ниже") относительно второго элемента. Кодирующая последовательность одного элемента может быть расположена на одной и той же или противоположной нити по отношению к кодирующей последовательности второго элемента и ориентирована в одном и том же или противоположном направлении. В некоторых вариантах осуществления один промотор управляет экспрессией транскрипта, кодирующего эффекторный белок для нацеливания на нуклеиновую кислоту и направляющую РНК, встроенных в одну или несколько интронных последовательностей (к примеру, каждая в разном интроне, две или более по меньшей мере в одном интроне или все в одном интроне). В некоторых вариантах осуществления эффекторный белок для нацеливания на нуклеиновую кислоту и направляющая РНК функционально связаны с одним и тем же промотором и экспрессированы от такового.Typically, in the context of an endogenous nucleic acid targeting system, formation of a nucleic acid targeting complex (comprising a guide RNA that hybridizes to a target sequence and forms a complex with one or more nucleic acid targeting effector proteins) results in cleavage of one or both strands of the RNA at (e.g., within 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 or more base pairs) or near the target sequence. In some embodiments, one or more vectors that direct expression of one or more elements of the nucleic acid targeting system are introduced into a host cell such that expression of the elements of the nucleic acid targeting system directs formation of the nucleic acid targeting complex at one or more target sites. For example, both the nucleic acid targeting effector protein and the guide RNA can be operably linked to separate regulatory elements on separate vectors. Alternatively, two or more elements expressed from the same or different regulatory elements can be combined in a single vector, with one or more additional vectors providing any components of the nucleic acid targeting system not included in the first vector. The elements of the nucleic acid targeting system that are combined in a single vector can be positioned in any suitable orientation, such as one element positioned 5' ("upstream") relative to a second element or 3' ("downstream") relative to a second element. The coding sequence of one element can be positioned on the same or opposite strand relative to the coding sequence of the second element and oriented in the same or opposite direction. In some embodiments, a single promoter drives the expression of a transcript encoding a nucleic acid targeting effector protein and a guide RNA embedded in one or more intronic sequences (e.g., each in a different intron, two or more in at least one intron, or all in a single intron). In some embodiments, the nucleic acid targeting effector protein and the guide RNA are operably linked to and expressed from the same promoter.
В целом, направляющая последовательность представляет собой любую полинуклеотидную последовательность, обладающую достаточной комплементарностью с целевой полинуклеотидной последовательностью для гибридизации с целевой последовательностью и управления специфичным к последовательности связыванием комплекса нацеливания на нуклеиновую кислоту с целевой последовательностью. В некоторых вариантах осуществления степень комплементарности между направляющей последовательностью и ее соответствующей целевой последовательностью при оптимальном выравнивании с применением подходящего алгоритма выравнивания составляет приблизительно или более чем приблизительно 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99% или больше. Оптимальное выравнивание можно определять с помощью любого подходящего алгоритма для выравниваемых последовательностей, неограничивающие примеры которого включают алгоритм Смита-Ватермана, алгоритм Нидлмана-Вунша, алгоритмы, основанные на преобразовании Барроуза-Уилера (к примеру, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies), ELAND (Illumina, Сан-Диего, Калифорния), SOAP (доступный на soap.genomics.org.cn) и Maq (доступный на maq.sourceforge.net). В некоторых вариантах осуществления длина направляющей последовательности составляет приблизительно или более чем приблизительно 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 или более нуклеотидов. В некоторых вариантах осуществления длина направляющей последовательности составляет менее чем приблизительно 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 или менее нуклеотидов. Способность направляющей последовательности управлять специфичным к последовательности связыванием комплекса нацеливания на нуклеиновую кислоту с целевой последовательностью можно оценить с помощью любого подходящего анализа. Например, компоненты системы нацеливания на нуклеиновую кислоту, достаточные для образования комплекса нацеливания на нуклеиновую кислоту, в том числе направляющая последовательность, подлежащая тестированию, могут быть доставлены в клетку-хозяина с соответствующей целевой последовательностью, как, например, с помощью трансфекции векторами, кодирующими компоненты последовательности нацеливания на нуклеиновую кислоту CRISPR, с последующей оценкой предпочтительного расщепления в пределах целевой последовательности или рядом с ней, как, например, с помощью анализа с использованием нуклеазы Surveyor, описываемого в данном документе. Аналогично расщепление целевой полинуклеотидной последовательности (или последовательности рядом с ней) может быть оценено в пробирке путем обеспечения целевой последовательности, компонентов комплекса нацеливания на нуклеиновую кислоту, в том числе направляющей последовательности, подлежащей тестированию, и контрольной направляющей последовательности, отличной от тестируемой направляющей последовательности, и сравнения связывания или степени расщепления в целевой последовательности или рядом с ней в случае реакций с тестируемой и контрольной направляющей последовательностью. Возможны и другие анализы, и они могут быть выполнены специалистами в данной области.In general, a guide sequence is any polynucleotide sequence that has sufficient complementarity with a target polynucleotide sequence to hybridize to the target sequence and direct sequence-specific binding of a nucleic acid targeting complex to the target sequence. In some embodiments, the degree of complementarity between a guide sequence and its corresponding target sequence when optimally aligned using a suitable alignment algorithm is about or greater than about 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%, or more. An optimal alignment can be determined using any suitable algorithm for the sequences to be aligned, non-limiting examples of which include the Smith-Waterman algorithm, the Needleman-Wunsch algorithm, algorithms based on the Burrows-Wheeler transform (e.g., Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign (Novocraft Technologies), ELAND (Illumina, San Diego, CA), SOAP (available at soap.genomics.org.cn), and Maq (available at maq.sourceforge.net). In some embodiments, the length of the guide sequence is about or greater than about 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 or more nucleotides. In some embodiments, the length of the guide sequence is less than about 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 or less nucleotides. The ability of the guide sequence to direct sequence-specific binding of the nucleic acid targeting complex to the target sequence can be assessed using any suitable assay. For example, components of a nucleic acid targeting system sufficient to form a nucleic acid targeting complex, including a guide sequence to be tested, can be delivered to a host cell with an appropriate target sequence, such as by transfection with vectors encoding CRISPR nucleic acid targeting sequence components, followed by assessment of preferential cleavage within or near the target sequence, such as by the Surveyor nuclease assay described herein. Similarly, cleavage of a target polynucleotide sequence (or a sequence near it) can be assessed in vitro by providing the target sequence, components of a nucleic acid targeting complex, including a guide sequence to be tested, and a control guide sequence different from the test guide sequence, and comparing binding or the extent of cleavage at or near the target sequence in reactions with the test and control guide sequences. Other assays are possible and can be performed by those skilled in the art.
Направляющая последовательность может быть выбрана для целенаправленного воздействия на любую целевую последовательность. В некоторых вариантах осуществления целевая последовательность представляет собой последовательность в пределах транскрипта или мРНК.The guide sequence may be selected to specifically target any target sequence. In some embodiments, the target sequence is a sequence within a transcript or mRNA.
В некоторых вариантах осуществления целевая последовательность является последовательностью в пределах генома клетки.In some embodiments, the target sequence is a sequence within the genome of the cell.
В некоторых вариантах осуществления направляющая последовательность выбрана для снижения доли вторичной структуры в направляющей последовательности. Вторичную структуру можно определить с помощью любого подходящего алгоритма сворачивания полинуклеотида. Некоторые программы основаны на вычислении минимальной свободной энергии Гиббса. Примером одного такого алгоритма является mFold, который описан Zuker и Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Другим примером алгоритма сворачивания является доступный в режиме онлайн веб-сервер RNAfold, разработанный в Институте теоретической химии при Венском университете, использующий алгоритм прогнозирования структуры на основе центроидного способа (см., например, A.R. Gruber et al., 2008, Cell 106(1): 23-24 и PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62). Дополнительные алгоритмы можно найти в заявке на патент США с серийным номером 61/836080); включенной в данный документ посредством ссылки.In some embodiments, the guide sequence is selected to reduce the proportion of secondary structure in the guide sequence. The secondary structure can be determined using any suitable polynucleotide folding algorithm. Some programs are based on the calculation of the minimum Gibbs free energy. An example of one such algorithm is mFold, which is described by Zuker and Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Another example of a folding algorithm is the online web server RNAfold, developed at the Institute for Theoretical Chemistry at the University of Vienna, which uses a centroid-based structure prediction algorithm (see, e.g., A. R. Gruber et al., 2008, Cell 106(1): 23-24 and P. A. Carr and G. M. Church, 2009, Nature Biotechnology 27(12): 1151-62). Additional algorithms can be found in U.S. Patent Application Serial No. 61/836,080), incorporated herein by reference.
В некоторых вариантах осуществления также предусмотрена матрица для рекомбинации. Матрица для рекомбинации может быть компонентом другого вектора, который описан в данном документе, может содержаться в отдельном векторе или предусматриваться в виде отдельного полинуклеотида. В некоторых вариантах осуществления матрица для рекомбинации разработана так, чтобы служить в качестве матрицы при гомологичной рекомбинации, как, например, в пределах целевой последовательности или рядом с ней, надрезанной или расщепленной ферментом с помощью эффекторного белка для нацеливания на нуклеиновую кислоту в качестве части комплекса нацеливания на нуклеиновую кислоту. Матричный полинуклеотид может иметь любую подходящую длину, как, например, приблизительно или более чем приблизительно 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1000 нуклеотидов или более. В некоторых вариантах осуществления матричный полинуклеотид комплементарен части полинуклеотида, содержащего целевую последовательность. При оптимальном выравнивании матричный полинуклеотид может перекрываться с одним или несколькими нуклеотидами целевых последовательностей (к примеру, с приблизительно или более чем приблизительно 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 или более нуклеотидами). В некоторых вариантах осуществления при оптимальном выравнивании матричной последовательности и полинуклеотида, содержащего целевую последовательность, наиболее близкий нуклеотид матричного полинуклеотида находится в пределах приблизительно 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1000, 5000, 10000 или более нуклеотидов от целевой последовательности.In some embodiments, a recombination template is also provided. The recombination template may be a component of another vector as described herein, may be contained in a separate vector, or may be provided as a separate polynucleotide. In some embodiments, the recombination template is designed to serve as a template for homologous recombination, such as within or near a target sequence, nicked or cleaved by an enzyme with a nucleic acid targeting effector protein as part of a nucleic acid targeting complex. The template polynucleotide may be any suitable length, such as about or greater than about 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1000 nucleotides or more. In some embodiments, the template polynucleotide is complementary to a portion of a polynucleotide comprising a target sequence. When optimally aligned, the template polynucleotide may overlap with one or more nucleotides of the target sequences (e.g., with about or more than about 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 or more nucleotides). In some embodiments, when a template sequence and a polynucleotide comprising a target sequence are optimally aligned, the closest nucleotide of the template polynucleotide is within about 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1000, 5000, 10000 or more nucleotides of the target sequence.
В некоторых вариантах осуществления эффекторный белок для нацеливания на нуклеиновую кислоту является частью слитого белка, содержащего один или несколько доменов гетерологичного белка (к примеру, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более доменов в дополнение к эффекторному белку нацеливания на нуклеиновую кислоту). В некоторых вариантах осуществления эффекторный белок/фермент CRISPR является частью слитого белка, содержащего один или несколько доменов гетерологичного белка (к примеру, приблизительно или более чем приблизительно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более доменов в дополнение к ферменту CRISPR). Слитый белок, содержащий фермент CRISPR, может содержать любую дополнительную последовательность белка и необязательно линкерную последовательность между любыми двумя доменами. Примеры белковых доменов, которые могут быть слиты с ферментом CRISPR, включают без ограничения эпитопные метки, последовательности из генов-репортеров и белковые домены с одной или несколькими из следующих видов активности: метилазная активность, деметилазная активность, активность в отношении активации транскрипции, активность в отношении репрессии транскрипции, активность фактора освобождения транскрипта, активность в отношении модификации гистонов, активность расщепления РНК и активность связывания нуклеиновой кислоты. Неограничивающие примеры эпитопных меток включают гистидиновые (His) метки, V5-метки, FLAG-метки, метки гемагглютинина вируса гриппа (HA), Myc-метки, VSV-G-метки и тиоредоксиновые (Trx) метки. Примеры генов-репортеров включают без ограничения глутатион-S-трансферазу (GST), пероксидазу хрена (HRP), хлорамфеникол-ацетилтрансферазу (CAT), бета-галактозидазу, бета-глюкуронидазу, люциферазу, зеленый флуоресцентный белок (GFP), HcRed, DsRed, голубой флуоресцентный белок (CFP), желтый флуоресцентный белок (YFP) и автофлуоресцирующие белки, в том числе синий флуоресцентный белок (BFP). Фермент CRISPR может быть слит с последовательностью гена, кодирующей белок или фрагмент белка, которые связываются с молекулами ДНК или связываются с другими клеточными молекулами, в том числе без ограничения связывающий мальтозу белок (MBP), S-метка, продукты слияния Lex A и ДНК-связывающего домена (DBD), продукты слияния GAL4 и ДНК-связывающего домена и продукты слияния белка BP16 вируса простого герпеса (HSV). Дополнительные домены, которые могут образовывать часть слитого белка, содержащего фермент CRISPR, описаны в US20110059502, включенном в данный документ с помощью ссылки. В некоторых вариантах осуществления меченый фермент CRISPR используют для идентификации расположения целевой последовательности.In some embodiments, the nucleic acid targeting effector protein is part of a fusion protein comprising one or more domains of a heterologous protein (e.g., about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more domains in addition to the nucleic acid targeting effector protein). In some embodiments, the effector protein/CRISPR enzyme is part of a fusion protein comprising one or more domains of a heterologous protein (e.g., about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more domains in addition to the CRISPR enzyme). The fusion protein comprising the CRISPR enzyme may comprise any additional protein sequence and, optionally, a linker sequence between any two domains. Examples of protein domains that can be fused to a CRISPR enzyme include, but are not limited to, epitope tags, reporter gene sequences, and protein domains with one or more of the following activities: methylase activity, demethylase activity, transcriptional activation activity, transcriptional repression activity, transcript release factor activity, histone modification activity, RNA cleavage activity, and nucleic acid binding activity. Non-limiting examples of epitope tags include histidine (His) tags, V5 tags, FLAG tags, influenza hemagglutinin (HA) tags, Myc tags, VSV-G tags, and thioredoxin (Trx) tags. Examples of reporter genes include, but are not limited to, glutathione S-transferase (GST), horseradish peroxidase (HRP), chloramphenicol acetyltransferase (CAT), beta-galactosidase, beta-glucuronidase, luciferase, green fluorescent protein (GFP), HcRed, DsRed, cyan fluorescent protein (CFP), yellow fluorescent protein (YFP), and autofluorescent proteins including blue fluorescent protein (BFP). The CRISPR enzyme may be fused to a gene sequence encoding a protein or protein fragment that binds to DNA molecules or binds to other cellular molecules, including, but not limited to, maltose binding protein (MBP), S-tag, Lex A DNA-binding domain (DBD) fusions, GAL4 DNA-binding domain fusions, and herpes simplex virus (HSV) BP16 fusions. Additional domains that may form part of a fusion protein comprising a CRISPR enzyme are described in US20110059502, incorporated herein by reference. In some embodiments, a labeled CRISPR enzyme is used to identify the location of a target sequence.
В некоторых вариантах осуществления фермент CRISPR может образовывать компонент индуцируемой системы. Индуцируемая природа системы будет обеспечивать возможность пространственно-временного контроля редактирования генов или экспрессии генов с использованием определенной формы энергии. Форма энергии может включать, но без ограничения, электромагнитное излучение, звуковую энергию, химическую энергию и тепловую энергию. Примеры индуцируемой системы включают индуцируемые тетрациклином промоторы (Tet-On или Tet-Off), двухгибридные системы активации транскрипции с использованием малых молекул (FKBP, ABA и т.д.) или индуцируемые светом системы (фитохром, домены LOV или криптохром). В одном варианте осуществления фермент CRISPR может быть частью индуцируемого светом транскрипционного эффектора (LITE) для управления изменениями транскрипционной активности специфичным к последовательности образом. Компоненты индуцируемой светом системы могут включать фермент CRISPR, чувствительный к свету гетеродимер цитохрома (например, из Arabidopsis thaliana) и домен активации/репрессии транскрипции. Дополнительные примеры индуцируемых ДНК-связывающих белков и способы их применения представлены в US 61/736465 и US 61/721283 и WO 2014/018423 и US8889418, US8895308, US20140186919, US20140242700, US20140273234, US20140335620, WO2014093635, которые включены в данный документ посредством ссылки во всей полноте.In some embodiments, the CRISPR enzyme may form a component of an inducible system. The inducible nature of the system will allow for spatiotemporal control of gene editing or gene expression using a form of energy. The form of energy may include, but is not limited to, electromagnetic radiation, sound energy, chemical energy, and thermal energy. Examples of an inducible system include tetracycline-inducible promoters (Tet-On or Tet-Off), small molecule two-hybrid transcriptional activation systems (FKBP, ABA, etc.), or light-inducible systems (phytochrome, LOV, or cryptochrome domains). In one embodiment, the CRISPR enzyme may be part of a light-inducible transcriptional effector (LITE) to drive changes in transcriptional activity in a sequence-specific manner. Components of a light-inducible system may include a CRISPR enzyme, a light-sensitive cytochrome heterodimer (e.g., from Arabidopsis thaliana), and a transcriptional activation/repression domain. Additional examples of inducible DNA binding proteins and methods of using them are provided in US 61/736,465 and US 61/721,283 and WO 2014/018423 and US8889418, US8895308, US20140186919, US20140242700, US20140273234, US20140335620, WO2014093635, which are incorporated herein by reference in their entireties.
В некоторых аспектах настоящее изобретение относится к способам, включающим доставку в клетку-хозяина одного или нескольких полинуклеотидов, как, например, или одного, или нескольких векторов, которые описаны в данном документе, одного или нескольких их транскриптов и/или одного или нескольких белков, транскрибируемых с них. В некоторых аспектах настоящее изобретение дополнительно предусматривает клетки, полученные с помощью таких способов, и организмы (такие как животные, растения или грибы), содержащие такие клетки или полученные из них. В некоторых вариантах осуществления эффекторный белок для нацеливания на нуклеиновую кислоту в комбинации с (и необязательно образующий комплекс с) направляющей РНК доставляют в клетку. Традиционные способы переноса генов с использованием вирусов и без использования вирусов можно применять для введения нуклеиновых кислот в клетки млекопитающих или целевые ткани. Такие способы можно использовать для введения нуклеиновых кислот, кодирующих компоненты системы нацеливания на нуклеиновую кислоту, в клетки в культуре или в организме-хозяине. Системы доставки на основе невирусных векторов включают плазмидные ДНК, РНК (например, транскрипт вектора, описанного в данном документе), "оголенную" нуклеиновую кислоту и нуклеиновую кислоту, образующую комплекс со средством доставки, таким как липосома. Системы доставки на основе вирусного вектора включают ДНК- и РНК-содержащие вирусы, которые имеют либо геномы в эписомальной форме, либо интегрированные геномы после доставки в клетку. В отношении обзора процедур генной терапии см. Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., в Current Topics in Microbiology and Immunology, Doerfler and Böhm (eds) (1995); и Yu et al., Gene Therapy 1:13-26 (1994).In some aspects, the present invention provides methods comprising delivering to a host cell one or more polynucleotides, such as, for example, or one or more vectors as described herein, one or more transcripts thereof, and/or one or more proteins transcribed therefrom. In some aspects, the present invention further provides cells produced by such methods and organisms (such as animals, plants, or fungi) comprising or derived from such cells. In some embodiments, a nucleic acid targeting effector protein in combination with (and optionally complexed with) a guide RNA is delivered to the cell. Conventional viral and non-viral gene transfer methods can be used to introduce nucleic acids into mammalian cells or target tissues. Such methods can be used to introduce nucleic acids encoding components of a nucleic acid targeting system into cells in culture or in a host organism. Non-viral vector delivery systems include plasmid DNA, RNA (e.g., the vector transcript described herein), naked nucleic acid, and nucleic acid complexed with a delivery vehicle such as a liposome. Viral vector delivery systems include DNA and RNA viruses that have either genomes in episomal form or integrated genomes after delivery into the cell. For reviews of gene therapy procedures, see Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology, Doerfler and Böhm (eds) (1995); and Yu et al., Gene Therapy 1:13-26 (1994).
Способы отличной от вирусной доставки нуклеиновых кислот включают липофекцию, нуклеофекцию, микроинъекцию, баллистическую трансфекцию, виросомы, липосомы, иммунолипосомы, поликатион или конъюгаты липид:нуклеиновая кислота, "оголенную" ДНК, искусственные вирионы и повышенное с помощью средства поглощение ДНК. Липофекция описана, например, в патентах США №№ 5049386, 4946787 и 4897355, и реагенты для липофекции реализуют в промышленных масштабах (к примеру, Transfectam™ и Lipofectin™). Катионные и нейтральные липиды, которые подходят для эффективной липофекции с узнаванием рецепторов полинуклеотидов, включают липиды из Felgner, WO 91/17424; WO 91/16024. Доставка может осуществляться в клетки (к примеру, введение in vitro или ex vivo) или целевые ткани (к примеру, введение in vivo).Methods for non-viral delivery of nucleic acids include lipofection, nucleofection, microinjection, ballistic transfection, virosomes, liposomes, immunoliposomes, polycation or lipid:nucleic acid conjugates, naked DNA, artificial virions, and agent-enhanced DNA uptake. Lipofection is described, for example, in U.S. Patent Nos. 5,049,386, 4,946,787, and 4,897,355, and lipofection reagents are commercially available (e.g., Transfectam™ and Lipofectin™). Cationic and neutral lipids that are suitable for efficient lipofection with polynucleotide receptor recognition include those of Felgner, WO 91/17424; WO 91/16024. Delivery can be to cells (e.g., in vitro or ex vivo administration) or target tissues (e.g., in vivo administration).
Получение комплексов липид:нуклеиновая кислота, в том числе нацеливающих липосом, таких как иммунолипидные комплексы, хорошо известно специалистам в данной области (см., к примеру, Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); патенты США №№ 4186183, 4217344, 4235871, 4261975, 4485054, 4501728, 4774085, 4837028 и 4946787).The preparation of lipid:nucleic acid complexes, including targeting liposomes such as immunolipid complexes, is well known in the art (see, e.g., Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); U.S. Patent Nos. 4,186,183, 4,217,344, 4235871, 4261975, 4485054, 4501728, 4774085, 4837028 and 4946787).
При применении систем на основе РНК- или ДНК-содержащих вирусов для доставки нуклеиновых кислот используют преимущества тщательно разработанных способов обеспечения нацеливания вируса на конкретные клетки в организме и перемещения полезных последовательностей вируса в ядро. Вирусные векторы можно вводить непосредственно пациентам (in vivo), или их можно использовать для обработки клеток in vitro, и модифицированные клетки можно необязательно вводить пациентам (ex vivo). Традиционные системы на основе вирусов для переноса генов могут включать ретровирусные, лентивирусные, аденовирусные векторы, векторы на основе аденоассоциированного вируса и вируса простого герпеса. Интеграция в геном хозяина возможна с применением способов переноса генов на основе ретровируса, лентивируса и аденоассоциированного вируса, что часто приводит к длительной экспрессии встроенного трансгена. Кроме того, высокие показатели эффективности трансдукции наблюдали у многих различных типов клеток и целевых тканей.The use of RNA or DNA virus-based systems for nucleic acid delivery takes advantage of carefully designed methods for ensuring targeting of the virus to specific cells in the body and translocation of the viral payload sequences into the nucleus. Viral vectors can be administered directly to patients (in vivo) or they can be used to manipulate cells in vitro and the modified cells can optionally be administered to patients (ex vivo). Traditional virus-based gene transfer systems can include retroviral, lentiviral, adenoviral, adeno-associated virus, and herpes simplex virus vectors. Integration into the host genome is possible using retroviral, lentiviral, and adeno-associated virus gene transfer methods, often resulting in long-term expression of the integrated transgene. In addition, high transduction efficiencies have been observed in many different cell types and target tissues.
Тропизм ретровируса может быть изменен путем включения чужеродных белков оболочки с расширением возможной целевой популяции целевых клеток. Лентивирусные векторы являются ретровирусными векторами, которые способны трансдуцировать или инфицировать неделящиеся клетки и, как правило, дают высокие вирусные титры. Выбор системы переноса генов на основе ретровирусов, таким образом, будет зависеть от целевой ткани. Ретровирусные векторы состоят из действующих в цис-положении длинных концевых повторов с упаковывающей способностью до 6-10 т. п. о. чужеродной последовательности. Минимальных действующих в цис-положении LTR достаточно для репликации и упаковки векторов, которые затем используют для интеграции терапевтического гена в целевую клетку с получением постоянной экспрессии трансгена. Широко используемые ретровирусные векторы включают такие векторы, как основанные на вирусе лейкоза мышей (MuLV), вирусе лейкоза гиббонов (GaLV), вирусе иммунодефицита обезьян (SIV), вирусе иммунодефицита человека (HIV) и их комбинациях (см., к примеру, Buchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700). В применениях, в которых транзиентная экспрессия является предпочтительной, можно применять системы на основе аденовирусов. Аденовирусные векторы способны проявлять очень высокую эффективность трансдукции во многих типах клеток и не требуют деления клеток. С применением таких векторов были получены высокие титры и уровни экспрессии. Такой вектор можно получать в больших количествах в относительно простой системе. Векторы на основе аденоассоциированного вируса ("AAV") также можно использовать для трансдукции в клетки целевых нуклеиновых кислот, к примеру, при получении in vitro нуклеиновых кислот и пептидов и для процедур генной терапии in vivo и ex vivo (см., к примеру, West et al., Virology 160:38-47 (1987); патент США № 4797368; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994). Создание рекомбинантных векторов на основе AAV описано в ряде публикаций, в том числе в патенте США № 5173414; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); и Samulski et al., J. Virol. 63:03822-3828 (1989).Retroviral tropism can be altered by incorporating foreign envelope proteins to broaden the possible target cell population. Lentiviral vectors are retroviral vectors that are capable of transducing or infecting non-dividing cells and typically yield high viral titers. The choice of retroviral gene transfer system will therefore depend on the target tissue. Retroviral vectors consist of cis-acting long terminal repeats with the packaging capacity of up to 6-10 kb of foreign sequence. Minimal cis-acting LTRs are sufficient for vector replication and packaging, which are then used to integrate the therapeutic gene into the target cell to produce permanent transgene expression. Commonly used retroviral vectors include those based on murine leukemia virus (MuLV), gibbon leukemia virus (GaLV), simian immunodeficiency virus (SIV), human immunodeficiency virus (HIV), and combinations thereof (see, e.g., Buchscher et al., J. Virol. 66:2731–2739 (1992); Johann et al., J. Virol. 66:1635–1640 (1992); Sommnerfelt et al., Virol. 176:58–59 (1990); Wilson et al., J. Virol. 63:2374–2378 (1989); Miller et al., J. Virol. 65:2220–2224 (1991); PCT/US94/05700). In applications where transient expression is preferred, adenovirus-based systems can be used. Adenovirus vectors can exhibit very high transduction efficiency in many cell types and do not require cell division. High titers and expression levels have been obtained using such vectors. Such a vector can be produced in large quantities in a relatively simple system. Adeno-associated virus ("AAV") vectors can also be used to transduce target nucleic acids into cells, such as for the in vitro production of nucleic acids and peptides and for in vivo and ex vivo gene therapy procedures (see, e.g., West et al., Virology 160:38-47 (1987); U.S. Patent No. 4,797,368; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994). The creation of recombinant AAV vectors has been described in a number of publications, including U.S. Patent No. 5,173,414; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol. Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); and Samulski et al., J. Virol. 63:03822–3828 (1989).
Доставка в целомDelivery in general
Настоящее изобретение также охватывает по меньшей мере один компонент комплекса CRISPR, например, РНК, доставленную посредством по меньшей мере одного комплекса на основе наночастиц. В некоторых аспектах настоящее изобретение относится к способам, включающим доставку в клетку-хозяина одного или нескольких полинуклеотидов, как, например, или одного, или нескольких векторов, которые описаны в данном документе, одного или нескольких их транскриптов и/или одного или нескольких белков, транскрибируемых с них. В некоторых аспектах настоящее изобретение дополнительно предусматривает клетки, полученные с помощью таких способов, и животных, содержащих такие клетки или полученных из них. В некоторых вариантах осуществления фермент CRISPR в комбинации с (и необязательно образующий комплекс с) направляющей последовательностью доставляют в клетку. Традиционные способы переноса генов с использованием вирусов и без использования вирусов можно применять для введения нуклеиновых кислот в клетки млекопитающих или целевые ткани. Такие способы можно использовать для введения нуклеиновых кислот, кодирующих компоненты системы CRISPR, в клетки в культуре или в организме-хозяине. Системы доставки на основе невирусных векторов включают плазмидные ДНК, РНК (например, транскрипт вектора, описанного в данном документе), "оголенную" нуклеиновую кислоту и нуклеиновую кислоту, образующую комплекс со средством доставки, таким как липосома. Системы доставки на основе вирусного вектора включают ДНК- и РНК-содержащие вирусы, которые имеют либо геномы в эписомальной форме, либо интегрированные геномы после доставки в клетку. В отношении обзора процедур генной терапии см. Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al. в Current Topics in Microbiology and Immunology, Doerfler and Böhm (eds) (1995) и Yu et al., Gene Therapy 1:13-26 (1994).The present invention also encompasses at least one component of a CRISPR complex, such as RNA, delivered via at least one nanoparticle complex. In some aspects, the present invention relates to methods comprising delivering to a host cell one or more polynucleotides, such as, for example, or one or more vectors as described herein, one or more transcripts thereof, and/or one or more proteins transcribed therefrom. In some aspects, the present invention further provides cells produced by such methods and animals comprising or derived from such cells. In some embodiments, a CRISPR enzyme in combination with (and optionally complexed with) a guide sequence is delivered to a cell. Conventional viral and non-viral gene transfer methods can be used to introduce nucleic acids into mammalian cells or target tissues. Such methods can be used to introduce nucleic acids encoding components of a CRISPR system into cells in culture or in a host organism. Non-viral vector delivery systems include plasmid DNA, RNA (e.g., the vector transcript described herein), naked nucleic acid, and nucleic acid complexed with a delivery vehicle such as a liposome. Viral vector delivery systems include DNA and RNA viruses that have either genomes in episomal form or integrated genomes after delivery into the cell. For reviews of gene therapy procedures, see Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al. in Current Topics in Microbiology and Immunology, Doerfler and Böhm (eds) (1995) and Yu et al., Gene Therapy 1:13-26 (1994).
Способы отличной от вирусной доставки нуклеиновых кислот включают липофекцию, микроинъекцию, баллистическую трансфекцию, доставка с помощью виросом, липосом, иммунолипосом, поликатион или конъюгатов липид:нуклеиновая кислота, "оголенной" ДНК, искусственных вирионов и повышенное с помощью определенного средства поглощение ДНК. Липофекция описана, например, в патентах США №№ 5049386, 4946787 и 4897355, и реагенты для липофекции реализуют в промышленных масштабах (к примеру, Transfectam™ и Lipofectin™). Катионные и нейтральные липиды, которые подходят для эффективной липофекции с узнаванием рецепторов полинуклеотидов, включают липиды из Felgner, WO 91/17424; WO 91/16024. Доставка может осуществляться в клетки (к примеру, введение in vitro или ex vivo) или целевые ткани (к примеру, введение in vivo).Methods for non-viral delivery of nucleic acids include lipofection, microinjection, ballistic transfection, virosome-mediated delivery via liposomes, immunoliposomes, polycation or lipid:nucleic acid conjugates, naked DNA, artificial virions, and agent-enhanced DNA uptake. Lipofection is described, for example, in U.S. Patent Nos. 5,049,386, 4,946,787, and 4,897,355, and lipofection reagents are commercially available (e.g., Transfectam™ and Lipofectin™). Cationic and neutral lipids that are suitable for efficient lipofection with polynucleotide receptor recognition include those of Felgner, WO 91/17424; WO 91/16024. Delivery can be to cells (e.g., in vitro or ex vivo administration) or target tissues (e.g., in vivo administration).
Получение комплексов липид:нуклеиновая кислота, в том числе нацеливающих липосом, таких как иммунолипидные комплексы, хорошо известно специалистам в данной области (см., к примеру, Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); патенты США №№ 4186183, 4217344, 4235871, 4261975, 4485054, 4501728, 4774085, 4837028 и 4946787).The preparation of lipid:nucleic acid complexes, including targeting liposomes such as immunolipid complexes, is well known in the art (see, e.g., Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); U.S. Patent Nos. 4,186,183, 4,217,344, 4235871, 4261975, 4485054, 4501728, 4774085, 4837028 and 4946787).
При применении систем на основе РНК- и ДНК-содержащих вирусов для доставки нуклеиновых кислот используют тщательно разработанные способы обеспечения нацеливания вируса на конкретные клетки в организме и перемещения полезных последовательностей вируса в ядро. Вирусные векторы можно вводить непосредственно пациентам (in vivo), или их можно использовать для обработки клеток in vitro, и модифицированные клетки можно необязательно вводить пациентам (ex vivo). Традиционные системы на основе вирусов для переноса генов могут включать ретровирусные, лентивирусные, аденовирусные векторы, векторы на основе аденоассоциированного вируса и вируса простого герпеса. Интеграция в геном хозяина возможна с применением способов переноса генов на основе ретровируса, лентивируса и аденоассоциированного вируса, что часто приводит к длительной экспрессии встроенного трансгена. Кроме того, высокие показатели эффективности трансдукции наблюдали у многих различных типов клеток и целевых тканей.RNA and DNA virus-based systems for nucleic acid delivery employ carefully designed methods to ensure targeting of the virus to specific cells in the body and translocation of the viral payload sequences into the nucleus. Viral vectors can be administered directly to patients (in vivo) or they can be used to manipulate cells in vitro and the modified cells can optionally be administered to patients (ex vivo). Traditional virus-based gene transfer systems can include retroviral, lentiviral, adenoviral, adeno-associated virus, and herpes simplex virus vectors. Integration into the host genome is possible using retroviral, lentiviral, and adeno-associated virus gene transfer methods, often resulting in long-term expression of the inserted transgene. In addition, high transduction efficiencies have been observed in many different cell types and target tissues.
Тропизм ретровируса может быть изменен путем включения чужеродных белков оболочки с расширением возможной целевой популяции целевых клеток. Лентивирусные векторы являются ретровирусными векторами, которые способны трансдуцировать или инфицировать неделящиеся клетки и, как правило, дают высокие вирусные титры. Выбор системы переноса генов на основе ретровирусов, таким образом, будет зависеть от целевой ткани. Ретровирусные векторы состоят из действующих в цис-положении длинных концевых повторов с упаковывающей способностью до 6-10 т. п. о. чужеродной последовательности. Минимальных действующих в цис-положении LTR достаточно для репликации и упаковки векторов, которые затем используют для интеграции терапевтического гена в целевую клетку с получением постоянной экспрессии трансгена. Широко используемые ретровирусные векторы включают такие векторы, как основанные на вирусе лейкоза мышей (MuLV), вирусе лейкоза гиббонов (GaLV), вирусе иммунодефицита обезьян (SIV), вирусе иммунодефицита человека (HIV) и их комбинациях (см., к примеру, Buchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol. 66:1635-1640 (1992); Sommnerfelt et al., Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700).Retroviral tropism can be altered by incorporating foreign envelope proteins to broaden the possible target cell population. Lentiviral vectors are retroviral vectors that are capable of transducing or infecting non-dividing cells and typically yield high viral titers. The choice of retroviral gene transfer system will therefore depend on the target tissue. Retroviral vectors consist of cis-acting long terminal repeats with the packaging capacity of up to 6-10 kb of foreign sequence. Minimal cis-acting LTRs are sufficient for vector replication and packaging, which are then used to integrate the therapeutic gene into the target cell to produce permanent transgene expression. Commonly used retroviral vectors include those based on murine leukemia virus (MuLV), gibbon leukemia virus (GaLV), simian immunodeficiency virus (SIV), human immunodeficiency virus (HIV), and combinations thereof (see, e.g., Buchscher et al., J. Virol. 66:2731–2739 (1992); Johann et al., J. Virol. 66:1635–1640 (1992); Sommnerfelt et al., Virol. 176:58–59 (1990); Wilson et al., J. Virol. 63:2374–2378 (1989); Miller et al., J. Virol. 65:2220–2224 (1991); PCT/US94/05700).
В другом варианте осуществления предусматриваются псевдотипированные ретровирусные векторные частицы на основе оболочки везикуловируса Кокал (см., например, публикацию заявки на патент США № 20120164118, закрепленной за Онкологическим исследовательским центром Фреда Хатчинсона). Вирус Кокал относится к роду Vesiculovirus и является возбудителем везикулярного стоматита у млекопитающих. Вирус Кокал изначально был выделен из клещей в Тринидаде (Jonkers et al., Am. J. Vet. Res. 25:236-242 (1964)), и инфекции были идентифицированы в Тринидаде, Бразилии и Аргентине у насекомых, крупного рогатого скота и лошадей. Многие везикуловирусы, которые инфицируют млекопитающих, были выделены у инфицированных в естественных условиях членистоногих, что позволяет предположить, что они являются передаваемыми переносчиками. Антитела к везикуловирусам распространены у людей, живущих в сельской местности, где вирусы являются эндемичными и внутрилабораторными; причем инфекции у людей обычно приводят к гриппоподобным симптомам. Гликопротеин оболочки вируса Кокал обладает идентичностью 71,5% на аминокислотном уровне с VSV-G Индианы, причем филогенетическое сравнение генов оболочки везикуловирусов показало, что вирус Кокал серологически отличается от VSV-G штаммов Индиана, но из везикуловирусов является наиболее близкородственным с ними. Jonkers et al., Am. J. Vet. Res. 25:236-242 (1964) и Travassos da Rosa et al., Am. J. Tropical Med. & Hygiene 33:999-1006 (1984). Псевдотипированные ретровирусные векторные частицы на основе оболочки везикуловируса Кокал могут включать, например, лентивирусные, альфаретровирусные, бетаретровирусные, гаммаретровирусные, дельтаретровирусные и эпсилонретровирусные векторные частицы, которые могут содержать ретровирусный Gag, Pol и/или один или несколько акцессорных белков и белок оболочки везикуловируса Кокал. В определенных аспектах этих вариантов осуществления Gag, Pol и дополнительные белки являются лентивирусными и/или гамма-ретровирусными. Настоящее изобретение предусматривает AAV, который содержит или состоит фактически из экзогенной молекулы нуклеиновой кислоты, кодирующей систему CRISPR, например, множество кассет, содержащих или состоящих из первой кассеты, содержащей или состоящей фактически из промотора, молекулы нуклеиновой кислоты, кодирующей CRISPR-ассоциированный (Cas) белок (предполагаемые нуклеазные или хеликазные белки), например Cas9, и терминатора, и две или более, преимущественно до предела упаковки вектора, например, всего (включая первую кассету) пять кассет, содержащих или состоящих фактически из промотора, молекулы нуклеиновой кислоты, кодирующей направляющую РНК (gRNA), и терминатора (например, каждая кассета схематически представлена как промотор-gRNA1-терминатор, промотор-gRNA2-терминатор ... промотор-gRNA(N)-терминатор (где N является количеством, которое можно встроить, находящееся на верхней границе предела упаковки вектора)), или два или более отдельных rAAV, причем каждый содержит одну или несколько кассет системы CRISPR, например первый rAAV, содержащий первую кассету, содержащую или состоящую фактически из промотора, молекулы нуклеиновой кислоты, кодирующей Cas, например, Cas (Cas9), и терминатора, и второй rAAV, содержащий несколько, четыре кассеты, кассет, содержащих или состоящих фактически из промотора, молекулы нуклеиновой кислоты, кодирующей направляющую РНК (gRNA), и терминатора (например, каждая кассета схематически представлена как промотор-gRNA1-терминатор, промотор-gRNA2-терминатор ... промотор-gRNA(N)-терминатор (где N является количеством, которое можно встроить, находящееся на верхней границе предела упаковки вектора)). Поскольку rAAV представляет собой ДНК-содержащий вирус, молекулы нуклеиновой кислоты в изложенном в данном документе обсуждении в отношении AAV или rAAV преимущественно представляют собой ДНК. В некоторых вариантах осуществления промотор преимущественно представляет собой промотор синапсина I человека (hSyn). Дополнительные способы доставки нуклеиновых кислот в клетки известны специалистам в данной области. См., например, US20030087817, включенный в данный документ посредством ссылки.In another embodiment, pseudotyped retroviral vector particles based on the envelope of the vesiculovirus Cocal (see, e.g., U.S. Patent Application Publication No. 20120164118 assigned to the Fred Hutchinson Cancer Research Center) are provided. Cocal virus is a member of the genus Vesiculovirus and is the causative agent of vesicular stomatitis in mammals. Cocal virus was originally isolated from ticks in Trinidad (Jonkers et al., Am. J. Vet. Res. 25:236-242 (1964)), and infections have been identified in Trinidad, Brazil, and Argentina in insects, cattle, and horses. Many vesiculoviruses that infect mammals have been isolated from naturally infected arthropods, suggesting that they are transmissible vectors. Antibodies to vesiculoviruses are common in people living in rural areas where the viruses are endemic and laboratory-associated; human infections typically result in influenza-like symptoms. The cocal virus envelope glycoprotein shares 71.5% amino acid identity with Indiana VSV-G, and phylogenetic comparison of vesiculovirus envelope genes has shown that cocal virus is serologically distinct from, but most closely related to, Indiana VSV-G strains of vesiculoviruses. Jonkers et al., Am. J. Vet. Res. 25:236–242 (1964) and Travassos da Rosa et al., Am. J. Tropical Med. & Hygiene 33:999–1006 (1984). Pseudotyped retroviral vector particles based on the Cocal vesiculovirus envelope may include, for example, lentiviral, alpharetroviral, betaretroviral, gammaretroviral, deltaretroviral and epsilonretroviral vector particles, which may comprise retroviral Gag, Pol and/or one or more accessory proteins and the Cocal vesiculovirus envelope protein. In certain aspects of these embodiments, the Gag, Pol and accessory proteins are lentiviral and/or gammaretroviral. The present invention provides an AAV that comprises or consists essentially of an exogenous nucleic acid molecule encoding a CRISPR system, such as a plurality of cassettes comprising or consisting essentially of a first cassette comprising or consisting essentially of a promoter, a nucleic acid molecule encoding a CRISPR-associated (Cas) protein (putative nuclease or helicase proteins), such as Cas9, and a terminator, and two or more, preferably up to the packaging limit of the vector, such as a total of (including the first cassette) five cassettes comprising or consisting essentially of a promoter, a nucleic acid molecule encoding a guide RNA (gRNA), and a terminator (e.g., each cassette is schematically represented as a promoter-gRNA1-terminator, a promoter-gRNA2-terminator ... a promoter-gRNA(N)-terminator (where N is the number that can be inserted, being at the upper limit of the packaging limit of the vector)), or two or more separate rAAVs, each comprising one or more cassettes of the CRISPR system, such as a first rAAV comprising a first cassette comprising or consisting essentially of a promoter, a nucleic acid molecule encoding a Cas, such as Cas (Cas9), and a terminator, and a second rAAV comprising multiple, four cassettes, cassettes comprising or consisting essentially of a promoter, a nucleic acid molecule encoding a guide RNA (gRNA), and a terminator (e.g., each cassette is schematically represented as a promoter-gRNA1-terminator, a promoter-gRNA2-terminator ... a promoter-gRNA(N)-terminator (where N is the number that can be inserted, being at the upper limit of the vector packaging limit)). Since rAAV is a DNA virus, nucleic acid molecules in the discussion herein with respect to AAV or rAAV are predominantly DNA. In some embodiments, the promoter is predominantly the human synapsin I (hSyn) promoter. Additional methods for delivering nucleic acids into cells are known to those skilled in the art. See, for example, US20030087817, incorporated herein by reference.
В некоторых вариантах осуществления клетка-хозяин транзиентно или нетранзиентно трасфицирована одним или несколькими векторами, описанными в данном документе. В некоторых вариантах осуществления клетку трансфицируют, когда она находится в естественных условиях у субъекта. В некоторых вариантах осуществления клетка, которую трансфицируют, получена от субъекта. В некоторых вариантах осуществления клетка происходит из клеток, полученных от субъекта, как, например, линии клеток. Из уровня техники известен целый ряд линий клеток, применяемых в качестве культуры тканей. Примеры линий клеток включают без ограничения C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, эпителиальные клетки почки обезьяны BS-C-1, эмбриональные фибробласты мыши BALB/ 3T3, 3T3 Swiss, 3T3-L1, фетальные фибробласты человека 132-d5; фибробласты мыши 10.1, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, клетки BCP-1, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, клетки JY, клетки K562, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, линии клеток OPCN/OPCT, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA/RMAS, клетки Saos-2, Sf-9, SkBr3, T2, T-47D, T84, линию клеток THP1, U373, U87, U937, VCaP, клетки Vero, WM39, WT-49, X63, YAC-1, YAR и их трансгенные разновидности. Линии клеток доступны из множества источников, известных специалистам в данной области (см., например, Американская коллекция типовых культур (ATCC) (Манассас, Вирджиния)). В некоторых вариантах осуществления клетку, трансфицированную с помощью одного или нескольких векторов, описанных в данном документе, используют для получения новой линии клеток, содержащей одну или несколько полученных из вектора последовательностей. В некоторых вариантах осуществления клетку, транзиентно трансфицированную с помощью компонентов системы CRISPR, описанной в данном документе (как, например, путем транзиентной трансфекции с помощью одного или нескольких векторов или трансфекции с использованием РНК), и модифицированную с помощью активности комплекса CRISPR, используют для получения новой линии клеток, содержащей клетки с модификацией, но без любой другой экзогенной последовательности. В некоторых вариантах осуществления клетки, транзиентно или нетранзиентно трансфицированные с помощью одного или нескольких векторов, описанных в данном документе, или линии клеток, полученные из таких клеток, применяют в оценке одного или нескольких тестируемых соединений.In some embodiments, the host cell is transiently or non-transiently transfected with one or more vectors described herein. In some embodiments, the cell is transfected while it is in vivo in the subject. In some embodiments, the cell that is transfected is derived from the subject. In some embodiments, the cell is derived from cells derived from the subject, such as cell lines. A variety of cell lines are known in the art for use in tissue culture. Examples of cell lines include, but are not limited to, C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, monkey kidney epithelial cells BS-C-1, mouse embryonic fibroblasts BALB/3T3, 3T3 Swiss, 3T3-L1, human fetal fibroblasts 132-d5; mouse fibroblasts 10.1, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, BCP-1, BEAS-2B, bEnd.3, BHK-21, BR cells 293, BxPC3, C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, JY cells, K562 cells, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, OPCN/OPCT cell lines, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA/RMAS, Saos-2 cells, Sf-9, SkBr3, T2, T-47D, T84, THP1 cell line, U373, U87, U937, VCaP, Vero cells, WM39, WT-49, X63, YAC-1, YAR, and transgenic variants thereof. Cell lines are available from a variety of sources known to those skilled in the art (see, e.g., American Type Culture Collection (ATCC) (Manassas, VA)). In some embodiments, a cell transfected with one or more vectors described herein is used to generate a new cell line comprising one or more vector-derived sequences. In some embodiments, a cell transiently transfected with components of the CRISPR system described herein (such as by transient transfection with one or more vectors or transfection using RNA) and modified with the activity of the CRISPR complex is used to generate a new cell line comprising cells with the modification but without any other exogenous sequence. In some embodiments, cells transiently or non-transiently transfected with one or more vectors described herein, or cell lines derived from such cells, are used in the evaluation of one or more test compounds.
В некоторых вариантах осуществления один или несколько векторов, описанных в данном документе, используют для получения отличного от человека трансгенного животного или трансгенного растения. В некоторых вариантах осуществления трансгенным животным является млекопитающее, как, например, мышь, крыса или кролик. Способы получения трансгенных животных и растений известны из уровня техники и, как правило, начинаются со способа трансфекции клетки, такого как описанный в данном документе. В другом варианте осуществления может предусматриваться устройство для доставки жидкости с матрицей игл (см., например, публикацию заявки на патент США № 20110230839, закрепленной за Онкологическим исследовательским центром Фреда Хатчинсона), для доставки CRISPR-Cas в плотную ткань. Устройство согласно публикации заявки на патент США № 20110230839 для доставки жидкости в плотную ткань может содержать множество игл, расположенных в виде матрицы; множество емкостей, каждая из которых находится в жидкостном соединении с соответствующей одной иглой из множества игл; и множество приводов, функционально связанных с соответствующими емкостями из множества емкостей и выполненных с возможностью регулирования давления жидкости в емкости. В определенных вариантах осуществления каждый из множества приводов может содержать один из множества поршней, причем первая концевая часть каждого из множества поршней находится в соответствующей одной емкости из множества емкостей, и в определенных дополнительных вариантах осуществления поршни из множества поршней функционально связаны вместе по соответствующим вторым концевым частям с обеспечением возможности одновременного нажатия. В определенных других дополнительных вариантах осуществления может предусматриваться управляющий элемент для поршней, сконфигурированный с возможностью нажатия всех из множества поршней с выборочно изменяющейся скоростью. В других вариантах осуществления каждый из множества приводов может содержать одну из множества жидкостных поточных линий, имеющих первую и вторую концевые части, причем первая концевая часть каждой из множества жидкостных поточных линий соединена с соответствующей одной емкостью из множества емкостей. В других вариантах осуществления устройство может содержать источник давления жидкости, и при этом каждый из множества приводов предусматривает гидравлическую муфту между источником давления жидкости и соответствующей одной емкостью из множества емкостей. В дополнительных вариантах осуществления источник давления жидкости может предусматривать по меньшей мере одно из следующих: компрессора, вакуумного накопителя, перистальтического насоса, основного цилиндра, микроструного насоса и клапана. В другом варианте осуществления каждая из множества игл может содержать множество отверстий, распределенных вдоль ее длины.In some embodiments, one or more vectors described herein are used to produce a non-human transgenic animal or transgenic plant. In some embodiments, the transgenic animal is a mammal, such as a mouse, rat, or rabbit. Methods for producing transgenic animals and plants are known in the art and typically begin with a cell transfection method such as described herein. In another embodiment, a needle array fluid delivery device (see, e.g., U.S. Patent Application Publication No. 20110230839 assigned to the Fred Hutchinson Cancer Research Center) may be provided for delivering CRISPR-Cas to solid tissue. The device of U.S. Patent Application Publication No. 20110230839 for delivering fluid to solid tissue may comprise a plurality of needles arranged in an array; a plurality of reservoirs, each of which is in fluid communication with a respective one of the plurality of needles; and a plurality of actuators operatively connected to the respective containers of the plurality of containers and configured to regulate the fluid pressure in the container. In certain embodiments, each of the plurality of actuators may comprise one of the plurality of pistons, wherein the first end portion of each of the plurality of pistons is located in the respective one container of the plurality of containers, and in certain further embodiments, the pistons of the plurality of pistons are operatively connected together at the respective second end portions with the ability to be pressed simultaneously. In certain other further embodiments, a control element for the pistons may be provided, configured to press all of the plurality of pistons at a selectively changing speed. In other embodiments, each of the plurality of actuators may comprise one of the plurality of fluid flow lines having first and second end portions, wherein the first end portion of each of the plurality of fluid flow lines is connected to the respective one container of the plurality of containers. In other embodiments, the device may comprise a fluid pressure source, and wherein each of the plurality of actuators provides a fluid coupling between the fluid pressure source and the respective one container of the plurality of containers. In further embodiments, the fluid pressure source may include at least one of the following: a compressor, a vacuum accumulator, a peristaltic pump, a main cylinder, a microfluidic pump, and a valve. In another embodiment, each of the plurality of needles may comprise a plurality of holes distributed along its length.
Доставка в почкиDelivery to the kidneys
Способы доставки в почку обобщены ниже.Delivery routes to the kidney are summarized below.
липидныйViral/
lipid
вирусныйHydrodynamic/
viral
pp. (1754-1764)Molitoris et al., J Am Soc Nephrol, (Aug 2009), Vol. 20, No. 8,
pp. (1754-1764)
липидныйHydrodynamic/
lipid
mNOX-E36Spiegelmer
mNOX-E36
Доставка в мозгDelivery to the brain
Варианты доставки в головной мозг включают инкапсулирование фермента CRISPR и направляющей РНК в форме ДНК или РНК в липосомы и конъюгацию с "молекулярными троянскими конями" для доставки через гематоэнцефалический барьер (BBB). Было показано, что "молекулярные троянские кони" являются эффективными для доставки векторов экспрессии B-gal в головной мозг отличных от человека приматов. Этот же подход можно применять для доставки векторов, содержащих фермент CRISPR и направляющую РНК. Например, Xia CF and Boado RJ, Pardridge WM ("Antibody-mediated targeting of siRNA via the human insulin receptor using avidin-biotin technology." Mol Pharm. 2009 May-Jun;6(3):747-51. doi: 10.1021/mp800194) описывают возможность доставки коротких интерферирующих РНК (siRNA) в клетки в культуре и in vivo в случае комбинированного применения моноклонального антитела (mAb), специфичного к рецептору, и авидин-биотиновой технологии. Авторы также сообщают, что, поскольку в случае применения авидин-биотиновой технологии связь между нацеливающим mAb и siRNA является устойчивой, и после внутривенного введения целенаправленно воздействующей siRNA наблюдаются эффекты RNAi in vivo в отдаленных участках, таких как головной мозг.Options for delivery to the brain include encapsulating the CRISPR enzyme and guide RNA in the form of DNA or RNA in liposomes and conjugating to "molecular Trojan horses" for delivery across the blood-brain barrier (BBB). "Molecular Trojan horses" have been shown to be effective in delivering B-gal expression vectors to the brain of non-human primates. The same approach could be used to deliver vectors containing the CRISPR enzyme and guide RNA. For example, Xia CF and Boado RJ, Pardridge WM ("Antibody-mediated targeting of siRNA via the human insulin receptor using avidin-biotin technology." Mol Pharm. 2009 May-Jun;6(3):747-51. doi: 10.1021/mp800194) describe the possibility of delivering short interfering RNAs (siRNAs) to cells in culture and in vivo using a combined receptor-specific monoclonal antibody (mAb) and avidin-biotin technology. The authors also report that since the association between the targeting mAb and siRNA is stable with avidin-biotin technology, RNAi effects are observed in vivo in distant sites such as the brain following intravenous administration of the targeting siRNA.
Zhang et al. (Mol Ther. 2003 Jan;7(1):11-8.)) описывают, как экспрессионные плазмиды, кодирующие репортеры, такие как люцифераза, инкапсулировали во внутреннее пространство "искусственного вируса", включающего пегилированную иммунолипосому размером 85 нм, нацеливаемую на головной мозг макака-резуса in vivo с помощью моноклонального антитела (MAb) к рецептору инсулина человека (HIR). MAb к HIR позволяет липосоме, несущей экзогенный ген, подвергаться трансцитозу через гематоэнцефалический барьер и эндоцитозу через плазматическую мембрану нейронов после внутривенной инъекции. Уровень экспрессии гена люциферазы в головном мозге у макака-резуса был в 50 раз выше по сравнению с крысой. Широко распространенная экспрессия гена бета-галактозидазы в нейронах головного мозга приматов была продемонстрирована с помощью как гистохимического анализа, так и конфокальной микроскопии. Авторы указывают, что данный подход позволяет достичь обратимой экспрессии трансгена у взрослых животных в течение 24 часов. Соответственно, применение иммунолипосом является предпочтительным. Их можно использовать в сочетании с антителами для нацеливания на конкретные ткани или белки клеточной поверхности.Zhang et al. (Mol Ther. 2003 Jan;7(1):11-8) describe how expression plasmids encoding reporters such as luciferase were encapsulated within an "artificial virus" comprising a pegylated 85 nm immunoliposome targeted to the rhesus macaque brain in vivo using a monoclonal antibody (MAb) to the human insulin receptor (HIR). The HIR MAb allows the liposome carrying the exogenous gene to undergo transcytosis across the blood-brain barrier and endocytosis across the plasma membrane of neurons following intravenous injection. The level of luciferase gene expression in the rhesus macaque brain was 50-fold higher than in the rat. Widespread expression of the beta-galactosidase gene in neurons of the primate brain was demonstrated using both histochemistry and confocal microscopy. The authors indicate that this approach allows for reversible expression of the transgene in adult animals within 24 hours. Accordingly, immunoliposomes are preferred. They can be used in combination with antibodies to target specific tissues or cell surface proteins.
HSC-доставка в гемопоэтические стволовые клетки и редактирование в них; определенные условияHSC delivery and editing in hematopoietic stem cells; certain conditions
Термин "гемопоэтическая стволовая клетка" или "HSC" включает в широком смысле те клетки, которые считаются HSC, например, клетки крови, которые приводят к образованию всех других клеток крови и получены из мезодермы; расположены в красном костном мозге, содержащемся во внутренней части большинства костей. HSC по настоящему изобретению включают клетки, имеющие фенотип гемопоэтических стволовых клеток, идентифицированных по небольшому размеру, отсутствию линейных (lin) маркеров и маркеров, которые принадлежат к кластеру серий дифференцировки, например: CD34, CD38, CD90, CD133, CD105, CD45, а также c-kit, - рецептор фактора стволовых клеток. Гемопоэтические стволовые клетки являются отрицательными по отношению к маркерам, которые используют для выявления детерминации дифференцировки, и, таким образом, называются Lin-; и во время их очистки с помощью FACS ряда из до 14 включительно маркеров линий зрелых клеток крови, например, CD13 и CD33 для миелодиных, CD71 - для эритроидных, CD19 - для B-клеток, CD61 - для мегакариоцитарных клеток и т.д., например, для человека; и B220 (мышиный CD45) - для B-клеток, Mac-1 (CD11b/CD18) - для моноцитов, Gr-1 - для гранулоцитов, Ter119 - для эритроидных клеток, Il7Ra, CD3, CD4, CD5, CD8 - для T-клеток и т.д. Маркеры мышиных HSC: CD34lo/-, SCA-1+, Thy1.1+/lo, CD38+, C-kit+, lin-, и маркеры человеческих HSC: CD34+, CD59+, Thy1/CD90+, CD38lo/-, C-kit/CD117+ и lin-. HSC идентифицируют с помощью маркеров. Таким образом, в вариантах осуществления, описанных в данном документе, HSC могут представлять собой CD34+ клетки. HSC также могут представлять собой гемопоэтические стволовые клетки, которые являются CD34-/CD38-. Стволовые клетки, у которых может отсутствовать c-kit на клеточной поверхности, которые считаются в данной области в качестве HSC, находятся в объеме настоящего изобретения, а также CD133+ клетки, аналогично считаются HSC в данной области.The term "hematopoietic stem cell" or "HSC" includes, in a broad sense, those cells that are considered to be HSCs, such as blood cells that give rise to all other blood cells and are derived from the mesoderm; located in the red bone marrow contained in the interior of most bones. HSCs of the present invention include cells having the phenotype of hematopoietic stem cells, identified by their small size, the absence of linear (lin) markers and markers that belong to a cluster of differentiation series, such as: CD34, CD38, CD90, CD133, CD105, CD45, and c-kit, a stem cell factor receptor. Hematopoietic stem cells are negative for markers that are used to detect differentiation commitment and are thus called Lin-; and during their purification by FACS of a number of up to 14 markers of mature blood cell lineages, such as CD13 and CD33 for myeloid, CD71 for erythroid, CD19 for B cells, CD61 for megakaryocytic cells, etc., such as for humans; and B220 (mouse CD45) for B cells, Mac-1 (CD11b/CD18) for monocytes, Gr-1 for granulocytes, Ter119 for erythroid cells, Il7Ra, CD3, CD4, CD5, CD8 for T cells, etc. Mouse HSC markers: CD34lo/-, SCA-1+, Thy1.1+/lo, CD38+, C-kit+, lin-, and human HSC markers: CD34+, CD59+, Thy1/CD90+, CD38lo/-, C-kit/CD117+, and lin-. HSC are identified by the markers. Thus, in embodiments described herein, HSC can be CD34+ cells. HSC can also be hematopoietic stem cells that are CD34-/CD38-. Stem cells that may lack c-kit on the cell surface, which are considered in the art to be HSC, are within the scope of the present invention, as well as CD133+ cells, which are similarly considered to be HSC in the art.
Система CRISPR-Cas (например, Cas9) может быть сконструирована для нацеливания на локус гена или локусы в HSC. Можно получить белок (например, Cas9), преимущественно кодон-оптимизированный по отношению к эукариотической клетке и, в частности, клетке млекопитающих, например, человеческой клетке, например, HSC, и sgRNA, нацеливающуюся на локус или локусы в HSC, например, ген EMX1. Их можно доставлять посредством частиц. Частицы могут образовываться с помощью белка Cas (например, Cas9) и добавляемой sgRNA. Смесь sgRNA и белка Cas (например, Cas9) можно смешивать, например, со смесью, содержащей или состоящей фактически из или состоящей из поверхностно-активного вещества, фосфолипида, биоразлагаемого полимера, липопротеина и спирта, при этом могут образовываться частицы, содержащие sgRNA и белок Cas (например, Cas9). Настоящее изобретение охватывает образованные таким образом частицы и частицы, полученные с помощью такого способа, а также варианты их применения.A CRISPR-Cas system (e.g., Cas9) can be designed to target a gene locus or loci in an HSC. A protein (e.g., Cas9) that is advantageously codon-optimized for a eukaryotic cell and in particular a mammalian cell, such as a human cell, such as an HSC, and an sgRNA that targets a locus or loci in an HSC, such as the EMX1 gene, can be provided. They can be delivered via particles. The particles can be formed by a Cas protein (e.g., Cas9) and an added sgRNA. A mixture of sgRNA and a Cas protein (e.g., Cas9) can be mixed, for example, with a mixture comprising or consisting essentially of or consisting of a surfactant, a phospholipid, a biodegradable polymer, a lipoprotein, and an alcohol, whereby particles comprising sgRNA and a Cas protein (e.g., Cas9) can be formed. The present invention encompasses particles formed in this manner and particles obtained by such a method, as well as their uses.
В более общем смысле частицы могут быть образованы с применением эффективного способа. Прежде всего, белок Cas (например, Cas9) и sgRNA, нацеленную на ген EMX1 или контрольный ген LacZ, можно смешивать вместе при подходящем молярном соотношении, например, 3:1-1:3, или 2:1-1:2, или 1:1, при подходящей температуре, например, 15-30C, например, 20-25C, например, комнатной температуре, в течение подходящего периода времени, например, 15-45, как, например, 30 минут, преимущественно в стерильном буфере без нуклеаз, например, 1X PBS. В отдельности, компоненты частиц, такие как или включающие поверхностно-активное вещество, например, катионный липид, например, 1,2-диолеоил-3-триметиламмонийпропан (DOTAP); фосфолипид, например, димиристоилфосфатидилхолин (DMPC); биоразлагаемый полимер, такой как полимер этиленгликоля или PEG, и липопротеин, такой как липопротеин низкой плотности, например, холестерин, можно растворять в спирте, преимущественно C1-6 алкиловом спирте, таком как метанол, этанол, изопропанол, например, 100% этанол. Два раствора можно смешивать вместе с образованием частиц, содержащих комплексы Cas (например, Cas9)-sgRNA. В определенных вариантах осуществления частица может содержать матрицу для HDR. Это может быть частица, совместно введенная с частицей, содержащей sgRNA+белок Cas (например, Cas9), т.е. в дополнение к приведению HSC в контакт с частицей, содержащей sgRNA+белок Cas (например, Cas9), при этом HSC приводят в контакт с частицей, содержащей матрицу для HDR; или HSC приводят в контакт с частицей, содержащей все из sgRNA, Cas (например, Cas9) и матрицы для HDR. Матрицу для HDR можно вводить с помощью отдельного вектора, при этом в первом случае частица проникает в клетку HSC и отдельный вектор также проникает в клетку, где геном HSC модифицирован sgRNA+Cas (например, Cas9) и также присутствует матрица для HDR, при этом локус генома модифицирован посредством HDR; например, это может приводить к исправлению мутации.In a more general sense, the particles can be formed using an effective method. First of all, a Cas protein (e.g., Cas9) and an sgRNA targeting an EMX1 gene or a LacZ control gene can be mixed together at a suitable molar ratio, such as 3:1-1:3, or 2:1-1:2, or 1:1, at a suitable temperature, such as 15-30C, such as 20-25C, such as room temperature, for a suitable period of time, such as 15-45, such as 30 minutes, preferably in a sterile nuclease-free buffer, such as 1X PBS. Individually, the particle components, such as or including a surfactant, such as a cationic lipid, such as 1,2-dioleoyl-3-trimethylammoniumpropane (DOTAP); a phospholipid, such as dimyristoylphosphatidylcholine (DMPC); a biodegradable polymer such as an ethylene glycol polymer or PEG and a lipoprotein such as a low density lipoprotein, for example cholesterol, can be dissolved in an alcohol, preferably a C1-6 alkyl alcohol such as methanol, ethanol, isopropanol, for example 100% ethanol. The two solutions can be mixed together to form particles comprising Cas (e.g. Cas9)-sgRNA complexes. In certain embodiments, the particle can comprise an HDR template. This can be a particle co-administered with a particle comprising sgRNA+Cas protein (e.g. Cas9), i.e. in addition to contacting the HSC with the particle comprising sgRNA+Cas protein (e.g. Cas9), the HSC is contacted with the particle comprising the HDR template; or the HSC is contacted with a particle comprising all of sgRNA, Cas (e.g. Cas9) and the HDR template. The HDR template can be introduced via a separate vector, in which case the particle enters the HSC cell and a separate vector also enters the cell where the HSC genome is modified with sgRNA+Cas (e.g. Cas9) and the HDR template is also present, in which case the genomic locus is modified via HDR; for example, this can lead to the correction of a mutation.
После образования частиц HSC в 96-луночных планшетах можно трансфицировать с помощью 15 мкг белка Cas (например, Cas9) на лунку. Через три дня после трансфекции можно собирать HSC и определять количество вставок и делеций (вставок/делеций) в локусе EMX1.Following particle formation, HSC in 96-well plates can be transfected with 15 μg of Cas protein (e.g., Cas9) per well. Three days after transfection, HSC can be harvested and the number of insertions and deletions (indels) in the EMX1 locus can be determined.
Это иллюстрирует то, как HSC можно модифицировать с помощью CRISPR-Cas (например, Cas9), нацеливающейся на представляющий интерес локус генома или локусы в HSC. HSC, которые подлежат модификации, могут находиться in vivo, например, в организме, например, человеке или отличном от человека эукариотическом организме, например, животном, таком как рыба, например, данио-рерио, млекопитающем, например, примате, например, человекообразной обезьяне, шимпанзе, макаке, грызуне, например, мыши, кролике, крысе, кошке или собаке, домашнем скоте (корове/быке, баране/овце, козе или свинье), дикой или домашней птице, например, курице. HSC, которые подлежат модификации, могут находиться in vitro, т.е. за пределами такого организма. Также модифицированные HSC можно использовать ex vivo, т.е., одну или нескольких таких HSC такого организма можно получить или выделить из организма, необязательно HSC можно разращивать, HSC модифицируют с помощью композиции, содержащей CRISPR-Cas (например, Cas9), которая нацеливается на локус гена или локусы в HSC, например, при приведении HSC в контакт с композицией, например, где композиция содержит фермент CRISPR и одну или несколько sgRNA, которая нацеливается на локус гена или локусы в HSC, например, частица, полученная или получаемая при смешивании sgRNA и белка Cas (например, Cas9) со смесью, содержащей или состоящей фактически или состоящей из поверхностно-активного вещества, фосфолипида, биоразлагаемого полимера, липопротеина и спирта (где одна или несколько sgRNA нацеливаются на локус гена или локусы в HSC), необязательно разращивать полученные модифицированные HSC и вводить в организм полученные модифицированные HSC. В некоторых примерах выделенные или полученные HSC могут происходить из первого организма, такого как организм того же самого вида, что и второй организм, и второй организм может представлять собой организм, в который вводят полученные модифицированные HSC, например, первый организм может быть донором (например, родственником, как в случае родителя или сибса) для второго организма. Модифицированные HSC могут иметь генетические мутации для лечения, облегчения или ослабления симптомов заболевания или состояния индивидуума, или субъекта, или пациента. Модифицированные HSC, например, в случае, когда первый организм является донором для второго организма, могут иметь генетические модификации с тем, чтобы HSC имели один или несколько белков, например, поверхностных маркеров или белков, которые более подобны, чем у второго организма. Модифицированные HSC могут иметь генетические модификации для имитации заболевания или состояния индивидуума, или субъекта, или пациента и могут быть повторно введены в отличный от человека организм с получением животной модели. Разращивание HSC находится в пределах компетенции специалиста в данной области исходя из настоящего изобретения и знаний в данной области, см., например, Lee, "Improved ex vivo expansion of adult hematopoietic stem cells by overcoming CUL4-mediated degradation of HOXB4." Blood. 2013 May 16;121(20):4082-9. doi: 10.1182/blood-2012-09-455204. Epub 2013 Mar 21.This illustrates how HSCs can be modified using CRISPR-Cas (e.g., Cas9) targeting a genomic locus or loci of interest within the HSC. The HSCs to be modified may be in vivo, such as within an organism, such as a human or a non-human eukaryotic organism, such as an animal, such as a fish, such as a zebrafish, a mammal, such as a primate, such as a great ape, a chimpanzee, a macaque, a rodent, such as a mouse, rabbit, rat, cat, or dog, a livestock (cow/bull, ram/sheep, goat, or pig), or a wild or domesticated bird, such as a chicken. The HSCs to be modified may be in vitro, i.e., outside of such an organism. Also, the modified HSCs can be used ex vivo, i.e., one or more such HSCs of such an organism can be obtained or isolated from the organism, optionally the HSCs can be expanded, the HSCs are modified using a composition comprising a CRISPR-Cas (e.g., Cas9) that targets a gene locus or loci in the HSCs, such as by contacting the HSCs with a composition, such as where the composition comprises a CRISPR enzyme and one or more sgRNAs that target a gene locus or loci in the HSCs, such as a particle obtained or obtainable by mixing sgRNA and a Cas protein (e.g., Cas9) with a mixture comprising or consisting essentially of or consisting of a surfactant, a phospholipid, a biodegradable polymer, a lipoprotein and an alcohol (wherein the one or more sgRNAs target a gene locus or loci in the HSCs), optionally expanding the obtained modified HSCs and introducing the obtained modified HSCs into the organism. In some examples, the isolated or obtained HSCs can be from a first organism, such as an organism of the same species as the second organism, and the second organism can be an organism into which the obtained modified HSCs are introduced, for example, the first organism can be a donor (for example, a relative, such as a parent or sibling) for the second organism. The modified HSCs can have genetic mutations for treating, alleviating or reducing the symptoms of a disease or condition of an individual or subject or patient. The modified HSCs, for example, in the case where the first organism is a donor for the second organism, can have genetic modifications so that the HSCs have one or more proteins, such as surface markers or proteins, that are more similar than those of the second organism. The modified HSCs can have genetic modifications to mimic a disease or condition of an individual or subject or patient and can be reintroduced into a non-human organism to form an animal model. Expanding HSC is within the skill of the art based on the present invention and knowledge in the art, see, for example, Lee, "Improved ex vivo expansion of adult hematopoietic stem cells by overcoming CUL4-mediated degradation of HOXB4." Blood. 2013 May 16;121(20):4082-9. doi: 10.1182/blood-2012-09-455204. Epub 2013 Mar 21.
Как указано, для повышения активности sgRNA можно обеспечивать предварительное образование комплекса sgRNA с белком Cas (например, Cas9) перед составлением целого комплекса в частице. Составы можно получать с различным молярным соотношением различных компонентов, известных как способствующие доставке нуклеиновых кислот в клетки (например, 1,2-диолеоил-3-триметиламмоний-пропан (DOTAP), 1,2-дитетрадеканоил-sn-глицеро-3-фосфохолин (DMPC), полиэтиленгликоль (PEG) и холестерин). Например, молярные соотношения DOTAP: DMPC: PEG: холестерин могут быть следующими: DOTAP 100, DMPC 0, PEG 0, холестерин 0; или DOTAP 90, DMPC 0, PEG 10, холестерин 0; или DOTAP 90, DMPC 0, PEG 5, холестерин 5. DOTAP 100, DMPC 0, PEG 0, холестерин 0. Настоящее изобретение, соответственно, охватывает смешивание sgRNA, белка Cas (например, Cas9) и компонентов, которые образуют частицу; а также частицы в результате такого добавления.As indicated, to enhance the activity of sgRNA, the sgRNA can be pre-complexed with a Cas protein (e.g., Cas9) before the entire complex is assembled into the particle. The formulations can be prepared with different molar ratios of various components known to facilitate the delivery of nucleic acids into cells (e.g., 1,2-dioleoyl-3-trimethylammonium propane (DOTAP), 1,2-ditetradecanoyl-sn-glycero-3-phosphocholine (DMPC), polyethyleneglycol (PEG), and cholesterol). For example, the molar ratios of DOTAP:DMPC:PEG:cholesterol can be DOTAP 100, DMPC 0, PEG 0, cholesterol 0; or DOTAP 90, DMPC 0, PEG 10, cholesterol 0; or DOTAP 90, DMPC 0, PEG 5, cholesterol 5. DOTAP 100, DMPC 0, PEG 0, cholesterol 0. The present invention accordingly encompasses mixing of sgRNA, Cas protein (e.g. Cas9) and components that form a particle; as well as particles resulting from such addition.
В предпочтительном варианте осуществления частицы, содержащие комплекс Cas (например, Cas9)-sgRNA, могут быть образованы путем смешивания белка Cas (например, Cas9) и одной или нескольких sgRNA вместе, предпочтительно при молярном соотношении фермент:направляющая РНК 1:1. В отдельности, различные компоненты, известные как способствующие доставке нуклеиновых кислот (например, DOTAP, DMPC, PEG и холестерин), являются растворенными, предпочтительно в этаноле. Два раствора можно смешивают вместе с образованием частиц, содержащих комплексы Cas (например, Cas9)-sgRNA. После образования частиц комплексами Cas (например, Cas9)-sgRNA можно трансфицировать клетки (например HSC). Можно применять штрихкодирование. Частицы, Cas-9 и/или sgRNA можно штрихкодировать.In a preferred embodiment, particles containing a Cas (e.g., Cas9)-sgRNA complex can be formed by mixing a Cas protein (e.g., Cas9) and one or more sgRNAs together, preferably at a molar ratio of enzyme:guide RNA of 1:1. Separately, various components known to facilitate nucleic acid delivery (e.g., DOTAP, DMPC, PEG, and cholesterol) are dissolved, preferably in ethanol. The two solutions can be mixed together to form particles containing the Cas (e.g., Cas9)-sgRNA complexes. After formation of the particles, the Cas (e.g., Cas9)-sgRNA complexes can be transfected into cells (e.g., HSCs). Barcoding can be used. The particles, Cas-9, and/or sgRNA can be barcoded.
Настоящее изобретение в одном варианте осуществления предусматривает способ получения частицы, содержащей комплекс из sgRNA и белка Cas (например, Cas9), включающий перемешивание смеси sgRNA и белка Cas (например, Cas9) со смесью, содержащей, состоящей по сути из, или состоящей из поверхностно-активного вещества, фосфолипида, биоразлагаемого полимера, липопротеина и спирта. Вариант осуществления охватывает частицу, содержащую комплекс из sgRNA и белка Cas (например, Cas9), полученную посредством данного способа. Настоящее изобретение в варианте осуществления охватывает применение частицы в способе модифицирования представляющего интерес локуса генома, или организма, или отличного от человека организма путем манипуляции с целевой последовательностью в представляющем интерес локусе генома, включающем приведение клетки, содержащей представляющий интерес локус генома, в контакт с частицей, где sgRNA осуществляет нацеливание на представляющий интерес локус генома; или способе модификации представляющего интерес локуса генома, или организма, или отличного от человека организма путем манипуляции с целевой последовательностью в представляющем интерес локусе генома, включающем приведение клетки, содержащей представляющий интерес локус генома, в контакт с частицей, где sgRNA осуществляет нацеливание на представляющий интерес локус генома. В этих вариантах осуществления представляющий интерес локус генома является предпочтительно локусом генома в HSC.The present invention in one embodiment provides a method of producing a particle comprising a complex of an sgRNA and a Cas protein (e.g., Cas9), comprising mixing a mixture of an sgRNA and a Cas protein (e.g., Cas9) with a mixture comprising, consisting essentially of, or consisting of a surfactant, a phospholipid, a biodegradable polymer, a lipoprotein, and an alcohol. The embodiment encompasses a particle comprising a complex of an sgRNA and a Cas protein (e.g., Cas9) produced by the method. The present invention in an embodiment encompasses use of the particle in a method of modifying a genomic locus of interest, or an organism, or a non-human organism by manipulating a target sequence in the genomic locus of interest, comprising contacting a cell comprising the genomic locus of interest with the particle, wherein the sgRNA targets the genomic locus of interest; or a method for modifying a genomic locus of interest, or an organism, or a non-human organism by manipulating a target sequence in the genomic locus of interest, comprising contacting a cell containing the genomic locus of interest with a particle wherein the sgRNA targets the genomic locus of interest. In these embodiments, the genomic locus of interest is preferably a genomic locus in an HSC.
Факторы, которые следует учитывать для применений в терапии Фактор в терапии на основе редактирования генома представляет собой выбор специфичной по отношению к последовательностям нуклезы, такой как вариант нуклеазы Cas9. Каждый вариант нуклеазы может обладать своим собственным специфичным набором сильных и слабых сторон, многие из которых должны быть сбалансированы в контексте лечения для сведения к максимуму терапевтического эффекта. До настоящего времени два подхода редактирования с терапевтической целью с применением нуклеаз продемонстрировали значительные перспективы: нарушение функционирования гена и коррекция гена. Нарушение функционирования гена охватывает стимуляцию NHEJ для создания целенаправленных вставок/делеций в генетических элементах, часто приводящих к мутациям с потерей функций, которые являются полезными для пациентов. Напротив, при коррекции гена используется HDR для прямой регрессии мутаций, вызывающих заболевание, с восстановлением функции при сохранении физиологической регуляции cкорректированного элемента. HDR также может применяться для вставки терапевтического трансгена в определенный "безопасный" локус в геноме для восстановления отсутствующей функции гена. С целью обеспечения эффективности специфической терапии с применением редактирования должен достигаться достаточно высокий уровень модификации в целевых клеточных популяциях для вызова обратного развития симптомов заболевания. Этот "порог" терапевтической модификации определяют путем определения пригодности редактированных клеток после обработки и количества продукта гена, необходимого для устранения симптомов. Что касается пригодности, редактирование предусматривает возникновение трех возможных результатов для обработанных клеток по сравнению с их нередактированными аналогами: повышенная, нейтральная или сниженная пригодность. В случае повышенной пригодности, например, при лечении SCID-X1, модифицированные кроветворные клетки-предшественники селективно разрастаются по сравнению с их нередактированными аналогами. SCID-X1 представляет собой заболевание, вызываемое мутациями в гене IL2RG, функция которого требуется для правильного развития лимфоцитарного ростка кроветворения [Leonard, W.J., et al. Immunological reviews 138, 61-86 (1994); Kaushansky, K. & Williams, W.J. Williams hematology, (McGraw-Hill Medical, New York, 2010)]. В клинических испытаниях с пациентами, которые получали генную терапию с использованием вирусов для SCID-X1, и в редком примере спонтанной коррекции мутации SCID-X1 скорректированные кроветворные клетки-предшественники по сравнению с их пораженными заболеванием аналогами могли преодолевать это блокирование развития и разрастались, способствуя терапии [Bousso, P., et al. Proceedings of the National Academy of Sciences of the United States of America 97, 274-278 (2000); Hacein-Bey-Abina, S., et al. The New England journal of medicine 346, 1185-1193 (2002); Gaspar, H.B., et al. Lancet 364, 2181-2187 (2004)]. В данном случае, когда редактированные клетки обладают преимуществом при отборе, даже небольшие количества редактированных клеток можно увеличивать посредством разрастания, обеспечивая терапевтический эффект для пациента. Напротив, редактирование в отношении других заболеваний системы кроветворения, таких как хроническая гранулематозная болезнь (CGD), не будет индуцировать изменений пригодности для редактированных кроветворных клеток-предшественников, повышая порог терапевтической модификации. CGD вызывается мутациями в генах, кодирующих белки фагоцитарной оксидазы, которые обычно используются нейтрофилами для образования активных форм кислорода, уничтожающих патогены [Mukherjee, S. & Thrasher, A.J. Gene 525, 174-181 (2013)]. Поскольку дисфункция этих генов не влияет на пригодность или развитие кроветворных клеток-предшественников, а только на способность гемопоэтических кроветворных зрелого типа бороться с инфекциями, вероятно, не будет наблюдаться предпочтительная экспансия отредактированных клеток при данном заболевании. Действительно, не наблюдалось преимущества при отборе в отношении скорректированных клеток CGD при испытаниях с генной терапией, что приводило к сложностям длительного приживления клеток [Malech, H.L., et al. Proceedings of the National Academy of Sciences of the United States of America 94, 12133-12138 (1997); Kang, H.J., et al. Molecular therapy: the journal of the American Society of Gene Therapy 19, 2092-2101 (2011)]. Как таковые, значительно более высокие уровни редактирования будут требоваться для лечения заболеваний, таких как CGD, где редактирование обуславливает преимущественно нейтральную пригодность, по сравнению с заболеваниями, где редактирование обуславливает повышенную пригодность целевых клеток. Если редактирование вносит недостаток пригодности, как это было бы в случае восстановления функции гена-супрессора опухолевого роста в раковых клетках, пораженные заболеванием аналоги будут вытеснять модифицированные клетки, в результате чего польза от лечения будет ниже по сравнению со скоростью редактирования. Этот последний класс заболеваний было бы особенно сложно лечить с помощью терапии с применением редактирования генома.Factors to Consider for Therapeutic Applications A factor in genome editing-based therapeutics is the choice of a sequence-specific nuclease, such as a Cas9 nuclease variant. Each nuclease variant may have its own unique set of strengths and weaknesses, many of which must be balanced in the context of a treatment to maximize therapeutic benefit. To date, two nuclease-based editing approaches for therapeutic intent have shown significant promise: gene disruption and gene correction. Gene disruption involves the stimulation of NHEJ to create targeted insertions/deletions in genetic elements, often resulting in loss-of-function mutations that are beneficial to patients. In contrast, gene correction utilizes HDR to directly regress disease-causing mutations, restoring function while maintaining physiological regulation of the corrected element. HDR can also be used to insert a therapeutic transgene into a defined “safe” locus in the genome to restore missing gene function. For a specific editing therapy to be effective, a high enough level of modification must be achieved in the target cell populations to reverse disease symptoms. This "threshold" of therapeutic modification is determined by determining the fitness of the edited cells after treatment and the amount of gene product required to reverse symptoms. With respect to fitness, editing allows for three possible outcomes for the treated cells compared to their unedited counterparts: increased, neutral, or decreased fitness. In the case of increased fitness, such as in the treatment of SCID-X1, the modified hematopoietic progenitor cells expand selectively compared to their unedited counterparts. SCID-X1 is a disease caused by mutations in the IL2RG gene, the function of which is required for the proper development of the lymphocyte lineage of hematopoiesis [Leonard, W. J., et al. Immunological reviews 138, 61-86 (1994); Kaushansky, K. & Williams, W. J. Williams hematology, (McGraw-Hill Medical, New York, 2010)]. In clinical trials with patients receiving viral gene therapy for SCID-X1, and in a rare example of spontaneous correction of the SCID-X1 mutation, the corrected hematopoietic progenitor cells, compared with their disease-affected counterparts, could overcome this developmental block and expanded, contributing to the therapy [Bousso, P., et al. Proceedings of the National Academy of Sciences of the United States of America 97, 274-278 (2000); Hacein-Bey-Abina, S., et al. The New England journal of medicine 346, 1185-1193 (2002); Gaspar, H.B., et al. Lancet 364, 2181-2187 (2004)]. In this case, where edited cells have a selection advantage, even small numbers of edited cells can be expanded through expansion, providing therapeutic benefit to the patient. In contrast, editing for other hematopoietic diseases, such as chronic granulomatous disease (CGD), will not induce fitness changes for edited hematopoietic progenitor cells, raising the threshold for therapeutic modification. CGD is caused by mutations in genes encoding phagocytic oxidase proteins, which are normally used by neutrophils to generate pathogen-killing reactive oxygen species [Mukherjee, S. & Thrasher, A.J. Gene 525, 174–181 (2013)]. Because dysfunction of these genes does not affect the fitness or development of hematopoietic progenitor cells, but only the ability of mature hematopoietic hematopoiesis to fight infections, there is likely to be no preferential expansion of edited cells in this disease. Indeed, no selection advantage was observed for CGD-corrected cells in gene therapy trials, leading to difficulties in long-term cell engraftment [Malech, H.L., et al. Proceedings of the National Academy of Sciences of the United States of America 94, 12133–12138 (1997); Kang, H.J., et al. Molecular therapy: the journal of the American Society of Gene Therapy 19, 2092–2101 (2011)]. As such, significantly higher levels of editing will be required to treat diseases such as CGD, where the editing confers predominantly neutral fitness, compared to diseases where the editing confers increased fitness on the target cells. If the editing introduces a fitness disadvantage, as would be the case if tumor suppressor gene function were restored in cancer cells, the disease-damaged counterparts would outcompete the modified cells, resulting in a treatment benefit that is lower relative to the rate of editing. This latter class of diseases would be particularly challenging to treat with genome-editing therapies.
В дополнение к пригодности клеток количество продукта гена, необходимого для лечения заболевания, также влияет на минимальный уровень редактирования генома с терапевтической целью, который должен достигаться для обратного развития симптомов. Гемофилия B является одним из заболеваний, в котором небольшое изменение уровней продукта гена может приводить к значительным изменениям клинических результатов. Данное заболевание вызывается мутациями в гене, кодирующем фактор IX, белок, обычно секретируемый печенью в кровь, где он функционирует в качестве компонента каскада свертывания крови. Клиническая тяжесть гемофилии B связана с величиной активности фактора IX. Ввиду того, что заболевание тяжелой степени ассоциировано с активностью менее 1% от нормальной, более легкие формы заболеваний ассоциированы с более чем 1% активности фактора IX [Kaushansky, K. & Williams, W.J. Williams hematology, (McGraw-Hill Medical, New York, 2010); Lofqvist, T., et al. Journal of internal medicine 241, 395-400 (1997)]. Это позволяет предположить, что варианты терапии с применением редактирования, которые могут восстанавливать экспрессию фактора IX в клетках печени до даже небольшого процента, могут оказывать большое влияние на клинические результаты. Исследование с применением ZFN для коррекции мышиной модели гемофилии B вскоре после рождения продемонстрировало, что 3-7% коррекция была достаточной для устранения симптомов заболевания, обеспечивая доклиническое подтверждение данной гипотезы [Li, H., et al. Nature 475, 217-221 (2011)].In addition to cell suitability, the amount of gene product required to treat a disease also influences the minimum level of therapeutic genome editing that must be achieved to reverse symptoms. Hemophilia B is one of the diseases in which a small change in gene product levels can lead to a large change in clinical outcome. The disease is caused by mutations in the gene encoding factor IX, a protein normally secreted by the liver into the blood where it functions as a component of the blood clotting cascade. The clinical severity of hemophilia B is related to the amount of factor IX activity. Whereas severe disease is associated with activity less than 1% of normal, milder forms of the disease are associated with greater than 1% of factor IX activity [Kaushansky, K. & Williams, W.J. Williams hematology, (McGraw-Hill Medical, New York, 2010); Lofqvist, T., et al. Journal of internal medicine 241, 395-400 (1997)]. This suggests that editing therapies that can restore factor IX expression in liver cells to even a small percentage may have a major impact on clinical outcomes. A study using ZFN to correct a mouse model of hemophilia B shortly after birth demonstrated that 3-7% correction was sufficient to reverse disease symptoms, providing preclinical support for this hypothesis [Li, H., et al. Nature 475, 217-221 (2011)].
Нарушения, при которых небольшое изменение уровней продукта гена может влиять на клинические результаты, и заболевания, где имеет место преимущество пригодности редактированных клеток, представляют собой превосходные мишени для терапии с применением редактирования генома, поскольку порог терапевтической модификации является достаточно низким для обеспечения высокой вероятности успеха с учетом современных технологий. Целенаправленное воздействие на данные заболевания на сегодняшний день привело к успехам в терапии с применением редактирования на доклиническом уровне и в фазе I клинического испытания. Усовершенствования в манипуляции путем репарации DSB и доставкой нуклеаз необходимы для распространения данных многообещающих результатов на заболевания с преимуществом нейтральной пригодности отредактированных клеток, или где для лечения необходимы более значительные количества продукта гена. В таблице, приведенной ниже, показаны некоторые примеры вариантов применения редактирования генома по отношению к терапевтическим моделям и ссылки из приведенной ниже таблицы и документы, которые перечислены в этих ссылках, включены в данный документ посредством ссылки, как если бы они были изложены в полном объеме.Disorders in which small changes in gene product levels can impact clinical outcomes and diseases where there is a fitness advantage of edited cells represent excellent targets for genome editing-based therapies because the threshold for therapeutic modification is low enough to provide a high probability of success given current technologies. Targeting these diseases has resulted in successes in editing-based therapies to date in preclinical and phase I clinical trials. Improvements in DSB repair manipulation and nuclease delivery are needed to extend these promising results to diseases with a neutral fitness advantage of edited cells or where larger amounts of gene product are needed for treatment. The table below shows some examples of applications of genome editing in therapeutic models and the references in the table below and the documents listed in those references are incorporated by reference herein as if set forth in full.
Лечение каждого из таких состояний из предшествующей таблицы с помощью системы CRISPR-Cas (например, Cas9) для нацеливания с помощью HDR-опосредованной коррекции мутации или HDR-опосредованной вставки надлежащей последовательности гена, предпочтительно посредством системы доставки, как описано в данном документе, например, системы доставки частицы, находится в пределах компетенции специалиста в данной области, исходя из настоящего изобретения и знаний в данной области. Таким образом, вариант осуществления охватывает приведение HSC, несущей мутацию, приводящую к гемофилии B, SCID (например, SCID-X1, ADA-SCID) или врожденной тирозинемии, в контакт с sgRNA и белком Cas (например, Cas9), осуществляющими нацеливание нa представляющий интерес локус генома, связанный с гемофилией B, SCID (например, SCID-X1, ADA-SCID) или врожденной тирозинемией (например, как описано в Li, Genovese или Yin). Частица также может содержать подходящую матрицу для HDR для коррекции мутации; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. В этом отношении упоминается, что гемофилия B представляет собой сцепленное с Х-хромосомой рецессивное нарушение, вызванное мутациями с потерей функций в гене, кодирующем фактор IX, важный компонент каскада свертывания крови. Восстановление активности фактора IX до приблизительно 1% от его уровней у тяжело пораженных индивидуумов может трансформировать заболевание в значительно более легкую форму, поскольку профилактическая инфузия рекомбинантного фактора IX у таких пациентов с раннего возраста для получения таких уровней в значительной степени облегчает тяжесть клинических осложнений. Специалист в данной области с использованием знаний в данной области и идей настоящего изобретения может корректировать HSC в отношении гемофилии B с применением системы CRISPR-Cas (например, Cas9), которая нацеливается на мутацию и корректирует ее (сцепленное с Х-хромосомой рецессивное нарушение, вызванное мутациями с потерей функции гена, кодирующем фактор IX) (например, с помощью подходящей матрицы для HDR, которая доставляет кодирующую последовательность для фактора IX); в частности, sgRNA может осуществлять нацеливание на мутацию, которая приводит к возникновению гемофилии B, и HDR может обеспечивать кодирование, приводящее к надлежащей экспрессии фактора IX. sgRNA, которая нацеливается на мутацию и частицу, содержащую белок Cas (например, Cas9), контактирует с HSC, несущими мутацию. Частица также может содержать подходящую матрицу для HDR для коррекции мутации с целью надлежащей экспрессии фактора IX; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. Приведенные таким образом в контакт клетки можно вводить и необязательно обрабатывать и размножать; см. Cartier., описанный в данном документе.Treating each of such conditions from the preceding table using a CRISPR-Cas system (e.g., Cas9) for targeting by HDR-mediated correction of a mutation or HDR-mediated insertion of an appropriate gene sequence, preferably via a delivery system as described herein, e.g., a particle delivery system, is within the skill of the art based on the present invention and the knowledge in the art. Thus, an embodiment encompasses contacting an HSC carrying a mutation leading to hemophilia B, SCID (e.g., SCID-X1, ADA-SCID) or congenital tyrosinemia with an sgRNA and a Cas protein (e.g., Cas9) targeting a genomic locus of interest associated with hemophilia B, SCID (e.g., SCID-X1, ADA-SCID) or congenital tyrosinemia (e.g., as described in Li, Genovese or Yin). The particle may also contain a suitable HDR template to correct the mutation; or the HSC may be contacted with a second particle or vector that contains or delivers a HDR template. In this regard, it is mentioned that hemophilia B is an X-linked recessive disorder caused by loss-of-function mutations in the gene encoding factor IX, an important component of the blood coagulation cascade. Restoration of factor IX activity to approximately 1% of its levels in severely affected individuals may transform the disease into a significantly milder form, since prophylactic infusion of recombinant factor IX in such patients from an early age to achieve such levels significantly alleviates the severity of clinical complications. A person skilled in the art, using the knowledge in the art and the teachings of the present invention, can correct HSCs for hemophilia B using a CRISPR-Cas system (e.g., Cas9) that targets and corrects a mutation (an X-linked recessive disorder caused by loss-of-function mutations in the gene encoding factor IX) (e.g., using a suitable template for HDR that delivers a coding sequence for factor IX); in particular, an sgRNA can target a mutation that leads to hemophilia B, and HDR can provide encoding that leads to proper expression of factor IX. An sgRNA that targets a mutation and a particle containing a Cas protein (e.g., Cas9) contacts HSCs bearing the mutation. The particle can also contain a suitable template for HDR to correct the mutation in order to properly express factor IX; or the HSC may be contacted with a second particle or vector that contains or delivers the HDR matrix. The cells so contacted may be administered and optionally processed and expanded; see Cartier, described herein.
В публикации Cartier "MINI-SYMPOSIUM: X-Linked Adrenoleukodystrophypa, Hematopoietic Stem Cell Transplantation and Hematopoietic Stem Cell Gene Therapy in X-Linked Adrenoleukodystrophy", Brain Pathology 20 (2010) 857-862, включенной в данный документ посредством ссылки вместе с документами, которые в ней перечислены так, если бы они были изложены в полном объеме, представлено подтверждение того, что аллогенную трансплантацию кроветворных стволовых клеток (HSCT) использовали для доставки нормального лизосомального фермента в головной мозг пациента с болезнью Гурлера, и описание генной терапии HSC для лечения ALD. У двух пациентов периферичные CD34+клетки собирали после активации гранулоцитарного колониестимулирующего фактора (G-CSF) и трансдуцировали лентивирусным вектором (MND)-ALD с энхансером миелопролиферативного вируса саркомы мышей, удаленным участком отрицательного контроля, замещенным сайтом связывания праймера dl587rev. CD34+ клетки пациентов трансдуцировали вектором MND-ALD в течение 16 ч. в присутствии цитокинов в низких концентрациях. Трансдуцированные CD34+ клетки замораживали после трансдукции для выполнения на 5% клеток ряда испытаний на безопасность, которые включали, в частности, три анализа на присутствие компетентных по репликации лентивирусов (RCL). Эффективность трансдукции CD34+ клеток находилась в диапазоне от 35% до 50% со средним количеством интегрированных копий лентивируса 0,65-0,70. После размораживания трансдуцированных CD34+ клеток пациентам проводили повторную инфузию более чем 4,106 трансдуцированных CD34+ клеток/кг с последующим полным разрушением миелиновых оболочек с применением бусульфана и циклофосфамида. Разрушали HSC пациента, способствуя приживлению генетически скорректированных HSC. Гематологическое восстановление для двух пациентов наступало в дни 13-15. Почти полное иммунологическое восстановление наступало через 12 месяцев для первого пациента и через 9 месяцев для второго пациента. В отличие от применения лентивируса специалист в данной области с использованием знаний в данной области и идей настоящего изобретения может корректировать HSC относительно ALD с применением системы CRISPR-Cas (Cas9), которая нацеливается на мутацию и корректирует ее (например, с помощью подходящей матрицы для HDR); в частности, sgRNA может осуществлять нацеливание на мутации в ABCD1, гене, который локализован на X-хромосоме, который кодирует ALD, мембранный транспортный белок пероксисом, и HDR может обеспечивать кодирование, приводящее к надлежащей экспрессии белка. sgRNA, которая нацеливается на мутацию и частицу, содержащую белок Cas (Cas9), контактирует с HSC, например, CD34+ клетками, несущими мутацию, как описано в Cartier. Частица также может содержать подходящую матрицу для HDR для коррекции мутации с целью экспрессии пероксисомального мембранного белка-переносчика; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. Приводимые таким образом в контакт клетки необязательно можно обрабатывать, как описано в Cartier. Приводимые таким образом в контакт клетки можно вводить, как описано в Cartier.Cartier's publication "MINI-SYMPOSIUM: X-Linked Adrenoleukodystrophypa, Hematopoietic Stem Cell Transplantation and Hematopoietic Stem Cell Gene Therapy in X-Linked Adrenoleukodystrophy", Brain Pathology 20 (2010) 857-862, incorporated herein by reference together with the documents that it would list if they were set forth in full, provides evidence that allogeneic hematopoietic stem cell transplantation (HSCT) has been used to deliver a normal lysosomal enzyme to the brain of a patient with Hurler disease and describes HSC gene therapy for the treatment of ALD. From two patients, peripheral CD34+ cells were collected after granulocyte colony-stimulating factor (G-CSF) activation and transduced with a lentiviral vector (MND)-ALD with the murine myeloproliferative sarcoma virus enhancer, the negative control region deleted, and the dl587rev primer binding site replaced. Patients' CD34+ cells were transduced with the MND-ALD vector for 16 h in the presence of low concentrations of cytokines. Transduced CD34+ cells were frozen after transduction to perform a battery of safety tests on 5% of the cells, which included, inter alia, three assays for the presence of replication-competent lentiviruses (RCL). Transduction efficiencies of CD34+ cells ranged from 35% to 50%, with a mean number of integrated lentivirus copies of 0.65-0.70. After thawing the transduced CD34+ cells, patients were re-infused with more than 4.106 transduced CD34+ cells/kg, followed by complete disruption of the myelin sheaths using busulfan and cyclophosphamide. The patient's HSCs were disrupted, allowing engraftment of the genetically corrected HSCs. Hematological recovery occurred on days 13-15 for two patients. Near-complete immunological recovery occurred at 12 months for the first patient and at 9 months for the second patient. In contrast to the use of lentivirus, one skilled in the art, using knowledge in the art and the teachings of the present invention, can correct HSCs for ALD using the CRISPR-Cas (Cas9) system, which targets and corrects the mutation (e.g., with an appropriate template for HDR); in particular, the sgRNA can target mutations in ABCD1, a gene located on the X chromosome that encodes ALD, a peroxisomal membrane transport protein, and HDR can provide encoding that results in proper expression of the protein. The sgRNA that targets the mutation and the particle containing the Cas protein (Cas9) is contacted with HSCs, such as CD34+ cells, carrying the mutation, as described in Cartier. The particle can also contain a suitable HDR template for correcting the mutation to express the peroxisomal membrane transport protein; or the HSC can be contacted with a second particle or vector that contains or delivers the HDR template. The cells thus contacted can optionally be treated as described in Cartier. The cells thus contacted can be administered as described in Cartier.
Следует упомянуть WO 2015/148860, в идеях, изложенных в данном документе, настоящее изобретение подразумевает способы и материалы этих документов, применяемые в сочетании с идеями, изложенными в данном документе. В одном аспекте генная терапия заболеваний, связанных с кровеносной системой, способы и композиции для лечения бета-талассемии могут быть адаптированы к системе CRISPR-Cas по настоящему изобретению (см., например, WO 2015/148860). В одном варианте осуществления WO 2015/148860 предусматривает лечение или предупреждение бета-талассемии, или ее симптомов, например, с помощью изменения гена B-клеточного CLL/лимфомы 11A (BCL11A). Ген BCL11A также известен как ген B-клеточного CLL/лимфомы 11A, BCL11A -L, BCL11A -S, BCL11AXL, CTIP 1, HBFQTL5 и ZNF. BCL11A кодирует белок "цинковый палец", который участвует в регуляции экспрессии генов глобинов. При изменении гена BCL11A (например, одного или обоих аллелей гена BCL11A) уровни гамма-глобина могут повышаться. Гамма-глобин может замещать бета-глобин в гемоглобиновом комплексе и эффективно доставлять кислород к тканям, тем самым нормализуя фенотипы заболевания бета-талассемии.Reference should be made to WO 2015/148860, in the teachings set forth therein, the present invention contemplates the methods and materials of these documents used in combination with the teachings set forth herein. In one aspect, gene therapy for diseases associated with the blood system, methods and compositions for the treatment of beta-thalassemia can be adapted to the CRISPR-Cas system of the present invention (see, for example, WO 2015/148860). In one embodiment, WO 2015/148860 provides for the treatment or prevention of beta-thalassemia, or its symptoms, for example, by altering the B-cell CLL/lymphoma 11A (BCL11A) gene. The BCL11A gene is also known as B-cell CLL/lymphoma gene 11A, BCL11A-L, BCL11A-S, BCL11AXL, CTIP 1, HBFQTL5, and ZNF. BCL11A encodes a zinc finger protein that is involved in regulating globin gene expression. When the BCL11A gene is altered (e.g., one or both alleles of the BCL11A gene), gamma globin levels may increase. Gamma globin can replace beta globin in the hemoglobin complex and efficiently deliver oxygen to tissues, thereby normalizing the disease phenotypes of beta thalassemia.
Следует упомянуть WO 2015/148863, и в идеях, изложенных в данном документе, настоящее изобретение подразумевает способы и материалы этих документов, которые могут быть адаптированы к системе CRISPR-Cas по настоящему изобретению. В аспекте лечения или предупреждения серповидноклеточной анемии, которая представляет собой наследственное гематологическое заболевание крови, WO 2015/148863 предусматривает изменение гена BCL11A. При изменении гена BCL11A (например, одного или обоих аллелей гена BCL11A) уровни гамма-глобина могут повышаться. Гамма-глобин может замещать бета-глобин в гемоглобиновом комплексе и эффективно доставлять кислород к тканям, тем самым нормализуя фенотипы серповидноклеточной анемии.WO 2015/148863 should be mentioned, and in the teachings set forth in this document, the present invention contemplates the methods and materials of these documents, which can be adapted to the CRISPR-Cas system of the present invention. In an aspect of treating or preventing sickle cell anemia, which is an inherited hematological blood disorder, WO 2015/148863 provides for altering the BCL11A gene. By altering the BCL11A gene (for example, one or both alleles of the BCL11A gene), gamma globin levels can be increased. Gamma globin can replace beta globin in the hemoglobin complex and effectively deliver oxygen to tissues, thereby normalizing the phenotypes of sickle cell anemia.
В одном аспекте настоящего изобретения способы и композиции, которые включают редактирование целевой последовательности нуклеиновой кислоты или модулирование экспрессии целевой последовательности нуклеиновой кислоты, и варианты их применения в связи с иммунотерапией рака понимают путем адаптации системы CRISPR-Cas по настоящему изобретению. Ссылаются на применение генной терапии в WO 2015/161276, который предусматривает способы и композиции, которые могут быть использованы для нарушения пролиферации, выживания и/или функции T-клеток в результате изменения одного или нескольких экспрессируемых T-клетками генов, например, одного или нескольких из генов FAS, BID, CTLA4, PDCD1, CBLB, PTPN6, TRAC и/или TRBC. В связанных аспектах пролиферация T-клеток может быть нарушена при изменении одного или нескольких экспрессируемых T-клетками генов, например, гена CBLB и/или PTPN6, гена FAS и/или BID, гена CTLA4, и/или PDCDI, и/или TRAC, и/или TRBC.In one aspect of the present invention, methods and compositions that involve editing a target nucleic acid sequence or modulating the expression of a target nucleic acid sequence and their uses in connection with cancer immunotherapy are understood by adapting the CRISPR-Cas system of the present invention. Reference is made to the use of gene therapy in WO 2015/161276, which provides methods and compositions that can be used to disrupt the proliferation, survival and/or function of T cells by altering one or more genes expressed by T cells, such as one or more of the FAS, BID, CTLA4, PDCD1, CBLB, PTPN6, TRAC and/or TRBC genes. In related aspects, T cell proliferation may be impaired by alteration of one or more genes expressed by T cells, such as the CBLB gene and/or PTPN6, the FAS gene and/or BID, the CTLA4 gene and/or PDCDI and/or TRAC and/or TRBC.
T-клетки с химерным антигенным рецептором (CAR)19 характеризуются антилейкозными эффектами в злокачественных образованиях пациентов. Однако пациенты с лейкозом часто имеют недостаточно T-клеток для сбора, следовательно, лечение должно включать модифицированные T-клетки от доноров. Соответственно, существует интерес создания банка донорских T-клеток. Qasim et al. ("First Clinical Application of Talen Engineered Universal CAR19 T Cells in B-ALL" ASH 57th Annual Meeting and Exposition, Dec. 5-8, 2015, Abstract 2046 (https://ash.confex.com/ash/2015/webprogram/Paper81653.html, опубликовано онлайн в ноябре 2015 г.) описывают модификацию T-клеток с CAR19 с целью устранения риска возникновения реакции "трансплантат против хозяина" посредством нарушения экспрессии T-клеточных рецепторов и нацеливания на CD52. Кроме того, клетки с CD52 были подвергнуты нацеливанию таким образом, что они стали невосприимчивыми к алемтузумабу, и, таким образом, способствовали тому, что алемтузумаб предупреждал опосредованное хозяином отторжение T-клеток с CAR19, несоответствующих лейкоцитарным антигенам человека (HLA). Исследователи использовали самоинактивирующийся лентивирусный вектор третьего поколения, кодирующий 4g7 CAR19 (CD19 scFv-4-1BB-CD3ζ), связанный с RQR8, затем электропорировали клетки с помощью двух пар мРНК TALEN для мультиплексного нацеливания на локус константной альфа-цепи T-клеточного рецептора (TCR) и локус гена CD52. Клетки, которые по-прежнему экспрессировали TCR после ex vivo разращения, подвергали истощению в результате истощения α/β TCR CliniMacs, приводя к образованию T-клеточного продукта (UCART19) с <1% экспрессией TCR, 85% которых приходились на CAR19, а 64% стали негативными по отношению к CD52. Модифицированные T-клетки с CAR19 вводили для лечения рецидивирующего острого лимфобластного лейкоза у пациентов. Идеи, представленные в данном документе, предусматривают эффективные способы получения модифицированных гемопоэтических стволовых клеток и их потомства, в том числе без ограничения клеток миелоидной и лимфоидной линии крови, в том числе T-клеток, B-клеток, моноцитов, макрофагов, нейтрофилов, базофилов, эозинофилов, эритроцитов, дендритных клеток и мегакариоцитов или тромбоцитов, и натуральных клеток-киллеров и их предшественников и потомков. Такие клетки можно модифицировать с помощью нокаута, нокина или иного модулирования мишеней, например, с удалением или модулированием CD52, как описано в данном документе, и других мишеней, таких как без ограничения CXCR4 и PD-1. Такие композиции, клетки и способ по настоящему изобретению можно применять для модулирования иммунных ответов и для лечения без ограничения злокачественных новообразований, вирусных инфекций и иммунных нарушений, в сочетании с введением T-клеток или других клеток пациентам.Chimeric antigen receptor (CAR)19 T cells have been shown to have anti-leukemic effects in patients with malignancies. However, leukemia patients often have insufficient T cells to collect, so treatment must include modified T cells from donors. Accordingly, there is interest in establishing a donor T cell bank. Qasim et al. ("First Clinical Application of Talen Engineered Universal CAR19 T Cells in B-ALL," ASH 57th Annual Meeting and Exposition, Dec. 5-8, 2015, Abstract 2046 (https://ash.confex.com/ash/2015/webprogram/Paper81653.html, published online November 2015) describe the modification of CAR19 T cells to eliminate the risk of graft-versus-host disease by disrupting T cell receptor expression and targeting CD52. Furthermore, CD52 cells were targeted so that they were refractory to alemtuzumab, thereby contributing to alemtuzumab's ability to prevent host-mediated rejection of human leukocyte antigen (HLA)-mismatched CAR19 T cells. The researchers used a third-generation self-inactivating lentiviral vector encoding 4g7 CAR19 (CD19 scFv-4-1BB-CD3ζ) linked to RQR8, then electroporated the cells with two pairs of TALEN mRNAs to multiplexly target the T cell receptor (TCR) constant alpha chain locus and the CD52 gene locus. Cells that still expressed TCR after ex vivo expansion were depleted by CliniMacs α/β TCR depletion, resulting in a T cell product (UCART19) with <1% TCR expression, 85% of which were CAR19 and 64% were negative for CD52. The CAR19-modified T cells were administered to treat relapsed acute lymphoblastic leukemia in patients. The ideas presented herein provide efficient methods for producing modified hematopoietic stem cells and their progeny, including but not limited to cells of the myeloid and lymphoid blood lineage, including T cells, B cells, monocytes, macrophages, neutrophils, basophils, eosinophils, erythrocytes, dendritic cells and megakaryocytes or platelets, and natural killer cells and their precursors and progeny. Such cells can be modified by knocking out, knocking in or otherwise modulating targets, such as by removing or modulating CD52 as described herein and other targets such as but not limited to CXCR4 and PD-1. Such compositions, cells and the method of the present invention can be used to modulate immune responses and to treat but not limited to malignancies, viral infections and immune disorders, in combination with the administration of T cells or other cells to patients.
Следует упомянуть WO 2015/148670 и в идеях, изложенных в данном документе, настоящее изобретение подразумевает способы и материалы этого документа, применяемые в сочетании с идеями, изложенными в данном документе. В одном аспекте генной терапии подразумеваются способы и композиции для редактирования целевой последовательности, связанной или находящейся в связи с вирусом иммунодефицита человека (HIV) и синдром приобретенного иммунодефицита (AIDS). В связанном аспекте настоящее изобретение, описанное в данном документе, подразумевает предупреждение и лечение инфекции, обусловленной HIV, и AIDS с помощью введения одной или нескольких мутаций в гене рецептора C-C-хемокина 5 типа (CCR5). Ген CCR5 также известен как CKR5, CCR-5, CD195, CKR-5, CCCKR5, CMKBR5, IDDM22 и CC-CKR-5. В дополнительном аспекте настоящее изобретение, описанное в данном документе, подразумевает применение с целью предупреждения или уменьшения инфекции, обусловленной HIV, и/или предупреждения или уменьшения способности HIV попадать в клетки-хозяева, например, у субъектов, которые уже инфицированы. Иллюстративные клетки-хозяева для HIV включают без ограничения CD4-клетки, T-клетки, лимфоидную ткань, ассоциированную с кишечником (GALT), макрофаги, дендритные клетки, миелоидные клетки-предшественники и микроглию. Попадание вируса в клетки-хозяева требует взаимодействия вирусных гликопротеинов gp41 и gp120 с CD4-рецептором и корецептором, например, CCR5. Если корецептор, например, CCR5, не присутствует на поверхности клеток-хозяев, то вирус не может связаться и попасть в клетки-хозяева. Таким образом, прогрессирование заболевания затрудняется. С помощью нокаута или нокдауна CCR5 в клетках-хозяевах, например, при введении защитной мутации (такой как мутация CCR5 дельта 32), предупреждают попадание вируса HIV в клетки-хозяева.Reference should be made to WO 2015/148670 and in the teachings set forth herein, the present invention pertains to the methods and materials of this document used in combination with the teachings set forth herein. In one aspect of gene therapy, methods and compositions for editing a target sequence associated with or in association with the human immunodeficiency virus (HIV) and acquired immunodeficiency syndrome (AIDS) are pertained. In a related aspect, the present invention described herein pertains to the prevention and treatment of HIV infection and AIDS by introducing one or more mutations in the C-C chemokine receptor type 5 (CCR5) gene. The CCR5 gene is also known as CKR5, CCR-5, CD195, CKR-5, CCCKR5, CMKBR5, IDDM22 and CC-CKR-5. In a further aspect, the present invention described herein involves use for preventing or reducing infection with HIV and/or preventing or reducing the ability of HIV to enter host cells, such as in subjects who are already infected. Exemplary host cells for HIV include, but are not limited to, CD4 cells, T cells, gut-associated lymphoid tissue (GALT), macrophages, dendritic cells, myeloid progenitor cells, and microglia. Entry of the virus into host cells requires interaction of the viral glycoproteins gp41 and gp120 with the CD4 receptor and a coreceptor, such as CCR5. If the coreceptor, such as CCR5, is not present on the surface of the host cells, the virus cannot bind to and enter the host cells. Thus, disease progression is impeded. By knocking out or knocking down CCR5 in host cells, for example by introducing a protective mutation (such as the CCR5 delta 32 mutation), the HIV virus is prevented from entering the host cells.
Сцепленная с Х-хромосомой хроническая гранулематозная болезнь (CGD) представляет собой наследственное нарушение иммунной защиты организма в связи с отсутствующей или сниженной активностью фагоцитарной NADPH-оксидазы. С помощью системы CRISPR-Cas9, которая нацеливается на мутацию и корректирует ее (отсутствующая или сниженная активность фагоцитарной NADPH-оксидазы) (например, с помощью подходящей матрицы для HDR, которая доставляет кодирующую последовательность для фагоцитарной NADPH-оксидазы); в частности, sgRNA может осуществлять нацеливание на мутацию, которая приводит к CGD (дефектная фагоцитарная NADPH-оксидаза), а HDR может обеспечивать кодирование для надлежащей экспрессии фагоцитарной NADPH-оксидазы. sgRNA, которая нацеливается на мутацию и частицу, содержащую белок Cas (Cas9), контактирует с HSC, несущими мутацию. Частица также может содержать подходящую матрицу для HDR для коррекции мутации с целью надлежащей экспрессии фагоцитарной NADPH-оксидазы; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. Приведенные таким образом в контакт клетки можно вводить и необязательно обрабатывать и размножать; см. Cartier.X-linked chronic granulomatous disease (CGD) is an inherited immune disorder due to absent or decreased activity of phagocytic NADPH oxidase. By using the CRISPR-Cas9 system, which targets and corrects the mutation (absent or decreased activity of phagocytic NADPH oxidase) (e.g., using a suitable template for HDR that delivers the coding sequence for phagocytic NADPH oxidase); in particular, sgRNA can target the mutation that leads to CGD (defective phagocytic NADPH oxidase), and HDR can provide coding for the proper expression of phagocytic NADPH oxidase. sgRNA that targets the mutation and a particle containing the Cas protein (Cas9) contacts HSCs carrying the mutation. The particle may also contain a suitable HDR matrix to correct the mutation for proper expression of phagocytic NADPH oxidase; or the HSC may be contacted with a second particle or vector that contains or delivers the HDR matrix. The cells so contacted may be administered and optionally processed and expanded; see Cartier.
Анемия Фанкони Мутации по меньшей мере в 15 генах (FANCA, FANCB, FANCC, FANCD1/BRCA2, FANCD2, FANCE, FANCF, FANCG, FANCI, FANCJ/BACH1/BRIP1, FANCL/PHF9/POG, FANCM, FANCN/PALB2, FANCO/Rad51C и FANCP/SLX4/BTBD12) могут вызывать анемию Фанкони. Белки, продуцируемые в результате экспрессии этих генов, вовлечены в клеточный процесс, известный как путь FA. Путь FA запускается (активируется), когда процесс создания новых копий ДНК, называемый “репликация ДНК”, блокируется в результате повреждения ДНК. Путь FA направляет определенные белки в область повреждения, которые запускают репарацию ДНК, поэтому репликация ДНК может продолжаться. Путь FA, в частности, реагирует на определенный тип повреждения ДНК, известный как межнитевые поперечные сшивки (ICL). ICL происходит, когда структурные элементы ДНК (нуклеотиды) на противоположных нитях ДНК аномально соединяются или связываются друг с другом, что останавливает репликацию ДНК. ICL могут вызываться накоплением токсических веществ, продуцируемых в организме, или при лечении определенными противоопухолевыми лекарственными средствами. Восемь белков ассоциируются с группой анемии Фанкони с образованием комплекса, известного как коровый комплекс FA. Коровый комплекс FA активирует два белка под названием FANCD2 и FANCI. Активация данных двух белков приводит к доставке белков для репарации ДНК в область ICL, так что поперечная сшивка может быть удалена и репликация ДНК может продолжаться с помощью корового комплекса FA. Более конкретно, коровый комплекс FA, представляющий собой ядерный мультипротеиновый комплекс, состоящий из FANCA, FANCB, FANCC, FANCE, FANCF, FANCG, FANCL и FANCM, функционирует в качестве убиквитинлигазы E3 и опосредует активацию комплекса ID, который представляет собой гетеродимер, состоящий из FANCD2 и FANCI. После моноубиквитинирования он взаимодействует с классическими супрессорами опухолевого роста ниже по пути FA, включая FANCD1/BRCA2, FANCN/PALB2, FANCJ/BRIP1 и FANCO/Rad51C, и, таким образом, участвует в репарации ДНК посредством гомологичной рекомбинации (HR). От восьмидесяти до 90 процентов случаев FA обусловлены мутациями в одном из трех генов, FANCA, FANCC и FANCG. Эти гены несут информацию для продуцирования компонентов корового комплекса FA. Мутации в таких генах, ассоциированные с коровым комплексом FA, будут приводить к потере комплексом функциональности и к разрушению всего пути FA. Как результат, повреждение ДНК не подвергается эффективной репарации, и со временем происходит накопление ICL. В публикации Geiselhart "Review Article, Disrupted Signaling through the Fanconi Anemia Pathway Leads to Dysfunctional Hematopoietic Stem Cell Biology: Underlying Mechanisms and Potential Therapeutic Strategies," Anemia Volume 2012 (2012), Article ID 265790, http://dx.doi.org/10.1155/2012/265790, обсуждается FA и эксперимент с животными, включающий интрафеморальное введение лентивируса, кодирующего ген FANCC, что приводило к коррекции HSC in vivo. С помощью системы CRISPR-Cas (Cas9), которая нацеливается на одну или несколько мутаций, ассоциированных с FA, например, системы CRISPR-Cas (Cas9), имеющей sgRNA и матрицу(матрицы) для HDR, которые соответственно нацеливаются на одну или несколько из мутаций FANCA, FANCC или FANCG, которые приводят к FA и обеспечивают откорректированную экспрессию одного или нескольких из FANCA, FANCC или FANCG; например, sgRNA может нацеливаться на мутацию, например, FANCC, и HDR может обеспечивать кодирование надлежащей экспрессии FANCC. sgRNA, которая нацеливается на мутацию(мутации) (например, одну или несколько, участвующих в FA, такие как мутация(мутации) в частице, содержащей любую один или несколько из FANCA, FANCC или FANCG) и белок Cas (Cas9), контактирует с HSC, несущими мутацию(мутации). Частица также может содержать подходящую(подходящие) матрицу(матрицы) для HDR для коррекции мутации с целью надлежащей экспрессии одного или нескольких из белков, участвующих в FA, таких как один или несколько из FANCA, FANCC или FANCG; или HSC может быть приведена в контакт со второй частицей или вектором, который содержит или доставляет матрицу для HDR. Приведенные таким образом в контакт клетки можно вводить и необязательно обрабатывать и размножать; см. Cartier.Fanconi Anemia Mutations in at least 15 genes (FANCA, FANCB, FANCC, FANCD1/BRCA2, FANCD2, FANCE, FANCF, FANCG, FANCI, FANCJ/BACH1/BRIP1, FANCL/PHF9/POG, FANCM, FANCN/PALB2, FANCO/Rad51C, and FANCP/SLX4/BTBD12) can cause Fanconi anemia. The proteins produced by the expression of these genes are involved in a cellular process known as the FA pathway. The FA pathway is turned on (activated) when the process of making new copies of DNA, called “DNA replication,” is blocked by DNA damage. The FA pathway directs certain proteins to the site of damage that trigger DNA repair so DNA replication can continue. The FA pathway specifically responds to a certain type of DNA damage known as interstrand crosslinks (ICLs). ICLs occur when DNA building blocks (nucleotides) on opposite strands of DNA abnormally join or link together, stopping DNA replication. ICLs can be caused by the buildup of toxic substances produced in the body or by treatment with certain anticancer drugs. Eight proteins associate with the Fanconi anemia group to form a complex known as the FA core complex. The FA core complex activates two proteins called FANCD2 and FANCI. Activation of these two proteins results in DNA repair proteins being recruited to the ICL region so that the crosslink can be removed and DNA replication can continue with the help of the FA core complex. More specifically, the FA core complex, a nuclear multiprotein complex consisting of FANCA, FANCB, FANCC, FANCE, FANCF, FANCG, FANCL, and FANCM, functions as an E3 ubiquitin ligase and mediates the activation of the ID complex, which is a heterodimer consisting of FANCD2 and FANCI. Once monoubiquitinated, it interacts with classical tumor suppressors downstream of the FA pathway, including FANCD1/BRCA2, FANCN/PALB2, FANCJ/BRIP1, and FANCO/Rad51C, and thus participates in DNA repair through homologous recombination (HR). Eighty to 90 percent of FA cases are due to mutations in one of three genes, FANCA, FANCC, and FANCG. These genes carry the information for the production of components of the FA core complex. Mutations in such genes associated with the FA core complex will result in loss of functionality of the complex and disruption of the entire FA pathway. As a result, DNA damage is not effectively repaired, and ICL accumulates over time. Geiselhart's "Review Article, Disrupted Signaling through the Fanconi Anemia Pathway Leads to Dysfunctional Hematopoietic Stem Cell Biology: Underlying Mechanisms and Potential Therapeutic Strategies," Anemia Volume 2012 (2012), Article ID 265790, http://dx.doi.org/10.1155/2012/265790, discusses FA and an animal experiment involving intrafemoral administration of a lentivirus encoding the FANCC gene, which resulted in correction of HSCs in vivo. By means of a CRISPR-Cas (Cas9) system that targets one or more mutations associated with FA, for example, a CRISPR-Cas (Cas9) system having an sgRNA and an HDR template(s) that respectively target one or more of the FANCA, FANCC or FANCG mutations that lead to FA and provide corrected expression of one or more of FANCA, FANCC or FANCG; for example, the sgRNA can target a mutation, for example, FANCC, and the HDR can provide encoding for proper expression of FANCC. The sgRNA that targets the mutation(s) (for example, one or more involved in FA, such as the mutation(s) in a particle containing any one or more of FANCA, FANCC or FANCG) and the Cas (Cas9) protein are contacted with HSCs bearing the mutation(s). The particle may also contain suitable HDR matrix(es) for correcting a mutation to properly express one or more of the proteins involved in FA, such as one or more of FANCA, FANCC, or FANCG; or the HSC may be contacted with a second particle or vector that contains or delivers the HDR matrix. The cells so contacted may be administered and optionally processed and expanded; see Cartier.
Частица в описании данного документа (например, содержащая sgRNA и Cas (Cas9), необязательно матрицу(матрицы) для HDR, или матрицу(матрицы) для HDR; например, в случае гемофилии B, SCID, SCID-X1, ADA-SCID, наследственной тирозинемии, β-талассемии, сцепленной с X-хромосомой CGD, синдрома Вискотта-Ольдрича, анемии Фанкони, адренолейкодистрофии (ALD), метахроматической лейкодистрофии (MLD), HIV/AIDS, иммунодефицита, гематологичекого состояния или генетической лизосомной болезни накопления) предпочтительно получена или может быть получена в результате смешивания смеси sgRNA и белка Cas (Cas9) (при этом необязательно содержит матрицу(матрицы) для HDR, или такая смесь только содержит матрицу(матрицы) для HDR в случае, если отдельные частицы по отношению к матрице(матрицам) являются желательными) со смесью, содержащей, или состоящей фактически из, или состоящей из поверхностно-активного вещества, фосфолипида, биоразлагаемого полимера, липопротеина и спирта (где одна или несколько sgRNA нацеливаются на локус гена или локусы в HSC).A particle in the description of this document (e.g. comprising an sgRNA and a Cas (Cas9), optionally an HDR template(s), or an HDR template(s); e.g. in the case of hemophilia B, SCID, SCID-X1, ADA-SCID, hereditary tyrosinemia, β-thalassemia, X-linked CGD, Wiskott-Aldrich syndrome, Fanconi anemia, adrenoleukodystrophy (ALD), metachromatic leukodystrophy (MLD), HIV/AIDS, an immunodeficiency, a hematological condition, or a genetic lysosomal storage disease) is preferably obtained or obtainable by mixing a mixture of an sgRNA and a Cas (Cas9) protein (optionally comprising an HDR template(s), or such mixture only comprising an HDR template(s) in the case where the individual particles (with respect to the matrix(es) are desirable) with a mixture comprising, or consisting essentially of, or consisting of a surfactant, a phospholipid, a biodegradable polymer, a lipoprotein, and an alcohol (wherein one or more sgRNAs target a gene locus or loci in an HSC).
Действительно, настоящее изобретение особенно подходит для лечения гемопоэтических наследственных нарушений с помощью редактирования генома и иммунодефицитов, таких как наследственные иммунодефициты, особенно с помощью технологии на основе частиц, описанной в данном документе. Наследственные иммунодефициты представляют собой заболевания, где процедуры редактирования генома по настоящему изобретению могут быть успешными. Причинами является то, что гемопоэтические клетки, подгруппой которых являются иммунные клетки, являются терапевтически доступными. Их можно удалить из организма и трансплантировать аутологически или аллогенически. Кроме того, определенные наследственные иммунодефициты, например, тяжелый комбинированный иммунодефицит (SCID), приводят к дефекту пролиферации иммунных клеток. Коррекция наследственных нарушений, вызывающих SCID, в результате редких спонтанных "обратных" мутаций указывает на то, что коррекция даже одного предшественника лимфоцита может быть достаточной для восстановления иммунной функции у пациентов .../../../Users/t_kowalski/AppData/Local/Microsoft/Windows/Temporary Internet Files/Content.Outlook/GA8VY8LK/Treating SCID for Ellen.docx - _ENREF_1, см. Bousso, P., et al. Diversity, functionality, and stability of the T cell repertoire derived in vivo from a single human T cell precursor. Proceedings of the National Academy of Sciences of the United States of America 97, 274-278 (2000). Селективное преимущество редактированных клеток обеспечивает то, что даже низкие уровни редактирования приводят к терапевтическому эффекту. Этот эффект по настоящему изобретению может наблюдаться при SCID, синдроме Вискотта-Олдрича и других состояниях, упомянутых в данном документе, в том числе наследственных гемопоэтических нарушениях, таких как альфа- и бета-талассемия, где недостаточности гемоглобина отрицательно влияют на пригодность предшественников эритроцитов.Indeed, the present invention is particularly suitable for the treatment of hematopoietic inherited disorders by genome editing and immunodeficiencies, such as inherited immunodeficiencies, especially using the particle-based technology described herein. Hereditary immunodeficiencies are diseases where the genome editing procedures of the present invention can be successful. The reasons are that hematopoietic cells, a subset of which are immune cells, are therapeutically accessible. They can be removed from the body and transplanted autologously or allogeneically. In addition, certain inherited immunodeficiencies, such as severe combined immunodeficiency (SCID), result in a defect in the proliferation of immune cells. Correction of inherited disorders causing SCID by rare spontaneous "reverse" mutations suggests that correction of even a single lymphocyte precursor may be sufficient to restore immune function in patients .../../../Users/t_kowalski/AppData/Local/Microsoft/Windows/Temporary Internet Files/Content.Outlook/GA8VY8LK/Treating SCID for Ellen.docx - _ENREF_1, see Bousso, P., et al. Diversity, functionality, and stability of the T cell repertoire derived in vivo from a single human T cell precursor. Proceedings of the National Academy of Sciences of the United States of America 97, 274-278 (2000). The selective advantage of edited cells ensures that even low levels of editing result in therapeutic effect. This effect according to the present invention can be observed in SCID, Wiskott-Aldrich syndrome and other conditions mentioned herein, including inherited hematopoietic disorders such as alpha- and beta-thalassemia, where hemoglobin deficiencies negatively affect the fitness of red blood cell precursors.
Активность репарации DSB с помощью NHEJ и HDR значительно варьирует в зависимости от типа клетки и состояния клетки. NHEJ не подвергается четкой регуляции клеточным циклом и является эффективным во всех типах клеток, обеспечивая наличие высоких уровней нарушения функционирования гена в доступных целевых клеточных популяциях. Напротив, HDR действует, главным образом, в течение фазы S/G2, и, таким образом, ограничена клетками, которые активно делятся, с ограничением применения видов лечения, которые требуют точных модификаций генома до митотических клеток [Ciccia, A. & Elledge, S.J. Molecular cell 40, 179-204 (2010); Chapman, J.R., et al. Molecular cell 47, 497-510 (2012)].The DSB repair activity of NHEJ and HDR varies considerably depending on the cell type and cell state. NHEJ is not tightly regulated by the cell cycle and is effective in all cell types, ensuring the presence of high levels of gene disruption in accessible target cell populations. In contrast, HDR acts primarily during the S/G2 phase and is thus restricted to cells that are actively dividing, limiting the application of therapies that require precise genomic modifications prior to mitotic cells [Ciccia, A. & Elledge, S.J. Molecular cell 40, 179–204 (2010); Chapman, J.R., et al. Molecular cell 47, 497–510 (2012)].
Эффективность коррекции с применением HDR может контролироваться по эпигенетическому состоянию или последовательности подверженного целенаправленному воздействию локуса или применяемой конфигурации специфической матрицы для репарации (однонитевые по сравнению с двухнитевыми, длинные по сравнению с короткими гомологичными плечами) [Hacein-Bey-Abina, S., et al. The New England journal of medicine 346, 1185-1193 (2002); Gaspar, H.B., et al. Lancet 364, 2181-2187 (2004); Beumer, K.J., et al. G3 (2013)]. Относительная активность механизмов NHEJ и HDR в целевых клетках может также оказывать влияние на эффективность коррекции гена, поскольку данные пути могут конкурировать за устранение DSB [Beumer, K.J., et al. Proceedings of the National Academy of Sciences of the United States of America 105, 19821-19826 (2008)]. HDR также вносит проблему доставки, не наблюдаемую при применении стратегий с NHEJ, поскольку она требует одновременой доставки нуклеаз и матриц для репарации. На практике данные ограничения до настоящего времени привели к низким уровням HDR в терапевтически значимых типах клеток. Переход к клиническому применению, таким образом, был в основном сосредоточен на стратегиях NHEJ для лечения заболевания, хотя доклинические исследования обоснованности концепции только что были описаны для мышиных моделей гемофилии B и врожденной тирозинемии [Li, H., et al. Nature 475, 217-221 (2011); Yin, H., et al. Nature biotechnology 32, 551-553 (2014)].The efficiency of HDR correction may be controlled by the epigenetic state or sequence of the targeted locus or the configuration of the specific repair template used (single-stranded versus double-stranded, long versus short homology arms) [Hacein-Bey-Abina, S., et al. The New England journal of medicine 346, 1185–1193 (2002); Gaspar, H.B., et al. Lancet 364, 2181–2187 (2004); Beumer, K.J., et al. G3 (2013)]. The relative activity of NHEJ and HDR machinery in target cells may also influence the efficiency of gene correction, as these pathways may compete for DSB repair [Beumer, K.J., et al. HDR also introduces a delivery problem not seen with NHEJ strategies, as it requires simultaneous delivery of nucleases and repair templates. In practice, these limitations have so far resulted in low levels of HDR in therapeutically relevant cell types. The transition to clinical application has thus largely focused on NHEJ strategies for disease treatment, although preclinical proof-of-concept studies have just been described for mouse models of hemophilia B and congenital tyrosinemia [Li, H., et al. Nature 475, 217–221 (2011); Yin, H., et al. Nature biotechnology 32, 551–553 (2014)].
Любое из приведенных применений редактирования генома может включать комбинации белков, малые молекулы РНК и/или матрицы для репарации, что делает доставку данных нескольких частей значительно более проблематичной, чем доставку низкомолекулярных лекарственных средств. Разрабатывали две основные стратегии доставки инструментов для редактирования генома: ex vivo и in vivo. В видах лечения ex vivo пораженные болезнью клетки удаляют из организма, редактируют и затем трансплантируют обратно пациенту. Редактирование ex vivo имеет преимущество в обеспечении возможности должного определения целевой популяции клеток и точного определения дозирования терапевтических молекул. Последний фактор, который следует учитывать, может быть особенно важным, когда нецелевые модификации представляют особый интерес, поскольку подбор количества нуклеазы может приводить к снижению уровня таких мутаций (Hsu et al., 2013). Другим преимуществом подходов ex vivo являются обычно высокие показатели редактирования, которые могут быть достигнуты в связи с разработкой эффективных систем доставки для белков и нуклеиновых кислот в клетки, находящиеся в культуре, для применений в научных исследованиях и генной терапии.Any of the above genome editing applications may involve combinations of proteins, small RNA molecules, and/or repair templates, making delivery of these multiple parts significantly more challenging than delivery of small molecule drugs. Two main strategies have been developed for delivering genome editing tools: ex vivo and in vivo. In ex vivo treatments, diseased cells are removed from the body, edited, and then transplanted back into the patient. Ex vivo editing has the advantage of allowing for proper targeting of the cell population and precise dosing of therapeutic molecules. The latter consideration may be particularly important when off-target modifications are of particular interest, as tailoring the amount of nuclease may result in lower levels of such mutations (Hsu et al., 2013). Another advantage of ex vivo approaches is the typically high editing yields that can be achieved due to the development of efficient delivery systems for proteins and nucleic acids into cells in culture for research and gene therapy applications.
Может быть два основных недостатка подходов ex vivo, которые ограничивают их применение в отношении небольшого числа заболеваний. Например, целевые клетки должны быть способны выживать при манипуляции вне организма. Для многих тканей, как, например, для головного мозга, культивирование клеток вне организма представляет собой большую проблему, поскольку клетки либо не в состоянии выжить, либо теряют свойства, необходимые для их функционирования in vivo. Таким образом, с точки зрения настоящего изобретения и знаний в данной области терапия ex vivo по отношению к тканям с популяциями взрослых стволовых клеток, поддающихся ex vivo культивированию и манипуляциям, таким как гемопоэтическая система, с помощью системы CRISPR-Cas (Cas9) является возможной. [Bunn, H.F. & Aster, J. Pathophysiology of blood disorders, (McGraw-Hill, New York, 2011)]There may be two major drawbacks to ex vivo approaches that limit their application to a small number of diseases. For example, the target cells must be able to survive manipulation outside the body. For many tissues, such as the brain, culturing cells outside the body is a major challenge because the cells either fail to survive or lose the properties necessary for their function in vivo. Thus, from the perspective of the present invention and the knowledge in the art, ex vivo therapy of tissues with adult stem cell populations that are amenable to ex vivo culturing and manipulation, such as the hematopoietic system, using the CRISPR-Cas (Cas9) system is feasible. [Bunn, H.F. & Aster, J. Pathophysiology of blood disorders, (McGraw-Hill, New York, 2011)]
Редактирование генома in vivo охватывает прямую доставку систем редактирования в их нативные ткани. Редактирование in vivo допускает лечение заболеваний, в которых пораженная популяция клеток не пригодна для манипуляции ex vivo. Более того, доставка нуклеаз в клетки in situ создает возможность для лечения многих тканей и типов клеток. Данные свойства, вероятно, обеспечивают применение лечения in vivo по отношению к более широкому спектру заболеваний, чем видов терапии ex vivo.In vivo genome editing involves direct delivery of editing systems into their native tissues. In vivo editing allows for the treatment of diseases in which the affected cell population is not amenable to ex vivo manipulation. Furthermore, in situ delivery of nucleases to cells creates the potential for treatment of multiple tissues and cell types. These properties likely make in vivo treatments applicable to a broader range of diseases than ex vivo therapies.
До настоящего времени редактирования in vivo в значительной степени достигали посредством применения вирусных векторов с определенным, специфичным к тканям тропизмом. Такие векторы в настоящее время ограничены по вместимости и тропизму, ограничивая данный вид терапии системами органов, где трансдукция клинически применимыми векторами является эффективной, как, например, печень, мышцы и глаза [Kotterman, M.A. & Schaffer, D.V. Nature reviews. Genetics 15, 445-451 (2014); Nguyen, T.H. & Ferry, N. Gene therapy 11 Suppl 1, S76-84 (2004); Boye, S.E., et al. Molecular therapy : the journal of the American Society of Gene Therapy 21, 509-519 (2013)].To date, in vivo editing has been achieved largely through the use of viral vectors with defined, tissue-specific tropism. Such vectors are currently limited in capacity and tropism, limiting this type of therapy to organ systems where transduction with clinically useful vectors is effective, such as the liver, muscle, and eye [Kotterman, M.A. & Schaffer, D.V. Nature reviews. Genetics 15, 445–451 (2014); Nguyen, T.H. & Ferry, N. Gene therapy 11 Suppl 1, S76–84 (2004); Boye, S.E., et al. Molecular therapy : the journal of the American Society of Gene Therapy 21, 509–519 (2013)].
Главным потенциальным барьером для доставки in vivo является иммунный ответ, который может быть сформирован в ответ на большие количества вируса, необходимого для лечения, но это явление не является уникальным для редактирования генома и наблюдается при других видах генной терапии на основе вирусов [Bessis, N., et al. Gene therapy 11 Suppl 1, S10-17 (2004)]. Также вероятно, что пептиды из осуществляющих редактирование нуклеаз сами по себе презентируются на молекулах MHC класса I для стимулирования иммунного ответа, хотя существует мало доказательств, подтверждающих, что это происходит на доклиническом уровне. Другой основной трудностью данного вида терапии является контроль распространения и, следовательно, дозировки нуклеаз для редактирования генома in vivo, приводящие к образованию профилей нецелевых мутаций, прогнозирование которых может быть затруднительным. Однако с точки зрения настоящего изобретения и знаний в данной области, в том числе применения видов терапии на основе вирусов и частиц, используемых при лечении онкологических заболеваний, in vivo модификация HSC, например, с помощью доставки частицы или вируса, находится в пределах компетенции специалиста в данной области.A major potential barrier to in vivo delivery is the immune response that may be generated in response to the large quantities of virus required for treatment, but this phenomenon is not unique to genome editing and has been observed in other viral-based gene therapies [Bessis, N., et al. Gene therapy 11 Suppl 1, S10-17 (2004)]. It is also likely that the peptides from the editing nucleases themselves are presented on MHC class I molecules to stimulate an immune response, although there is little evidence that this occurs at the preclinical level. Another major challenge with this type of therapy is controlling the distribution and hence dosage of the genome editing nucleases in vivo, resulting in off-target mutation profiles that can be difficult to predict. However, in view of the present invention and the knowledge in the art, including the use of virus- and particle-based therapies used in the treatment of cancer, in vivo modification of HSC, for example by delivery of a particle or virus, is within the skill of the art.
Терапия с применением редактирования ex vivo Длительная клиническая экспертиза с очисткой, культивированием и трансплантацией кроветворных клеток определила заболевания, поражающие систему крови, такие как SCID, анемия Фанкони, синдром Вискотта-Олдрича и серповидноклеточная анемия, в приоритетную область терапии с применением редактирования ex vivo. Другой причиной сосредоточения внимания на кроветворных клетках является то, что благодаря предыдущим усилиям по разработке генной терапии нарушений со стороны крови уже существуют системы доставки с относительно высокой эффективностью. С учетом этих преимуществ этот вид терапии может быть применим при заболеваниях, где редактированные клетки обладают преимуществом пригодности, так что небольшое количество прижившихся, редактированных клеток могут размножаться и обеспечивать лечение заболевания. Одним таким заболеванием является HIV, при котором инфекция приводит к недостатку пригодности CD4+ T-клеток.Ex vivo editing-based therapies Long-term clinical experience with purification, culture, and transplantation of hematopoietic cells has identified diseases affecting the blood system, such as SCID, Fanconi anemia, Wiskott-Aldrich syndrome, and sickle cell anemia, as priority areas for ex vivo editing-based therapies. Another reason for focusing on hematopoietic cells is that, thanks to previous efforts to develop gene therapies for blood disorders, delivery systems with relatively high efficiencies already exist. Given these advantages, this type of therapy may be applicable to diseases where the edited cells have a fitness advantage, such that a small number of engrafted, edited cells can proliferate and provide treatment for the disease. One such disease is HIV, in which infection results in a fitness deficiency of CD4+ T cells.
Терапию с применением редактирования ex vivo в недавнем времени расширили путем включения стратегий коррекции генов. Барьеры для HDR ex vivo были преодолены, что показано в недавней работе Genovese и соавт., которые добивались коррекции мутированного гена IL2RG в гемопоэтических стволовых клетках (HSC), полученных от пациента, страдающего от SCID-X1 [Genovese, P., et al. Nature 510, 235-240 (2014)]. Genovese et. al. осуществляли коррекцию гена в HSC с применением мультимодальной стратегии. Во-первых, HSC трансдуцировали с использованием лентивируса с дефектом интеграции, содержащего матрицу для HDR, кодирующую терапевтическую cDNA для IL2RG. После трансдукции клетки подвергали электропорации с применением мРНК, кодирующей ZFN, целенаправленно воздействующие на горячую точку мутагенеза в IL2RG для стимулирования коррекции гена, основанной на HDR. Для повышения показателей HDR условия культивирования оптимизировали путем использования малых молекул, способствующих делению HSC. С применением оптимизированных условий культивирования, нуклеаз и матриц для HDR, HSC со скорректированными генами от пациента с SCID-X1 получали в культуре при терапевтически значимых уровнях. HSC от непораженных индивидуумов, которых подвергали той же процедуре коррекции генов, могли поддерживать длительное кроветворение у мышей, что является золотым стандартом функционирования HSC. HSC способны давать начало всем типам кроветворных клеток, и их можно подвергать аутологической трансплантации, что делает их чрезвычайно важной популяцией клеток для всех наследственных нарушений кроветворения [Weissman, I.L. & Shizuru, J.A. Blood 112, 3543-3553 (2008)]. В принципе, HSC со корректированными генами можно применять для лечения широкого cпектра генетических нарушений со стороны крови, что делает данное исследование важным открытием для редактирования генома с терапевтической целью.Ex vivo editing therapies have recently been expanded to include gene correction strategies. Barriers to ex vivo HDR have been overcome, as demonstrated by the recent work of Genovese et al., who achieved correction of the mutated IL2RG gene in hematopoietic stem cells (HSCs) derived from a patient suffering from SCID-X1 [Genovese, P., et al. Nature 510, 235-240 (2014)]. Genovese et al. performed gene correction in HSCs using a multimodal strategy. First, HSCs were transduced with an integration-deficient lentivirus containing an HDR template encoding a therapeutic cDNA for IL2RG. Following transduction, cells were electroporated with mRNA encoding ZFNs that target a mutagenesis hotspot in IL2RG to promote HDR-based gene correction. To enhance HDR rates, culture conditions were optimized using small molecules that promote HSC division. Using optimized culture conditions, nucleases, and HDR templates, gene-corrected HSCs from a SCID-X1 patient were obtained in culture at therapeutically relevant levels. HSCs from unaffected individuals that underwent the same gene correction procedure could maintain long-term hematopoiesis in mice, which is the gold standard for HSC function. HSCs are capable of giving rise to all hematopoietic cell types and can be autologously transplanted, making them an extremely important cell population for all inherited hematopoietic disorders [Weissman, I.L. & Shizuru, J.A. Blood 112, 3543-3553 (2008)]. In principle, gene-corrected HSCs could be used to treat a wide range of genetic blood disorders, making this study an important discovery for therapeutic genome editing.
Терапия с применением редактирования in vivo. Редактирование in vivo можно применять преимущественно исходя из настоящего изобретения и знаний в данной области. Для систем органов, доставка в которые является эффективной, уже существует ряд впечатляющих доклинических терапевтических успехов. Первый пример успешной терапии in vivo с применением редактирования был продемонстрирован на мышиной модели гемофилии B [Li, H., et al. Nature 475, 217-221 (2011)]. Как было отмечено ранее, гемофилия B представляет собой сцепленное с Х-хромосомой рецессивное нарушение, вызванное мутациями с потерей функций в гене, кодирующем фактор IX, важный компонент каскада свертывания крови. Восстановление активности фактора IX до приблизительно 1% от его уровней у тяжело пораженных индивидуумов может трансформировать заболевание в значительно более легкую форму, поскольку профилактическая инфузия рекомбинантного фактора IX у таких пациентов с раннего возраста для получения таких уровней в значительной степени облегчает тяжесть клинических осложнений [Lofqvist, T., et al. Journal of internal medicine 241, 395-400 (1997)]. Таким образом, крайне низкие уровни коррекции гена, опосредованной HDR, являются необходимы для изменения клинических результатов у пациентов. Кроме того, фактор IX синтезируется и секретируется печенью, органом, который может быть эффективно трансдуцирован вирусными векторами, кодирующими системы для редактирования.In vivo editing-based therapy. In vivo editing can be advantageously applied based on the present invention and the knowledge in the art. For organ systems to which delivery is effective, there are already a number of impressive preclinical therapeutic successes. The first example of successful in vivo editing-based therapy was demonstrated in a mouse model of hemophilia B [Li, H., et al. Nature 475, 217-221 (2011)]. As noted earlier, hemophilia B is an X-linked recessive disorder caused by loss-of-function mutations in the gene encoding factor IX, an important component of the blood coagulation cascade. Restoring factor IX activity to approximately 1% of its levels in severely affected individuals can transform the disease into a significantly milder form, since prophylactic infusion of recombinant factor IX in such patients from an early age to achieve such levels significantly alleviates the severity of clinical complications [Lofqvist, T., et al. Journal of internal medicine 241, 395-400 (1997)]. Thus, extremely low levels of HDR-mediated gene correction are required to alter clinical outcomes in patients. Furthermore, factor IX is synthesized and secreted by the liver, an organ that can be efficiently transduced by viral vectors encoding editing systems.
С применением гепатотропных серотипов аденоассоциированного вируса (AAV), кодирующих ZFN и корректирующую матрицу для HDR, получали до 7% коррекции мутированного, гуманизированного гена фактора IX в печени мыши [Li, H., et al. Nature 475, 217-221 (2011)]. Это приводило к улучшению кинетики свертывания крови, меры функционирования каскада свертывания крови, впервые демонстрируя, что терапия in vivo с применением редактирования является не только возможной, но и эффективной Как описано в данном документе, специалист в данной области ориентируется на основе идей данного документа и знаний в данной области, например, Li в случае лечения гемофилии B частицей, содержащей матрицу для HDR и систему CRISPR-Cas (Cas9), которая нацеливается на мутацию сцепленного с X-хромосомой рецессивного нарушения для обращения мутации потери функции.Using hepatotropic adeno-associated virus (AAV) serotypes encoding ZFN and an HDR proofreading template, up to 7% correction of the mutated, humanized factor IX gene in mouse liver was achieved [Li, H., et al. Nature 475, 217–221 (2011)]. This resulted in improved coagulation kinetics, a measure of the function of the blood coagulation cascade, demonstrating for the first time that in vivo editing-based therapy is not only possible but also effective. As described in this paper, one skilled in the art is guided by the teachings of this paper and knowledge in the art, such as Li in the case of treating hemophilia B with a particle containing an HDR template and the CRISPR-Cas (Cas9) system that targets a mutation in an X-linked recessive disorder to reverse a loss-of-function mutation.
Основываясь на данном исследовании, другие группы с недавнего времени применяют редактирование генома в печени in vivo с использованием CRISPR-Cas для успешного лечения мышиной модели врожденной тирозинемии и для создания мутаций, которые обеспечивают защиту от сердечно-сосудистого заболевания. Эти два отдельных применения демонстрируют универсальность данного подхода для нарушений, которые охватывают дисфункцию печени [Yin, H., et al. Nature biotechnology 32, 551-553 (2014); Ding, Q., et al. Circulation research 115, 488-492 (2014)]. Применения редактирования in vivo других систем органов необходимы для подтверждения того, что данная стратегия широко применима. В настоящее время усилия для оптимизации как вирусных векторов, так и векторов, отличных от вирусных, находятся на пути реализации для расширения спектра нарушений, которые можно лечить с использованием данного метода терапии [Kotterman, M.A. & Schaffer, D.V. Nature reviews. Genetics 15, 445-451 (2014); Yin, H., et al. Nature reviews. Genetics 15, 541-555 (2014)]. Как описано в данном документе, специалист в данной области ориентируется на основе идей данного документа и знаний в данной области, например, Yin в случае лечения наследственной тирозинемии частицей, содержащей матрицу для HDR и систему CRISPR-Cas (Cas9), которая нацеливается на мутацию.Building on this study, other groups have recently applied in vivo liver genome editing using CRISPR-Cas to successfully treat a mouse model of congenital tyrosinemia and to generate mutations that confer protection against cardiovascular disease. These two separate applications demonstrate the generality of this approach for disorders that involve liver dysfunction [Yin, H., et al. Nature biotechnology 32, 551–553 (2014); Ding, Q., et al. Circulation research 115, 488–492 (2014)]. Applications of in vivo editing to other organ systems are needed to confirm the broad applicability of this strategy. Efforts to optimize both viral and non-viral vectors are currently underway to expand the spectrum of disorders that can be treated with this therapy [Kotterman, M.A. & Schaffer, D.V. Nature reviews. Genetics 15, 445-451 (2014); Yin, H., et al. Nature reviews. Genetics 15, 541-555 (2014)]. As described in this document, one skilled in the art is guided by the teachings of this document and knowledge in the art, such as Yin in the case of treating hereditary tyrosinemia with a particle containing an HDR template and a CRISPR-Cas (Cas9) system that targets a mutation.
Целенаправленная делеция, варианты терапевтического применения. Целенаправленная делеция генов может быть предпочтительной. Таким образом, предпочтительными являются гены, участвующие в иммунодефиците, гематологическом состоянии или генетической лизосомной болезни накопления, например, гемофилии B, SCID, SCID-X1, ADA-SCID, наследственной тирозинемии, β-талассемии, сцепленной с X-хромосомой CGD, синдроме Вискотта-Олдрича, анемии Фанкони, адренолейкодистрофии (ALD), метахромацитной лейкодистрофии (MLD), HIV/AIDS, других метаболических нарушениях, гены, кодирующие неправильно свернутые белки, участвующие в заболеваниях, гены, приводящие к потере функции, участвующей в заболевании, мутации, которые могут подвергаться нацеливанию в HSC, с помощью любой из описанных в данном документе систем доставки, при этом система с использованием частиц является предпочтительной.Targeted deletion, therapeutic uses. Targeted deletion of genes may be preferred. Thus, genes involved in an immunodeficiency, hematological condition or genetic lysosomal storage disease are preferred, for example, hemophilia B, SCID, SCID-X1, ADA-SCID, hereditary tyrosinemia, β-thalassemia, X-linked CGD, Wiskott-Aldrich syndrome, Fanconi anemia, adrenoleukodystrophy (ALD), metachromocytic leukodystrophy (MLD), HIV/AIDS, other metabolic disorders, genes encoding misfolded proteins involved in diseases, genes leading to loss of function involved in the disease, mutations that can be targeted to HSCs using any of the delivery systems described herein, with a particle system being preferred.
В настоящем изобретении иммуногенность фермента CRISPR, в частности, можно снизить, следуя подходу, впервые изложенному Tangri et al. в отношении эритропоэтина и впоследствии получившему развитие. Соответственно, для снижения иммуногенности фермента CRISPR (например, Cas9) у вида-хозяина (человека или другого вида) можно применять направленную эволюцию или рациональное конструирование.In the present invention, the immunogenicity of a CRISPR enzyme in particular can be reduced following the approach first described by Tangri et al. for erythropoietin and subsequently developed. Accordingly, directed evolution or rational engineering can be used to reduce the immunogenicity of a CRISPR enzyme (e.g., Cas9) in a host species (human or other species).
Редактирование генома. Системы CRISPR/Cas (Cas9) по настоящему изобретению можно применять для коррекции генетических мутаций, попытки которой с ограниченным успехом ранее предпринимались с применением TALEN и ZFN, а также лентивирусов, в том числе, как описано в данном документе; см. также WO2013163628.Genome editing. The CRISPR/Cas (Cas9) systems of the present invention can be used to correct genetic mutations, which has previously been attempted with limited success using TALENs and ZFNs, as well as lentiviruses, including as described herein; see also WO2013163628.
Виды адоптивной клеточной терапииTypes of adoptive cell therapy
Настоящее изобретение также предусматривает применение системы CRISPR-Cas, описанной в данном документе, например, систем эффекторного белка Cas9, для модификации клеток с целью адоптивных видов терапии. Аспекты по настоящему изобретению включают адоптивный перенос клеток иммунной системы, таких как T-клетки, специфичных в отношении определенных антигенов, таких как опухоль-ассоциированные антигены (см. Maus et al., 2014, Adoptive Immunotherapy for Cancer or Viruses, Annual Review of Immunology, Vol. 32: 189-225; Rosenberg and Restifo, 2015, Adoptive cell transfer as personalized immunotherapy for human cancer, Science Vol. 348 no. 6230 pp. 62-68; Restifo et al., 2015, Adoptive immunotherapy for cancer: harnessing the T cell response. Nat. Rev. Immunol. 12(4): 269-281; и Jenson and Riddell, 2014, Design and implementation of adoptive therapy with chimeric antigen receptor-modified T cells. Immunol Rev. 257(1): 127-144). Например, различные стратегии можно использовать для генетической модификации T-клеток с помощью изменения специфичности T-клеточного рецептора (TCR), например, посредством введения новых α- и β-цепей TCR со специфичностью по отношению к определенным пептидам (см. патент США №8697854; публикации заявок на патент согласно PCT: WO2003020763, WO2004033685, WO2004044004, WO2005114215, WO2006000830, WO2008038002, WO2008039818, WO2004074322, WO2005113595, WO2006125962, WO2013166321, WO2013039889, WO2014018863, WO2014083173; патент США № 8088379).The present invention also provides for the use of the CRISPR-Cas system described herein, such as the Cas9 effector protein systems, to modify cells for adoptive therapies. Aspects of the present invention include the adoptive transfer of immune system cells, such as T cells, specific for certain antigens, such as tumor-associated antigens (see Maus et al., 2014, Adoptive Immunotherapy for Cancer or Viruses, Annual Review of Immunology, Vol. 32: 189-225; Rosenberg and Restifo, 2015, Adoptive cell transfer as personalized immunotherapy for human cancer, Science Vol. 348 no. 6230 pp. 62-68; Restifo et al., 2015, Adoptive immunotherapy for cancer: harnessing the T cell response. Nat. Rev. Immunol. 12(4): 269-281; and Jenson and Riddell, 2014, Design and implementation of adoptive therapy with chimeric antigen receptor-modified T cells. Immunol Rev. 257(1): 127–144). For example, various strategies can be used to genetically modify T cells by altering the specificity of the T cell receptor (TCR), such as by introducing new TCR α- and β-chains with specificity for certain peptides (see U.S. Patent No. 8,697,854; PCT Patent Application Publications: WO2003020763, WO2004033685, WO2004044004, WO2005114215, WO2006000830, WO2008038002, WO2008039818, WO2004074322, WO2005113595, WO2006125962, WO2013166321, WO2013039889, WO2014018863, WO2014083173; US Patent No. 8088379).
В качестве альтернативы или дополнительно к модификациям TCR химерные антигенные рецепторы (CAR) можно использовать с целью получения иммунореактивных клеток, таких как T-клетки, специфичные по отношению к определенным мишеням, таким как злокачественные клетки, с широким разнообразием описанных рецепторных химерных конструкций (см. патенты США №№ 5843728; 5851828; 5912170; 6004811; 6284240; 6392013; 6410014; 6753162; 8211422 и публикацию согласно PCT WO9215322). Альтернативные конструкции CAR можно охарактеризовать как принадлежащие к последующим поколениям. CAR первого поколения, как правило, состоят из однонитевого вариабельного фрагмента антитела, специфичного по отношению к антигену, например, содержащего VL, связанную с VH конкретного антитела, связанного с помощью гибкого линкера, например, с помощью шарнирного домена CD8α и трансмембранного домена CD8α с трансмембранными доменами и доменами внутриклеточной передачи сигнала CD3ζ или FcRγ (scFv-CD3ζ или scFv-FcRγ; см. патент США №7741465; патент США №5912172; патент США №5906936). CAR второго поколения охватывают внутриклеточные домены одной или нескольких костимулирующих молекул, таких как CD28, OX40 (CD134) или 4-1BB (CD137) в эндодомене (например, scFv-CD28/OX40/4-1BB-CD3ζ; см. патенты США №№ 8911993; 8916381; 8975071; 9101584; 9102760; 9102761). CAR третьего поколения включают комбинацию костимулирующих эндодоменов, таких как сигнальные домены CD3ζ-цепи, CD97, GDI la-CD18, CD2, ICOS, CD27, CD154, CDS, OX40, 4-1BB или CD28 (например, scFv-CD28-4-1BB-CD3ζ или scFv-CD28-OX40-CD3ζ; см. патент США № 8906682; патент США № 8399645; патент США № 5686281; публикацию согласно PCT № WO2014134165; публикацию согласно PCT № WO2012079000). Альтернативно костимиляцию можно регулировать с помощью экспрессии CAR в антиген-специфичных T-клетках, выбранных с целью активации и размножения в результате вовлечения их нативных αβTCR, например, с помощью антигена на профессиональных антиген-представляющих клетках с помощью сопутствующей костимуляции. Кроме того, дополнительные сконструированные рецепторы могут быть предусмотрены на иммунореактивных клетках, например, для улучшения нацеливания T-клеточной атаки и/или сведения к минимуму побочных эффектов.As an alternative or in addition to TCR modifications, chimeric antigen receptors (CARs) can be used to generate immunoresponsive cells, such as T cells, specific for certain targets, such as cancer cells, with a wide variety of receptor chimeric constructs having been described (see U.S. Patent Nos. 5,843,728; 5,851,828; 5,912,170; 6,004,811; 6,284,240; 6,392,013; 6,410,014; 6,753,162; 8,211,422 and PCT publication WO9215322). Alternative CAR constructs can be characterized as belonging to subsequent generations. First generation CARs typically consist of a single-chain variable fragment of an antibody specific for an antigen, e.g., comprising a V L linked to a V H of a particular antibody, linked via a flexible linker, e.g., via the CD8α hinge domain and the CD8α transmembrane domain to the transmembrane and intracellular signaling domains of CD3ζ or FcRγ (scFv-CD3ζ or scFv-FcRγ; see U.S. Patent No. 7,741,465; U.S. Patent No. 5,912,172; U.S. Patent No. 5,906,936). Second-generation CARs encompass the intracellular domains of one or more costimulatory molecules such as CD28, OX40 (CD134), or 4-1BB (CD137) in the endodomain (e.g., scFv-CD28/OX40/4-1BB-CD3ζ; see U.S. Patent Nos. 8,911,993; 8,916,381; 8,975,071; 9,101,584; 9,102,760; 9,102,761). Third-generation CARs include a combination of costimulatory endodomains such as the signaling domains of the CD3ζ chain, CD97, GDI la-CD18, CD2, ICOS, CD27, CD154, CDS, OX40, 4-1BB, or CD28 (e.g., scFv-CD28-4-1BB-CD3ζ or scFv-CD28-OX40-CD3ζ; see U.S. Patent No. 8,906,682; U.S. Patent No. 8,399,645; U.S. Patent No. 5,686,281; PCT Publication No. WO2014134165; PCT Publication No. WO2012079000). Alternatively, costimulation can be regulated by CAR expression in antigen-specific T cells selected for activation and expansion by engagement of their native αβTCR, e.g., by antigen on professional antigen-presenting cells via concomitant costimulation. In addition, additional engineered receptors can be provided on immunoreactive cells, e.g., to improve targeting of T cell attack and/or minimize side effects.
Альтернативные методики можно применять для трансформации целевых иммунореактивных клеток, такие как слияние протопласта, липофекция, трансфекция или электропорация. Можно использовать широкое разнообразие векторов, таких как ретровирусные векторы, лентивирусные векторы, аденовирусные векторы, аденоассоциированные вирусные векторы, плазмиды или транспозоны, такие как транспозон "Спящая красавица" (см. патенты США №№ 6489458; 7148203; 7160682; 7985739; 8227432), их можно использовать для введения CAR, например, с помощью получения антиген-специфичных CAR 2-го поколения, передающих сигналы с участием CD3ζ и CD28 или CD137. Вирусные векторы, могут, например, включать векторы на основе HIV, SV40, EBV, HSV или BPV.Alternative techniques can be used to transform the target immunoresponsive cells, such as protoplast fusion, lipofection, transfection, or electroporation. A wide variety of vectors can be used, such as retroviral vectors, lentiviral vectors, adenoviral vectors, adeno-associated viral vectors, plasmids, or transposons such as the Sleeping Beauty transposon (see U.S. Patent Nos. 6,489,458; 7,148,203; 7,160,682; 7,985,739; 8,227,432), and can be used to administer CARs, such as by generating 2nd generation antigen-specific CARs that signal through CD3ζ and CD28 or CD137. Viral vectors can include, for example, HIV, SV40, EBV, HSV, or BPV-based vectors.
Клетки, которые подвергаются нацеливанию с целью трансформации, могут включать, например, T-клетки, натуральные клетки-киллеры (NK), цитотоксические T-лимфоциты (CTL), регуляторные T-клетки, человеческие эмбриональные стволовые клетки, инфильтрующие опухоль лимфоциты (TIL) или плюрипотентную стволовую клетку, из которой лимфоидные клетки могут дифференцироваться. T-клетки, экспрессирующие желаемый CAR, можно, например, выбрать посредством кокультивирования с γ-облученными активирующими и делящимися клетками (AaPC), которые коэкспрессируют раковый антиген и костимулирующие молекулы. Сконструированные CAR Т-клетки можно размножать, например, с помощью кокультивирования на AaPC в присутствии растворенных факторов, таких как IL-2 и IL-21. Такое разращивание, можно, например, проводить с целью получения CAR+ T-клеток памяти (которые можно, например, анализировать с помощью неферментативного цифрового массива и/или многопанельной проточной цитометрии ). В этом отношении можно получить CAR T-клетки, которые характеризуются специфичной цитотоксической активностью по отношению к антиген-несущим опухолям (необязательно в сочетании с образованием желаемых хемокинов, таких как интерферон-γ). CAR T-клетки этого типа, например, можно использовать в животных моделях, например, для лечения ксенотрансплантатов опухолей.The cells to be targeted for transformation may include, for example, T cells, natural killer (NK) cells, cytotoxic T lymphocytes (CTL), regulatory T cells, human embryonic stem cells, tumor infiltrating lymphocytes (TIL), or a pluripotent stem cell from which lymphoid cells can differentiate. T cells expressing the desired CAR can, for example, be selected by co-cultivation with γ-irradiated activating and dividing cells (AaPC) that co-express a cancer antigen and costimulatory molecules. The engineered CAR T cells can be expanded, for example, by co-cultivation on AaPC in the presence of solubilized factors such as IL-2 and IL-21. Such expansion can, for example, be carried out with the aim of obtaining CAR+ memory T cells (which can, for example, be analyzed using non-enzymatic digital array and/or multi-panel flow cytometry). In this regard, CAR T cells can be obtained that are characterized by specific cytotoxic activity towards antigen-bearing tumors (optionally in combination with the formation of desired chemokines, such as interferon-γ). CAR T cells of this type can, for example, be used in animal models, for example for the treatment of tumor xenografts.
Подходы, такие как вышеизложенные, можно адаптировать для обеспечения способов лечения и/или повышения выживаемости субъекта, имеющего заболевание, такое как новообразование, например, с помощью введения эффективного количества иммунореактивных клеток, содержащих распознающий антиген рецептор, которые связывается с определенным антигеном, где связывание активирует иммунореактивную клетку, тем самым при этом осуществляется лечение или предупреждение заболевания (такого как новообразование, патогенная инфекция, аутоиммунное заболевание или реакция на аллогенный трансплантат). Дозирование в видах лечения на основе CAR T-клеток может, например, предусматривать введение от 106 до 109 клеток/кг, с курсом или без курса противолимфомной терапии, например, с помощью циклофосфамида.Approaches such as those described above can be adapted to provide methods for treating and/or improving the survival of a subject having a disease, such as a neoplasm, for example, by administering an effective amount of immunoresponsive cells comprising an antigen recognition receptor that binds to a particular antigen, wherein the binding activates the immunoresponsive cell, thereby treating or preventing the disease (such as a neoplasm, a pathogenic infection, an autoimmune disease, or a reaction to an allogeneic transplant). Dosing in CAR T cell-based therapies can, for example, involve administering 10 6 to 10 9 cells/kg, with or without a course of anti-lymphoma therapy, such as cyclophosphamide.
В одном варианте осуществления лечение можно назначать пациентам, проходящим иммуносупрессивное лечение. Клетки или популяцию клеток можно сделать устойчивыми по меньшей мере к одному иммуносупрессивному средству в результате инактивации гена, кодирующего рецептор для такого иммуносупрессивного средства. Не ограничиваясь теорией, иммуносупрессивное лечение должно облегчать отбор и разращивание иммунореактивных клеток или T-клеток в соответствии с настоящим изобретением у пациента.In one embodiment, the treatment can be administered to patients undergoing immunosuppressive treatment. The cells or population of cells can be rendered resistant to at least one immunosuppressive agent by inactivating a gene encoding a receptor for such an immunosuppressive agent. Without being limited by theory, the immunosuppressive treatment should facilitate the selection and expansion of immunoreactive cells or T cells in accordance with the present invention in the patient.
Введение клеток или популяции клеток в соответствии с настоящим изобретением можно выполнять любым удобным способом, в том числе с помощью аэрозольной ингаляции, инъекции, поглощения, трансфузии, имплантации или трансплантации. Клетки или популяцию клеток можно вводить пациенту подкожно, внутрикожно, внутрь опухоли, внутрь узла, интрамедуллярно, внутримышечно, с помощью внутривенной или внутрилимфатической инъекции или внутрибрюшинно. В одном варианте осуществления клеточные композиции по настоящему изобретению предпочтительно вводят с помощью внутривенной инъекции.The administration of the cells or cell population according to the present invention can be performed by any convenient method, including by aerosol inhalation, injection, absorption, transfusion, implantation or transplantation. The cells or cell population can be administered to the patient subcutaneously, intradermally, intratumorally, intranodularly, intramedullary, intramuscularly, by intravenous or intralymphatic injection or intraperitoneally. In one embodiment, the cellular compositions of the present invention are preferably administered by intravenous injection.
Введение клеток или популяции клеток может состоять из введения 104- 109 клеток на кг массы тела, предпочтительно от 105 до 106 клеток/кг массы тела, включая целые значения числа клеток в пределах этих диапазонов. Дозирование в видах лечения на основе CAR T-клеток может, например, предусматривать введение от 106 до 109 клеток/кг, с курсом или без курса противолимфомной терапии, например, с помощью циклофосфамида. Клетки или популяцию клеток можно вводить в одной или нескольких дозах. В другом варианте осуществления эффективное количество клеток вводят в виде одной дозы. В другом варианте осуществления эффективное количество клеток вводят в виде более чем одной дозы в течение периода времени. Определение времени введения находится в пределах компетенции лечащего врача и зависит от клинического состояния пациента. Клетки или популяцию клеток можно получать из любого источника, такого как банк крови или донор. Принимая во внимание то, что потребности индивидуумов варьируют, определение оптимальных диапазонов эффективных количеств определенного типа клеток для определенных заболеваний или состояний находится в пределах компетенции специалиста в данной области. Эффективное количество означает количество, которое обеспечивает терапевтическое или профилактическое преимущество. Вводимая доза может зависеть от возраста, состояния здоровья и веса реципиента, вида сопутствующего лечения, при необходимости, частоты лечения и природы желаемого эффекта.The administration of the cells or cell population may comprise the administration of 10 4 - 10 9 cells per kg body weight, preferably 10 5 to 10 6 cells/kg body weight, including integer cell numbers within these ranges. Dosing in CAR T cell-based therapies may, for example, comprise the administration of 10 6 to 10 9 cells/kg, with or without a course of anti-lymphoma therapy, such as cyclophosphamide. The cells or cell population may be administered in one or more doses. In another embodiment, an effective amount of cells is administered in a single dose. In another embodiment, an effective amount of cells is administered in more than one dose over a period of time. The timing of administration is within the discretion of the treating physician and depends on the clinical condition of the patient. The cells or cell population may be obtained from any source, such as a blood bank or a donor. Given that individual needs vary, it is within the skill of the art to determine optimal ranges of effective amounts of a particular cell type for a particular disease or condition. An effective amount is an amount that provides a therapeutic or prophylactic benefit. The dose administered may depend on the age, health, and weight of the recipient, the type of concomitant treatment, if any, the frequency of treatment, and the nature of the desired effect.
В другом варианте осуществления эффективное количество клеток или композиции, содержащей такие клетки, вводят парентерально. Введение может представлять собой внутривенное введение. Введение может быть выполнено непосредственно с помощью инъекции в опухоль.In another embodiment, an effective amount of cells or a composition containing such cells is administered parenterally. The administration may be intravenous administration. The administration may be performed directly by injection into the tumor.
Для предупреждения возможных побочных реакций сконструированные иммунореактивные клетки могут быть оснащены предохранителем в форме трансгена, который делает клетки восприимчивыми к воздействию специфического сигнала. Например, в этом отношении можно использовать ген тимидинкиназы вируса простого герпеса (TK), например, с помощью введения в аллогенные T-лимфоциты, используемые в качестве инфузий донорских лимфоцитов после трансплантации стволовых клеток (Greco, et al., Improving the safety of cell therapy with the TK-suicide gene. Front. Pharmacol. 2015; 6: 95). В таких клетках введение пролекарства на основе нуклеозидов, такого как ганцикловир или ацикловир, вызывает клеточную смерть. Альтернативные конструкции предохранителей включают индуцируемую каспазу 9, например, активируемую введением низкомолекулярного димера, который соединяет две нефункциональные молекулы icasp9 с образованием активного фермента. Было описано широкое разнообразие альтернативных подходов для осуществления контроля пролиферации клеток (см. публикацию заявки на патент США № 20130071414; публикацию заявки на патент согласно PCT WO2011146862; публикацию заявки на патент согласно PCT WO2014011987; публикацию заявки на патент согласно PCT WO2013040371; Zhou et al. BLOOD, 2014, 123/25:3895 - 3905; Di Stasi et al., The New England Journal of Medicine 2011; 365:1673-1683; Sadelain M, The New England Journal of Medicine 2011; 365:1735-173; Ramos et al., Stem Cells 28(6):1107-15 (2010)).To prevent potential adverse reactions, engineered immunoresponsive cells can be equipped with a safety device in the form of a transgene that renders the cells susceptible to the action of a specific signal. For example, the herpes simplex virus thymidine kinase (TK) gene can be used in this regard, for example by introducing it into allogeneic T lymphocytes used as donor lymphocyte infusions after stem cell transplantation (Greco, et al., Improving the safety of cell therapy with the TK-suicide gene. Front. Pharmacol. 2015; 6: 95). In such cells, introduction of a nucleoside prodrug such as ganciclovir or acyclovir induces cell death. Alternative safety device designs include inducible caspase 9, for example activated by introduction of a small molecule dimer that joins two non-functional icasp9 molecules to form the active enzyme. A wide variety of alternative approaches have been described for controlling cell proliferation (see U.S. Patent Application Publication No. 20130071414; PCT Patent Application Publication WO2011146862; PCT Patent Application Publication WO2014011987; PCT Patent Application Publication WO2013040371; Zhou et al. BLOOD, 2014, 123/25:3895-3905; Di Stasi et al., The New England Journal of Medicine 2011; 365:1673-1683; Sadelain M, The New England Journal of Medicine 2011; 365:1735-173; Ramos et al., Stem Cells 28(6):1107-15 (2010)).
При дополнительном усовершенствовании видов адоптивной терапии редактирование генома можно применять для приспособления иммунореактивных клеток к альтернативным вариантам осуществления, например, с получением отредактированных CAR T-клеток (см. Poirot et al., 2015, Multiplex genome edited T-cell manufacturing platform for "off-the-shelf" adoptive T-cell immunotherapies, Cancer Res 75 (18): 3853). Клетки можно редактировать с помощью системы CRISPR и способа ее применения, описанного в данном документе. Системы CRISPR могут быть доставлены в иммунную клетку с помощью любого способа, описанного в данном документе. В предпочтительных вариантах осуществления клетки редактируют ex vivo и переносят в субъекта, нуждающегося в этом. Можно редактировать иммунореактивные клетки, CAR T-клетки или любые клетки для адоптивного клеточного переноса. Редактирование можно выполнять с целью устранения потенциальных аллореактивных T-клеточных рецепторов (TCR), нарушения мишени хемотерапевтического средства, блокирования иммунной контрольной точки, активации T-клетки и/или повышения дифференцировки и/или пролиферации функционально истощенных или дисфункциональных CD8+ T-клеток (см. публикации на патент согласно PCT WO2013176915, WO2014059173, WO2014172606, WO2014184744 и WO2014191128). Редактирование может приводить к инактивации гена.In further improving adoptive therapies, genome editing can be used to adapt immunoresponsive cells to alternative embodiments, such as to produce edited CAR T cells (see Poirot et al., 2015, Multiplex genome edited T-cell manufacturing platform for "off-the-shelf" adoptive T-cell immunotherapies, Cancer Res 75 (18): 3853). The cells can be edited using the CRISPR system and method of using it described herein. The CRISPR systems can be delivered to the immune cell using any method described herein. In preferred embodiments, the cells are edited ex vivo and transferred to a subject in need thereof. Immunoresponsive cells, CAR T cells, or any cells for adoptive cell transfer can be edited. Editing may be performed to eliminate potential alloreactive T cell receptors (TCRs), disrupt the target of a chemotherapeutic agent, block an immune checkpoint, activate a T cell, and/or enhance the differentiation and/or proliferation of functionally exhausted or dysfunctional CD8+ T cells (see PCT Patent Publications WO2013176915, WO2014059173, WO2014172606, WO2014184744, and WO2014191128). Editing may result in gene inactivation.
Под инактивацией гена предполагается, что представляющий интерес ген не экспрессируется в форме функционального белка. В конкретном варианте осуществления система CRISPR специфично катализирует расщепление в одном целевом гене, тем самым инактивируя указанный целевой ген. Вызванные разрывы нити нуклеиновой кислоты обычно репарируются с помощью различных механизмов гомологичной рекомбинации или негомологичного соединения концов (NHEJ). Однако NHEJ представляет собой несовершенный процесс репарации, который часто приводит к изменениям последовательности ДНК в сайте расщепления. Репарация посредством негомологичного соединения концов (NHEJ) часто приводит к небольшим вставкам или делециям (вставкам/делециям) и может быть использована для получения определенных нокаутов генов. Клетки, в которых произошло явление индуцированного расщеплением мутагенеза, можно идентифицировать и/или отобрать с помощью общеизвестных способов в данной области.By gene inactivation is meant that the gene of interest is not expressed as a functional protein. In a specific embodiment, the CRISPR system specifically catalyzes cleavage in one target gene, thereby inactivating said target gene. The resulting nucleic acid strand breaks are typically repaired by various mechanisms of homologous recombination or non-homologous end joining (NHEJ). However, NHEJ is an imperfect repair process that often results in changes in the DNA sequence at the cleavage site. Non-homologous end joining (NHEJ) repair often results in small insertions or deletions (insertions/deletions) and can be used to obtain specific gene knockouts. Cells in which the cleavage-induced mutagenesis phenomenon has occurred can be identified and/or selected using well-known methods in the art.
T-клеточные рецепторы (TCR) представляют собой рецепторы клеточной поверхности, которые участвуют в активации T-клеток в ответ на представление антигена. TCR, как правило, состоит из двух цепей, α и β, которые собираются с образованием гетеродимера, и связывается с CD3-трансдуцирующими субъединицами, с образованием комплекса T-клеточного рецептора, присутствующего на клеточной поверхности. Каждая α- и β-цель TCR состоит из иммуноглобулин-подобной N-концевой вариабельной (V) и константной (C) области, гидрофобного трансмембранного домена и короткого цитоплазматического участка. Как в случае иммуноглобулиновых молекул, вариабельную область α-и β-целей получают с помощью V(D)J рекомбинации, создавая большое разнообразие антигенных специфичностей в пределах популяции T-клеток. Однако в отличие от иммуноглобулинов, которые распознают интактный антиген, T-клетки активируются с помощью процессированных пептидных фрагментов в сочетании с молекулой MHC, вводящей дополнительную область для распознавания антигенов T-клетками, известную как MHC-рестрикция. Распознавание несовпадений MHC между донором и реципиентом посредством T-клеточного рецептора приводит к T-клеточной пролиферации и потенциальному развитию реакции "трансплантат против хозяина" (GVHD). Инактивация TCRα или TCRβ может приводить к элиминации TCR с поверхности T-клеток, предупреждая распознавание аллоантигена и, таким образом, GVHD. Однако нарушение TCR, как правило, приводит к элиминации CD3 сигнального компонента и изменяет способы дальнейшего разращивания T-клеток.T cell receptors (TCRs) are cell surface receptors that are involved in the activation of T cells in response to antigen presentation. The TCR typically consists of two chains, α and β, that assemble to form a heterodimer and associate with CD3 transducing subunits to form the T cell receptor complex present on the cell surface. The α and β targets of the TCR each consist of an immunoglobulin-like N-terminal variable (V) and constant (C) region, a hydrophobic transmembrane domain, and a short cytoplasmic region. As with immunoglobulin molecules, the variable region of the α and β targets is generated by V(D)J recombination, creating a wide variety of antigen specificities within the T cell population. However, unlike immunoglobulins, which recognize intact antigen, T cells are activated by processed peptide fragments in combination with an MHC molecule, introducing an additional region for T cell antigen recognition known as the MHC restriction site. Recognition of MHC mismatches between donor and recipient via the T cell receptor leads to T cell proliferation and potential development of graft-versus-host disease (GVHD). Inactivation of TCRα or TCRβ can result in the elimination of TCR from the T cell surface, preventing alloantigen recognition and thus GVHD. However, disruption of the TCR typically results in the elimination of the CD3 signaling component and alters the pathways for further T cell expansion.
Аллогенные клетки быстро отторгаются иммунной системой хозяина. Было показано, что аллогенные лейкоциты, присутствующие в необлученных продуктах крови, сохраняются не более 5-6 дней (Boni, Muranski et al. 2008 Blood 1;112(12):4746-54). Таким образом, для предупреждения отторжения аллогенных клеток, иммунную систему хозяина, как правило, необходимо подавлять до некоторой степени. Однако в случае адоптивного клеточного переноса применение иммуносупрессивных препаратов также оказывает вредное воздействие на введенные с терапевтической целью T-клетки. Таким образом, для эффективного применения подхода на основе адоптивной иммунотерапии в этих условиях введенные клетки должны быть устойчивыми к иммуносупрессивному лечению. Таким образом, в конкретном варианте осуществления настоящее изобретение дополнительно предусматривает стадию модификации T-клеток для придания им устойчивости к иммуносупрессивному средству, предпочтительно с помощью инактивации по меньшей мере одного гена, кодирующего иммуносупрессивное средство. Иммуносупрессивное средство представляет собой средство, которое подавляет иммунную функцию посредством одного из нескольких механизмов действия. Иммуносупрессивное средство может представлять собой без ограничения ингибитор кальциневрина, мишень для рапамицина, блокатор α-цепи рецептора интерлейкина 2, ингибитор инозинмонофосфатдегидрогеназы, ингибитор редуктазы дигидрофолиевой кислоты, кортикостероид или иммуносупрессивный антиметаболит. Настоящее изобретение предусматривает придание T-клеткам устойчивости к иммуносупрессорам с целью иммунотерапии с помощью инактивации мишени иммуносупрессивного средства в T-клетках. В качестве неограничивающих примеров мишени для иммуносупрессивного средства могут представлять собой рецептор для иммуносупрессивного средства, такой как CD52, глюкокортикоидный рецептор (GR), представитель семейства генов FKBP и представитель семейства генов циклофилина.Allogeneic cells are rapidly rejected by the host immune system. Allogeneic leukocytes present in non-irradiated blood products have been shown to survive for no more than 5-6 days (Boni, Muranski et al. 2008 Blood 1;112(12):4746-54). Thus, to prevent rejection of allogeneic cells, the host immune system typically needs to be suppressed to some extent. However, in the case of adoptive cell transfer, the use of immunosuppressive drugs also has a detrimental effect on the therapeutically administered T cells. Thus, for an adoptive immunotherapy approach to be effective in these settings, the administered cells must be resistant to immunosuppressive treatment. Thus, in a specific embodiment, the present invention further provides the step of modifying the T cells to render them resistant to an immunosuppressive agent, preferably by inactivating at least one gene encoding an immunosuppressive agent. An immunosuppressant is an agent that suppresses immune function through one of several mechanisms of action. An immunosuppressant may be, but is not limited to, a calcineurin inhibitor, a target of rapamycin, an interleukin 2 receptor alpha chain blocker, an inosine monophosphate dehydrogenase inhibitor, a dihydrofolic acid reductase inhibitor, a corticosteroid, or an immunosuppressive antimetabolite. The present invention provides for rendering T cells resistant to immunosuppressants for immunotherapy by inactivating a target of an immunosuppressant in T cells. As non-limiting examples, targets of an immunosuppressant may be a receptor for an immunosuppressant such as CD52, a glucocorticoid receptor (GR), a member of the FKBP gene family, and a member of the cyclophilin gene family.
Иммунные контрольные точки представляют собой ингибирующие пути, которые замедляют или останавливают иммунные реакции и предупреждают избыточное разрушение тканей в результате неконтролируемой активности иммунных клеток. В определенных вариантах осуществления целевая иммунная контрольная точка представляет собой ген программируемой смерти 1 (PD-1 или CD279) (PDCD1). В других вариантах осуществления иммунная контрольная точка, на которую оказывают воздействие, представляет собой антиген, ассоциированный с цитотоксическим T-лимфоцитом (CTLA-4). В дополнительных вариантах осуществления целевая иммунная контрольная точка представляет собой другой представитель суперсемейства CD28 и CTLA4 Ig, такой как BTLA, LAG3, ICOS, PDL1 или KIR. В дополнительных вариантах осуществления целевая иммунная контрольная точка представляет собой представителя суперсемейства TNFR, такой как CD40, OX40, CD137, GITR, CD27 или TIM-3.Immune checkpoints are inhibitory pathways that slow or stop immune responses and prevent excessive tissue destruction due to uncontrolled immune cell activity. In certain embodiments, the target immune checkpoint is programmed death gene 1 (PD-1 or CD279) (PDCD1). In other embodiments, the immune checkpoint being targeted is cytotoxic T lymphocyte-associated antigen (CTLA-4). In further embodiments, the target immune checkpoint is another member of the CD28 and CTLA4 Ig superfamily, such as BTLA, LAG3, ICOS, PDL1, or KIR. In further embodiments, the target immune checkpoint is a member of the TNFR superfamily, such as CD40, OX40, CD137, GITR, CD27, or TIM-3.
Дополнительные иммунные контрольные точки включают содержащую домен с гомологией 2 Src протеинтирозинфосфатазу 1 (SHP-1) (Watson HA, et al., SHP-1: the next checkpoint target for cancer immunotherapy? Biochem Soc Trans. 2016 Apr 15;44(2):356-62). SHP-1 представляет собой широко экспрессируемую ингибирующую протеинтирозинфосфатазу (PTP). В T-клетках она является отрицательным регулятором антигензависимой активации и пролиферации. Она представляет собой цитозольный белок и поэтому не пригодна для опосредованных антителами видов терапии, однако ее роль в активации и пролиферации делает ее привлекательной мишенью для генетической манипуляции в стратегиях адоптивного переноса, например, Т-клеток с химерными антигенными рецепторами (CAR). Иммунные контрольные точки могут также включать T-клеточный иммунорецептор с Ig и ITIM доменами (TIGIT/Vstm3/WUCAM/VSIG9) и VISTA (Le Mercier I, et al., (2015) Beyond CTLA-4 and PD-1, the generation Z of negative checkpoint regulators. Front. Immunol. 6:418).Additional immune checkpoints include Src homology 2 domain-containing protein tyrosine phosphatase 1 (SHP-1) (Watson HA, et al., SHP-1: the next checkpoint target for cancer immunotherapy? Biochem Soc Trans. 2016 Apr 15;44(2):356-62). SHP-1 is a widely expressed inhibitory protein tyrosine phosphatase (PTP). In T cells, it is a negative regulator of antigen-dependent activation and proliferation. It is a cytosolic protein and therefore not amenable to antibody-mediated therapies, but its role in activation and proliferation makes it an attractive target for genetic manipulation in adoptive transfer strategies such as chimeric antigen receptor (CAR) T cells. Immune checkpoints may also include the T-cell immunoreceptor with Ig and ITIM domains (TIGIT/Vstm3/WUCAM/VSIG9) and VISTA (Le Mercier I, et al., (2015) Beyond CTLA-4 and PD-1, the generation Z of negative checkpoint regulators. Front. Immunol. 6:418).
WO2014172606 относится к применению ингибиторов MT1 и/или MT1 для повышения пролиферации и/или активности истощенных CD8+ T-клеток и для снижения CD8+ T-клеточного истощения (например, снижения функциональных свойств истощенных или невосприимчивых CD8+ иммунных клеток). В определенных вариантах осуществления металлотионеины подвергаются нацеливанию с помощью редактирования генов в адоптивно перенесенных T-клетках.WO2014172606 relates to the use of MT1 and/or MT1 inhibitors to enhance the proliferation and/or activity of exhausted CD8+ T cells and to reduce CD8+ T cell exhaustion (e.g., a decrease in the functional properties of exhausted or unresponsive CD8+ immune cells). In certain embodiments, metallothioneins are targeted by gene editing in adoptively transferred T cells.
В определенных вариантах осуществления мишени редактирования генов могут представлять собой по меньшей мере один целевой локус, участвующий в экспрессии белка иммунной контрольной точки. Такие мишени могут включают без ограничения CTLA4, PPP2CA, PPP2CB, PTPN6, PTPN22, PDCD1, ICOS (CD278), PDL1, KIR, LAG3, HAVCR2, BTLA, CD160, TIGIT, CD96, CRTAM, LAIR1, SIGLEC7, SIGLEC9, CD244 (2B4), TNFRSF10B, TNFRSF10A, CASP8, CASP10, CASP3, CASP6, CASP7, FADD, FAS, TGFBRII, TGFRBRI, SMAD2, SMAD3, SMAD4, SMAD10, SKI, SKIL, TGIF1, IL10RA, IL10RB, HMOX2, IL6R, IL6ST, EIF2AK4, CSK, PAG1, SIT1, FOXP3, PRDM1, BATF, VISTA, GUCY1A2, GUCY1A3, GUCY1B2, GUCY1B3, MT1, MT2, CD40, OX40, CD137, GITR, CD27, SHP-1 или TIM-3. В предпочтительных вариантах осуществления генный локус, участвующий в экспрессии генов PD-1 или CTLA-4, является целевым. В других предпочтительных вариантах осуществления комбинации генов являются целевыми, такие как без ограничения PD-1 и TIGIT.In certain embodiments, gene editing targets may be at least one target locus involved in the expression of an immune checkpoint protein. Such targets may include, but are not limited to, CTLA4, PPP2CA, PPP2CB, PTPN6, PTPN22, PDCD1, ICOS (CD278), PDL1, KIR, LAG3, HAVCR2, BTLA, CD160, TIGIT, CD96, CRTAM, LAIR1, SIGLEC7, SIGLEC9, CD244 (2B4), TNFRSF10B, TNFRSF10A, CASP8, CASP10, CASP3, CASP6, CASP7, FADD, FAS, TGFBRII, TGFRBRI, SMAD2, SMAD3, SMAD4, SMAD10, SKI, SKIL, TGIF1, IL10RA, IL10RB, HMOX2, IL6R, IL6ST, EIF2AK4, CSK, PAG1, SIT1, FOXP3, PRDM1, BATF, VISTA, GUCY1A2, GUCY1A3, GUCY1B2, GUCY1B3, MT1, MT2, CD40, OX40, CD137, GITR, CD27, SHP-1, or TIM-3. In preferred embodiments, a gene locus involved in the expression of the PD-1 or CTLA-4 genes is targeted. In other preferred embodiments, combinations of genes are targeted, such as, but not limited to, PD-1 and TIGIT.
В других вариантах осуществления по меньшей мере два гена редактируют. Пары генов могут включать без ограничения PD1 и TCRα, PD1 и TCRβ, CTLA-4 и TCRα, CTLA-4 и TCRβ, LAG3 и TCRα, LAG3 и TCRβ, Tim3 и TCRα, Tim3 и TCRβ, BTLA и TCRα, BTLA и TCRβ, BY55 и TCRα, BY55 и TCRβ, TIGIT и TCRα, TIGIT и TCRβ, B7H5 и TCRα, B7H5 и TCRβ, LAIR1 и TCRα, LAIR1 и TCRβ, SIGLEC10 и TCRα, SIGLEC10 и TCRβ, 2B4 и TCRα, 2B4 и TCRβ.In other embodiments, at least two genes are edited. Gene pairs may include, but are not limited to, PD1 and TCRα, PD1 and TCRβ, CTLA-4 and TCRα, CTLA-4 and TCRβ, LAG3 and TCRα, LAG3 and TCRβ, Tim3 and TCRα, Tim3 and TCRβ, BTLA and TCRα, BTLA and TCRβ, BY55 and TCRα, BY55 and TCRβ, TIGIT and TCRα, TIGIT and TCRβ, B7H5 and TCRα, B7H5 and TCRβ, LAIR1 and TCRα, LAIR1 and TCRβ, SIGLEC10 and TCRα, SIGLEC10 and TCRβ, 2B4 and TCRα, 2B4 and TCRβ.
Вне зависимости от того, является ли модификация Т-клеток предварительной или последующей, T-клетки можно активировать и размножать, как правило, с помощью способов, описанных, например, в патентах США 6352694; 6534055; 6905680; 5858358; 6887466; 6905681; 7144575; 7232566; 7175843; 5883223; 6905874; 6797514; 6867041 и 7572631. T-клетки можно размножать in vitro или in vivo.Regardless of whether the modification of T cells is pre- or post-modification, T cells can be activated and expanded, typically using methods described in, for example, U.S. Patents 6,352,694; 6,534,055; 6,905,680; 5,858,358; 6,887,466; 6,905,681; 7,144,575; 7,232,566; 7,175,843; 5,883,223; 6,905,874; 6,797,514; 6,867,041; and 7,572,631. T cells can be expanded in vitro or in vivo.
Практическое осуществление настоящего изобретения предусматривает, если не указано иное, традиционные методики иммунологии, биохимии, химии, молекулярной биологии, микробиологии, клеточной биологии, геномики и технологию рекомбинантной ДНК, которые находятся в пределах квалификации специалиста в данной области. См. MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989) (Sambrook, Fritsch and Maniatis); MOLECULAR CLONING: A LABORATORY MANUAL, 4th edition (2012) (Green and Sambrook); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (1987) (F. M. Ausubel, et al. eds.); серию METHODS IN ENZYMOLOGY (Academic Press, Inc.); PCR 2: A PRACTICAL APPROACH (1995) (M.J. MacPherson, B.D. Hames and G.R. Taylor eds.); ANTIBODIES, A LABORATORY MANUAL (1988) (Harlow and Lane, eds.); ANTIBODIES A LABORATORY MANUAL, 2nd edition (2013) (E.A. Greenfield ed.); and ANIMAL CELL CULTURE (1987) (R.I. Freshney, ed.).The practice of the present invention will employ, unless otherwise indicated, conventional techniques of immunology, biochemistry, chemistry, molecular biology, microbiology, cell biology, genomics, and recombinant DNA technology, all of which are within the skill of the art. See MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989) (Sambrook, Fritsch and Maniatis); MOLECULAR CLONING: A LABORATORY MANUAL, 4th edition (2012) (Green and Sambrook); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (1987) (F. M. Ausubel, et al. eds.); METHODS IN ENZYMOLOGY series (Academic Press, Inc.); PCR 2: A PRACTICAL APPROACH (1995) (M.J. MacPherson, B.D. Hames and G.R. Taylor eds.); ANTIBODIES, A LABORATORY MANUAL (1988) (Harlow and Lane, eds.); ANTIBODIES A LABORATORY MANUAL, 2nd edition (2013) (E.A. Greenfield ed.); and ANIMAL CELL CULTURE (1987) (R.I. Freshney, ed.).
Практическое осуществление настоящего изобретения предусматривает, если не указано иное, стандартные методики получения генетически модифицированных мышей. См. Marten H. Hofker and Jan van Deursen, TRANSGENIC MOUSE METHODS AND PROTOCOLS, 2nd edition (2011).The practice of the present invention involves, unless otherwise indicated, standard techniques for producing genetically modified mice. See Marten H. Hofker and Jan van Deursen, TRANSGENIC MOUSE METHODS AND PROTOCOLS, 2nd edition (2011).
ALSALS
В публикации заявки на патент США № 20110023144 описывается применение нуклеаз с "цинковыми пальцами" для генетической модификации клеток, животных и белков, ассоциированных с заболеванием амиотрофическим латеральным склерозом (ALS). ALS характеризуется постепенной прогрессирующей дегенерацией определенных нервных клеток в коре головного мозга, стволе головного мозга и спинном мозге, связанных с произвольными движениями.U.S. Patent Application Publication No. 20110023144 describes the use of zinc finger nucleases to genetically modify cells, animals, and proteins associated with the disease amyotrophic lateral sclerosis (ALS). ALS is characterized by gradual, progressive degeneration of certain nerve cells in the cerebral cortex, brainstem, and spinal cord that are involved in voluntary movement.
Что касается нарушения, связанного с двигательными нейронами, белки, ассоциированные с этими нарушениями, представляют собой разнородную группу белков, которые оказывают влияние на восприимчивость к развитию нарушения, связанного с двигательными нейронами, наличие нарушения, связанного с двигательными нейронами, тяжесть нарушения, связанного с двигательными нейронами, или любую их комбинацию. Настоящее раскрытие предусматривает редактирование любых хромосомных последовательностей, которые кодируют белки, ассоциированные с заболеванием, связанным с ALS, специфическим нарушением, связанным с двигательными нейронами. Белки, ассоциированные с ALS, как правило, выбирают исходя из экспериментально установленной взаимосвязи белков, связанных с ALS, с нарушением по типу ALS. Например, скорость образования или концентрация в кровотоке белка, ассоциированного с ALS, может быть повышенной или пониженной в популяции с ALS по сравнению с популяцией без ALS. Различия по уровням белка можно оценить с помощью протеомных методик, в том числе без ограничения вестерн-блоттинга, иммуногистохимического окрашивания, твердофазного иммуноферментного анализа (ELISA) и масс-спектрометрии. Альтернативно белки, ассоциированные с ALS, можно идентифицировать путем получения профилей экспрессии генов для генов, кодирующих белки, с помощью методик геномного анализа, в том числе без ограничения микроматричного анализа ДНК, последовательного анализа экспрессии генов (SAGE) и количественной полимеразной цепной реакции в режиме реального времени (Q-PCR).With respect to a disorder associated with motor neurons, proteins associated with these disorders are a diverse group of proteins that influence susceptibility to developing a disorder associated with motor neurons, the presence of a disorder associated with motor neurons, the severity of a disorder associated with motor neurons, or any combination thereof. The present disclosure contemplates editing any chromosomal sequences that encode proteins associated with an ALS-related disease, a specific disorder associated with motor neurons. Proteins associated with ALS are typically selected based on an experimentally established relationship of ALS-related proteins with an ALS-type disorder. For example, the rate of formation or the concentration in the bloodstream of a protein associated with ALS may be increased or decreased in a population with ALS compared to a population without ALS. Differences in protein levels can be assessed using proteomic techniques, including but not limited to Western blotting, immunohistochemical staining, enzyme-linked immunosorbent assay (ELISA), and mass spectrometry. Alternatively, ALS-associated proteins can be identified by gene expression profiling of protein-coding genes using genomic analysis techniques, including but not limited to DNA microarray analysis, sequence-based analysis of gene expression (SAGE), and quantitative real-time polymerase chain reaction (Q-PCR).
В качестве неограничивающего примера белки, ассоциированные с ALS, включают без ограничения следующие белки: SOD1 - растворимая супероксиддисмутаза 1, ALS3 - белок 3, связанный с амиотрофическим латеральным склерозом, SETX - сенатаксин, ALS5 - белок 5, связанный с амиотрофическим латеральным склерозом, FUS - РНК-связывающий белок FUS (слит при саркоме), ALS7 - белок 7, связанный с амиотрофическим латеральным склерозом, ALS2 - белок 2, связанный с амиотрофическим латеральным склерозом, DPP6 - дипептидилпептидаза 6, NEFH - тяжелый полипептид нейрофиламента, PTGS1 - простагландин-эндопероксидсинтазы 1, SLC1A2 - семейство 1 переносчиков растворенных веществ (глутаматный транспортер глиальных клеток с высоким сродством), представитель 2, TNFRSF10B - фактор некроза опухоли, суперсемейство рецепторов, представитель 10b, PRPH - периферин, HSP90AA1 - 90 кДа белок теплового шока альфа (цитозольный), класс A представитель 1, GRIA2 - глутаматный рецептор, ионотропный, AMPA 2, IFNG - интерферон, гамма, S100B - S100, кальций-связывающий белок B, FGF2 - фактор 2 роста фибробластов, AOX1 - альдегидоксидаза 1, CS - цитратсинтаза, TARDBP - TAR ДНК-связывающий белок, TXN - тиоредоксин, RAPH1 - Ras-ассоциированный белок, (RaIGDS/AF-6) и киназа 5 с доменами 1, характеризующимися гомологией с плекстрином, MAP3K5 - митоген-активируемая протеинкиназа, NBEAL1 - белок 1, подобный нейробичину, GPX1 - глутатионпероксидаза 1, ICA1L - подобный 1,69 кДа-аутоантигену островковых клеток, RAC1 - ras-родственный белок, подобный субстрату 1 ботулинического C3 токсина, MAPT - белок tau, ассоциированный с микротрубочками, ITPR2 - рецептор инозитол-1,4,5-трифосфата, тип 2, ALS2CR4 - кандидатный участок 4 хромосомы для белка 2, связанного с амиотрофическим латеральным склерозом (ювенильным), GLS - глутаминаза, ALS2CR8 - кандидатный участок 8 хромосомы для белка 2, связанного с амиотрофическим латеральным склерозом (ювенильным), CNTFR - рецептор для цилиарного нейротрофического фактора, ALS2CR11 - кандидатный участок 11 хромосомы для белка 2, связанного с амиотрофическим латеральным склерозом (ювенильным), FOLH1 - фолатгидролаза 1, FAM117B - семейство белков со сходством последовательности с белком 117, представитель B, P4HB - пролил-4-гидроксилаза, полипептид бета, CNTF - цилиарный нейротрофический фактор, SQSTM1 - секвестосома 1, STRADB - STE20-родственная киназа, бета-адаптерная, NAIP - семейство NLR, связанный с апоптозом ингибиторный белок, YWHAQ - тирозиназа/триптофан-5-монооксигеназа активирующий белок, полипептид тета, SLC33A1 - семейство 33 переносчиков растворенных веществ (ацетил-CoA транспортеры), представитель 1, TRAK2 - транспортный белок, кинезин-связывающий 2, фиг. 4, гомолог, содержащий домен фосфатазы липидов SAC1, NIF3L1 - NIF3 NGG1-взаимодействующий фактор 3, подобный 1, INA - интернексин, нейрональный промежуточный филаментный белок, альфа, PARD3B - белок par-3 (partitioning defective 3), гомолога B, COX8A - цитохром c оксидаза, субъединица VIIIA, CDK15 - циклин-зависимая киназа, HECW1 HECT - белок, содержащий домен C2 и WW 15, E3 - лигаза 1 убиквитинового белка, NOS1 - синтаза 1 оксида азота, MET - протоонкоген met, SOD2 - митохондриальная супероксиддисмутаза 2, HSPB1 - 27 кДа белок 1 теплового шока, NEFL - легкий полипептид нейрофиламента, CTSB - катепсин B, ANG - ангиогенин, рибонуклеаза ANG - ангиогенин, рибонуклеаза, РНКаза семейства 5, HSPA8 - 70 кДа белок теплового шока 8, VAPB VAMP (ассоциированный с везикулами мембранный белок)-ассоциированные белки B и C, ESR1 - эстрогеновый рецептор 1, SNCA -синуклеин, альфа, HGF - фактор роста гепатоцитов, CAT - каталаза, ACTB - актин, бета, NEFM - среднего размера полипептид нейрофиламента, TH - тирозингидроксилаза, BCL2 - белок 2 B-клеток, связанный с CLL/лимфомой, FAS - Fas (суперсемейство рецепторов TNF, представитель 6), CASP3 - каспаза 3, связанная с апоптозом цистеинпептидаза, CLU - кластерин, SMN1 - белок, связанный с выживанием двигательных нейронов, G6PD - глюкозо-6-фосфатдегидрогеназа 1, BAX BCL2-ассоциированный белок X, HSF1 - транскрипционный фактор 1 белка теплового шока, RNF19A - белок 19A с доменом ring, JUN - онкоген jun, ALS2CR12 - кандидатный участок 12 хромосомы для белка 2, связанного с амиотрофическим латеральным склерозом (ювенильным), HSPA5 - 70 кДа белок 5 теплового шока, MAPK14 - митоген-активируемая протеинкиназа 14, IL10 - интерлейкин 10, APEX1 - APEX-нуклеаза (мультифункциональный фермент репарации ДНК), TXNRD1 - тиоредоксинредуктаза 1, NOS2 - индуцируемая синтаза 2 оксида азота, TIMP1 - TIMP - ингибитор 1 металлопептидазы, CASP9 - каспаза 9, связанная с апоптозом цистеинпептидаза, XIAP - сцепленный с X-хромосомой ингибитор апоптоза, GLG1 - гликопротеин 1 комплекса Гольджи, EPO - эритропоэтин, VEGFA - фактор роста эндотелия сосудов A, ELN - эластин, GDNF - нейротрофический фактор, полученный из глиальных клеток, NFE2L2 - белок 2, подобный ядерному фактору (эритроидному), SLC6A3 - представитель 3 семейства 6 переносчиков растворенных веществ (транспортер нейротрансмиттеров, допаминовый), HSPA4 - 70 кДа белок 4 теплового шока, APOE - аполипопротеин E, PSMB8 - субъединица протеасомы (просома, макропаин), тип бета, 8, DCTN1 - динактин 1, TIMP3 - TIMP - ингибитор 3 металлопептидазы, KIFAP3 - кинезин-ассоциированный белок 3, SLC1A1 - представитель 1 семейства 1 переносчиков растворенных веществ (глутаматный транспортер нейронов/эпителиальных клеток с высоким сродством, система Xag), SMN2 - центромерный белок 2 выживания двигательных нейронов, CCNC - циклин C, MPP4 - пальмитоилированный мембранный белок 4, STUB1 - белок 1, гомологичный STIP1 и содержащий U-box, ALS2 - белок-предшественник амилоида бета (A4), PRDX6 - пероксиредоксин 6, SYP - синаптофизин, CABIN1 - кальциневрин-связывающий белок 1, CASP1 - каспаза 1, связанная с апоптозом цистеинпептидаза, GART - фосфорибозилглицинамидформилтрансфераза, фосфорибозилглицинамидсинтетаза, фосфорибозиламиноимидазолсинтетаза, CDK5 - циклин-зависимая киназа 5, ATXN3 - атаксин 3, RTN4 - ретикулон 4, C1QB компонент комплемента 1, субкомпонент q, цепь B, VEGFC - рецептор фактора роста нервов, HTT - хантингтин, PARK7 - белок 7, связанный с болезнью Паркинсона, XDH - ксантиндегидрогеназа, GFAP - глиальный фибриллярный кислый белок, MAP2 - белок 2, ассоциированный с микротрубочками, CYCS - цитохром c, соматические клетки, FCGR3B - Fc-фрагмент рецептора IIIb для IgG с низким сродством, CCS - медь-содержащий шаперон супероксиддисмутазы, UBL5 - белок 5, подобный убиквитину, MMP9 - матриксная металлопептидаза 9, SLC18A3 - представитель 3 семейства 18 переносчиков растворенных веществ (везикулярный, ацетилхолиновый), TRPM7 - катионный канал транзиентного рецепторного потенциала, подсемейство M, представитель 7, HSPB2 - 27 кДа белок 2 теплового шока, AKT1 - гомолог 1 онкогена v-akt вируса тимомы мышей, DERL1- представитель 1 семейства белков с Der1-подобным доменом, CCL2 - лиганд 2 хемокина (C--C мотив), NGRN - неугрин, ассоциированный с ростом аксонов, GSR - глутатионредуктаза, TPPP3 - представитель 3 семейства белков, способствующих полимеризации тубулина, APAF1 - фактор 1, активирующий апоптическую пептидазу, BTBD10 - белок 10, содержащий домен BTB (POZ), GLUD1 - глутаматдегидрогеназа 1, CXCR4 - рецептор 4 хемокина (C--X--C мотив), SLC1A3 - представитель 3 семейства 1 переносчиков растворенных веществ (глутаматный транспортер глиальных клеток с высоким сродством), FLT1 - тирозинкиназа 1, родственная fms, PON1 - параоксоназа 1, AR - андрогеновый рецептор, LIF - ингибиторный фактор, связанный с лейкозом, ERBB3 - гомолог 3 онкогена v-erb-b2 вируса эритробластического лейкоза, LGALS1 - лектин, галактозид-связывающий, растворимый, белок 1, CD44 - молекула CD44, TP53 - опухолевый белок p53, TLR3 - толл-подобный рецептор 3, GRIA1 - глутаматный рецептор, ионотропный, AMPA 1, GAPDH - глицеральдегид-3-фосфатдегидрогеназа, GRIK1 - глутаматный рецептор, ионотропный, каинатный белок 1, DES - десмин, CHAT - холинацетилтрансфераза, FLT4 - тирозинкиназа 4, родственная fms, CHMP2B - белок 2B, модифицирующий хроматин, BAG1 - BCL2-ассоциированный атаноген, MT3 - металлотионеин 3, CHRNA4 - холинергический рецептор, никотиновый, альфа 4, GSS - глутатионсинтетаза, BAK1 - BCL2-антагонист/киллер 1, KDR - рецептор вставочного домена киназы (рецептор тирозинкиназы III типа), GSTP1 - глутатион-S-трансфераза пи 1, OGG1 - 8-оксогуанин-ДНК-гликозилаза, IL6 - интерлейкин 6 (интерферон, бета 2).By way of non-limiting example, proteins associated with ALS include, but are not limited to, the following proteins: SOD1 - soluble superoxide dismutase 1, ALS3 - amyotrophic lateral sclerosis-associated protein 3, SETX - senataxin, ALS5 - amyotrophic lateral sclerosis-associated protein 5, FUS - FUS RNA-binding protein (fused in sarcoma), ALS7 - amyotrophic lateral sclerosis-associated protein 7, ALS2 - amyotrophic lateral sclerosis-associated protein 2, DPP6 - dipeptidyl peptidase 6, NEFH - neurofilament heavy polypeptide, PTGS1 - prostaglandin endoperoxide synthase 1, SLC1A2 - solute carrier family 1 (glial cell high-affinity glutamate transporter), member 2, TNFRSF10B - tumor necrosis factor receptor superfamily, member 10b, PRPH - peripherin, HSP90AA1 - 90 kDa heat shock protein alpha (cytosolic), class A member 1, GRIA2 - glutamate receptor, ionotropic, AMPA 2, IFNG - interferon, gamma, S100B - S100, calcium-binding protein B, FGF2 - fibroblast growth factor 2, AOX1 - aldehyde oxidase 1, CS - citrate synthase, TARDBP - TAR DNA-binding protein, TXN - thioredoxin, RAPH1 - Ras-associated protein (RaIGDS/AF-6), and pleckstrin-homology domain kinase 5 1, MAP3K5 - mitogen-activated protein kinase, NBEAL1 - neurobichin-like protein 1, GPX1 - glutathione peroxidase 1, ICA1L - islet cell autoantigen 1.69 kDa-like, RAC1 - ras-related protein, botulinum C3 toxin substrate 1-like, MAPT - microtubule-associated protein tau, ITPR2 - inositol-1,4,5-triphosphate receptor type 2, ALS2CR4 - amyotrophic lateral sclerosis (juvenile)-associated protein 2 candidate region on chromosome 4, GLS - glutaminase, ALS2CR8 - amyotrophic lateral sclerosis (juvenile)-associated protein 2 candidate region on chromosome 8, CNTFR - ciliary neurotrophic factor receptor, ALS2CR11 - chromosome 11 candidate region for 2, associated with amyotrophic lateral sclerosis (juvenile), FOLH1 - folate hydrolase 1, FAM117B - protein family with sequence similarity to protein 117, member B, P4HB - prolyl 4-hydroxylase, polypeptide beta, CNTF - ciliary neurotrophic factor, SQSTM1 - sequestosome 1, STRADB - STE20-related kinase, beta-adaptor, NAIP - NLR family apoptosis-associated inhibitory protein, YWHAQ - tyrosinase/tryptophan-5-monooxygenase activating protein, polypeptide theta, SLC33A1 - solute carrier (acetyl-CoA) transporter family 33, member 1, TRAK2 - transport protein, kinesin-binding 2, Fig. 4, SAC1 lipid phosphatase domain-containing homolog, NIF3L1 - NIF3 NGG1-interacting factor 3-like 1, INA - internexin, neuronal intermediate filament protein, alpha, PARD3B - par-3 (partitioning defective 3) protein, homolog B, COX8A - cytochrome c oxidase, subunit VIIIA, CDK15 - cyclin-dependent kinase, HECW1 HECT - C2 and WW 15 domain-containing protein, E3 - ubiquitin protein ligase 1, NOS1 - nitric oxide synthase 1, MET - met proto-oncogene, SOD2 - mitochondrial superoxide dismutase 2, HSPB1 - 27 kDa heat shock protein 1, NEFL - neurofilament light polypeptide, CTSB - cathepsin B, ANG - angiogenin, ribonuclease ANG - angiogenin, ribonuclease, RNase family 5, HSPA8 - 70 kDa heat shock protein 8, VAPB VAMP (vesicle-associated membrane protein)-associated proteins B and C, ESR1 - estrogen receptor 1, SNCA - synuclein, alpha, HGF - hepatocyte growth factor, CAT - catalase, ACTB - actin, beta, NEFM - medium-sized neurofilament polypeptide, TH - tyrosine hydroxylase, BCL2 - B-cell protein 2, CLL/lymphoma-associated protein 2, FAS - Fas (TNF receptor superfamily, member 6), CASP3 - caspase 3, apoptosis-associated cysteine peptidase, CLU - clusterin, SMN1 - motor neuron survival-associated protein, G6PD - glucose-6-phosphate dehydrogenase 1, BAX BCL2-associated protein X, HSF1 - heat shock protein transcription factor 1, RNF19A - ring domain protein 19A, JUN - jun oncogene, ALS2CR12 - amyotrophic lateral sclerosis (juvenile)-associated protein 2 candidate region on chromosome 12, HSPA5 - 70 kDa heat shock protein 5, MAPK14 - mitogen-activated protein kinase 14, IL10 - interleukin 10, APEX1 - APEX nuclease (multifunctional DNA repair enzyme), TXNRD1 - thioredoxin reductase 1, NOS2 - inducible nitric oxide synthase 2, TIMP1 - TIMP - inhibitor of metallopeptidase 1, CASP9 - caspase 9, apoptosis-associated cysteine peptidase, XIAP - X-linked inhibitor of apoptosis, GLG1 - Golgi glycoprotein 1, EPO - erythropoietin, VEGFA - vascular endothelial growth factor A, ELN - elastin, GDNF - glial cell-derived neurotrophic factor, NFE2L2 - nuclear factor (erythroid)-like protein 2, SLC6A3 - solute carrier family 6 member 3 (neurotransmitter transporter, dopamine transporter), HSPA4 - 70 kDa heat shock protein 4, APOE - apolipoprotein E, PSMB8 - proteasome (prosome, macropain) subunit, type beta, 8, DCTN1 - dynactin 1, TIMP3 - TIMP - metallopeptidase inhibitor 3, KIFAP3 - kinesin-associated protein 3, SLC1A1 - solute carrier family 1 member 1 (high-affinity neuronal/epithelial cell glutamate transporter, Xag system), SMN2 - motor neuron survival centromeric protein 2, CCNC - cyclin C, MPP4 - palmitoylated membrane protein 4, STUB1 - STIP1-homologous and U-box-containing protein 1, ALS2 - amyloid beta (A4) precursor protein, PRDX6 - peroxiredoxin 6, SYP - synaptophysin, CABIN1 - calcineurin-binding protein 1, CASP1 - caspase 1, apoptosis-associated cysteine peptidase, GART - phosphoribosylglycinamide formyltransferase, phosphoribosylglycinamide synthetase, phosphoribosylaminoimidazole synthetase, CDK5 - cyclin-dependent kinase 5, ATXN3 - ataxin 3, RTN4 - reticulon 4, C1QB complement component 1, subcomponent q, chain B, VEGFC - nerve growth factor receptor, HTT - huntingtin, PARK7 - Parkinson's disease-associated protein 7, XDH - xanthine dehydrogenase, GFAP - glial fibrillary acidic protein, MAP2 - microtubule-associated protein 2, CYCS - cytochrome c, somatic cells, FCGR3B - Fc fragment of IgG receptor IIIb with low affinity, CCS - copper-containing chaperone of superoxide dismutase, UBL5 - ubiquitin-like protein 5, MMP9 - matrix metallopeptidase 9, SLC18A3 - member 3 of solute carrier family 18 (vesicular, acetylcholine), TRPM7 - cation channel of transient receptor potential, subfamily M, member 7, HSPB2 - 27 kDa heat shock protein 2, AKT1 - murine thymoma virus v-akt oncogene homolog 1, DERL1- member 1 of protein family with Der1-like domain, CCL2 - chemokine ligand 2 (C--C motif), NGRN - neugrin, associated with axon growth, GSR - glutathione reductase, TPPP3 - member 3 of proteins that promote tubulin polymerization, APAF1 - factor 1, activating apoptotic peptidase, BTBD10 - protein 10, containing BTB domain (POZ), GLUD1 - glutamate dehydrogenase 1, CXCR4 - chemokine receptor 4 (C--X--C motif), SLC1A3 - solute carrier family 1 member 3 (high-affinity glutamate transporter of glial cells), FLT1 - fms-related tyrosine kinase 1, PON1 - paraoxonase 1, AR - androgen receptor, LIF - leukemia-associated inhibitory factor, ERBB3 - v-erb-b2 oncogene homolog 3 of erythroblastic leukemia virus, LGALS1 - lectin, galactoside-binding, soluble, protein 1, CD44 - CD44 molecule, TP53 - tumor protein p53, TLR3 - toll-like receptor 3, GRIA1 - glutamate receptor, ionotropic, AMPA 1, GAPDH - glyceraldehyde-3-phosphate dehydrogenase, GRIK1 - glutamate receptor, ionotropic, kainate protein 1, DES - desmin, CHAT - choline acetyltransferase, FLT4 - fms-related tyrosine kinase 4, CHMP2B - chromatin modifying protein 2B, BAG1 - BCL2-associated athanogen, MT3 - metallothionein 3, CHRNA4 - cholinergic receptor, nicotinic, alpha 4, GSS - glutathione synthetase, BAK1 - BCL2 antagonist/killer 1, KDR - receptor tyrosine kinase insertion domain (receptor tyrosine kinase type III), GSTP1 - glutathione-S-transferase pi 1, OGG1 - 8-oxoguanine DNA glycosylase, IL6 - interleukin 6 (interferon, beta 2).
Животное или клетка могут содержать 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более хромосомных последовательностей с нарушенной структурой, кодирующих белок, ассоциированный с ALS, и нуль, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более интегрированных в хромосомы последовательностей, кодирующих белок с нарушенной структурой, ассоциированный с ALS. Предпочтительные белки, ассоциированные с ALS, включают SOD1 (супероксиддисмутазу 1), ALS2 (белок 2, ассоциированный с боковым амиотрофическим склерозом), FUS (РНК-связывающий белок FUS), TARDBP (TAR-ДНК связывающий белок), VAGFA (фактор роста эндотелия сосудов A), VAGFB (фактор роста эндотелия сосудов B) и VAGFC (фактор роста эндотелия сосудов C) и любую их комбинацию.The animal or cell may comprise 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more chromosomal sequences with a disrupted structure encoding a protein associated with ALS, and zero, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more chromosomally integrated sequences encoding a protein with a disrupted structure associated with ALS. Preferred proteins associated with ALS include SOD1 (superoxide dismutase 1), ALS2 (amyotrophic lateral sclerosis-associated protein 2), FUS (FUS RNA-binding protein), TARDBP (TAR-DNA binding protein), VAGFA (vascular endothelial growth factor A), VAGFB (vascular endothelial growth factor B) and VAGFC (vascular endothelial growth factor C), and any combination thereof.
АутизмAutism
В публикации заявки на патент США № 20110023145 описывается применение нуклеаз с "цинковыми пальцами" для генетической модификации клеток, животных и белков, ассоциированных с расстройствами аутистического спектра (ASD). Расстройства аутистического спектра (ASD) представляют собой группу расстройств, характеризующихся качественным нарушением социального взаимодействия и коммуникации, а также ограниченными повторяющимися и стереотипными формами поведения, интересов и видов деятельности. Три расстройства, аутизм, синдром Аспергера (AS) и неспецифическое первазивное расстройство развития (PDD-NOS) относятся к одному и тому же расстройству с различными степенями тяжести, ассоциированными с умственной деятельностью и медицинскими состояниями. ASD преимущественно являются расстройствами, которые предопределены наследственными факторами, с наследуемостью приблизительно 90%.U.S. Patent Application Publication No. 20110023145 describes the use of zinc finger nucleases to genetically modify cells, animals, and proteins associated with autism spectrum disorders (ASD). Autism spectrum disorders (ASD) are a group of disorders characterized by qualitative impairments in social interaction and communication, as well as restricted, repetitive, and stereotyped patterns of behavior, interests, and activities. The three disorders, autism, Asperger syndrome (AS), and pervasive developmental disorder not otherwise specified (PDD-NOS), refer to the same disorder with varying degrees of severity associated with intellectual functioning and medical conditions. ASD is predominantly a disorder that is determined by heritable factors, with a heritability of approximately 90%.
В публикации заявки на патент США № 20110023145 предусматривается редактирование любых хромосомных последовательностей, которые кодируют белки, ассоциированные с ASD, что можно применять по отношению к системе CRISPR-Cas согласно настоящему изобретению. Белки, ассоциированные с ASD, как правило, выбирают исходя из экспериментально установленной ассоциации белка, ассоциированного с ASD, с возникновением или симптомом ASD. Например, скорость образования или концентрация в кровотоке белка, связанного с ASD, может быть повышенной или пониженной в популяции с ASD по сравнению с популяцией без ASD. Различия по уровням белка можно оценить с помощью протеомных методик, в том числе без ограничения вестерн-блоттинга, иммуногистохимического окрашивания, твердофазного иммуноферментного анализа (ELISA) и масс-спектрометрии. Альтернативно белки, ассоциированные с ASD, можно идентифицировать путем получения профилей экспрессии генов для генов, кодирующих белки, с помощью методик геномного анализа, в том числе без ограничения микроматричного анализа ДНК, последовательного анализа экспрессии генов (SAGE) и количественной полимеразной цепной реакции в режиме реального времени (Q-PCR).U.S. Patent Application Publication No. 20110023145 contemplates editing of any chromosomal sequences that encode proteins associated with ASD, which may be applied to the CRISPR-Cas system of the present invention. Proteins associated with ASD are typically selected based on an experimentally established association of the protein associated with ASD with the occurrence or symptom of ASD. For example, the rate of production or circulating concentration of a protein associated with ASD may be increased or decreased in a population with ASD compared to a population without ASD. Differences in protein levels may be assessed using proteomic techniques, including, but not limited to, Western blotting, immunohistochemical staining, enzyme-linked immunosorbent assay (ELISA), and mass spectrometry. Alternatively, proteins associated with ASD can be identified by obtaining gene expression profiles for protein-coding genes using genomic analysis techniques, including but not limited to DNA microarray analysis, sequence-based analysis of gene expression (SAGE), and quantitative real-time polymerase chain reaction (Q-PCR).
Неограничивающие примеры болезненных состояний или расстройств, которые могут быть ассоциированы с белками, ассоциированными с ASD, включают аутизм, синдром Аспергера (AS), неспецифическое первазивное расстройство развития (PDD-NOS), синдром Ретта, туберозный склероз, фенилкетонурию, синдром Смита-Лемли-Опица и синдром ломкой X-хромосомы. В качестве неограничивающего примера белки, ассоциированные с ASD, включают без ограничения следующие белки: ATP10C - аминофосфолипид-транспортирующую АТФазу (ATP10C), MET - MET-рецепторную тирозинкиназу, BZRAP1, MGLUR5 (GRM5) - метаботропный глутаматный рецептор 5 (MGLUR5), CDH10 - кадгерин-10, MGLUR6 (GRM6) - метаботропный глутаматный рецептор 6 (MGLUR6), CDH9 - кадгерин-9, NLGN1 - нейролигин-1, CNTN4 - контактин-4, NLGN2 - нейролигин-2, CNTNAP2 - белок 2, подобный контактин-ассоциированному белку (CNTNAP2), SEMA5A - нейролигин-3, DHCR7 - 7-дегидрохолестеринредуктазу (DHCR7), NLGN4X - нейролигин-4 X-связанный, NLGN4Y - нейролигин-4 Y-связанный, DOC2A - альфа-белок, содержащий двойной C2-подобный домен, DPP6 - белок 6, подобный дипептидиламинопептидазе, NLGN5 - нейролигин-5, EN2 - белок 2, кодируемый гомеобоксом (EN2), NRCAM - молекулу адгезии нейронов (NRCAM), MDGA2, ассоциированный с умственной отсталостью, сцепленной с ломкой X-хромосомой (MDGA2), NRXN1 - нейрексин-1, FMR2 (AFF2) - представитель 2 семейства AF4/FMR2, OR4M2 - рецептор обонятельных луковиц 4M2, FOXP2 - белок, кодируемый Forkhead-боксом P2 (FOXP2), OR4N4 - рецептор обонятельных луковиц 4N4, FXR1 - аутосомный гомолог 1, связанный с умственной отсталостью, сцепленной с ломкой X-хромосомой (FXR1), OXTR - окситоциновый рецептор (OXTR), FXR2 - аутосомный гомолог 2, связанный с умственной отсталостью, сцепленной с ломкой X-хромосомой (FXR2), PAH - фенилаланингидроксилазу (PAH), GABRA1 - субъединицу альфа-1 рецептора гамма-аминомасляной кислоты (GABRA1), PTEN - гомолог фосфатазы и тензина (PTEN), GABRA5 - субъединицу альфа-5 рецептора GABAA (гамма-аминомасляной кислоты) (GABRA5), PTPRZ1 - протеиновую тирозинфосфатазу-дзета рецепторного типа (PTPRZ1), GABRB1 - субъединицу бета-1 рецептора гамма-аминомасляной кислоты (GABRB1), RELN - рилин, GABRB3 - субъединицу бета-3 рецептора GABAA (гамма-аминомасляной кислоты) (GABRB3), RPL10 - рибосомальный белок 60S L10, GABRG1 - субъединицу гамма-1 рецептора гамма-аминомасляной кислоты (GABRG1), SEMA5A - семафорин-5A (SEMA5A), HIRIP3 - HIRA-взаимодействующий белок 3, SEZ6L2 - белок 2, подобный гомологу белка 6, связанного с приступами (мышь), HOXA1 - белок, кодируемый гомеобоксом Hox-A1 (HOXA1), SHANK3 - белок 3, содержащий SH3 и несколько повторяющихся доменов анкирина (SHANK3), IL6 - интерлейкин-6, SHBZRAP1 - белок 3, содержащий SH3 и несколько повторяющихся доменов анкирина (SHBZRAP1), LAMB1 - ламинин, субъединицу бета-1 (LAMB1), SLC6A4 - серотониновый транспортер (SERT), MAPK3 - митоген-активируемую протеинкиназу 3, TAS2R1 - вкусовой рецептор типа 2, представитель 1 (TAS2R1), MAZ - Myc-ассоциированный белок с "цинковыми пальцами", TSC1 - белок 1, ассоциированный с туберозным склерозом, MDGA2 - гликозилфосфатидилинозитол-связанный белок 2, якорная форма 2, содержащий домен MAM (MDGA2), TSC2 - белок 2, ассоциированный с туберозным склерозом, MECP2 - метил-CpG-связывающий белок 2 (MECP2), UBE3A - убиквитинпротеинлигазу E3A (UBE3A), MECP2 - метил-CpG-связывающий белок 2 (MECP2), WNT2 - сайт интеграции MMTV типа Wingless, представитель 2 семейства (WNT2).Non-limiting examples of disease states or disorders that may be associated with ASD-associated proteins include autism, Asperger syndrome (AS), pervasive developmental disorder not otherwise specified (PDD-NOS), Rett syndrome, tuberous sclerosis, phenylketonuria, Smith-Lemli-Opitz syndrome, and fragile X syndrome. As a non-limiting example, proteins associated with ASD include, but are not limited to, the following proteins: ATP10C - aminophospholipid transfer ATPase (ATP10C), MET - MET receptor tyrosine kinase, BZRAP1, MGLUR5 (GRM5) - metabotropic glutamate receptor 5 (MGLUR5), CDH10 - cadherin-10, MGLUR6 (GRM6) - metabotropic glutamate receptor 6 (MGLUR6), CDH9 - cadherin-9, NLGN1 - neuroligin-1, CNTN4 - contactin-4, NLGN2 - neuroligin-2, CNTNAP2 - contactin-associated protein-like protein 2 (CNTNAP2), SEMA5A - neuroligin-3, DHCR7 - 7-dehydrocholesterol reductase (DHCR7), NLGN4X - neuroligin-4 X-linked, NLGN4Y - neuroligin-4 Y-linked, DOC2A - alpha-protein containing double C2-like domain, DPP6 - dipeptidylaminopeptidase-like protein 6, NLGN5 - neuroligin-5, EN2 - homeobox-encoded protein 2 (EN2), NRCAM - neuronal cell adhesion molecule (NRCAM), MDGA2, associated with mental retardation linked to fragile X chromosome (MDGA2), NRXN1 - neurexin-1, FMR2 (AFF2) - member 2 of the AF4/FMR2 family, OR4M2 - olfactory bulb receptor 4M2, FOXP2 - protein encoded by forkhead box P2 (FOXP2), OR4N4 - olfactory bulb receptor 4N4, FXR1 - fragile X-linked mental retardation autosomal homolog 1 (FXR1), OXTR - oxytocin receptor (OXTR), FXR2 - fragile X-linked mental retardation autosomal homolog 2 (FXR2), PAH - phenylalanine hydroxylase (PAH), GABRA1 - gamma-aminobutyric acid receptor alpha-1 subunit (GABRA1), PTEN - phosphatase and tensin homolog (PTEN), GABRA5 - GABAA (gamma-aminobutyric acid) receptor alpha-5 subunit (GABRA5), PTPRZ1 - protein tyrosine phosphatase-zeta receptor type (PTPRZ1), GABRB1 - gamma-aminobutyric acid receptor beta-1 subunit (GABRB1), RELN - reelin, GABRB3 - GABAA (gamma-aminobutyric acid) receptor beta-3 subunit (GABRB3), RPL10 - 60S ribosomal protein L10, GABRG1 - gamma-aminobutyric acid receptor gamma-1 subunit (GABRG1), SEMA5A - semaphorin-5A (SEMA5A), HIRIP3 - HIRA-interacting protein 3, SEZ6L2 - seizure-associated protein 6 homolog-like protein 2 (mouse), HOXA1 - Hox homeobox A1 (HOXA1)-encoded protein, SHANK3 - SH3 and multiple ankyrin repeat domain-containing protein 3 (SHANK3), IL6 - interleukin-6, SHBZRAP1 - SH3 and multiple repeat domain-containing protein 3 ankyrin (SHBZRAP1), LAMB1 - laminin, beta-1 subunit (LAMB1), SLC6A4 - serotonin transporter (SERT), MAPK3 - mitogen-activated protein kinase 3, TAS2R1 - taste receptor type 2, member 1 (TAS2R1), MAZ - Myc-associated zinc finger protein, TSC1 - tuberous sclerosis-associated protein 1, MDGA2 - glycosylphosphatidylinositol-related protein 2, anchor form 2, containing MAM domain (MDGA2), TSC2 - tuberous sclerosis-associated protein 2, MECP2 - methyl-CpG-binding protein 2 (MECP2), UBE3A - ubiquitin protein ligase E3A (UBE3A), MECP2 - methyl-CpG-binding protein 2 (MECP2), WNT2 - MMTV integration site of the Wingless type, representative of the 2nd family (WNT2).
Идентичность белка, ассоциированного с ASD, редактирование хромосомной последовательности которого осуществляют, может и будет варьировать. В предпочтительных вариантах осуществления белки, ассоциированные с ASD, редактирование хромосомной последовательности которых осуществляют, могут представлять собой белок 1, ассоциированный с периферическим бензодиазепиновым рецептором (BZRAP1), кодируемый геном BZRAP1, белок-представитель 2 семейства AF4/FMR2 (AFF2), кодируемый геном AFF2 (также называемый MFR2), белок-аутосомный гомолог 1, ассоциированный с умственной отсталостью, сцепленной с ломкой X-хромосомой (FXR1), кодируемый геном FXR1, или белок-аутосомный гомолог 2, ассоциированный с умственной отсталостью, сцепленной с ломкой X-хромосомой (FXR2), кодируемый геном FXR2, гликозилфосфатидилинозитол-связанный белок, содержащий домен MAM, якорная форма 2 (MDGA2), кодируемый геном MDGA2, метил-CpG связывающий белок 2 (MECP2), кодируемый геном MECP2, метаботропный глутаматный рецептор 5 (MGLUR5), кодируемый геном MGLUR5-1 (также называемый GRM5), белок нейрексин 1, кодируемый геном NRXN1, или белок семафорин-5A (SEMA5A), кодируемый геном SEMA5A. В иллюстративном варианте осуществления генетически модифицированным животным является крыса, и редактируемые хромосомные последовательности, кодирующие белок, ассоциированный с ASD, перечислены ниже: BZRAP1 - белок 1, ассоциированный с (периферическим) бензодиазепиновым рецептором (BZRAP1) - XM_002727789, XM_213427, XM_002724533, XM_001081125, AFF2 (FMR2) - представитель 2 семейства AF4/FMR2 (AFF2) - XM_219832, XM_001054673, FXR1 - аутосомный гомолог 1, ассоциированный с умственной отсталостью, сцепленной с ломкой X-хромосомой (FXR1) - NM_001012179, FXR2 - аутосомный гомолог 2, ассоциированный с умственной отсталостью, сцепленной с ломкой X-хромосомой (FXR2) - NM_001100647, MDGA2 - гликозилфосфатидилинозитол-связанный белок, содержащий домен MAM, якорная форма 2 (MDGA2) - NM_199269, MECP2 - метил-CpG-связывающий белок 2 (MECP2) - NM_022673, MGLUR5 - метаботропный глутаматный рецептор 5 (GRM5) (MGLUR5) - NM_017012, NRXN1 - нейрексин-1 - NM_021767, SEMA5A - семафорин-5A (SEMA5A) - NM_001107659.The identity of the ASD-associated protein whose chromosomal sequence is edited can and will vary. In preferred embodiments, the ASD-associated proteins whose chromosomal sequence editing is performed may be benzodiazepine receptor-associated protein 1 (BZRAP1), encoded by the BZRAP1 gene, AF4/FMR2 family member 2 (AFF2), encoded by the AFF2 gene (also referred to as MFR2), fragile X-linked mental retardation-associated autosomal homolog 1 (FXR1), encoded by the FXR1 gene, or fragile X-linked mental retardation-associated autosomal homolog 2 (FXR2), encoded by the FXR2 gene, glycosylphosphatidylinositol-related protein containing MAM domain anchor form 2 (MDGA2), encoded by the MDGA2 gene, methyl-CpG binding protein 2 (MECP2), encoded by the MECP2 gene, metabotropic glutamate receptor 5 (MGLUR5), encoded by the MGLUR5-1 gene (also called GRM5), neurexin 1 protein, encoded by the NRXN1 gene, or semaphorin-5A protein (SEMA5A), encoded by the SEMA5A gene. In an exemplary embodiment, the genetically modified animal is a rat and the edited chromosomal sequences encoding a protein associated with ASD are listed below: BZRAP1 - benzodiazepine receptor (peripheral) associated protein 1 (BZRAP1) - XM_002727789, XM_213427, XM_002724533, XM_001081125, AFF2 (FMR2) - AF4/FMR2 family member 2 (AFF2) - XM_219832, XM_001054673, FXR1 - fragile X-linked mental retardation associated autosomal homolog 1 (FXR1) - NM_001012179, FXR2 - autosomal homolog 2, associated with fragile X-linked mental retardation (FXR2) - NM_001100647, MDGA2 - glycosylphosphatidylinositol-related protein containing MAM domain, anchor form 2 (MDGA2) - NM_199269, MECP2 - methyl-CpG-binding protein 2 (MECP2) - NM_022673, MGLUR5 - metabotropic glutamate receptor 5 (GRM5) (MGLUR5) - NM_017012, NRXN1 - neurexin-1 - NM_021767, SEMA5A - semaphorin-5A (SEMA5A) - NM_001107659.
Нарушения, связанные с экспансией тринуклеотидных повторов (TRE)Trinucleotide repeat expansion (TRE) disorders
В публикации заявки на патент США № 20110016540 описывается применение нуклеаз с "цинковыми пальцами" для генетической модификации клеток, животных и белков, ассоциированных с нарушениями, связанными с экспансией тринуклеотидных повторов. Нарушения, связанные с экспансией тринуклеотидных повторов, являются комплексными прогрессирующими нарушениями, затрагивающими биологию развития нервной системы и часто нарушающими когнитивные функции, а также сенсомоторные функции.U.S. Patent Application Publication No. 20110016540 describes the use of zinc finger nucleases to genetically modify cells, animals, and proteins associated with trinucleotide repeat expansion disorders. Trinucleotide repeat expansion disorders are complex, progressive disorders that affect neurodevelopmental biology and often impair cognitive function as well as sensorimotor function.
Белки, связанные с экспансией тринуклеотидных повторов, представляют собой разнородную группу белков, ассоциированных с восприимчивостью к развитию нарушения, связанного с экспансией тринуклеотидных повторов, наличием нарушения, связанного с экспансией тринуклеотидных повторов, тяжестью нарушения, связанного с экспансией тринуклеотидных повторов, или любой их комбинацией. Нарушения, связанные с экспансией тринуклеотидных повторов, подразделяют на две категории, определяемые типом повтора. Наиболее распространенным повтором является триплет CAG, который, в случае наличия в кодирующем участке гена, кодирует аминокислоту глутамин (Q). Таким образом, эти нарушения называются нарушениями, связанными с экспансией полиглутаминовых повторов (поли-Q), и включают следующие заболевания: болезнь Гентингтона (HD); спинобульбарную мышечную атрофию (SBMA); формы спинально-церебеллярной атаксии (SCA типов 1, 2, 3, 6, 7 и 17) и дентато-рубро-паллидо-льюисову атрофию (DRPLA). Остальные нарушения, связанные с экспансией тринуклеотидных повторов, при которых триплет CAG не вовлечен, либо триплет CAG находится не в кодирующем участке гена, называются, таким образом, нарушениями, не связанными с экспансией полиглутаминовых повторов. Нарушения, не связанные с экспансией полиглутаминовых повторов, включают синдром ломкой X-хромосомы (FRAXA); синдром умственной отсталости, сцепленный с ломкой X-хромосомой (FRAXE); атаксию Фридрейха (FRDA); миотоническую дистрофию (DM) и формы спинально-церебеллярной атаксии (SCA типов 8 и 12).Trinucleotide repeat expansion-associated proteins are a diverse group of proteins associated with susceptibility to developing a trinucleotide repeat expansion disorder, the presence of a trinucleotide repeat expansion disorder, the severity of a trinucleotide repeat expansion disorder, or any combination thereof. Trinucleotide repeat expansion disorders are divided into two categories determined by the type of repeat. The most common repeat is the CAG triplet, which, when present in the coding region of a gene, codes for the amino acid glutamine (Q). These disorders are thus termed polyglutamine (poly-Q) repeat expansion disorders and include the following disorders: Huntington disease (HD); spinal muscular atrophy (SBMA); forms of spinocerebellar ataxia (SCA types 1, 2, 3, 6, 7, and 17) and dentato-rubro-pallido-Lewis atrophy (DRPLA). The remaining trinucleotide repeat expansion disorders in which the CAG triplet is not involved or the CAG triplet is not in the coding region of the gene are thus termed non-polyglutamine repeat expansion disorders. Non-polyglutamine repeat expansion disorders include fragile X syndrome (FRAXA); fragile X-linked mental retardation syndrome (FRAXE); Friedreich's ataxia (FRDA); myotonic dystrophy (DM), and forms of spinocerebellar ataxia (SCA types 8 and 12).
Белки, ассоциированные с нарушениями, связанными с экспансией тринуклеотидных повторов, как правило, выбирают на основании экспериментально установленной ассоциации белка, ассоциированного с нарушением, связанным с экспансией тринуклеотидных повторов, и нарушения, связанного с экспансией тринуклеотидных повторов. Например, скорость образования или концентрация в кровотоке белка, ассоциированного с нарушением, связанным с экспансией тринуклеотидных повторов, может быть повышенной или пониженной в популяции, имеющей нарушение, связанное с экспансией тринуклеотидных повторов, по сравнению с популяцией, не имеющей нарушения, связанного с экспансией тринуклеотидных повторов. Различия по уровням белка можно оценить с помощью протеомных методик, в том числе без ограничения вестерн-блоттинга, иммуногистохимического окрашивания, твердофазного иммуноферментного анализа (ELISA) и масс-спектрометрии. Альтернативно белки, ассоциированные с нарушениями, обусловленными экспансией тринуклеотидных повторов, можно идентифицировать путем получения профилей генной экспрессии для генов, кодирующих белки, с помощью методик геномного анализа, в том числе без ограничения микроматричного анализа ДНК, последовательного анализа экспрессии генов (SAGE) и количественной полимеразной цепной реакции в режиме реального времени (Q-PCR).Proteins associated with trinucleotide repeat expansion disorders are typically selected based on an experimentally established association between the trinucleotide repeat expansion disorder-associated protein and the trinucleotide repeat expansion disorder. For example, the rate of production or circulating concentration of a protein associated with a trinucleotide repeat expansion disorder may be increased or decreased in a population with a trinucleotide repeat expansion disorder compared to a population without a trinucleotide repeat expansion disorder. Differences in protein levels can be assessed using proteomic techniques, including but not limited to Western blotting, immunohistochemical staining, enzyme-linked immunosorbent assay (ELISA), and mass spectrometry. Alternatively, proteins associated with trinucleotide repeat expansion disorders can be identified by generating gene expression profiles for protein-coding genes using genomic analysis techniques, including but not limited to DNA microarray analysis, sequence-based analysis of gene expression (SAGE), and quantitative real-time polymerase chain reaction (Q-PCR).
Неограничивающие примеры белков, ассоциированных с нарушениями, связанными с экспансией тринуклеотидных повторов, включают AR (андрогенный рецептор), FMR1 (белок 1, ассоциированный с умственной отсталостью, сцепленной с ломкой X-хромосомой), HTT (гентингтин), DMPK (протеинкиназу, ассоциированную с миотонической дистрофией), FXN (фратаксин), ATXN2 (атаксин 2), ATN1 (атрофин 1), FEN1 (структуроспецифичную флэп-эндонуклеазу 1), TNRC6A (белок, кодируемый геном 6A, содержащим тринуклеотидные повторы), PABPN1 (ядерный поли(A)-связывающий белок 1), JPH3 (юнктофилин 3), MED15 (субъединицу 15 медиаторного комплекса), ATXN1 (атаксин 1), ATXN3 (атаксин 3), TBP (TATA-бокс-связывающий белок), CACNA1A (альфа-1A-субъединицу потенциал-зависимого кальциевого канала P/Q-типа), ATXN80S (белок, синтезируемый с противоположной нити ATXN8 (не кодирующей белок)), PPP2R2B (бета-изоформу регуляторной субъединицы B протеинфосфатазы 2), ATXN7 (атаксин 7), TNRC6B (белок, кодируемый геном 6B, содержащим тринуклеотидные повторы), TNRC6C (белок, кодируемый геном 6C, содержащим тринуклеотидные повторы), CELF3 (CUGBP, представитель 3 семейства Elav-подобных белков), MAB21L1 (mab-21-подобный белок 1 (C. elegans)), MSH2 (гомолог 2 mutS, ассоциированный с неполипозным колоректальным раком 1 типа (E. coli)), TMEM185A (трансмембранный белок 185A), SIX5 (белок, кодируемый гомеобоксом 5 SIX), CNPY3 (гомолог Canopy 3 (данио-рерио)), FRAXE (белок, ассоциированный с "редким" ломким сайтом, проявляющимся при недостатке фолиевой кислоты, fra(X)(q28) E), GNB2 (бета-полипептид 2 белка, связывающего гуаниновые нуклеотиды (G-белка)), RPL14 (рибосомный белок L14), ATXN8 (атаксин 8), INSR (инсулиновый рецептор), TTR (транстиретин), EP400 (E1A-связывающий белок p400), GIGYF2 (белок GYF 2, взаимодействующий с GRB10), OGG1 (8-оксогуанин-ДНК-гликозилазу), STC1 (станниокальцин 1), CNDP1 (карнозиндипептидазу 1 (металлопептидазу семейства M20)), C10orf2 (белок, кодируемый открытой рамкой считывания 2 хромосомы 10), MAML3 (mastermind-подобный белок 3 (Drosophila)), DKC1 (белок 1, ассоциированный с врожденным дискератозом, дискерин), PAXIP1 (белок 1, взаимодействующий с PAX (с доменом активации транскрипции)), CaSK (кальций/кальмодулин-зависимую сериновую протеинкиназу (семейства MAGUK)), MAPT (белок tau, ассоциированный с микротрубочками), SP1 (фактор транскрипции Sp1), POLG (полимеразу гамма (ДНК-направленную)), AFF2 (представитель 2 семейства AF4/FMR2), THBS1 (тромбоспондин 1), TP53 (опухолевый белок p53), ESR1 (эстрогеновый рецептор 1), CGGBP1 (белок 1, связывающий триплетный повтор CGG), ABT1 (активатор 1 базальной транскрипции), KLK3 (родственную калликреину пептидазу 3), PRNP (белок приона), JUN (онкоген jun), KCNN3 (кальций-активируемый калиевый канал средней/малой проводимости, представитель 3 подсемейства N), BAX (BCL2-ассоциированный белок X), FRAXA (белок, ассоциированный с "редким" ломким сайтом, проявляющимся при недостатке фолиевой кислоты, fra(X)(q27.3) A (макроорхидизм, умственная отсталость)), KBTBD10 (белок 10, содержащий повтор Kelch и домен BTB (POZ)), MBNL1 (muscleblind-подобный белок (Drosophila)), RAD51 (гомолог RAD51 (гомолог RecA, E. coli) (S. cerevisiae)), NCOA3 (коактиватор 3 ядерных рецепторов), ERDA1 (белок с экспансией повторяющихся доменов, CAG/CTG 1), TSC1 (белок 1, ассоциированный с туберозным склерозом), COMP (олигомерный матриксный белок хряща), GCLC (каталитическую субъединицу глутаматцистеинлигазы), RRAD (Ras-родственный белок, ассоциированный с сахарным диабетом), MSH3 (гомолог 3 mutS (E. coli)), DRD2 (дофаминовый рецептор D2), CD44 (молекулу CD44 (система групп крови Indian)), CTCF (CCCTC-связывающий фактор (белок с "цинковыми пальцами")), CCND1 (циклин D1), CLSPN (гомолог класпина (Xenopus laevis)), MEF2A (энхансерный фактор 2A миоцитов), PTPRU (протеинтирозинфосфатазу рецепторного типа U), GAPDH (глицеральдегид-3-фосфатдегидрогеназу), TRIM22 (белок 22, содержащий тройной мотив), WT1 (белок 1 опухоли Вильмса), AHR (арил-углеводородный рецептор), GPX1 (глутатионпероксидазу 1), TPMT (тиопурин-S-метилтрансферазу), NDP (белок, ассоциированный с болезнью Норри (псевдоглиомой)), ARX (белок, кодируемый гомеобоксом гена, родственного aristaless), MUS81 (гомолог эндонуклеазы MUS81 (S. cerevisiae)), TYR (тирозиназу (глазокожный альбинизм IA)), EGR1 (белок 1 раннего ростового ответа), UNG (урацил-ДНК-гликозилазу), NUMBL (белок, подобный гомологу numb (Drosophila)), FABP2 (белок 2, связывающий жирные кислоты в кишечнике), EN2 (белок, кодируемый гомеобоксом engrailed 2), CRYGC (гамма-C-кристаллин), SRP14 (гомологичный РНК-связывающий белок Alu размером 14 кДа из частицы узнавания сигнала), CRYGB (гамма-B-кристаллин), PDCD1 (белок 1 запрограммированной гибели клеток), HOXA1 (белок, кодируемый гомеобоксом A1), ATXN2L (атаксин-2-подобный белок), PMS2 (PMS2, белок 2, противодействующий повышению уровня постмейотической сегрегации (S. cerevisiae)), GLA (альфа-галактозидазу), CBL (белок, кодируемый последовательностью, трансформирующей с экотропным ретровирусом Cas-Br-M (мышей)), FTH1 (полипептид 1 тяжелой субъединицы ферритина), IL12RB2 (бета-2-субъединицу рецептора интерлейкина 12), OTX2 (белок, кодируемый гомеобоксом orthodenticle 2), HOXA5 (белок, кодируемый гомеобоксом A5), POLG2 (вспомогательную гамма-2-субъединицу полимеразы (ДНК-направленной)), DLX2 (белок, кодируемый гомеобоксом distal-less 2), SIRPA (сигнально-регуляторный белок альфа), OTX1 (белок, кодируемый гомеобоксом orthodenticle 1), AHRR (репрессор арил-углеводородного рецептора), MANF (мезэнцефальный нейротрофический фактор, происходящий из астроцитов), TMEM158 (трансмембранный белок 158 (ген/псевдоген)) и ENSG00000078687.Non-limiting examples of proteins associated with trinucleotide repeat expansion disorders include AR (androgen receptor), FMR1 (Fragile X-linked mental retardation-associated protein 1), HTT (huntingtin), DMPK (myotonic dystrophy-associated protein kinase), FXN (frataxin), ATXN2 (ataxin 2), ATN1 (utrophin 1), FEN1 (flap structure-specific endonuclease 1), TNRC6A (trinucleotide repeat-containing gene 6A protein), PABPN1 (nuclear poly(A)-binding protein 1), JPH3 (junctophilin 3), MED15 (mediator complex subunit 15), ATXN1 (ataxin 1), ATXN3 (ataxin 3), TBP (TATA box binding protein), CACNA1A (alpha-1A subunit of P/Q voltage-dependent calcium channel), ATXN80S (protein synthesized from the opposite strand of ATXN8 (non-coding protein)), PPP2R2B (beta isoform of protein phosphatase 2 regulatory subunit B), ATXN7 (ataxin 7), TNRC6B (protein encoded by gene 6B containing trinucleotide repeats), TNRC6C (protein encoded by gene 6C containing trinucleotide repeats), CELF3 (CUGBP, member 3 of Elav-like proteins family), MAB21L1 (mab-21-like protein 1 (C. elegans)), MSH2 (mutS homolog 2, associated with nonpolyposis colorectal cancer type 1 (E. coli)), TMEM185A (transmembrane protein 185A), SIX5 (protein encoded by homeobox 5 SIX), CNPY3 (homolog of Canopy 3 (zebrafish)), FRAXE (folate deficiency rare fragile site-associated protein, fra(X)(q28)E), GNB2 (guanine nucleotide binding protein (G protein) beta polypeptide 2), RPL14 (ribosomal protein L14), ATXN8 (ataxin 8), INSR (insulin receptor), TTR (transthyretin), EP400 (E1A-binding protein p400), GIGYF2 (GYF 2 protein interacting with GRB10), OGG1 (8-oxoguanine DNA glycosylase), STC1 (stanniocalcin 1), CNDP1 (carnosine dipeptidase 1 (M20 family metallopeptidase)), C10orf2 (chromosome 10 open reading frame 2 protein), MAML3 (mastermind-like protein 3 (Drosophila)), DKC1 (dyskeratosis congenita-associated protein 1, dyskerin), PAXIP1 (PAX-interacting protein 1 (with transcription activation domain)), CaSK (calcium/calmodulin-dependent serine protein kinase (MAGUK family)), MAPT (microtubule-associated protein tau), SP1 (Sp1 transcription factor), POLG (polymerase gamma (DNA-directed)), AFF2 (AF4/FMR2 family member 2), THBS1 (thrombospondin 1), TP53 (p53 tumor protein), ESR1 (estrogen receptor 1), CGGBP1 (CGG triplet repeat-binding protein 1), ABT1 (basal transcription activator 1), KLK3 (kallikrein-related peptidase 3), PRNP (prion protein), JUN (jun oncogene), KCNN3 (medium/small-conductance calcium-activated potassium channel, member 3 of the N subfamily), BAX (BCL2-associated protein X), FRAXA (folate deficiency rare fragile site-associated protein, fra(X)(q27.3) A (macro-orchidism, mental retardation)), KBTBD10 (Kelch repeat and BTB domain-containing protein 10 (POZ)), MBNL1 (muscleblind-like protein (Drosophila)), RAD51 (RAD51 homolog (RecA homolog, E. coli) (S. cerevisiae)), NCOA3 (nuclear receptor coactivator 3), ERDA1 (repeat domain expansion protein, CAG/CTG 1), TSC1 (tuberous sclerosis-associated protein 1), COMP (cartilage oligomeric matrix protein), GCLC (catalytic subunit of glutamate cysteine ligase), RRAD (Ras-related protein associated with diabetes mellitus), MSH3 (mutS homolog 3 (E. coli)), DRD2 (dopamine D2 receptor), CD44 (CD44 molecule (Indian blood group system)), CTCF (CCCTC-binding factor (protein with "zinc (with fingers")), CCND1 (cyclin D1), CLSPN (claspin homolog (Xenopus laevis)), MEF2A (myocyte enhancer factor 2A), PTPRU (protein tyrosine phosphatase receptor type U), GAPDH (glyceraldehyde-3-phosphate dehydrogenase), TRIM22 (triple motif-containing protein 22), WT1 (Wilms tumor protein 1), AHR (aryl hydrocarbon receptor), GPX1 (glutathione peroxidase 1), TPMT (thiopurine-S-methyltransferase), NDP (Norrie disease (pseudoglioma)-associated protein), ARX (aristaless-related homeobox protein), MUS81 (MUS81 endonuclease homolog (S. cerevisiae)), TYR (tyrosinase (oculocutaneous albinism IA)), EGR1 (early growth response protein 1), UNG (uracil DNA glycosylase), NUMBL (numb homolog-like protein (Drosophila)), FABP2 (fatty acid binding protein 2 in the intestine), EN2 (engrailed homeobox 2-derived protein), CRYGC (gamma-C-crystallin), SRP14 (signal recognition particle homologous protein 14 kDa Alu RNA-binding protein), CRYGB (gamma-B-crystallin), PDCD1 (programmed cell death protein 1), HOXA1 (homeobox A1-derived protein), ATXN2L (ataxin-2-like protein), PMS2 (PMS2, postmeiotic segregation enhancement counteracting protein 2 (S. cerevisiae)), GLA (alpha-galactosidase), CBL (a protein encoded by a sequence transforming with the ecotropic retrovirus Cas-Br-M (mouse)), FTH1 (ferritin heavy subunit polypeptide 1), IL12RB2 (interleukin 12 receptor beta-2 subunit), OTX2 (a protein encoded by orthodenticle homeobox 2), HOXA5 (a protein encoded by homeobox A5), POLG2 (an accessory gamma-2 subunit of the polymerase (DNA-directed)), DLX2 (a protein encoded by distal-less 2), SIRPA (signal regulatory protein alpha), OTX1 (a protein encoded by orthodenticle homeobox 1), AHRR (aryl hydrocarbon receptor repressor), MANF (mesencephalic neurotrophic factor-derived astrocytes), TMEM158 (transmembrane protein 158 (gene/pseudogene)) and ENSG00000078687.
Предпочтительные белки, ассоциированные с нарушениями, обусловленными экспансией тринуклеотидных повторов, включают HTT (гентингтин), AR (андрогенный рецептор), FXN (фратаксин), Atxn3 (атаксин), Atxn1 (атаксин), Atxn2 (атаксин), Atxn7 (атаксин), Atxn10 (атаксин), DMPK (протеинкиназу, ассоциированную с миотонической дистрофией), Atn1 (атрофин 1), CBP (creb-связывающий белок), VLDLR (рецептор липопротеинов очень низкой плотности) и их любую комбинацию.Preferred proteins associated with trinucleotide repeat expansion disorders include HTT (huntingtin), AR (androgen receptor), FXN (frataxin), Atxn3 (ataxin), Atxn1 (ataxin), Atxn2 (ataxin), Atxn7 (ataxin), Atxn10 (ataxin), DMPK (myotonic dystrophy-associated protein kinase), Atn1 (utrophin 1), CBP (creb-binding protein), VLDLR (very low density lipoprotein receptor), and any combination thereof.
Болезнь АльцгеймераAlzheimer's disease
В публикации заявки на патент США № 20110023153 описывается применение нуклеаз с "цинковыми пальцами" для генетической модификации клеток, животных и белков, ассоциированных с болезнью Альцгеймера. После модификации клетки и животных можно дополнительно исследовать с применением известных способов для исследования воздействия целенаправленных мутаций на развитие и/или прогрессирование AD с использованием показателей, обычно применяемых в исследовании AD - таких как без ограничения обучение и память, тревожность, депрессия, привыкание и сенсомоторные функции, а также анализов, с помощью которых измеряют поведенческие, функциональные, патологические, метаболические и биохимические характеристики.U.S. Patent Application Publication No. 20110023153 describes the use of zinc finger nucleases to genetically modify cells, animals, and proteins associated with Alzheimer's disease. Once modified, the cells and animals can be further assayed using known methods to study the effects of targeted mutations on the development and/or progression of AD using measures commonly used in AD research, such as, but not limited to, learning and memory, anxiety, depression, addiction, and sensorimotor function, as well as assays that measure behavioral, functional, pathological, metabolic, and biochemical characteristics.
Настоящее раскрытие предусматривает редактирование любых хромосомных последовательностей, которые кодируют белки, ассоциированные с AD. Белки, связанные с AD, обычно выбирают исходя из экспериментально подтвержденной ассоциации белка, связанного с AD, с заболеванием AD. Например, скорость образования или концентрация в кровотоке белка, связанного с AD, может быть повышенной или пониженной в популяции с заболеванием AD по сравнению с популяцией без заболевания AD. Различия по уровням белка можно оценить с помощью протеомных методик, в том числе без ограничения вестерн-блоттинга, иммуногистохимического окрашивания, твердофазного иммуноферментного анализа (ELISA) и масс-спектрометрии. Альтернативно белки, связанные с AD, можно идентифицировать путем получения профилей генной экспрессии для генов, кодирующих белки, с помощью методик геномного анализа, в том числе без ограничения микроматричного анализа ДНК, последовательного анализа экспрессии генов (SAGE) и количественной полимеразной цепной реакции в режиме реального времени (Q-PCR).The present disclosure contemplates editing any chromosomal sequences that encode proteins associated with AD. Proteins associated with AD are typically selected based on experimentally confirmed association of the AD-associated protein with AD. For example, the rate of production or circulating concentration of an AD-associated protein may be increased or decreased in a population with AD compared to a population without AD. Differences in protein levels can be assessed using proteomic techniques, including but not limited to Western blotting, immunohistochemical staining, enzyme-linked immunosorbent assay (ELISA), and mass spectrometry. Alternatively, proteins associated with AD can be identified by generating gene expression profiles for genes encoding the proteins using genomic analysis techniques, including but not limited to DNA microarray analysis, sequence-based analysis of gene expression (SAGE), and quantitative real-time polymerase chain reaction (Q-PCR).
Примеры ассоциированных с болезнью Альцгеймера белков могут включать, например, белок-рецептор липопротеинов очень низкой плотности (VLDLR), кодируемый геном VLDLR, фермент 1, активирующий убиквитин-подобный модификатор (UBA1), кодируемый геном UBA1, или белок, являющийся каталитической субъединицей NEDD8-активирующего фермента E1 (UBE1C), кодируемый геном UBA3.Examples of Alzheimer's disease-associated proteins may include, for example, the very low density lipoprotein receptor protein (VLDLR) encoded by the VLDLR gene, the ubiquitin-like modifier activating enzyme 1 (UBA1) encoded by the UBA1 gene, or the NEDD8-activating enzyme E1 catalytic subunit protein (UBE1C) encoded by the UBA3 gene.
В качестве неограничивающего примера, белки, ассоциированные с AD, включают без ограничения белки, перечисленные ниже: кодируемый хромосомной последовательностью белок ALAS2, дельта-аминолевулинатсинтаза 2 (ALAS2), ABCA1 - ATФ-связывающий кассетный транспортер (ABCA1), ACE - ангиотензин I-превращающий фермент (ACE), APOE - предшественник аполипопротеина E (APOE), APP - белок-предшественник амилоида (APP), AQP1 - белок аквапорин 1 (AQP1), BIN1 - Myc-бокс-зависимый взаимодействующий белок 1 или адаптерный белок-интегратор 1 (BIN1), BDNF - нейротрофический фактор головного мозга (BDNF), BTNL8 - белок 8, подобный бутирофилину (BTNL8), C1ORF49 - белок, кодируемый открытой рамкой считывания 49 хромосомы 1, CDH4 - кадгерин-4, CHRNB2 - нейрональный ацетилхолиновый рецептор, субъединица бета-2, CKLFSF2 - CKLF-подобный белок 2, содержащий трансмембранный домен MARVEL (CKLFSF2), CLEC4E - лектиновый домен C-типа, семейство 4, представитель e (CLEC4E), CLU - кластериновый белок (также известный как аполипопротеин J) CR1 - эритроцитарный рецептор комплемента 1 (CR1, также известный как CD35, рецептор C3b/C4b и рецептор иммунной адгезии), CR1L - эритроцитарный рецептор комплемента 1 (CR1L), CSF3R - рецептор гранулоцитарного колониестимулирующего фактора 3 (CSF3R), CST3 - цистатин C или цистатин 3, CYP2C - цитохром P450 2C, DAPK1 - ассоциированная с клеточной гибелью протеинкиназа 1 (DAPK1), ESR1 - эстрогеновый рецептор 1, FCAR - Fc-фрагмент рецептора для IgA (FCAR, также известный как CD89), FCGR3B - Fc-фрагмент рецептора IIIb для IgG, с низким сродством (FCGR3B или CD16b), FFA2 - рецептор 2 свободных жирных кислот (FFA2), FGA - фибриноген (фактор I), GAB2 - GRB2-ассоциированный связывающий белок 2 (GAB2), GAB2 - GRB2-ассоциированный связывающий белок 2 (GAB2), GALP - галанин-подобный пептид, GAPDHS - глицеральдегид-3-фосфатдегидрогеназа сперматогенных клеток (GAPDHS), GMPB - GMBP, HP - гаптоглобин (HP), HTR7 - 5-гидрокситриптаминовый (серотониновый) рецептор 7 (сопряженный с аденилатциклазой), IDE - фермент, разрушающий инсулин IF127 IF127, IFI6 - интерферон альфа-индуцируемый белок 6 (IFI6), IFIT2 - интерферон-индуцируемый белок с тетратрикопептидными повторами 2 (IFIT2), IL1RN - антагонист рецептора интерлейкина-1 (IL-1RA), IL8RA - рецептор интерлейкина 8, альфа (IL8RA или CD181), IL8RB - рецептор интерлейкина 8, бета (IL8RB), JAG1 - белок Jagged 1 (JAG1), KCNJ15 - входящий калиевый канал, подсемейство J, представитель 15 (KCNJ15), LRP6 - белок 6, родственный рецептору липопротеинов низкой плотности (LRP6), MAPT - белок tau, ассоциированный с микротрубочками (MAPT), MARK4 - киназа 4 MAP/регулирующая сродство к микротрубочкам (MARK4), MPHOSPH1 - фосфобелок 1 M-фазы, MTHFR - 5,10-метилентетрагидрофолатредуктазу, MX2 - интерферон-индуцируемый GTP-связывающий белок Mx2, NBN - нибрин, также известный как NBN, NCSTN - никастрин, NIACR2 - рецептор 2 ниацина (NIACR2, также известный как GPR109B), NMNAT3 - никотинамиднуклеотидаденилилтрансфераза 3, NTM - нейротримин (или HNT), ORM1 - орозомукоид 1 (ORM1) или альфа-1-кислый гликопротеин 1, P2RY13 - пуринергический рецептор P2Y 13 (P2RY13), PBEF1 - никотинамидфосфорибозилтрансфераза (NAmPRTазу или Nampt), также известная как колониестимулирующий фактор 1 пре-B-клеток (PBEF1) или висфатин, PCK1 - -фосфоенолпируваткарбоксикиназа, PICALM - фосфатидилинозит-cвязывающий белок, вовлеченный в формирование клатриновых комплексов (PICALM), PLAU - активатор плазминогена урокиназного типа (PLAU), PLXNC1 - плексин C1 (PLXNC1), PRNP - прионный белок, PSEN1 - белок пресенилин 1 (PSEN1), PSEN2 - белок пресенилин 2 (PSEN2), PTPRA - белок, представляющий собой рецепторную протеинтирозинфосфатазу типа A (PTPRA), RALGPS2 - Ral GEF с доменом PH и SH3-связывающим мотивом 2 (RALGPS2), RGSL2 - белок 2, подобный регулятору передачи сигнала с помощью G-белка (RGSL2), SELENBP1 - селенсвязывающий белок 1 (SELNBP1), SLC25A37 - митоферрин-1, SORL1 - родственный сортилину рецептор L (класс DLR), белок, содержащий повторы A (SORL1), TF - трансферрин, TFAM - митохондриальный транскрипционный фактор A, TNF - фактор некроза опухоли, TNFRSF10C - суперсемейство рецепторов фактора некроза опухоли, представитель 10C (TNFRSF10C), TNFSF10 - суперсемейство рецепторов фактора некроза опухоли (TRAIL), представитель 10a (TNFSF10), UBA1 - фермент 1, активирующий убиквитин-подобный модификатор (UBA1), UBA3 - белок, являющийся каталитической субъединицей NEDD8-активирующего фермента E1 (UBE1C), UBB - белок убиквитин B (UBB), UBQLN1 - убиквилин-1, UCHL1 - белок эстеразу карбокси-конца убиквитина L1 (UCHL1), UCHL3 - белок-изофермент L3 гидролазы карбокси-конца убиквитина (UCHL3), VLDLR - белок-рецептор липопротеинов очень низкой плотности (VLDLR).By way of non-limiting example, proteins associated with AD include, but are not limited to, the proteins listed below: chromosomally encoded protein ALAS2, delta-aminolevulinate synthase 2 (ALAS2), ABCA1 - ATP-binding cassette transporter (ABCA1), ACE - angiotensin I-converting enzyme (ACE), APOE - apolipoprotein E precursor (APOE), APP - amyloid precursor protein (APP), AQP1 - aquaporin 1 protein (AQP1), BIN1 - Myc-box-dependent interacting protein 1 or adaptor protein integrator 1 (BIN1), BDNF - brain-derived neurotrophic factor (BDNF), BTNL8 - butyrophilin-like protein 8 (BTNL8), C1ORF49 - chromosome 1 open reading frame 49 protein, CDH4 - cadherin-4, CHRNB2 - neuronal acetylcholine receptor, subunit beta-2, CKLFSF2 - CKLF-like protein 2 containing MARVEL transmembrane domain (CKLFSF2), CLEC4E - C-type lectin domain, family 4, member e (CLEC4E), CLU - clusterin protein (also known as apolipoprotein J), CR1 - erythrocyte complement receptor 1 (CR1, also known as CD35, the C3b/C4b receptor, and the immune adhesion receptor), CR1L - erythrocyte complement receptor 1 (CR1L), CSF3R - granulocyte colony-stimulating factor receptor 3 (CSF3R), CST3 - cystatin C or cystatin 3, CYP2C - cytochrome P450 2C, DAPK1 - death-associated protein kinase 1 (DAPK1), ESR1 - estrogen receptor 1, FCAR - Fc fragment of the receptor for IgA (FCAR, also known as CD89), FCGR3B - Fc fragment of the receptor IIIb for IgG, low affinity (FCGR3B or CD16b), FFA2 - free fatty acid receptor 2 (FFA2), FGA - fibrinogen (factor I), GAB2 - GRB2-associated binding protein 2 (GAB2), GAB2 - GRB2-associated binding protein 2 (GAB2), GALP - galanin-like peptide, GAPDHS - glyceraldehyde-3-phosphate dehydrogenase of spermatogenic cells (GAPDHS), GMPB - GMBP, HP - haptoglobin (HP), HTR7 - 5-hydroxytryptamine (serotonin) receptor 7 (adenyl cyclase-coupled), IDE - insulin degrading enzyme IF127 IF127, IFI6 - interferon alpha-inducible protein 6 (IFI6), IFIT2 - interferon-inducible protein with tetratricopeptide repeats 2 (IFIT2), IL1RN - interleukin-1 receptor antagonist (IL-1RA), IL8RA - interleukin 8 receptor, alpha (IL8RA or CD181), IL8RB - interleukin 8 receptor, beta (IL8RB), JAG1 - Jagged 1 protein (JAG1), KCNJ15 - potassium influx channel, subfamily J, member 15 (KCNJ15), LRP6 - low-density lipoprotein receptor-related protein 6 (LRP6), MAPT - microtubule-associated protein tau (MAPT), MARK4 - MAP/microtubule affinity-regulated kinase 4 (MARK4), MPHOSPH1 - M-phase phosphoprotein 1, MTHFR - 5,10-methylenetetrahydrofolate reductase, MX2 - interferon-inducible GTP-binding protein Mx2, NBN - nibrin, also known as NBN, NCSTN - nicastrin, NIACR2 - niacin receptor 2 (NIACR2, also known as GPR109B), NMNAT3 - nicotinamide nucleotide adenylyltransferase 3, NTM - neurotrimin (or HNT), ORM1 - orosomucoid 1 (ORM1) or alpha-1-acid glycoprotein 1, P2RY13 - P2Y purinergic receptor 13 (P2RY13), PBEF1 - nicotinamide phosphoribosyltransferase (NAmPRTase or Nampt), also known as pre-B-cell colony-stimulating factor 1 (PBEF1) or visfatin, PCK1 - phosphoenolpyruvate carboxykinase, PICALM - phosphatidylinositol-binding protein involved in the formation of clathrin complexes (PICALM), PLAU - urokinase-type plasminogen activator (PLAU), PLXNC1 - plexin C1 (PLXNC1), PRNP - prion protein, PSEN1 - presenilin 1 protein (PSEN1), PSEN2 - presenilin 2 protein (PSEN2), PTPRA - protein tyrosine receptor phosphatase type A (PTPRA), RALGPS2 - Ral GEF with PH domain and SH3-binding motif 2 (RALGPS2), RGSL2 - G protein-coupled signaling regulator 2-like protein (RGSL2), SELENBP1 - selenium-binding protein 1 (SELNBP1), SLC25A37 - mitoferrin-1, SORL1 - sortilin-related receptor L (DLR class) repeat-containing protein A (SORL1), TF - transferrin, TFAM - mitochondrial transcription factor A, TNF - tumor necrosis factor, TNFRSF10C - tumor necrosis factor receptor superfamily member 10C (TNFRSF10C), TNFSF10 - tumor necrosis factor receptor superfamily (TRAIL) member 10a (TNFSF10), UBA1 - ubiquitin-like modifier-activating enzyme 1 (UBA1), UBA3 - NEDD8-activating enzyme E1 catalytic subunit protein (UBE1C), UBB - ubiquitin B protein (UBB), UBQLN1 - ubiquilin-1, UCHL1 - ubiquitin carboxy-terminal esterase protein L1 (UCHL1), UCHL3 - ubiquitin carboxy-terminal hydrolase L3 isoenzyme protein (UCHL3), VLDLR - very low density lipoprotein receptor protein (VLDLR).
В иллюстративных вариантах осуществления белки, ассоциированные с AD, редактирование хромосомной последовательности которых осуществляют, могут представлять собой белок рецептора липопротеинов очень низкой плотности (VLDLR), кодируемый геном VLDLR, фермент 1, активирующий убиквитин-подобный модификатор (UBA1), кодируемый геном UBA1, белок каталитической субъединицы NEDD8-активирующего фермента E1 (UBE1C), кодируемый геном UBA3, белок аквапорин 1 (AQP1), кодируемый геном AQP1, белок эстеразы карбокси-конца убиквитина L1 (UCHL1), кодируемый геном UCHL1, белок, относящийся к изоферменту L3 гидролазы карбокси-конца убиквитина (UCHL3), кодируемый геном UCHL3, белок убиквитин B (UBB), кодируемый геном UBB, белок tau, ассоциированный с микротрубочками (MAPT), кодируемый геном MAPT, белок рецептора тирозинфосфатазы типа A (PTPRA), кодируемый геном PTPRA, фосфатидилинозит-cвязывающий белок, вовлеченный в формирование клатриновых комплексов (PICALM), кодируемый геном PICALM, кластериновый белок (также известный как аполипопротеин J), кодируемый геном CLU, белок пресенилин 1, кодируемый геном PSEN1, белок пресенилин 2, кодируемый геном PSEN2, родственный сортилину рецептор L (класс DLR), белок, содержащий повторы A (SORL1), кодируемый геном SORL1, белок-предшественник амилоида (APP), кодируемый геном APP, предшественник аполипопротеина E (APOE), кодируемый геном APOE, или нейротрофический фактор головного мозга (BDNF), кодируемый геном BDNF. В иллюстративном варианте осуществления генетически модифицированное животное представляет собой крысу, и редактируемые хромосомные последовательности, кодирующие белок, ассоциированный с AD, являются следующими: APP - белок-предшественник амилоида (APP) - NM_019288, AQP1 - белок аквапорин 1 (AQP1) - NM_012778, BDNF - нейротрофический фактор головного мозга - NM_012513, CLU - кластериновый белок (также известный как аполипопротеин J) - NM_053021, MAPT - белок tau, ассоциированный с микротрубочками (MAPT) - NM_017212, PICALM - фосфатидилинозит-cвязывающий белок, вовлеченный в формирование клатриновых комплексов (PICALM) - NM_053554, PSEN1 - белок пресенилин 1 (PSEN1) - NM_019163, PSEN2 - белок пресенилин 2 (PSEN2) - NM_031087, PTPRA - белок, представляющий собой рецепторную протеинтирозинфосфатазу типа A (PTPRA) - NM_012763, SORL1 - родственный сортилину рецептор L (класс DLR), белок, содержащий повторы A (SORL1) - NM_053519, XM_001065506, XM_217115, UBA1 - фермент 1, активирующий убиквитин-подобный модификатор (UBA1) - NM_001014080, UBA3 - белок, являющийся каталитической субъединицей NEDD8-активирующего фермента E1 (UBE1C) - NM_057205, UBB - белок убиквитин B (UBB) - NM_138895, UCHL1 - белок эстераза карбокси-конца убиквитина L1 (UCHL1) - NM_017237, UCHL3 - белок-изофермент L3 гидролазы карбокси-конца убиквитина (UCHL3) - NM_001110165, VLDLR - белок-рецептор липопротеинов очень низкой плотности (VLDLR) - NM_013155.In exemplary embodiments, the AD-associated proteins whose chromosomal sequence editing is performed can be the very low density lipoprotein receptor (VLDLR) protein encoded by the VLDLR gene, the ubiquitin-like modifier activating enzyme 1 (UBA1) enzyme encoded by the UBA1 gene, the NEDD8 activating enzyme E1 catalytic subunit protein (UBE1C) protein encoded by the UBA3 gene, the aquaporin 1 (AQP1) protein encoded by the AQP1 gene, the ubiquitin carboxy-terminal esterase L1 protein (UCHL1) protein encoded by the UCHL1 gene, the ubiquitin carboxy-terminal hydrolase isoenzyme L3 protein (UCHL3) encoded by the UCHL3 gene, the ubiquitin B (UBB) protein encoded by the UBB gene, the microtubule-associated tau protein (MAPT) encoded by the MAPT gene, protein tyrosine phosphatase receptor type A (PTPRA), encoded by the PTPRA gene, phosphatidylinositol-binding protein involved in clathrin complex formation (PICALM), encoded by the PICALM gene, clusterin protein (also known as apolipoprotein J), encoded by the CLU gene, presenilin 1 protein, encoded by the PSEN1 gene, presenilin 2 protein, encoded by the PSEN2 gene, sortilin-related receptor L (DLR class), protein containing repeats A (SORL1), encoded by the SORL1 gene, amyloid precursor protein (APP), encoded by the APP gene, apolipoprotein E precursor (APOE), encoded by the APOE gene, or brain-derived neurotrophic factor (BDNF), encoded by the BDNF gene. In an exemplary embodiment, the genetically modified animal is a rat and the edited chromosomal sequences encoding a protein associated with AD are as follows: APP - amyloid precursor protein (APP) - NM_019288, AQP1 - aquaporin 1 protein (AQP1) - NM_012778, BDNF - brain-derived neurotrophic factor - NM_012513, CLU - clusterin protein (also known as apolipoprotein J) - NM_053021, MAPT - microtubule-associated protein tau (MAPT) - NM_017212, PICALM - phosphatidylinositol-binding protein involved in the formation of clathrin complexes (PICALM) - NM_053554, PSEN1 - presenilin protein 1 (PSEN1) - NM_019163, PSEN2 - presenilin 2 protein (PSEN2) - NM_031087, PTPRA - protein tyrosine phosphatase receptor type A (PTPRA) - NM_012763, SORL1 - sortilin-related receptor L (DLR class), protein containing repeats A (SORL1) - NM_053519, XM_001065506, XM_217115, UBA1 - ubiquitin-like modifier activating enzyme 1 (UBA1) - NM_001014080, UBA3 - protein that is the catalytic subunit of NEDD8-activating enzyme E1 (UBE1C) - NM_057205, UBB - ubiquitin B protein (UBB) - NM_138895, UCHL1 - ubiquitin carboxy-terminal esterase protein L1 (UCHL1) - NM_017237, UCHL3 - ubiquitin carboxy-terminal hydrolase protein L3 isoenzyme (UCHL3) - NM_001110165, VLDLR - very low density lipoprotein receptor protein (VLDLR) - NM_013155.
Животное или клетка может содержать 1, 2, 3, 4, 5, 6, 7, 8, 9,10, 11, 12, 13, 14, 15 или более хромосомных последовательностей с нарушенной структурой, кодирующих белок, ассоциированный с AD, и ноль, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 или более интегрированных в хромосомы последовательностей, кодирующих белок, ассоциированный с AD.The animal or cell may contain 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 or more chromosomal sequences with a disrupted structure encoding a protein associated with AD, and zero, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 or more chromosomally integrated sequences encoding a protein associated with AD.
Отредактированную или интегрированную хромосомную последовательность можно модифицировать так, чтобы она кодировала измененный белок, ассоциированный с AD. Ряд мутаций в хромосомных последовательностях, связанных с AD, были ассоциированы с AD. Например, миссенс-мутация V7171 (т.е. валин в положении 717 заменен на изолейцин) в APP приводит к семейной форме AD. Несколько мутаций в белке пресенилин-1, например, H163R (т.е. гистидин в положении 163 заменен на аргинин), A246E (т.е. аланин в положении 246 заменен на глутамат), L286V (т.е. лейцин в положении 286 заменен на валин) и C410Y (т.е. цистеин в положении 410 заменен на тирозин) приводят к семейной форме болезни Альцгеймера 3 типа. Мутации в белке пресенилин-2, например, N141I (т.е. аспарагин в положении 141 заменен на изолейцин), M239V (т.е. метионин в положении 239 заменен на валин) и D439A (т.е. аспартат в положении 439 заменен на аланин) приводят к семейной форме болезни Альцгеймера 4 типа. Другие ассоциации генных вариантов генов, ассоциированных с AD, и заболевания известны из уровня техники. См., например, публикацию Waring et al. (2008) Arch. Neurol. 65:329-334, раскрытие которой включено в данный документ посредством ссылки во всей своей полноте.The edited or integrated chromosomal sequence can be modified to encode an altered protein associated with AD. A number of mutations in chromosomal sequences associated with AD have been associated with AD. For example, the missense mutation V7171 (i.e., valine at position 717 is replaced by isoleucine) in APP results in a familial form of AD. Several mutations in the presenilin-1 protein, such as H163R (i.e., histidine at position 163 is replaced by arginine), A246E (i.e., alanine at position 246 is replaced by glutamate), L286V (i.e., leucine at position 286 is replaced by valine), and C410Y (i.e., cysteine at position 410 is replaced by tyrosine), result in a familial form of Alzheimer's disease type 3. Mutations in the presenilin-2 protein, such as N141I (i.e., asparagine at position 141 is replaced by isoleucine), M239V (i.e., methionine at position 239 is replaced by valine), and D439A (i.e., aspartate at position 439 is replaced by alanine) lead to familial Alzheimer's disease type 4. Other associations of gene variants in genes associated with AD and disease are known in the art. See, for example, Waring et al. (2008) Arch. Neurol. 65:329-334, the disclosure of which is incorporated herein by reference in its entirety.
Примеры связанных с заболеваниями геновExamples of disease-associated genes
Примеры ассоциированных с заболеваниями генов и полинуклеотидов приведены в таблицах A и B. Примеры ассоциированных с биохимическими путями передачи сигналов генов и полинуклеотидов приведены в таблице C.Examples of disease-associated genes and polynucleotides are shown in Tables A and B. Examples of biochemical signaling pathway-associated genes and polynucleotides are shown in Table C.
склерозеin amyotrophic lateral
sclerosis
Перечень иллюстративных целевых генов, целевых локусов, целевых полинуклеотидовList of illustrative target genes, target loci, target polynucleotides
В качестве примера хромосомная последовательность может включать без ограничения IL1B (интерлейкин 1, бета), XDH (ксантиндегидрогеназу), TP53 (опухолевый белок p53), PTGIS (простагландин 12 (простациклин) синтазу), MB (миоглобин), IL4 (интерлейкин 4), ANGPT1 (ангиопоэтин 1), ABCG8 (АТФ-связывающую кассету, подсемейство G (WHITE), представитель 8), CTSK (катепсин K), PTGIR (рецептор простангландина 12 (простациклина) (IP)), KCNJ11 (калиевый канал внутреннего выпрямления, подсемейство J, представитель 11), INS (инсулин), CRP (C-реактивный белок, связанный с пентраксином), PDGFRB (тромбоцитарный фактор роста, бета-полипептид), CCNA2 (циклин A2), PDGFB (гомолог онкогена бета-полипептида тромбоцитарного фактора роста (вируса сарпкомы обезьян (v-sis))), KCNJ5 (калиевый канал внутреннего выпрямления, подсемейство J, представитель 5), KCNN3 (калиевый, активируемый кальцием канал, промежуточного/низкого проведения, подсемейство N, представитель 3), CAPN10 (кальпаин 10), PTGES (простагландин E синтаза), ADRA2B (альфа-2B-адренергический рецептор), ABCG5 (АТФ-связывающую кассету, подсемейство G (WHITE), представитель 5), PRDX2 (пероксиредоксин 2), CAPN5 (кальпаин 5), PARP14 (семейство поли (АДФ-рибозо) полимераз, представитель 14), MEX3C (гомолог C mex-3 (C. elegans)), ACE ангиотензин I-конвертирующий фермент (пептидил-дипептидазу A) 1), TNF (фактор некроза опухоли (суперсемейство TNF, представитель 2)), IL6 (интерлейкин 6 (интерферон, бета 2)), STN (статин), SERPINE1 (ингибитор серпинпептидазы, клада E (нексин, ингибитор активатора плазминогена 1 типа), представитель 1), ALB (альбумин), ADIPOQ (адипонектин, содержащий C1Q и коллагеновый домен), APOB (аполипопротеин B (в том числе антиген Ag(x))), APOE (аполипопротеин E), LEP (лептин), MTHFR (5,10-метилентетрагидрофолатредуктаза (NADPH)), APOA1 (аполипопротеин A-I), EDN1 (эндотелин 1), NPPB (предшественник натрийуретического пептида B), NOS3 (синтазу оксида азота 3 типа (эндотелиальная клетка)), PPARG (гамма-рецептор, активируемый пролифератором пероксисом), PLAT (активатор плазминогена, тканевой), PTGS2 (простагландин-эндопероксидсинтазу 2 типа (простагландин G/H синтазу и циклооксигеназу)), CETP (транспортный белок холестериновых эфиров, плазменный), AGTR1 (рецептор антиотензина II, 1 тип), HMGCR (3-гидрокси-3-метилглутарил-кофермент A редуктазу), IGF1 (инсулинподобный фактор роста 1 (соматомедин C)), SELE (селектин E), REN (ренин), PPARA (альфа-рецептор, активируемый пролифератором пероксисом), PON1 (параоксоназу 1), KNG1 (кининоген 1), CCL2 (хемокиновый лиганд 2 (с мотивом C-C)), LPL (липопротеинлипазу), VWF (фактор фон Виллебранда), F2 (фактор коагуляции II (тромбин)), ICAM1 (молекулу межклеточной адгезии 1), TGFB1 (трансформирующий фактор роста, бета 1), NPPA (предшественник натрийуретического пептида A), IL10 (интерлейкин 10), EPO (эритропоэтин), SOD1 (супероксиддисмутазу 1, растворимую), VCAM1 (молекулу адгезии эндотелия сосудов 1 типа), IFNG (интерферон, гамма), LPA (липопротеин, Lp(a)), MPO (миелопероксидазу), ESR1 (эстрогеновый рецептор 1), MAPK1 (митоген-активируемую протеинкиназу 1), HP (гаптоглобин), F3 (фактор коагуляции III (тромбопластин, тканевой фактор)), CST3 (цистатин C), COG2 (компонент олигомерного комплекса Гольджи 2 типа), MMP9 (матриксную металлопептидазу 9 (желатиназу B, желатиназу размером 92 кДа, коллагеназу IV типа размером 92 кДа)), SERPINC1 (ингибитор серпинпептидазы, клада C (антитромбин), представитель 1), F8 (фактор коагуляции VIII, прокоагулянтный компонент), HMOX1 (гемоксигеназу (дециклическую) 1 типа), APOC3 (аполипопротеин C-III), IL8 (интерлейкин 8), PROK1 (прокинетицин 1), CBS (цистатионин-бета-синтазу), NOS2 (синтазу оксида натрия 2 типа, индуцируемую), TLR4 (toll-подобный рецептор 4 типа), SELP (селектин P (гранульный мембранный белок размером 140 кДа, антиген CD62)), ABCA1 (АТФ-связывающую кассету, подсемейство A (ABC1), представитель 1), AGT (ангиотензин (ингибитор серпинпептидазы, клада A, представитель 8)), LDLR (рецептор липопротеина низкой плотности), GPT (глутамат-пируваттрансаминазу (аланинаминотрансферазу)), VEGFA (фактор роста эндотелия сосудов A), NR3C2 (ядерный рецептор, подсемейство 3, группа C, представитель 2), IL18 (интерлейкин 18 (фактор индукции интерферона гамма)), NOS1 (синтазу оксида азота 1 типа (нейрональную)), NR3C1 (ядерный рецептор, подсемейство 3, группа C, представитель 1 (глюкокортикоидный рецептор)), FGB (бета-цепь фибриногена), HGF (фактор роста гепатоцитов (гепатопоэтин A; рассеивающий фактор)), IL1A (интерлейин 1, альфа), RETN (резистин), AKT1 (гомолог онкогена вируса тимомы мышей 1 типа v-akt), LIPC (липазу, печеночную), HSPD1 (белок теплового шока 1 типа размером 60 кДА (шаперонин)), MAPK14 (митоген-активируемую протеинкиназу 14), SPP1 (секретируемый фосфопротеин 1), ITGB3 (интегрин, бета 3 (тромбоцитарный гликопротеин 111a, антиген CD61)), CAT (каталазу), UTS2 (уротензин 2), THBD (тромбомодулин), F10 (фактор коагуляции X), CP (церулоплазмин (ферроксидазу)), TNFRSF11B (суперсемейство фактора некроза опухоли, представитель 11b), EDNRA (рецептор эндотелина типа A), EGFR (рецептор эпидермального фактора роста (гомолог онкогена вируса эритробластического лейкоза (v-erb-b), птичьего)), MMP2 (матриксную металлопептидазу 2 (желатиназу A, желатиназу с массой 72 кДа, коллагеназу IV типа размером 72 кДа)), PLG (плазминоген), NPY (нейропептид Y), RHOD (семейство генов гомологов ras, представитель D), MAPK8 (митоген-активируемую протеинкиназу 8), MYC (гомолог онкогена вируса миелоцистоматоза v-myc (птичьего)), FN1 (фибронектин 1), CMA1 (химазу 1, тучная клетка), PLAU (активатор плазминогена, урокиназу), GNB3 (гуанин-нуклеотид-связывающий белок (G-белок), бета-полипептид 3 типа), ADRB2 (адренергический бета-2-рецептор, поверхностный), APOA5 (аполипопротеин A-V), SOD2 (супероксиддисмутазу 2, митохондриальную), F5 (фактор коагуляции V (проакселерин, лабильный фактор)), VDR (рецептор витамина D (1,25-дигидроксивитамина D3), ALOX5 (арахидонат 5-липооксигеназу), HLA-DRB1 (главный комплекс гистосовместимости, класс II, DR бета 1), PARP1 (поли (АДФ-рибозо) полимеразу 1 типа), CD40LG (лиганд CD40), PON2 (параоксоназу 2), AGER (рецептор, специфичный к конечным продуктам дополнительного гликозилирования), IRS1 (субстрат для инсулинового рецептора 1 типа), PTGS1 (простагландин-эндопероксидсинтазу 1 типа (простагландин G/H синтазу и циклооксигеназу)), ECE1 (эндотелин-превращающий фермент 1 типа), F7 (фактор коагуляции VII (сывороточный ускоритель превращения тромбина)), URN (антагонист рецептора интерлейкина 1), EPHX2 (эпоксидгидролазу 2 типа, цитоплазматическую), IGFBP1 (связывающий белок инсулинподобного фактора роста 1 типа), MAPK10 (митоген-активируемую протеинкиназу 10), FAS (Fas (суперсемейство рецепторов TNF, представитель 6)), ABCB1 (АТФ-связывающую кассету, подсемейство B (MDR/TAP), представитель 1), JUN (онкоген jun), IGFBP3 (связывающий белок инсулинподобного фактора роста 3 типа), CD14 (молекулу CD14), PDE5A (фосфодиэстеразу 5A, cGMP-специфичную), AGTR2 (рецептор ангиотензина II, 2 тип), CD40 (молекулу CD40, представитель 5 суперсемейства рецепторов TNF), LCAT (лецитин-холестерин-ацилтрансферазу), CCR5 (хемокиновый рецептор 5 типа (с мотивом C-C)), MMP1 (матриксную металлопептидазу 1 (интерстициальную коллагеназу)), TIMP1 (ингибитор металлопептидазы TIMP 1 типа), ADM (адреномедуллин), DYT10 (дистонию 10), STAT3 (передатчик сигнала и активатор транскрипции 3 типа (фактор ответа острой фазы)), MMP3 (матриксную металлопептидазу 3 (стромелизин 1, прожелатиназу)), ELN (эластин), USF1 (фактор транскрипции, связывающийся перед сайтом инициации транскрипции 1), CFH (фактор комплемента H), HSPA4 (белок теплового шока 4 размером 70 кДа), MMP12 (матриксную металлопептидазу 12 (макрофагальную эластазу)), MME (мембранную металлоэндопептидазу), F2R (рецептор фактора коагуляции II (тромбина)), SELL (селектин L), CTSB (катепсин B), ANXA5 (аннексин A5), ADRB1 (адренергический бета-1-рецептор), CYBA (цитохром b-245, альфа-пептид), FGA (альфа-цепь фибриногена), GGT1 (гамма-глутамилтрансферазу 1), LIPG (липазу, эндотелиальную), HIF1A (фактор, индуцируемый гипоксией 1, альфа-субъединицу (фактор транскрипции основной структуры спираль-петля-спираль)), CXCR4 (хемокиновый рецептор 4 (с мотивом C-X-C)), PROC (белок C (инактиватор факторов коагуляции Va и VIIIa)), SCARB1 (фагоцитарный рецептор, класс B, представитель 1), CD79A (молекулу CD79a, иммуноглобулин-ассоциированную альфа), PLTP (белок переноса фосфолипидов), ADD1 (аддуцин 1 (альфа)), FGG (гамма-цепь фибриногена), SAA1 (сывороточный амилоид A1), KCNH2 (калиевый потенциалзависимый канал, семейство H (eag-связанный), представитель 2), DPP4 (дипептидилпептидазу 4), G6PD (глюкозо-6-фосфатдегидрогеназу), NPR1 (натрийуретический пептидный рецептор A/гуанилатциклазу A (атрионатрийуретический пептидный рецептор A)), VTN (витронектин), KIAA0101 (KIAA0101), FOS (гомолог онкогена вируса остеосаркомы мышей FBJ), TLR2 (toll-подобный рецептор 2), PPIG (пептидилпролинизомеразу G (циклопролин G)), IL1R1 (рецептор интерлейкина I типа), AR (андрогеновый рецептор), CYP1A1 (цитохром P450, семейство 1, подсемейство A, полипептид 1), SERPINA1 (ингибитор серпинпептидазы, клада A (альфа-1 антипротеиназу, антитрипсин), представитель 1), MTR (5-метилтетрагидрофолат-госоцистеинметилтрансферазу), RBP4 (ретинол-связывающий белок 4 типа, плазменный), APOA4 (аполипопротеин A-IV), CDKN2A (циклин-зависимый ингибитор киназы 2A (меланома, p16, ингибирует CDK4)), FGF2 (фактор роста фибробластов 2 (основной)), EDNRB (эндотелиновый рецептор B типа), ITGA2 (интегрин, альфа 2 (CD49B, альфа 2 субъединицу VLA-2 рецептора)), CABIN1 (кальцинейрин-связывающий белок 1), SHBG (глобулин, связывающийся с половыми гормонами), HMGB1 (группу белков с высокой подвижностью 1 типа), HSP90B2P (белок теплового шока размером 90 кДА, бета (Grp94), представитель 2 (псевдоген)), CYP3A4 (цитохром P450, семейство 3, подсемейство A, полипептид 4), GJA1 (белок межклеточных щелевых контактов, альфа 1, 43 кДа), CAV1 (кавеолин 1, белок кавеол, 22 кДа), ESR2 (эстрогеновый рецептор 2 (ER бета)), LTA (лимфотоксин альфа (суперсемейство TNF, представитель 1)), GDF15 (фактор роста и дифференцировки 15), BDNF (нейротрофический фактор головного мозга), CYP2D6 (цитохром P450, семейство 2, подсемейство D, полипептид 6), NGF (фактор роста нервов (бета-полипептид)), SP1 (фактор транкрипции Sp1), TGIF1 (TGFB-индуцируемый фактор гомеобокс 1), SRC (гомолог онкогена вируса саркомы v-src (Schmidt-Ruppin A-2) (птичьего)), EGF (эпидермальный фактор роста (бета-урогастрон)), PIK3CG (фосфоинозитид-3-киназу, каталитическую, гамма-полипептид), HLA-A (основной комплекс гистосовместимости, класс I, A), KCNQ1 (калиевый потенциалзависимый канал, KQT-подобное семейство, представитель 1), CNR1 (каннабиноидный рецептор 1 (головной мозг)), FBN1 (фибриллин 1), CHKA (холинкиназу альфа), BEST1 (бестрофин 1), APP (белок-предшественник амилоида бета (A4)), CTNNB1 (катенин (кадгерин-ассоциированный беок), бета 1, 88 кДа), IL2 (интерлейкин 2), CD36 (молекулу CD36 (тромбоспондиновый рецептор)), PRKAB1 (протеинкиназу, AMФ-активируемую, бета 1 некаталитическую субъединицу), TPO (тиреоидную перокидазу), ALDH7A1 (семейство альдегиддегидрогеназы 7, представитель A1), CX3CR1 (хемокиновый рецептор 1 (с мотивом C-X3-C)), TH (тирозингидроксилазу), F9 (фактор коагуляции IX), GH1 (гормон роста 1), TF (трансферрин), HFE (гемохроматоз), IL17A (интерлейкин 17A), PTEN (гомолог фосфатазы и тензина), GSTM1 (глутатион S-трансферазу мю 1), DMD (дистрофин), GATA4 (GATA связывающий белок 4 типа), F13A1 (фактор коагуляции XIII, полипептид A1), TTR (транстиретин), FABP4 (связывающий белок жирных кислот 4 типа, адипоцитарный), PON3 (параоксоназу 3), APOC1 (аполипопротеин C-I), INSR (инсулиновый рецептор), TNFRSF1B (суперсемейство рецепторов фактора некроза опухоли, представитель 1B), HTR2A (5-гидрокситриптаминовый (серотониновый) рецептор 2A), CSF3 (колониестимулирующий фактор 3 (гранулоцитарный)), CYP2C9 (цитохром P450, семейство 2, подсемейство C, полипептид 9), TXN (тиоредоксин), CYP11B2 (цитохром P450, семейство 11, подсемейство B, полипептид 2), PTH (паратиреоидный гормон), CSF2 (колониестимулирующий фактор 2 (гранулоцитарно-макрофагальный)), KDR (рецептор, содержащий домен вставки киназы (рецептор тирозинкиназы III типа)), PLA2G2A (фосфолипазу A2, группа IIA (тромбоциты, синовиальная жидкость)), B2M (бета-2-микроглобулин), THBS1 (тромбоспондин 1), GCG (глюкагон), RHOA (семейство генов гомологов ras, представитель A), ALDH2 (семейство альдегиддегидрогеназы 2 (митохондриальной)), TCF7L2 (фактор транскрипции 7, подобный фактору 2 (специфичный по отношению к T-клеткам, HMG-бокс)), BDKRB2 (брадикининовый рецептор B2), NFE2L2 (фактор 2, подобный ядерному фактору (эритроидный 2)), NOTCH1 (гомолог Notch 1, ассоциированный с транслокациями (дрозофилиный)), UGT1A1 (UDP-глюкуронилтрансферазу семейства 1, полипипетид A1), IFNA1 (интерферон, альфа 1), PPARD (дельта-рецептор, активируемый пролифератором пероксисом), SIRT1 (сиртуин 1 (гомолог 2 регуляции молчащей информации совпадающего типа) (S. cerevisiae)), GNRH1 (гонадотропин-рилизинг гормон 1 (лютеинизирующий-рилизинг гормон)), PAPPA (ассоциированный с беременностью белок A плазмы, папализин 1), ARR3 (аррестин 3, ретинальный (X-аррестин)), NPPC (предшественник натрийуретического пептида C), AHSP (альфа-гемоглобин-стабилизирующий белок), PTK2 (протеинтирозинкиназу 2 типа PTK2), IL13 (интерлейкин 13), MTOR (мишень механизма действия рапамицина (серин/треоринкиназу)), ITGB2 (интергрин, бета 2 (субъединицу рецептора 3 и 4 компонента 3 комплемента)), GSTT1 (глутатион-S-трансферазу тета 1), IL6ST (передатчик сигнала интерлейкина 6 (gp130, рецептор онкостатина М)), CPB2 (карбоксипептидазу B2 (плазменную)), CYP1A2 (цитохром P450, семейство 1, подсемейство A, полипептид 2), HNF4A (ядерный фактор гепатоцитов 4, альфа), SLC6A4 (семейство переносчиков растворенных веществ 6 (переносчик нейромедиаторов, серотонина), представитель 4), PLA2G6 (фосфолипазу A2, группа VI (цитозольную, кальций-независимую)), TNFSF11 (суперсемейство фактора роста опухоли (лиганд), представитель 11), SLC8A1 (семейство переносчиков растворенных веществ 8 (натрий-кальциевый антипортер), представитель 1), F2RL1 (рецептор-подобный фактор коагуляции II 1 (тромбин)), AKR1A1 (семейство альдокеторедуктаз 1, представитель A1 (алдегидредуктазу)), ALDH9A1 (семейство альдегиддегирогензы 9, представитель A1), BGLAP (белок гамма-карбоксиглутамата (gla)), MTTP (микросомальный белок переноса триглицеридов), MTRR (редуктаза 5-метилтетрагидрофолат-гомоцистеинметилтрансферазы), SULT1A3 (семейство сульфотрансфераз, цитозолоный, 1A, фенол-предпочтительный, представитель 3), RAGE (антиген опухоли почек), C4B (компонент 4В комплемента (группа крови Chido), P2RY12 (пуринергический рецептор P2Y, связанный с G-белком, 12), RNLS (реналазу, FAD-зависимую аминооксидазу), CREB1 (белок 1, связывающий чувствительный к cAMP элемент), POMC (проопиомеланокортин), RAC1 (связанный с ras субстрат 1 ботулотоксина C3 (семейство rho, малый GTP связывающий белок Rac1)), LMNA (ламин NC), CD59 (молекулу CD59, регуляторный белок комплемента), SCN5A (натриевый канал, потенциалзависимый, V типа, альфа-субъединицу), CYP1B1 (цитохром P450, семейство 1, подсемейство B, полипептид 1), MIF (фактор ингибирования миграции макрофагов (фактор, ингибирующий гликозилирование)), MMP13 (матриксную метталлопептидазу 13 (коллагеназу 3)), TIMP2 (ингибитор металлопептидазы 2 TIMP), CYP19A1 (цитохром P450, семейство 19, подсемейство A, полипептид 1), CYP21A2 (цитохром P450, семейство 21, подсемейство A, полипептид 2), PTPN22 (протеинтирозинфосфатазу, нерецепторную, 22 типа (лимфоидную)), MYH14 (миозин, тяжелую цепь 14, немышечный), MBL2 (маннозо-связывающий лектин (белок C) 2, растворимый (дефект опсонина)), SELPLG (лиганд селектина P), AOC3 (аминоксидазу, медь-содержащую 3 (белок 1 адгезии сосудов)), CTSL1 (катепсин L1), PCNA (ядерный антиген пролиферирующих клеток), IGF2 (инсулинподобный фактор роста 2 (соматомедин A)), ITGB1 (интегрин, бета 1 (фибронектиновый рецептор, бета-полипептид, антиген CD29 включает MDF2, MSK12)), CAST (кальпастатин), CXCL12 (хемокиновый лиганд 12 (с мотивом C-X-C) (стромальный клеточный фактор 1)), IGHE (константную область тяжелой эпсилон-цепи иммуноглобулина), KCNE1 (калиевый потенциалзависимый канал, Isk-связанное семейство, представитель 1), TFRC (трансферриновый рецептор (p90, CD71)), COL1A1 (коллаген 1 типа, альфа 1), COL1A2 (коллаген, I типа, альфа 2), IL2RB (рецептор интерлейкина 2, бета), PLA2G10 (фрсфолипидазу A2, группа X), ANGPT2 (ангиопоэтин 2), PROCR (рецептор протеина C, эндотелиальный (EPCR)), NOX4 (NADPH-оксидазу 4), HAMP (гепцидиновый антимикробный пептид), PTPN11 (протеинтирозинфосфатазу, нерецепторную, 11 типа), SLC2A1 (семейство переносчиков растворенных веществ 2 (переносчик глюкозы посредством облегченной диффузии), представитель 1), IL2RA (рецептор интерлейкина 2, альфа), CCL5 (хемокиновый лиганд 5 (с мотивом C-C)), IRF1 (регуляторный фактор интерферона 1), CFLAR (CASP8 и FADD-подобный регулятор апоптоза), CALCA (кальцитонин-связанный полипептид альфа), EIF4E (фактор инициации трансляции эукариот 4E), GSTP1 (пи-1-глутатин-S-трансферазу), JAK2 (Янус-киназу 2), CYP3A5 (цитохром P450, семейство 3, подсемейство A, полипептид 5), HSPG2 (гепаринсульфатпротеогликан 2), CCL3 (хемокиновый лиганд 3 (с мотивом C-C)), MYD88 (ген первичного ответа миелоидной дифференциации (88)), VIP (вазоактивный пептид кишечника), SOAT1 (стерол-O-ацилтрансферазу 1), ADRBK1 (адренергическую, бета, рецепторную киназу 1), NR4A2 (подсемейство ядерных рецепторов 4, группа A, представитель 2), MMP8 (матриксную металлопептидазу 8 (нейтрофильную коллагеназу)), NPR2 (рецептор натрийуретического пептида B/гуанилатциклазу B (рецептор атрионатрийуретического пептида B)), GCH1 (GTP гидролазу 1), EPRS (глутамил-пропил-тРНК-синтетазу), PPARGC1A (гамма-рецептор, активируемый пролифератором пероксисом, коактиватор 1 альфа), F12 (фактор коагуляции XII (фактор Хагемана)), PECAM1 (молекулу адгезии тромбоцитов/эндотелиальных клеток), CCL4 (хемокиновый лиганд 4 (с мотивом C-C)), SERPINA3 (ингибитор серпинпептидазы, клада A (альфа-1-антипротеиназу, антитрипсин), представитель 3), CASR (кальций-чувствительный рецептор), GJA5 (белок межклеточных щелевых контактов, альфа 5, 40 кДа), FABP2 (связывающий белок жирных кислот 2 типа, кишечный), TTF2 (фактор терминации транскрипции, РНК-полимеразу II), PROS1 (белок S (альфа)), CTF1 (кардиотропин 1), SGCB (саркогликан, бета (дистрофин-ассоциированный гликопротеин размером 43 кДа)), YME1L1 (YME1-подобный фактор 1 (S. cerevisiae)), CAMP (кателицидиновый антимикробный пептид), ZC3H12A (содержащий фактор типа CCCH с цинковыми пальцами 12A), AKR1B1 (семейство альдокеторедуктазы 1, представитель B1 (альдоредуктазу)), DES (десмин), MMP7 (матриксную металлопептидазу 7 (матрилизин, маточный)), AHR (арил-углеводородный рецептор), CSF1 (колониестимулирующий фактор 1 (макрофагальный)), HDAC9 (гистон-деацетилазу 9), CTGF (фактор роста соединительной ткани), KCNMA1 (калиевый, активируемый кальцием канал высокого проведения, подсемейство M, альфа, представитель 1), UGT1A (UDP-глюкуронилтрансферазу семейства 1, локус комплекса полипептида A), PRKCA (протеинкиназу C, альфа), COMT (катехол-бета-метилтрансферазу), S100B (S100 кальций-связывающий белок B), EGR1 (фактор роста раннего ответа 1), PRL (пролактин), IL15 (интерлейкин 15), DRD4 (дофаминовый рецептор D4), CAMK2G (кальций/кальмодулинзависимую протеинкиназу II гамма), SLC22A2 (семейство переносчиков растворенных веществ 22 (переносчик органических катионов), представитель 2), CCL11 (хемокиновый лиганд 11 (с мотивом C-C)), PGF (плацентартный фактор роста B321), THPO (тромбопоэтин), GP6 (гликопротеин VI (тромбоцитарный)), TACR1 (тахикиновый рецептор 1), NTS (нейротензин), HNF1A (HNF1 гомеобокс A), SST (соматостатин), KCND1 (калиевый потенциалзависимый канал, связанное с Shal подсемейство, представитель 1), LOC646627 (ингибитор фосфолипазы), TBXAS1 (тромбоксан A синтазу 1 (тромбоцитарную)), CYP2J2 (цитохром P450, семейство 2, подсемейство J, полипептид 2), TBXA2R (рецептор тромбоксана A2), ADH1C (алкогольдегидрогеназу 1C (класс I), гамма-полипептид), ALOX12 (арахидонат 12-липогеназу), AHSG (альфа-2-HS-гликопротеин), BHMT (бетаин-гомоцистеинметилтрансферазу), GJA4 (белок щелевых межклеточных контактов, альфа 4, 37 кДа), SLC25A4 (семейство переносчиков растворенных веществ 25 (митохондриальный переносчик; аденин-нуклеотид транслокатор), представитель 4), ACLY (АТФ-цитратлиазу), ALOX5AP (белок, активирующий арахидонат-5-липооксигеназу), NUMA1 (ядерный белок митотического аппарата 1), CYP27B1 (цитохром P450, семейство 27, подсемейство B, полипептид 1), CYSLTR2 (цистеинил-лейкотриеновый рецептор 2), SOD3 (супероксиддисмутазу 3, внеклеточную), LTC4S (лейкотриен C4-синтазу), UCN (урокортин), GHRL (препропептид грелина/обестатина), APOC2 (аполипопротеин C-II), CLEC4A (семейство 4 домена лектина C-типа, представитель A), KBTBD10 (содержащий kelch-повтор и домен BTB (POZ) 10), TNC (тенаскин C), TYMS (тимидилатсинтетазу), SHCl (SHC-трансформирующий белок 1 (содержащий домен 2 с Src-гомологией)), LRP1 (белок 1, связанный с рецепторами липопротеина низкой плотности), SOCS3 (супрессор 3 передачи сигнала с участием цитокинов), ADH1B (алкогольдегидрогеназу 1B (I класс), бета-полипептид), KLK3 (связанную с калликреином пептидазу 3), HSD11B1 (гидроксистероид (11-бета) дегидрогеназу 1), VKORC1 (витамин K эпоксид-редуктазный комплекс, субъединица 1), SERPINB2 (ингибитор серпинпептидазы, клада B (овальбумин), представитель 2), TNS1 (тензин 1), RNF19A (белок "цинковый палец" типа ring 19A), EPOR (эритропоэтиновый рецептор), ITGAM (интегрин, альфа M (субъединицу рецептора 3 компонента 3 комплемента)), PITX2 (подобный парному гомеодомен 2), MAPK7 (митоген-активированную протеинкиназу 7), FCGR3A (Fc-фрагмент IgG, с низкой аффинностью 111a, рецептор (CD16a)), LEPR (лептиновый рецептор), ENG (эндоглин), GPX1 (глутатионпероксидазу 1), GOT2 (щавелево-уксусную трансаминазу глутаминовой кислоты 2 типа, митохондриальную (аспартатаминотрансферазу 2 типа)), HRH1 (гистаминовый рецептор H1), NR112 (семейство ядерных рецепторов 1, I группа, представитель 2), CRH (кортикотропин-рилизинг гормон), HTR1A (5-гидрокситриптаминовый (серотониновый) рецептор 1A), VDAC1 (потенциалзависимый анионный канал 1), HPSE (гепараназу), SFTPD (поверхностно-активный белок D), TAP2 (переносчик 2, АТФ-связывающая кассета, подсемейство B (MDR/TAP)), RNF123 (белок "цинковый палец" типа ring 123), PTK2B (PTK2B протеинтирозинкиназу 2 бета), NTRK2 (нейротрофическую тирозинкиназу, рецептор, 2 тип), IL6R (рецептор интерлейкина 6), ACHE (ацетилхолинэстеразу (группу крови Yt)), GLP1R (рецептор глюкагон-подобного пептида 1), GHR (рецептор гормона роста), GSR (глутатионредуктазу), NQO1 (NAD(P)H-дегидрогеназу, хинон 1), NR5A1 (семейство ядерных рецепторов 5, группа A, представитель 1), GJB2 (белок межклеточных щелевых контактов, бета 2, 26 кДа), SLC9A1 (семейство переносчиков растворенных веществ 9 (натрий-водородный антипортер), представитель 1), MAOA (моноаминоксидазу A), PCSK9 (пропротеинконвертазу субтилизин-кексинового 9 типа), FCGR2A (Fc-фрагмент IgG, с низкой аффинностью IIa, рецептор (CD32)), SERPINF1 (ингибитор серпинпептидазы, клада F (альфа-2-антиплазмин, фактор пигментного эпителия), представитель 1), EDN3 (эндотелин 3), DHFR (дигидрофолатредуктазу), GAS6 (специфичный к задержке роста фактор 6), SMPD1 (сфингомиелинфосфодиэстеразу 1, кислую лизосомальную), UCP2 (неспаренный белок 2 (митохондриальный, переносчик протонов)), TFAP2A (транспортный фактор AP-2 альфа (активирующий энхансер связывающий белок 2 альфа)), C4BPA (связывающий белок 4 компонента комплемента, альфа), SERPINF2 (ингибитор серпинпептидазы, клада F (альфа-2-антилазмин, фактор пигментного эпителия), представитель 2), TYMP (тимидинфосфорилазу), ALPP (щелочную фосфатазу, плацентарную (изозим Регана)), CXCR2 (хемокиновый рецептор 2 (с мотивом C-X-C)), SLC39A3 (семейство переносчиков растворенных веществ 39 (переносчик цинка), представитель 3), ABCG2 (АТФ-связывающую кассету, подсемейство G (WHITE), представитель 2), ADA (аденозиндезаминазу), JAK3 (Янус-киназу 3), HSPA1A (белок теплового шока 1А размером 70 кДа), FASN (синтазу жирных кислот), FGF1 (фактор роста фибробластов 1 (кислотный)), F11 (фактор коагуляции XI), ATP7A (АТФазу, транспортирование Cu++, альфа-полипептид), CR1 (рецептор 1 компонента комплемента (3b/4b) (группы крови Knops)), GFAP (глиофибриллярный щелочной белок), ROCK1 (Rho-ассоциированную содержащую двуспиральную протеинкиназу 1), MECP2 (метил CpG-связывающий белок 2 (синдром Ретта)), MYLK (легкую цепь миозина), BCHE (бутирилхолинэстеразу), LIPE (липазу, гормончувствительную), PRDX5 (пероксиредоксин 5), ADORA1 (рецептор аденозина A1), WRN (синдром Вернера, RecQ, подобный хеликазе), CXCR3 (хемокиновый рецептор 3 (с мотивом C-X-C)), CD81 (молекулу CD81), SMAD7 (семейство SMAD, представитель 7), LAMC2 (ламинин, гамма 2), MAP3K5 (митоген-активируемую протеинкиназу киназы 5), CHGA (хромогранин A (паратиреоридный секреторный белок 1)), IAPP (островковый амилоидный пептид), RHO (родопсин), ENPP1 (эктонуклеотидпирофосфатазу/фосфодиэстеразу 1), PTHLH (подобный паратиреоидному гормону гормон), NRG1 (нейрегулин 1), VEGFC (фактор роста эндотелия сосудов C), ENPEP (глутамиламинопептидазу (аминопептидазу A)), CEBPB (CCAAT/энхансерный связывающий белок (C/EBP), бета), NAGLU (N-ацетилглюкозаминидазу, альфа-), F2RL3 (фактор коагуляции II (тромбин), рецептор-подобный 3), CX3CL1 (хемокиновый лиганд 1 (с мотивом C-X3-C)), BDKRB1 (брадикиновый рецептор B1), ADAMTS13 (ADAM металлопептидазу с тромбоспондиновым мотивом 1 типа, 13), ELANE (эластазу, экспрессируемую в нейтрофилах), ENPP2 (эктонуклеотидпирофосфатазу/фосфодиэстеразу 2), CISH (индуцируемый цитокином SH2-содержащий белок), GAST (гастрин), MYOC (миоцилин, индуцируемый трабекулярной сетью глюкокортикоидный ответ), ATP1A2 (АТФазу, Na+/K+ транспорт, альфа 2 полипептид), NF1 (нейрофибромин 1), GJB1 (белок межклеточных щелевых контактов, бета 1, 32 кДа), MEF2A (миоцитарный энхансорный фактор 2A), VCL (винкулин), BMPR2 (рецептор костного морфогенетического белка, тип II (серин/треонинкиназу)), TUBB (тубулин, бета), CDC42 (фактор клеточного цикла 42 (GTP-связывающий белок, 25 кДа)), KRT18 (кератин 18), HSF1 (фактор транскрипции белка теплового шока 1), MYB (гомолог онкогена вируса миелобластоза v-myb (птичьего)), PRKAA2 (протеинкиназу, AMP-активируемую, каталитическую субъединицу альфа 2), ROCK2 (Rho-ассоциированную содержащую двуспиральную протеинкиназу 2), TFPI (ингибитор пути тканевого фактора (липопротеин-ассоциированный ингибитор коагуляции)), PRKG1 (протеинкиназу, cGMP-зависимую, I тип), BMP2 (костный морфогенетический белок 2), CTNND1 (катенин (кадгерин-ассоциированный белок), дельта 1), CTH (цистатионазу (цистатионин-гамма-лиазу)), CTSS (катепсин S), VAV2 (фактор обмена гуаниновых нуклеотидов vav 2), NPY2R (рецептор Y2 нейропептида Y), IGFBP2 (связывающий белок 2 инсулин-подобного фактора роста, 36 кДа), CD28 (молекулу CD28), GSTA1 (глутатион-S-трансферазу, альфа 1), PPIA (пептидилпролилизомеразу A (циклофилин A)), APOH (аполипопротеин H (бета-2-гликопротеин I)), S100A8 (S100 кальций-связывающий белок A8), IL11 (интерлейкин 11), ALOX15 (арахидонат-15-липоксигеназу), FBLN1 (фибулин 1), NR1H3 (семейство ядерных рецепторов 1, группа H, представитель 3), SCD (стеароил-CoA десатуразу (дельта-9-десатуразу)), GIP (желудочный ингибиторный пептид), CHGB (хромогранин B (секретогранин 1)), PRKCB (протеинкиназу C, бета), SRD5A1 (стероид-5-альфа-редуктазу, альфа-полипептид 1 (3-оксо-5 альфа-стероид дельта-4-дегидрогеназу альфа 1)), HSD11B2 (гидроксистероид (11-бета) дегидрогеназу 2), CALCRL (подобный кальцитониновому рецептору), GALNT2 (UDP-N-ацетил-альфа-D-галактозамин:полипептид N-ацетилгалактозаминилтрансферазу 2 (GalNAc-T2)), ANGPTL4 (ангиопоэтинподобный 4), KCNN4 (калиевый, активируемый кальцием канал, промежуточного/низкого проведения, подсемейство N, представитель 4), PIK3C2A (фосфоинозитидин-3-киназу, класс 2, альфа-полипептид), HBEGF (гепарин-связывающий EGF-подобный фактор роста), CYP7A1 (цитохром P450, семейство 7, подсемейство A, полипептид 1), HLA-DRB5 (главный комплекс гистосовместимости, класс II, DR бета 5), BNIP3 (белок 3 с массой 19 кДа, взаимодействующий с BCL2/аденовирусом E1B), GCKR (регулятор глюкокиназы (гексокиназы 4)), S100A12 (S100 кальций-связывающий белок A12), PADI4 (пептидиларгининдеиминазу, тип IV), HSPA14 (белок 14 теплового шока с массой 70 кДа), CXCR1 (хемокиновый рецептор 1 (с мотивом C-X-C)), H19 (H19, экспрессируемый пептид, импринтированный со стороны матери (некодирующий белок)), KRTAP19-3 (кератин-ассоциированный белок 19-3), IDDM2 (фактор инсулин-зависимого сахарного диабета 2 типа), RAC2 (ras-связанный субстрат 2 ботулотоксина C3 (семейство rho, малый GTP связывающий белок Rac2)), RYR1 (рианодиновый рецептор 1 (мышечный)), CLOCK (гомолог гена (мышиный)), NGFR (рецептор фактора роста нервов (суперсемейство TNFR, представитель 16)), DBH (дофамин бета-гидроксилазу (дофамин бета-монооксигеназу)), CHRNA4 (холинергический рецептор, никотиновый, альфа 4), CACNA1C (кальциевый канал, потенциалзависимый, типа L, субъединицу альфа 1C), PRKAG2 (протеинкиназу, AMP-активированную, гамма 2 некаталическую субъединицу), CHAT (холинацетилтрансферазу), PTGDS (простагландин D2 синтазу размером 21 кДа (головного мозга)), NR1H2 (семейство 1 ядерных рецепторов, группа H, представитель 2), TEK (TEK тирозинкиназу, эндотелиальную), VEGFB (фатор роста эндотелия сосудов B), MEF2C (миоцитарный энхансерный фактор 2C), MAPKAPK2 (протеинкиназу 2, активированную митоген-активированной протеинкиназой), TNFRSF11A (суперсемейство рецепторов фактора некроза опухоли, представитель 11a, активатор NFKB), HSPA9 (белок 9 теплового шока размером 70 кДа (морталин)), CYSLTR1 (цистеинил-лейкотриеновый рецептор 1), MAT1A (метионинаденозилтрансферазу I, альфа), OPRL1 (подобный опиатному рецептору 1), IMPA1 (инизитол(мио)-1(или 4)-монофосфатазу 1), CLCN2 (канал-переносчик для ионов хлора 2), DLD (дигидролипоамиддегидрогеназу), PSMA6 (протеасомную субъединицу (просому, макропаин), тип альфа, 6), PSMB8 (протеасомную субъединицу (просому, макропаин), тип бета, 8 (большую мультифункциональную пептидазу 7)), CHI3L1 (фактор 1, подобный хитиназе 3 (хрящевой гликопротеин 39)), ALDH1B1 (альдегиддегидрогеназу, семейство 1, представитель B1), PARP2 (поли (АДФ-рибозо) полимеразу 2), STAR (стероидогенный острый регуляторный белок), LBP (липополисахарид-связывающий белок), ABCC6 (АТФ-связывающую кассету, подсемейство C (CFTR/MRP), представитель 6), RGS2 (регулятор передачи сигнала с участием G-белка 2, 24 кДа), EFNB2 (эфрин-B2), GJB6 (белок межклеточных щелевых контактов, бета 6, 30 кДа), APOA2 (аполипопротеин A-II), AMPD1 (аденозинмонофосфатдезаминазу 1), DYSF (дисферлин, тазо-плечевая мышечная дистрофия 2B (аутосомно-рецессивная)), FDFT1 (фарнезил-дифосфатфарнелизтрансферазу 1), EDN2 (эндотелин 2), CCR6 (хемокиновый рецептор 6 (с мотивом C-C)), GJB3 (белок межклеточных щелевых контактов, бета 3, 31 кДа), IL1RL1 (фактор 1, подобный рецептору интерлейкина 1), ENTPD1 (эктонуклеозидтрифосфат-дифосфогидролазу 1), BBS4 (фактор 4 синдром Барде-Бидля), CELSR2 (кадгерин, семиканальный рецептор 2 G-типа EGF LAG (гомолог flamingo, дрозофилиный)), F11R (рецептор F11), RAPGEF3 (фактор обмена гуаниновых нуклеотидов Rap (GEF) 3), HYAL1 (гиалуроноглюкозаминидазу 1), ZNF259 (белок "цинковый палец" 259), ATOX1 (гомолог антиоксидантного белка 1 ATX1 (дрожжевой)), ATF6 (фактор активации транскрипции 6), KHK (кетогексокиназу (фруктокиназу)), SAT1 (спермидин/спермин N1-ацетилтрансферазу 1), GGH (гамма-глутамилгидролазу (конъюгазу, фолилполигаммаглутамингидролазу)), TIMP4 (ингибитор TIMP металлопептидазы 4), SLC4A4 (семейство переносчиков растворенных белков 4, бикарбонат-натриевый контранспортер, представитель 4), PDE2A (фосфодиэстеразу 2A, cGMP-стимулированную), PDE3B (фосфодиэстеразу 3B, cGMP-ингибированную), FADS1 (десатуразу 1 жирных кислот), FADS2 (десатуразу 2 жирных кислот), TMSB4X (тимозин бета 4, X-сцепленный), TXNIP (белок, взаимодействующий с тиоредоксином), LIMS1 (домены 1, подобные LIM и антигену стареющих клеток), RHOB (семейство генов гомологов ras, представитель B), LY96 (лимфоцитарный антиген 96), FOXO1 (forkhead-бокс О1), PNPLA2 (фактор 2, содержащий домен пататин-подобной фосфолипидазы), TRH (тиротропин-рилизинг гормон), GJC1 (белок межклеточных щелевых контактов, гамма 1, 45 кДа), SLC17A5 (семейство переносчиков растворенных веществ 17 (переносчик анионов и сахаров), представитель 5), FTO (фактор, ассоциированный с жировой массой и ожирением), GJD2 (белок межклеточных щелевых контактов, дельта 2, 36 кДа), PSRC1 (двуспиральный фактор с высоким содержанием пролина и серина 1), CASP12 (каспазу 12 (ген/псевдоген)), GPBAR1 (рецептор 1 желчных кислот, связанный с G-белком), PXK (серин/треонинкиназу, содержащую домен PX), IL33 (интерлейкин 33), TRIB1 (гомолог tribbles 1 (дрозофилиный)), PBX4 (гомеобокс 4 пре-B-клеточного лейкоза), NUPR1 (ядерный белок, регулятор транскрипции, 1), 15-Sep (селенопротеин размером 15 кДа), CILP2 (белок промежуточного слоя хряща 2), TERC (РНК-компонент теломеразы), GGT2 (гамма-глутамилтрансферазу 2), MT-CO1 (цитохром c оксидазу I, кодируемую митохондриальным геномом) и UOX (уратоксидазу, псевдоген). Любая из данных последовательностей может быть мишенью для системы CRISPR-Cas, например, для изучения мутации.As an example, the chromosomal sequence may include, but is not limited to, IL1B (interleukin 1, beta), XDH (xanthine dehydrogenase), TP53 (p53 tumor protein), PTGIS (prostaglandin 12 (prostacyclin) synthase), MB (myoglobin), IL4 (interleukin 4), ANGPT1 (angiopoietin 1), ABCG8 (ATP-binding cassette, subfamily G (WHITE), member 8), CTSK (cathepsin K), PTGIR (prostacyclin 12 (IP) receptor), KCNJ11 (inward rectifier potassium channel, subfamily J, member 11), INS (insulin), CRP (pentraxin-related C-reactive protein), PDGFRB (platelet-derived growth factor, beta polypeptide), CCNA2 (cyclin A2), PDGFB (platelet-derived growth factor beta polypeptide oncogene homolog (simian sarcoma virus (v-sis))), KCNJ5 (inward-rectifying potassium channel, subfamily J, member 5), KCNN3 (intermediate/low-conducting calcium-activated potassium channel, subfamily N, member 3), CAPN10 (calpain 10), PTGES (prostaglandin E synthase), ADRA2B (alpha-2B-adrenergic receptor), ABCG5 (ATP-binding cassette, subfamily G (WHITE), member 5), PRDX2 (peroxiredoxin 2), CAPN5 (calpain 5), PARP14 (poly (ADP-ribose) polymerase family, member 14), MEX3C (C mex-3 homolog C (C. elegans)), ACE angiotensin I-converting enzyme (peptidyl dipeptidase A) 1), TNF (tumor necrosis factor (TNF superfamily, member 2)), IL6 (interleukin 6 (interferon, beta 2)), STN (statin), SERPINE1 (serpin peptidase inhibitor, clade E (nexin, plasminogen activator inhibitor type 1), member 1), ALB (albumin), ADIPOQ (adiponectin containing C1Q and collagen domain), APOB (apolipoprotein B (including Ag(x))), APOE (apolipoprotein E), LEP (leptin), MTHFR (5,10-methylenetetrahydrofolate reductase (NADPH)), APOA1 (apolipoprotein A-I), EDN1 (endothelin 1), NPPB (precursor natriuretic peptide B), NOS3 (synthase nitric oxide type 3 (endothelial cell)), PPARG (peroxisome proliferator-activated receptor gamma), PLAT (tissue plasminogen activator), PTGS2 (prostaglandin endoperoxide synthase type 2 (prostaglandin G/H synthase and cyclooxygenase)), CETP (plasma cholesteryl ester transport protein), AGTR1 (anti-otensin II receptor type 1), HMGCR (3-hydroxy-3-methylglutaryl-coenzyme A reductase), IGF1 (insulin-like growth factor 1 (somatomedin C)), SELE (selectin E), REN (renin), PPARA (peroxisome proliferator-activated receptor alpha), PON1 (paraoxonase 1), KNG1 (kininogen 1), CCL2 (chemokine ligand 2 (with C-C motif)), LPL (lipoprotein lipase), VWF (von Willebrand factor), F2 (coagulation factor II (thrombin)), ICAM1 (intercellular adhesion molecule 1), TGFB1 (transforming growth factor, beta 1), NPPA (precursor natriuretic peptide A), IL10 (interleukin 10), EPO (erythropoietin), SOD1 (superoxide dismutase 1, soluble), VCAM1 (vascular endothelial adhesion molecule type 1), IFNG (interferon, gamma), LPA (lipoprotein, Lp(a)), MPO (myeloperoxidase), ESR1 (estrogen receptor 1), MAPK1 (mitogen-activated protein kinase 1), HP (haptoglobin), F3 (coagulation factor III (thromboplastin, tissue factor)), CST3 (cystatin C), COG2 (component of the oligomeric Golgi complex type 2), MMP9 (matrix metallopeptidase 9 (gelatinase B, 92 kDa gelatinase, 92 kDa collagenase type IV)), SERPINC1 (serpin peptidase inhibitor, clade C (antithrombin), member 1), F8 (coagulation factor VIII, procoagulant component), HMOX1 (heme oxygenase (decyclic) type 1), APOC3 (apolipoprotein C-III), IL8 (interleukin 8), PROK1 (prokineticin 1), CBS (cystathionine beta synthase), NOS2 (sodium oxide synthase type 2, inducible), TLR4 (toll-like receptor type 4), SELP (selectin P (140 kDa granule membrane protein, CD62 antigen)), ABCA1 (ATP-binding cassette, subfamily A (ABC1), member 1), AGT (angiotensin (serpin peptidase inhibitor, clade A, member 8)), LDLR (low-density lipoprotein receptor), GPT (glutamate-pyruvate transaminase (alanine aminotransferase)), VEGFA (vascular endothelial growth factor A), NR3C2 (nuclear receptor, subfamily 3, group C, member 2), IL18 (interleukin 18 (interferon gamma inducing factor)), NOS1 (nitric oxide synthase type 1 (neuronal)), NR3C1 (nuclear receptor, subfamily 3, group C, member 1 (glucocorticoid receptor)), FGB (fibrinogen beta chain), HGF (hepatocyte growth factor (hepatopoietin A; scattering factor)), IL1A (interleuin 1, alpha), RETN (resistin), AKT1 (murine thymoma virus oncogene homolog type 1 v-akt), LIPC (lipase, liver), HSPD1 (heat shock protein type 1 of 60 kDa (chaperonin)), MAPK14 (mitogen-activated protein kinase 14), SPP1 (secreted phosphoprotein 1), ITGB3 (integrin, beta 3 (platelet glycoprotein 111a, CD61 antigen)), CAT (catalase), UTS2 (urotensin 2), THBD (thrombomodulin), F10 (coagulation factor X), CP (ceruloplasmin (ferroxidase)), TNFRSF11B (tumor necrosis factor superfamily, member 11b), EDNRA (endothelin receptor type A), EGFR (epidermal growth factor receptor (v-erb-b oncogene homolog, avian)), MMP2 (matrix metallopeptidase 2 (gelatinase A, 72-kDa gelatinase, 72-kDa collagenase type IV)), PLG (plasminogen), NPY (neuropeptide Y), RHOD (ras homolog gene family, member D), MAPK8 (mitogen-activated protein kinase 8), MYC (v-myc myelocystomatosis virus oncogene homolog, avian)), FN1 (fibronectin 1), CMA1 (chymase 1, mast cell), PLAU (plasminogen activator, urokinase), GNB3 (guanine nucleotide-binding protein (G protein), beta polypeptide type 3), ADRB2 (adrenergic beta-2 receptor, surface), APOA5 (apolipoprotein A-V), SOD2 (superoxide dismutase 2, mitochondrial), F5 (coagulation factor V (proaccelerin, labile factor)), VDR (vitamin D receptor (1,25-dihydroxyvitamin D3), ALOX5 (arachidonate 5-lipoxygenase), HLA-DRB1 (major histocompatibility complex, class II, DR beta 1), PARP1 (poly (ADP-ribose) polymerase type 1), CD40LG (CD40 ligand), PON2 (paraoxonase 2), AGER (receptor for advanced glycation end products), IRS1 (insulin receptor substrate type 1), PTGS1 (prostaglandin endoperoxide synthase type 1 (prostaglandin G/H synthase and cyclooxygenase)), ECE1 (endothelin-converting enzyme type 1), F7 (coagulation factor VII (serum thrombin converting accelerator)), URN (interleukin 1 receptor antagonist), EPHX2 (epoxide hydrolase type 2, cytoplasmic), IGFBP1 (insulin-like growth factor binding protein type 1), MAPK10 (mitogen-activated protein kinase 10), FAS (Fas (TNF receptor superfamily, member 6)), ABCB1 (ATP-binding cassette, subfamily B (MDR/TAP), member 1), JUN (jun oncogene), IGFBP3 (insulin-like growth factor binding protein type 3), CD14 (CD14 molecule), PDE5A (phosphodiesterase 5A, cGMP-specific), AGTR2 (receptor angiotensin II, type 2), CD40 (CD40 molecule, member of the TNF receptor superfamily 5), LCAT (lecithin-cholesterol acyltransferase), CCR5 (chemokine receptor type 5 (with a C-C motif)), MMP1 (matrix metallopeptidase 1 (interstitial collagenase)), TIMP1 (TIMP inhibitor of metallopeptidase type 1), ADM (adrenomedullin), DYT10 (dystonia 10), STAT3 (signal transducer and activator of transcription type 3 (acute phase response factor)), MMP3 (matrix metallopeptidase 3 (stromelysin 1, progelatinase)), ELN (elastin), USF1 (transcription factor binding upstream of the transcription initiation site 1), CFH (complement factor H), HSPA4 (warm shock protein 4 of 70 kDa), MMP12 (matrix metallopeptidase 12 (macrophage elastase)), MME (membrane metalloendopeptidase), F2R (coagulation factor II (thrombin) receptor), SELL (selectin L), CTSB (cathepsin B), ANXA5 (annexin A5), ADRB1 (adrenergic beta-1 receptor), CYBA (cytochrome b-245, alpha peptide), FGA (fibrinogen alpha chain), GGT1 (gamma-glutamyl transferase 1), LIPG (lipase, endothelial), HIF1A (hypoxia-inducible factor 1, alpha subunit (helix-loop-helix basic structure transcription factor)), CXCR4 (chemokine receptor 4 (with C-X-C motif)), PROC (protein C (coagulation factor Va and VIIIa inactivator)), SCARB1 (phagocytic receptor, class B, member 1), CD79A (CD79a molecule, immunoglobulin-associated alpha), PLTP (phospholipid transfer protein), ADD1 (adducin 1 (alpha)), FGG (fibrinogen gamma chain), SAA1 (serum amyloid A1), KCNH2 (potassium voltage-gated channel, family H (eag-related), member 2), DPP4 (dipeptidyl peptidase 4), G6PD (glucose-6-phosphate dehydrogenase), NPR1 (natriuretic peptide receptor A/guanylate cyclase A (atrionatriuretic peptide receptor A)), VTN (vitronectin), KIAA0101 (KIAA0101), FOS (homolog murine osteosarcoma virus oncogene FBJ), TLR2 (toll-like receptor 2), PPIG (peptidylproline isomerase G (cycloproline G)), IL1R1 (interleukin I receptor), AR (androgen receptor), CYP1A1 (cytochrome P450, family 1, subfamily A, polypeptide 1), SERPINA1 (serpin peptidase inhibitor, clade A (alpha-1 antiproteinase, antitrypsin), member 1), MTR (5-methyltetrahydrofolate-hexacysteine methyltransferase), RBP4 (retinol-binding protein type 4, plasma), APOA4 (apolipoprotein A-IV), CDKN2A (cyclin-dependent kinase inhibitor 2A (melanoma, p16, inhibits CDK4)), FGF2 (fibroblast growth factor 2 (basic)), EDNRB (endothelin receptor type B), ITGA2 (integrin, alpha 2 (CD49B, alpha 2 subunit of the VLA-2 receptor)), CABIN1 (calcineurin-binding protein 1), SHBG (sex hormone-binding globulin), HMGB1 (high-mobility group 1 protein), HSP90B2P (heat shock protein 90 kDa beta (Grp94), member 2 (pseudogene)), CYP3A4 (cytochrome P450, family 3, subfamily A, polypeptide 4), GJA1 (gap junction protein, alpha 1, 43 kDa), CAV1 (caveolin 1, caveolae protein, 22 kDa), ESR2 (estrogen receptor 2 (ER beta)), LTA (lymphotoxin alpha (TNF superfamily, member 1)), GDF15 (growth and differentiation factor 15), BDNF (brain-derived neurotrophic factor), CYP2D6 (cytochrome P450, family 2, subfamily D, polypeptide 6), NGF (nerve growth factor (beta polypeptide)), SP1 (transcription factor Sp1), TGIF1 (TGFB-inducible factor homeobox 1), SRC (sarcoma virus oncogene homolog v-src (Schmidt-Ruppin A-2) (avian)), EGF (epidermal growth factor (beta-urogastron)), PIK3CG (phosphoinositide 3-kinase, catalytic, gamma polypeptide), HLA-A (major histocompatibility complex, class I, A), KCNQ1 (potassium voltage-gated channel, KQT-like family, member 1), CNR1 (cannabinoid receptor 1 (brain)), FBN1 (fibrillin 1), CHKA (choline kinase alpha), BEST1 (bestrophin 1), APP (amyloid precursor protein beta (A4)), CTNNB1 (catenin (cadherin-associated protein), beta 1, 88 kDa), IL2 (interleukin 2), CD36 (CD36 molecule (thrombospondin receptor)), PRKAB1 (protein kinase, AMP-activated, beta 1 non-catalytic subunit), TPO (thyroid peroxidase), ALDH7A1 (aldehyde dehydrogenase family 7, member A1), CX3CR1 (chemokine receptor 1 (with C-X3-C motif)), TH (tyrosine hydroxylase), F9 (coagulation factor IX), GH1 (growth hormone 1), TF (transferrin), HFE (hemochromatosis), IL17A (interleukin 17A), PTEN (phosphatase tensin homolog), GSTM1 (glutathione S-transferase mu 1), DMD (dystrophin), GATA4 (GATA binding protein type 4), F13A1 (coagulation factor XIII, polypeptide A1), TTR (transthyretin), FABP4 (fatty acid binding protein type 4, adipocyte), PON3 (paraoxonase 3), APOC1 (apolipoprotein C-I), INSR (insulin receptor), TNFRSF1B (tumor necrosis factor receptor superfamily, member 1B), HTR2A (5-hydroxytryptamine (serotonin) receptor 2A), CSF3 (colony stimulating factor 3 (granulocyte)), CYP2C9 (cytochrome P450, family 2, subfamily C, polypeptide 9), TXN (thioredoxin), CYP11B2 (cytochrome P450, family 11, subfamily B, polypeptide 2), PTH (parathyroid hormone), CSF2 (colony stimulating factor 2 (granulocyte-macrophage)), KDR (receptor kinase insertion domain-containing (receptor tyrosine kinase type III)), PLA2G2A (phospholipase A2, group IIA (platelets, synovial fluid)), B2M (beta-2-microglobulin), THBS1 (thrombospondin 1), GCG (glucagon), RHOA (ras homolog gene family, member A), ALDH2 (aldehyde dehydrogenase 2 family (mitochondrial)), TCF7L2 (transcription factor 7, factor 2-like (T-cell-specific, HMG-box)), BDKRB2 (bradykinin receptor B2), NFE2L2 (nuclear factor 2-like (erythroid 2)), NOTCH1 (Notch 1 homolog, translocation-associated (Drosophila)), UGT1A1 (UDP-glucuronyl transferase family 1, polypipeline A1), IFNA1 (interferon, alpha 1), PPARD (peroxisome proliferator-activated receptor delta), SIRT1 (sirtuin 1 (silent information regulation homolog 2) (S. cerevisiae)), GNRH1 (gonadotropin-releasing hormone 1 (luteinizing-releasing hormone)), PAPPA (pregnancy-associated plasma protein A, papalysin 1), ARR3 (arrestin 3, retinal (X-arrestin)), NPPC (precursor natriuretic peptide C), AHSP (alpha-hemoglobin-stabilizing protein), PTK2 (protein tyrosine kinase type 2 PTK2), IL13 (interleukin 13), MTOR (mechanism of action target of rapamycin (serine/threorine kinase)), ITGB2 (intergreen, beta 2 (subunit of complement component 3 receptor 3 and 4)), GSTT1 (glutathione-S-transferase theta 1), IL6ST (interleukin 6 signal transducer (gp130, oncostatin M receptor)), CPB2 (carboxypeptidase B2 (plasma)), CYP1A2 (cytochrome P450, family 1, subfamily A, polypeptide 2), HNF4A (hepatocyte nuclear factor 4, alpha), SLC6A4 (solute carrier family 6 (neurotransmitter transporter, serotonin), member 4), PLA2G6 (phospholipase A2, group VI (cytosolic, calcium-independent)), TNFSF11 (tumor growth factor superfamily (ligand), member 11), SLC8A1 (solute carrier family 8 (sodium-calcium antiporter), member 1), F2RL1 (coagulation factor II receptor-like 1 (thrombin)), AKR1A1 (aldoketo reductase family 1, member A1 (aldehyde reductase)), ALDH9A1 (aldehyde dehydrogenase family 9, member A1), BGLAP (gamma-carboxyglutamate (gla) protein), MTTP (microsomal triglyceride transfer protein), MTRR (5-methyltetrahydrofolate-homocysteine methyltransferase reductase), SULT1A3 (sulfotransferase family, cytosolic, 1A, phenol-preferred, member 3), RAGE (renal tumor antigen), C4B (complement component 4B (Chido blood group), P2RY12 (P2RY purinergic receptor G protein-coupled 12), RNLS (renalase, FAD-dependent amine oxidase), CREB1 (cAMP-responsive element-binding protein 1), POMC (pro-opiomelanocortin), RAC1 (ras-related botulinum toxin substrate 1) C3 (rho family, small GTP binding protein Rac1)), LMNA (lamin NC), CD59 (CD59 molecule, complement regulatory protein), SCN5A (sodium channel, voltage-gated, type V, alpha subunit), CYP1B1 (cytochrome P450, family 1, subfamily B, polypeptide 1), MIF (macrophage migration inhibitory factor (glycosylation inhibitory factor)), MMP13 (matrix metallopeptidase 13 (collagenase 3)), TIMP2 (TIMP inhibitor of metallopeptidase 2), CYP19A1 (cytochrome P450, family 19, subfamily A, polypeptide 1), CYP21A2 (cytochrome P450, family 21, subfamily A, polypeptide 2), PTPN22 (protein tyrosine phosphatase, non-receptor, 22 type (lymphoid)), MYH14 (myosin, heavy chain 14, non-muscle), MBL2 (mannose-binding lectin (protein C) 2, soluble (opsonin defect)), SELPLG (selectin P ligand), AOC3 (amine oxidase, copper-containing 3 (vascular adhesion protein 1)), CTSL1 (cathepsin L1), PCNA (proliferating cell nuclear antigen), IGF2 (insulin-like growth factor 2 (somatomedin A)), ITGB1 (integrin, beta 1 (fibronectin receptor, beta polypeptide, CD29 antigen includes MDF2, MSK12)), CAST (calpastatin), CXCL12 (chemokine ligand 12 (with C-X-C motif) (stromal cell factor 1)), IGHE (heavy epsilon chain), KCNE1 (potassium voltage-gated channel, Isk-related family, member 1), TFRC (transferrin receptor (p90, CD71)), COL1A1 (collagen type 1, alpha 1), COL1A2 (collagen type I, alpha 2), IL2RB (interleukin 2 receptor, beta), PLA2G10 (pro-phospholipidase A2, group X), ANGPT2 (angiopoietin 2), PROCR (protein C receptor, endothelial (EPCR)), NOX4 (NADPH oxidase 4), HAMP (hepcidin antimicrobial peptide), PTPN11 (protein tyrosine phosphatase, non-receptor, type 11), SLC2A1 (solute carrier family 2 (facilitated diffusion glucose transporter), member 1), IL2RA (interleukin 2 receptor, alpha), CCL5 (chemokine ligand 5 (with C-C motif)), IRF1 (interferon regulatory factor 1), CFLAR (CASP8 and FADD-like regulator of apoptosis), CALCA (calcitonin-related polypeptide alpha), EIF4E (eukaryotic translation initiation factor 4E), GSTP1 (pi-1-glutathione S-transferase), JAK2 (Janus kinase 2), CYP3A5 (cytochrome P450, family 3, subfamily A, polypeptide 5), HSPG2 (heparin sulfate proteoglycan 2), CCL3 (chemokine ligand 3 (with C-C motif)), MYD88 (myeloid differentiation primary response gene (88)), VIP (vasoactive intestinal peptide), SOAT1 (sterol O-acyltransferase 1), ADRBK1 (adrenergic beta receptor kinase 1), NR4A2 (nuclear receptor subfamily 4, group A, member 2), MMP8 (matrix metallopeptidase 8 (neutrophil collagenase)), NPR2 (natriuretic peptide receptor B/guanylate cyclase B (atrionatriuretic peptide receptor B)), GCH1 (GTP hydrolase 1), EPRS (glutamyl propyl-tRNA synthetase), PPARGC1A (peroxisome proliferator-activated receptor gamma coactivator 1 alpha), F12 (coagulation factor XII (Hageman factor)), PECAM1 (platelet/endothelial cell adhesion molecule), CCL4 (chemokine (C-C motif) ligand 4), SERPINA3 (serpin peptidase inhibitor, clade A (alpha-1-antiproteinase, antitrypsin), member 3), CASR (calcium-sensing receptor), GJA5 (gap junction protein, alpha 5, 40 kDa), FABP2 (fatty acid binding protein 2, intestinal), TTF2 (transcription termination factor, RNA polymerase II), PROS1 (protein S (alpha)), CTF1 (cardiotropin 1), SGCB (sarcoglycan, beta (dystrophin-associated glycoprotein of 43 kDa)), YME1L1 (YME1-like factor 1 (S. cerevisiae)), CAMP (cathelicidin antimicrobial peptide), ZC3H12A (containing zinc finger factor CCCH-type 12A), AKR1B1 (aldo-keto reductase family 1, member B1 (aldose reductase)), DES (desmin), MMP7 (matrix metallopeptidase 7 (matrilysin, uterine)), AHR (aryl hydrocarbon receptor), CSF1 (colony stimulating factor 1 (macrophage)), HDAC9 (histone deacetylase 9), CTGF (connective tissue growth factor), KCNMA1 (high-conductance calcium-activated potassium channel, subfamily M, alpha, member 1), UGT1A (UDP-glucuronyl transferase family 1, polypeptide complex locus A), PRKCA (protein kinase C, alpha), COMT (catechol-beta-methyltransferase), S100B (S100 calcium-binding protein B), EGR1 (early response growth factor 1), PRL (prolactin), IL15 (interleukin 15), DRD4 (dopamine D4 receptor), CAMK2G (calcium/calmodulin-dependent protein kinase II gamma), SLC22A2 (solute carrier family 22 (organic cation transporter), member 2), CCL11 (chemokine ligand 11 (C-C motif)), PGF (placental growth factor B321), THPO (thrombopoietin), GP6 (glycoprotein VI (platelet)), TACR1 (tachykine receptor 1), NTS (neurotensin), HNF1A (HNF1 homeobox A), SST (somatostatin), KCND1 (potassium voltage-gated channel, Shal-related subfamily, member 1), LOC646627 (phospholipase inhibitor), TBXAS1 (thromboxane A synthase 1 (platelet ), CYP2J2 (cytochrome P450, family 2, subfamily J, polypeptide 2), TBXA2R (thromboxane A2 receptor), ADH1C (alcohol dehydrogenase 1C (class I), gamma polypeptide), ALOX12 (arachidonate 12-lipogenase), AHSG (alpha-2-HS-glycoprotein), BHMT (betaine-homocysteine methyltransferase), GJA4 (gap junction protein, alpha 4, 37 kDa), SLC25A4 (solute carrier family 25 (mitochondrial transporter; adenine nucleotide translocator), member 4), ACLY (ATP citrate lyase), ALOX5AP (arachidonate-5-lipoxygenase activating protein), NUMA1 (nuclear protein of the mitotic apparatus 1), CYP27B1 (cytochrome P450, family 27, subfamily B, polypeptide 1), CYSLTR2 (cysteinyl leukotriene receptor 2), SOD3 (superoxide dismutase 3, extracellular), LTC4S (leukotriene C4 synthase), UCN (urocortin), GHRL (ghrelin/obestatin prepropeptide), APOC2 (apolipoprotein C-II), CLEC4A (C-type lectin domain family 4, member A), KBTBD10 (kelch repeat and BTB domain-containing (POZ) 10), TNC (tenaskin C), TYMS (thymidylate synthetase), SHCl (SHC-transforming protein 1 (Src-homology domain-containing 2)), LRP1 (low-density lipoprotein receptor-related protein 1), SOCS3 (suppressor of cytokine signaling 3), ADH1B (alcohol dehydrogenase 1B (class I), beta polypeptide), KLK3 (kallikrein-related peptidase 3), HSD11B1 (hydroxysteroid (11-beta) dehydrogenase 1), VKORC1 (vitamin K epoxide reductase complex, subunit 1), SERPINB2 (serpin peptidase inhibitor, clade B (ovalbumin), member 2), TNS1 (tensin 1), RNF19A (ring zinc finger protein 19A), EPOR (erythropoietin receptor), ITGAM (integrin, alpha M (subunit of complement component 3 receptor 3)), PITX2 (paired homeodomain-like 2), MAPK7 (mitogen-activated protein kinase 7), FCGR3A (Fc fragment of IgG, low affinity 111a, receptor (CD16a)), LEPR (leptin receptor), ENG (endoglin), GPX1 (glutathione peroxidase 1), GOT2 (oxaloacetic transaminase glutamic acid type 2, mitochondrial (aspartate aminotransferase type 2)), HRH1 (histamine H1 receptor), NR112 (nuclear receptor family 1, group I, member 2), CRH (corticotropin-releasing hormone), HTR1A (5-hydroxytryptamine (serotonin) receptor 1A), VDAC1 (voltage-gated anion channel 1), HPSE (heparanase), SFTPD (surface-active protein D), TAP2 (ATP-binding cassette transporter 2, subfamily B (MDR/TAP)), RNF123 (ring 123 zinc finger protein), PTK2B (PTK2B protein tyrosine kinase 2 beta), NTRK2 (neurotrophic tyrosine kinase receptor, type 2), IL6R (interleukin 6 receptor), ACHE (acetylcholinesterase (blood group Yt)), GLP1R (glucagon-like peptide 1 receptor), GHR (growth hormone receptor), GSR (glutathione reductase), NQO1 (NAD(P)H dehydrogenase, quinone 1), NR5A1 (nuclear receptor family 5, group A, member 1), GJB2 (gap junction protein, beta 2, 26 kDa), SLC9A1 (solute carrier family 9 (sodium hydrogen antiporter), member 1), MAOA (monoamine oxidase A), PCSK9 (proprotein convertase subtilisin-kexin type 9), FCGR2A (Fc fragment of IgG, low affinity IIa, receptor (CD32)), SERPINF1 (serpin peptidase inhibitor, clade F (alpha-2-antiplasmin, pigment epithelial factor), member 1), EDN3 (endothelin 3), DHFR (dihydrofolate reductase), GAS6 (growth arrest-specific factor 6), SMPD1 (sphingomyelin phosphodiesterase 1, acidic lysosomal), UCP2 (unpaired protein 2 (mitochondrial, proton transporter)), TFAP2A (transport factor AP-2 alpha (activating enhancer binding protein 2 alpha)), C4BPA (complement component 4 binding protein alpha), SERPINF2 (serpin peptidase inhibitor, clade F (alpha-2-antilasmin, pigment epithelial factor), member 2), TYMP (thymidine phosphorylase), ALPP (alkaline phosphatase, placental (Regan isozyme)), CXCR2 (chemokine receptor 2 (with C-X-C motif)), SLC39A3 (solute carrier family 39 (zinc transporter), member 3), ABCG2 (ATP-binding cassette, subfamily G (WHITE), member 2), ADA (adenosine deaminase), JAK3 (Janus kinase 3), HSPA1A (70 kDa heat shock protein 1A), FASN (fatty acid synthase), FGF1 (fibroblast growth factor 1 (acidic)), F11 (coagulation factor XI), ATP7A (ATPase, Cu++ transporter, alpha polypeptide), CR1 (complement component receptor 1 (3b/4b) (Knops blood groups)), GFAP (glial fibrillary alkaline protein), ROCK1 (Rho-associated double-stranded protein kinase 1), MECP2 (methyl CpG-binding protein 2 (Rett syndrome)), MYLK (myosin light chain), BCHE (butyrylcholinesterase), LIPE (lipase, hormone-sensitive), PRDX5 (peroxiredoxin 5), ADORA1 (adenosine A1 receptor), WRN (Werner syndrome, RecQ helicase-like), CXCR3 (chemokine receptor 3 (with C-X-C motif)), CD81 (CD81 molecule), SMAD7 (SMAD family, member 7), LAMC2 (laminin, gamma 2), MAP3K5 (mitogen-activated protein kinase kinase 5), CHGA (chromogranin A (parathyroid secretory protein 1)), IAPP (islet amyloid peptide), RHO (rhodopsin), ENPP1 (ectonucleotide pyrophosphatase/phosphodiesterase 1), PTHLH (parathyroid hormone-like hormone), NRG1 (neuregulin 1), VEGFC (vascular endothelial growth factor C), ENPEP (glutamyl aminopeptidase (aminopeptidase A)), CEBPB (CCAAT/enhancer binding protein (C/EBP) beta), NAGLU (N-acetylglucosaminidase alpha), F2RL3 (coagulation factor II (thrombin) receptor-like 3), CX3CL1 (chemokine (C-X3-C motif) ligand 1), BDKRB1 (bradykine receptor B1), ADAMTS13 (ADAM metallopeptidase with thrombospondin motif type 1, 13), ELANE (neutrophil-expressed elastase), ENPP2 (ectonucleotide pyrophosphatase/phosphodiesterase 2), CISH (cytokine-inducible SH2-containing protein), GAST (gastrin), MYOC (myocilin, trabecular meshwork-inducible glucocorticoid response), ATP1A2 (ATPase, Na+/K+ transport, alpha 2 polypeptide), NF1 (neurofibromin 1), GJB1 (gap junction protein, beta 1, 32 kDa), MEF2A (myocyte enhancer factor 2A), VCL (vinculin), BMPR2 (bone morphogenetic protein receptor, type II (serine/threonine kinase)), TUBB (tubulin, beta), CDC42 (cell cycle factor 42 (GTP-binding protein, 25 kDa)), KRT18 (keratin 18), HSF1 (heat shock protein transcription factor 1), MYB (myeloblastosis virus oncogene homolog v-myb (avian)), PRKAA2 (protein kinase, AMP-activated, catalytic subunit alpha 2), ROCK2 (Rho-associated double-stranded protein kinase 2), TFPI (tissue factor pathway inhibitor (lipoprotein-associated inhibitor of coagulation)), PRKG1 (protein kinase, cGMP-dependent, type I), BMP2 (bone morphogenetic protein 2), CTNND1 (catenin (cadherin-associated protein), delta 1), CTH (cystathionase (cystathionine gamma-lyase)), CTSS (cathepsin S), VAV2 (guanine nucleotide exchange factor vav 2), NPY2R (neuropeptide Y receptor Y2), IGFBP2 (insulin-like growth factor binding protein 2, 36 kDa), CD28 (CD28 molecule), GSTA1 (glutathione S-transferase, alpha 1), PPIA (peptidylprolyl isomerase A (cyclophilin A)), APOH (apolipoprotein H (beta-2-glycoprotein I)), S100A8 (S100 calcium-binding protein A8), IL11 (interleukin 11), ALOX15 (arachidonate 15-lipoxygenase), FBLN1 (fibulin 1), NR1H3 (nuclear receptor family 1, group H, member 3), SCD (stearoyl-CoA desaturase (delta-9-desaturase)), GIP (gastric inhibitory peptide), CHGB (chromogranin B (secretogranin 1)), PRKCB (protein kinase C, beta), SRD5A1 (steroid-5-alpha-reductase, alpha polypeptide 1 (3-oxo-5 alpha-steroid delta-4-dehydrogenase alpha 1)), HSD11B2 (hydroxysteroid (11-beta) dehydrogenase 2), CALCRL (calcitonin receptor-like), GALNT2 (UDP-N-acetyl-alpha-D-galactosamine:N-acetylgalactosaminyltransferase 2 polypeptide (GalNAc-T2)), ANGPTL4 (angiopoietin-like 4), KCNN4 (calcium-activated potassium channel, intermediate/low conduction, subfamily N, member 4), PIK3C2A (phosphoinositidine 3-kinase, class 2, alpha polypeptide), HBEGF (heparin-binding EGF-like growth factor), CYP7A1 (cytochrome P450, family 7, subfamily A, polypeptide 1), HLA-DRB5 (major histocompatibility complex, class II, DR beta 5), BNIP3 (19-molecular-weight protein 3), kDa, interacting with BCL2/adenovirus E1B), GCKR (glucokinase (hexokinase) regulator 4), S100A12 (S100 calcium-binding protein A12), PADI4 (peptidylarginine deiminase, type IV), HSPA14 (70 kDa heat shock protein 14), CXCR1 (chemokine receptor 1 (with a C-X-C motif)), H19 (H19, maternally expressed peptide imprinted (non-coding protein)), KRTAP19-3 (keratin-associated protein 19-3), IDDM2 (insulin-dependent diabetes mellitus type 2 factor), RAC2 (ras-related botulinum toxin C3 substrate 2 (rho family, small GTP binding protein Rac2)), RYR1 (ryanodine receptor 1 (muscle)), CLOCK (gene homolog (mouse)), NGFR (nerve growth factor receptor (TNFR superfamily, member 16)), DBH (dopamine beta-hydroxylase (dopamine beta-monooxygenase)), CHRNA4 (cholinergic receptor, nicotinic, alpha 4), CACNA1C (calcium channel, voltage-gated, type L, subunit alpha 1C), PRKAG2 (protein kinase, AMP-activated, gamma 2 noncatalytic subunit), CHAT (choline acetyltransferase), PTGDS (prostaglandin D2 synthase 21 kDa (brain)), NR1H2 (nuclear receptor family 1, group H, member 2), TEK (TEK tyrosine kinase, endothelial), VEGFB (vascular endothelial growth factor B), MEF2C (myocyte enhancer factor 2C), MAPKAPK2 (mitogen-activated protein kinase-activated protein kinase 2), TNFRSF11A (tumor necrosis factor receptor superfamily member 11a, NFKB activator), HSPA9 (70 kDa heat shock protein 9 (mortalin)), CYSLTR1 (cysteinyl leukotriene receptor 1), MAT1A (methionine adenosyltransferase I alpha), OPRL1 (opiate receptor-like 1), IMPA1 (insitol (myo)-1 (or 4)-monophosphatase 1), CLCN2 (chloride ion transporter channel 2), DLD (dihydrolipoamide dehydrogenase), PSMA6 (proteasome subunit (prosome, macropain), alpha type 6), PSMB8 (proteasome subunit (prosome, macropain), beta type 8 (large multifunctional peptidase 7)), CHI3L1 (chitinase 3-like factor 1 (cartilage glycoprotein 39)), ALDH1B1 (aldehyde dehydrogenase, family 1, member B1), PARP2 (poly (ADP-ribose) polymerase 2), STAR (steroidogenic acute regulatory protein), LBP (lipopolysaccharide-binding protein), ABCC6 (ATP-binding cassette, subfamily C (CFTR/MRP), member 6), RGS2 (regulator of G protein-mediated signaling 2, 24 kDa), EFNB2 (ephrin-B2), GJB6 (gap junction protein, beta 6, 30 kDa), APOA2 (apolipoprotein A-II), AMPD1 (adenosine monophosphate deaminase 1), DYSF (dysferlin, hip-shoulder muscular dystrophy 2B (autosomal recessive)), FDFT1 (farnesyl-diphosphate farnelystransferase 1), EDN2 (endothelin 2), CCR6 (chemokine receptor 6 (with a C-C motif)), GJB3 (gap junction protein, beta 3, 31 kDa), IL1RL1 (interleukin 1 receptor-like factor 1), ENTPD1 (ectonucleoside triphosphate diphosphohydrolase 1), BBS4 (Bardet-Biedl syndrome factor 4), CELSR2 (cadherin, seven-channel G-type receptor 2 EGF LAG (flamingo homolog, Drosophila)), F11R (F11 receptor), RAPGEF3 (Rap guanine nucleotide exchange factor (GEF) 3), HYAL1 (hyaluronoglycosaminidase 1), ZNF259 (zinc finger protein 259), ATOX1 (ATX1 antioxidant protein 1 homolog (yeast)), ATF6 (transcription activating factor 6), KHK (ketohexokinase (fructokinase)), SAT1 (spermidine/spermine N1-acetyltransferase 1), GGH (gamma-glutamyl hydrolase (conjugase, folylpolygamma-glutamyl hydrolase)), TIMP4 (TIMP inhibitor of metallopeptidase 4), SLC4A4 (solute carrier family 4, sodium bicarbonate cotransporter, member 4), PDE2A (phosphodiesterase 2A, cGMP-stimulated), PDE3B (phosphodiesterase 3B, cGMP-inhibited), FADS1 (fatty acid desaturase 1), FADS2 (fatty acid desaturase 2), TMSB4X (thymosin beta 4, X-linked), TXNIP (thioredoxin-interacting protein), LIMS1 (LIM-like and senescent cell antigen-like domains 1), RHOB (ras homolog gene family, member B), LY96 (lymphocyte antigen 96), FOXO1 (forkhead box O1), PNPLA2 (patatin-like phospholipidase domain-containing factor 2), TRH (thyrotropin-releasing hormone), GJC1 (gap junction protein gamma 1, 45 kDa), SLC17A5 (solute carrier family 17 (anion and sugars), member 5), FTO (fat mass and obesity-associated factor), GJD2 (gap junctional protein delta 2, 36 kDa), PSRC1 (proline-serine-rich double-stranded factor 1), CASP12 (caspase 12 (gene/pseudogene)), GPBAR1 (G protein-coupled bile acid receptor 1), PXK (PX domain-containing serine/threonine kinase), IL33 (interleukin 33), TRIB1 (tribbles homolog 1 (Drosophila)), PBX4 (pre-B-cell leukemia homeobox 4), NUPR1 (nuclear transcriptional regulator protein 1), 15-Sep (15 kDa selenoprotein), CILP2 (cartilage intermediate layer protein 2), TERC (RNA component of telomerase), GGT2 (gamma-glutamyl transferase 2), MT-CO1 (cytochrome c oxidase I, encoded by the mitochondrial genome) and UOX (urate oxidase, a pseudogene). Any of these sequences can be targeted by the CRISPR-Cas system, for example, to study mutation.
В дополнительном варианте осуществления хромосомная последовательность также может быть выбрана из следующих: Pon1 (параоксоназа 1), LDLR (рецептор LDL), ApoE (аполипопротеин E), Apo B-100 (аполипопротеин B-100), ApoA (аполипопротеин(a)), ApoA1 (аполипопротеин A1), CBS (цистатион-B-синтаза), гликопротеин IIb/IIb, MTHRF (5,10-метилентетрагидрофолатредуктаза (NADPH) и их комбинаций. В одном случае хромосомные последовательности и белки, кодируемые хромосомными последовательностями, связанные с сердечно-сосудистым заболеванием, могут быть выбраны из Cacna1C, Sod1, Pten, Ppar(альфа), Apo E, лептина и их комбинаций в качестве мишени(мишеней) для системы CRISPR-Cas.In a further embodiment, the chromosomal sequence may also be selected from the following: Pon1 (paraoxonase 1), LDLR (LDL receptor), ApoE (apolipoprotein E), Apo B-100 (apolipoprotein B-100), ApoA (apolipoprotein(a)), ApoA1 (apolipoprotein A1), CBS (cystathionine B synthase), glycoprotein IIb/IIb, MTHRF (5,10-methylenetetrahydrofolate reductase (NADPH) and combinations thereof. In one case, the chromosomal sequences and proteins encoded by the chromosomal sequences associated with cardiovascular disease may be selected from Cacna1C, Sod1, Pten, Ppar(alpha), Apo E, leptin and combinations thereof as the target(s) for the CRISPR-Cas system.
Нарушения, связанные с активностью секретазыDisorders associated with secretase activity
В публикации заявки на патент США № 20110023146 описывается применение нуклеаз с "цинковыми пальцами" для генетической модификации клеток, животных и белков, ассоциированных с нарушением, связанным с активностью секретазы. Секретазы необходимы для процессинга белков-предшественников с образованием их биологически активных форм. Дефекты различных компонентов секретазных путей связаны со многими нарушениями, в частности, с характерным амилоидогенезом или амилоидными бляшками, например, болезнь Альцгеймера (AD).U.S. Patent Application Publication No. 20110023146 describes the use of zinc finger nucleases to genetically modify cells, animals, and proteins associated with a disorder related to secretase activity. Secretases are required for the processing of precursor proteins into their biologically active forms. Defects in various components of the secretase pathways are associated with many disorders, particularly those characterized by amyloidogenesis or amyloid plaques, such as Alzheimer's disease (AD).
Что касается нарушения, связанного с активностью секретазы, белки, ассоциированные с этими нарушениями, представляют собой разнородную группу белков, которые оказывают влияние на восприимчивость ко многим нарушениям, наличие нарушения, тяжесть нарушения или любую их комбинацию. Настоящее раскрытие предусматривает редактирование любых хромосомных последовательностей, которые кодируют белки, ассоциированные с нарушением, связанным с активностью секретазы. Белки, ассоциированные с нарушением, связанным с активностью секретазы, как правило, выбирают исходя из экспериментально установленной ассоциации белков, родственных секретазе, с развитием нарушения, связанного с активностью секретазы. Например, скорость образования или концентрация в кровотоке белка, ассоциированного с нарушением, связанным с активностью секретазы, может быть повышенной или пониженной в популяции с нарушением, связанным с активностью секретазы, по сравнению с популяцией без нарушения, связанного с активностью секретазы. Различия по уровням белка можно оценить с помощью протеомных методик, в том числе без ограничения вестерн-блоттинга, иммуногистохимического окрашивания, твердофазного иммуноферментного анализа (ELISA) и масс-спектрометрии. Альтернативно белок, ассоциированный с нарушением, связанным с активностью секретазы, можно идентифицировать путем получения профилей экспрессии генов для генов, кодирующих белки, с помощью методик геномного анализа, в том числе без ограничения микроматричного анализа ДНК, последовательного анализа экспрессии генов (SAGE) и количественной полимеразной цепной реакции в режиме реального времени (Q-PCR).With respect to a disorder associated with secretase activity, proteins associated with these disorders are a diverse group of proteins that influence susceptibility to multiple disorders, the presence of a disorder, the severity of a disorder, or any combination thereof. The present disclosure contemplates editing any chromosomal sequences that encode proteins associated with a disorder associated with secretase activity. Proteins associated with a disorder associated with secretase activity are typically selected based on an experimentally established association of secretase-related proteins with the development of a disorder associated with secretase activity. For example, the rate of formation or the circulating concentration of a protein associated with a disorder associated with secretase activity may be increased or decreased in a population with a disorder associated with secretase activity compared to a population without a disorder associated with secretase activity. Differences in protein levels can be assessed using proteomic techniques including, but not limited to, Western blotting, immunohistochemical staining, enzyme-linked immunosorbent assay (ELISA), and mass spectrometry. Alternatively, the protein associated with a secretase activity disorder can be identified by generating gene expression profiles of protein-coding genes using genomic analysis techniques including, but not limited to, DNA microarray analysis, sequence-based analysis of gene expression (SAGE), and quantitative real-time polymerase chain reaction (Q-PCR).
В качестве неограничивающего примера белки, ассоциированные с нарушением, связанным с активностью секретазы, включают PSENEN (гомолог 2 энхансера пресенилина (C. elegans)), CTSB (катепсин B), PSEN1 (пресенелин 1), APP (предшественник белка амилоида бета (A4)), APH1B (гомолог В дефекта переднего отдела гортани 1 (C. elegans)), PSEN2 (пресенилин 2 (болезнь Альцгеймера 4 типа)), BACE1 (бета-сайт APP-расщепляющий фермент 1), ITM2B (интегральный мембранный белок 2B), CTSD (катепсин D), NOTCH1 (гомолог 1 Notch, ассоциированный с транслокацией (дрозофилиный)), TNF (фактор некроза опухоли (семейство TNF, представитель 2)), INS (инсулин), DYT10 (фактор 10 дистонии), ADAM17 (домен 17 ADAM металлопептидазы), APOE (аполипопротеин E), ACE (ангиотензин I превращающий фермент (пептидил-дипептидазу A) 1), STN (статин), TP53 (опухолевый белок p53), IL6 (интерлейкин 6 (интерферон, бета 2)), NGFR (рецептор фактора роста нервов (семейство TNFR, представитель 16)), IL1B (интерлейкин 1, бета), ACHE (ацетилхолинэстеразу (группа крови Yt)), CTNNB1 (катенин (кадгерин-ассоциированный белок), бета 1, 88 кДа), IGF1 (инсулин-подобный фактор роста 1 (соматомедин C)), IFNG (интерферон, гамма), NRG1 (неурегулин 1), CASP3 (каспазу 3, связанную с апоптозом цистеинпептидазу), MAPK1 (митоген-активируемую протеинкиназу 1), CDH1 (кадгерин 1, 1 тип, E-кадгерин (эпителиальный)), APBB1 (протеин-связывающий предшественник амилоида бета (A4), семейство B, представитель 1 (Fe65)), HMGCR (3-гидрокси-3-метилглутарил-кофермент A редуктазу), CREB1 (связывающий белок 1 чувствительного к cAMP элемента), PTGS2 (простагландин-эндопероксидсинтазу 2 (простагландин G/H синтазу и циклооксигеназу)), HES1 (белок "hairy and enhancer of split 1", (дрозофилиный)), CAT (каталазу), TGFB1 (трансформирующий фактор роста, бета 1), ENO2 (энолазу 2 (гамма, нейрональную)), ERBB4 (гомолог 4 онкогена вируса эритробластического лейкоза v-erb-a (птичий)), TRAPPC10 (комплекс миграции белковых частиц 10), MAOB (моноаминоксидазу B), NGF (фактор роста нервов (бета-полпипептид)), MMP12 (матриксную металлопептидазу 12 (макрофагальную эластазу)), JAG1 (jagged 1 (синдром Алажиля)), CD40LG (лиганд к CD40), PPARG (гамма-рецептор, активируемый пролифератором пероксисом), FGF2 (фактор роста фибробластов 2 (основной)), IL3 (интерлейкин 3 (колониестимулирующий фактор, множественный)), LRP1 (белок 1, связанный с рецептором липопротеина низкой плотности), NOTCH4 (гомолог 4 Notch (дрозофилиный)), MAPK8 (митоген-активируемую протеинкиназу 8), PREP (пролилэндопептидазу), NOTCH3 (гомолог 3 Notch 3 (дрозофилиный)), PRNP (прионный белок), CTSG (катапсин G), EGF (эпидермальный фактор роста (бета-урогастрон)), REN (ренин), CD44 (молекулу CD44 (группа крови системы Indian)), SELP (селектин P (гранулярный мембранный белок с массой 140 кДа, антиген CD62)), GHR (рецептор гормона роста), ADCYAP1 (полипептид 1, активирующий адентилатциклазу 1 (гипофизарный)), INSR (инсулиновый рецептор), GFAP (глиофибриллярный кислый белок), MMP3 (матриксную металлопептидазу 3 (стромелизин 1, прожелатиназу)), MAPK10 (митоген-актвированную протеинкиназу 10), SP1 (фактор транскрипции Sp1), MYC (гомолог онкогена вируса миелоцитоматоза v-myc (птичий)), CTSE (катепсин E), PPARA (альфа-рецептор, активируемый пролифератором пероксисом), JUN (онкоген jun), TIMP1 (ингибитор TIMP металлопептидазы 1), IL5 (интерлейкин 5 (колониестимулирующий фактор, эозинофильный)), IL1A (интерлейкин 1, альфа), MMP9 (матриксную металлопептидазу 9 (желатиназу B, желатиназу с массой 92 кДа, коллагеназу IV типа с массой 92 кДа)), HTR4 (5-гидрокситриптамин (серотониновый) рецептор 4 типа), HSPG2 (гепарансульфат-протеогликан 2), KRAS (гомолог онкогена вируса саркомы крыс Kirsten v-Ki-ras2), CYCS (цитохром c, соматический), SMG1 (гомолог SMG1, киназу, связанную с фосфатидилинозитол-3-киназой (C. elegans)), IL1R1 (рецептор интерлейкина 1, I тип), PROK1 (прокинетицин 1), MAPK3 (митоген-активируемую протеинкиназу 3), NTRK1 (нейротрофическую тирозинкиназу, рецептор, 1 тип), IL13 (интерлейкин 13), MME (мембранную металлоэндопептидазу), TKT (транскетолазу), CXCR2 (хемокиновый рецептор 2 (с мотивом C-X-C)), IGF1R (рецептор 1 инсулин-подобного фактора роста), RARA (рецептор ретиноевой кислоты, альфа), CREBBP (CREB связывающий белок), PTGS1 (простагландин-эндопероксидсинтазу 1 (простагландин G/H синтазу и циклооксигеназу)), GALT (галактозо-1-фосфатуридилтрансферазу), CHRM1 (холинергический рецептор, мускариновый 1), ATXN1 (атаксин 1), PAWR (PRKC, апоптический, WT1, регулятор), NOTCH2 (гомолог 2 Notch (дрозофилиный)), M6PR (маннозо-6-фосфатный рецептор (катион-зависимый)), CYP46A1 (цитохром P450, семейство 46, подсемейство A, полипептид 1), CSNK1 D (казеинкиназу 1, дельта), MAPK14 (митоген-активируемую протеинкиназу 14), PRG2 (протеогликан 2, костномозговой (активатор натуральных клеток-киллеров, главный основной белок эозинофильных гранул)), PRKCA (протеинкиназу C, альфа), L1 CAM (молекулу клеточной адгезии L1), CD40 (молекулу CD40, представитель 5 суперсемейства рецепторов TNF), NR1I2 (семейство 1 ядерных рецепторов, I группа, представитель 2), JAG2 (jagged 2), CTNND1 (катенин (кадгерин-ассоциированный белок), дельта 1), CDH2 (кадгерин 2, 1 тип, N-кадгерин (нейрональный)), CMA1 (химазу 1, тучных клеток), SORT1 (сортилин 1), DLK1 (дельта-подобный 1 гомолог (дрозофилиный)), THEM4 (представитель 4 семейства тиоэстераз 4), JUP (плакоглобин межклеточных контактов), CD46 (молекулу CD46, регуляторный белок комплемента), CCL11 (хемокиновый лиганд 11 (с мотивом C-C)), CAV3 (кавеолин 3), RNASE3 (рибонуклеазу, РНКазу, семейство A, 3 (эозинофильный катионный белок)), HSPA8 (белок 8 теплового шока, с массой 70 кДа), CASP9 (каспазу 9, связанную с апоптозом цистеинпептидазу), CYP3A4 (цитохром P450, семейство 3, подсемейство A, полипептид 4), CCR3 (хемокиновый рецептор 3 (с мотивом C-C)), TFAP2A (фактор транскрипции AP-2 альфа (активирующий энхансер связывающий белок 2 альфа)), SCP2 (белок-переносчик стеринов 2), CDK4 (циклин-зависимую киназу 4), HIF1A (индуцируемый гипоксией фактор 1, альфа-субъединица (основной фактор транскрипции спираль-петля-спираль)), TCF7L2 (фактор 2, подобный фактору транскрипции 7 (специфичный по отношению к T-клеткам, HMG-бокс)), IL1R2 (рецептор интерлейкина 1, II тип), B3GALTL (факторы, подобный бета 1,3-галактолизтрансферазе), MDM2 (гомолог Mdm2 p53-связывающего белка (мышиный)), RELA (гомолог онкогена А вируса ретикулоэндотелиоза v-rel (птичий)), CASP7 (каспазу 7, связанную с апоптозом цистеинпептидазу), IDE (разрушающий инсулин фермент), FABP4 (белок 4, связывающий жирные кислоты, адипоцитарный), CASK (кальций/кальмодулин-зависимую протеинкиназу (семейство MAGUK)), ADCYAP1R1 (аденилатциклазный активирующий рецептор полипептида 1 (гипофизарный), I тип), ATF4 (активирующий фактор транскрипции 4 (чувствительный к tax энхансерный элемент B67)), PDGFA (тромбоцитарный фактор роста, альфа-полипептид), C21 или f33 (открытая рамка считывания 33 хромосомы 21), SCG5 (секретогранин V (белок 7B2)), RNF123 (белок "цинковый палец" типа ring 123), NFKB1 (ядерный фактор энхансера гена каппа-полипептида легкой цепи в B-клетках 1 типа), ERBB2 (гомолог онкогена 2 вируса эритробластного лейкоза v-erb-b2, гомолог онкогена нейро-/глиобластомного происхождения (птичий)), CAV1 (кавеолин 1, белок кавеол, 22 кДа), MMP7 (матриксную металлопептидазу 7 (матрилизин, маточный)), TGFA (трансформирующий фактор роста, альфа), RXRA (ретиноидный X-рецептор, альфа), STX1A (синтаксин 1A (головного мозга)), PSMC4 (протеасомную субъединицу 26S (просому, макропаин), АТФазу, 4), P2RY2 (пиринергический рецептор P2Y, связанный с G-белком, 2), TNFRSF21 (семейство рецепторов фактора некроза опухоли, представитель 21), DLG1 (discs, большой гомолог 1 (дрозофилиный)), NUMBL (гомолог, подобный numb (дрозофилиный)), SPN (сиалофорин), PLSCR1 (фосфолипидскрамблазу 1), UBQLN2 (убиквитин 2), UBQLN1 (убиквитин 1), PCSK7 (пропротеинконвертазу субтилизин/кексин 7 типа), SPON1 (спондин 1, белок внеклеточного матрикса), SILV (гомолог silver (мышиный)), QPCT (глутаминил-пептид-циклотрансферазу), HESS (белок "hairy and enhancer of split 5" (дрозофилиный)), GCC1 (содержащий GRIP двуспиральный домен 1) и их комбинацию.By way of non-limiting example, proteins associated with secretase activity disorder include PSENEN (presenilin enhancer homolog 2 (C. elegans)), CTSB (cathepsin B), PSEN1 (presenilin 1), APP (amyloid beta (A4) protein precursor), APH1B (anterior laryngeal defect 1 homolog B (C. elegans)), PSEN2 (presenilin 2 (Alzheimer's disease type 4)), BACE1 (beta-site APP-cleaving enzyme 1), ITM2B (integral membrane protein 2B), CTSD (cathepsin D), NOTCH1 (Notch translocation-associated homolog 1 (Drosophila)), TNF (tumor necrosis factor (TNF family member 2)), INS (insulin), DYT10 (dysfunction factor 10 dystonia), ADAM17 (ADAM domain 17 metallopeptidase), APOE (apolipoprotein E), ACE (angiotensin I converting enzyme (peptidyl dipeptidase A) 1), STN (statin), TP53 (tumor protein p53), IL6 (interleukin 6 (interferon, beta 2)), NGFR (nerve growth factor receptor (TNFR family, member 16)), IL1B (interleukin 1, beta), ACHE (acetylcholinesterase (blood group Yt)), CTNNB1 (catenin (cadherin-associated protein), beta 1, 88 kDa), IGF1 (insulin-like growth factor 1 (somatomedin C)), IFNG (interferon, gamma), NRG1 (neuregulin 1), CASP3 (apoptosis-associated caspase 3 cysteine peptidase), MAPK1 (mitogen-activated protein kinase 1), CDH1 (cadherin 1, type 1, E-cadherin (epithelial)), APBB1 (amyloid precursor-binding protein beta (A4), family B, member 1 (Fe65)), HMGCR (3-hydroxy-3-methylglutaryl-coenzyme A reductase), CREB1 (cAMP-responsive element binding protein 1), PTGS2 (prostaglandin-endoperoxide synthase 2 (prostaglandin G/H synthase and cyclooxygenase)), HES1 (hairy and enhancer of split 1 protein, (Drosophila)), CAT (catalase), TGFB1 (transforming growth factor, beta 1), ENO2 (enolase 2 (gamma, neuronal)), ERBB4 (ERBB4 oncogene homolog 4 virus erythroblastic leukemia v-erb-a (avian)), TRAPPC10 (particle protein migration complex 10), MAOB (monoamine oxidase B), NGF (nerve growth factor (beta-polypeptide)), MMP12 (matrix metallopeptidase 12 (macrophage elastase)), JAG1 (jagged 1 (Alagille syndrome)), CD40LG (CD40 ligand), PPARG (peroxisome proliferator-activated receptor-gamma), FGF2 (fibroblast growth factor 2 (basic)), IL3 (interleukin 3 (colony stimulating factor, multiple)), LRP1 (low-density lipoprotein receptor-related protein 1), NOTCH4 (Notch homolog 4 (Drosophila)), MAPK8 (mitogen-activated protein kinase 8), PREP (prolyl endopeptidase), NOTCH3 (Notch 3 homolog 3 (Drosophila)), PRNP (prion protein), CTSG (catapsin G), EGF (epidermal growth factor (beta-urogastron)), REN (renin), CD44 (CD44 molecule (Indian blood group)), SELP (selectin P (granular membrane protein with a mass of 140 kDa, CD62 antigen)), GHR (growth hormone receptor), ADCYAP1 (adentyl cyclase activating polypeptide 1 1 (pituitary)), INSR (insulin receptor), GFAP (glial fibrillary acidic protein), MMP3 (matrix metallopeptidase 3 (stromelysin 1, progelatinase)), MAPK10 (mitogen-activated protein kinase 10), SP1 (transcription factor Sp1), MYC (avian myelocytomatosis virus oncogene homolog v-myc), CTSE (cathepsin E), PPARA (peroxisome proliferator-activated receptor alpha), JUN (jun oncogene), TIMP1 (TIMP inhibitor of metallopeptidase 1), IL5 (interleukin 5 (colony stimulating factor, eosinophil)), IL1A (interleukin 1, alpha), MMP9 (matrix metallopeptidase 9 (gelatinase B, 92-kDa gelatinase, 92-kDa collagenase type IV)), HTR4 (5-hydroxytryptamine (serotonin) receptor type 4), HSPG2 (heparan sulfate proteoglycan 2), KRAS (Kirsten rat sarcoma virus oncogene homolog v-Ki-ras2), CYCS (cytochrome c, somatic), SMG1 (SMG1 homolog, phosphatidylinositol 3-kinase-related kinase (C. elegans)), IL1R1 (interleukin 1 receptor, type I), PROK1 (prokineticin 1), MAPK3 (mitogen-activated protein kinase 3), NTRK1 (neurotrophic tyrosine kinase receptor, type 1), IL13 (interleukin 13), MME (membrane metalloendopeptidase), TKT (transketolase), CXCR2 (chemokine receptor 2 (with a C-X-C motif)), IGF1R (insulin-like growth factor receptor 1), RARA (retinoic acid receptor, alpha), CREBBP (CREB binding protein), PTGS1 (prostaglandin endoperoxide synthase 1 (prostaglandin G/H synthase and cyclooxygenase)), GALT (galactose-1-phosphate uridyl transferase), CHRM1 (cholinergic receptor, muscarinic 1), ATXN1 (ataxin 1), PAWR (PRKC, apoptotic, WT1, regulator), NOTCH2 (Notch homolog 2 (Drosophila)), M6PR (mannose-6-phosphate receptor (cation-dependent)), CYP46A1 (cytochrome P450, family 46, subfamily A, polypeptide 1), CSNK1 D (casein kinase 1, delta), MAPK14 (mitogen-activated protein kinase 14), PRG2 (proteoglycan 2, bone marrow (activator of natural killer cells, major basic eosinophil granule protein)), PRKCA (protein kinase C, alpha), L1 CAM (cell adhesion molecule L1), CD40 (CD40 molecule, TNF receptor superfamily member 5), NR1I2 (nuclear receptor family 1, group I, member 2), JAG2 (jagged 2), CTNND1 (catenin (cadherin-associated protein), delta 1), CDH2 (cadherin 2, type 1, N-cadherin (neuronal)), CMA1 (chymase 1, mast cell), SORT1 (sortilin 1), DLK1 (delta-like 1 homolog (Drosophila)), THEM4 (thioesterase family member 4), JUP (intercellular contact plakoglobin), CD46 (CD46 molecule, complement regulatory protein), CCL11 (chemokine ligand 11 (with C-C motif)), CAV3 (caveolin 3), RNASE3 (ribonuclease, RNase, family A, 3 (eosinophil cationic protein)), HSPA8 (heat shock protein 8, with a mass of 70 kDa), CASP9 (caspase 9, apoptosis-associated cysteine peptidase), CYP3A4 (cytochrome P450, family 3, subfamily A, polypeptide 4), CCR3 (chemokine receptor 3 (with C-C motif)), TFAP2A (transcription factor AP-2 alpha (activating enhancer binding protein 2 alpha)), SCP2 (sterol transfer protein 2), CDK4 (cyclin-dependent kinase 4), HIF1A (hypoxia-inducible factor 1, alpha subunit (basic helix-loop-helix transcription factor)), TCF7L2 (T-cell-specific transcription factor 7-like factor 2, HMG-box), IL1R2 (interleukin 1 receptor, type II), B3GALTL (beta 1,3-galactosyltransferase-like factors), MDM2 (Mdm2 homolog of p53-binding protein (mouse)), RELA (reticuloendotheliosis virus oncogene A homolog v-rel (avian)), CASP7 (caspase 7, apoptosis-associated cysteine peptidase), IDE (insulin-degrading enzyme), FABP4 (fatty acid-binding protein 4, adipocyte), CASK (calcium/calmodulin-dependent protein kinase (MAGUK family)), ADCYAP1R1 (adenylate cyclase activating receptor polypeptide 1 (pituitary), type I), ATF4 (activating transcription factor 4 (tax-responsive enhancer element B67)), PDGFA (platelet-derived growth factor alpha polypeptide), C21 or f33 (chromosome 21 open reading frame 33), SCG5 (secretogranin V (protein 7B2)), RNF123 (ring 123 zinc finger protein), NFKB1 (nuclear factor of B-cell kappa light chain polypeptide gene enhancer type 1), ERBB2 (erythroblastic leukemia virus oncogene 2 homolog v-erb-b2, oncogene homolog of neuro-/glioblastoma origin (avian)), CAV1 (caveolin 1, caveolae protein, 22 kDa), MMP7 (matrix metallopeptidase 7 (matrilysin, uterine)), TGFA (transforming growth factor, alpha), RXRA (retinoid X receptor, alpha), STX1A (syntaxin 1A (brain)), PSMC4 (proteasome subunit 26S (prosome, macropain) ATPase, 4), P2RY2 (pyrenergic receptor P2Y, G protein-coupled receptor, 2), TNFRSF21 (tumor necrosis factor receptor family, member 21), DLG1 (discs, large homolog 1 (Drosophila)), NUMBL (numb-like homolog (Drosophila)), SPN (sialophorin), PLSCR1 (phospholipid scramblease 1), UBQLN2 (ubiquitin 2), UBQLN1 (ubiquitin 1), PCSK7 (proprotein convertase subtilisin/kexin type 7), SPON1 (spondin 1, extracellular matrix protein), SILV (silver homolog (mouse)), QPCT (glutaminyl peptide cyclotransferase), HESS (hairy and enhancer of split 5 protein (Drosophila)), GCC1 (GRIP-containing double-stranded domain 1), and combinations thereof.
Генетически модифицированные животное или клетка может содержать 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более хромосомных последовательностей с нарушенной структурой, кодирующих белок, ассоциированный с нарушением, связанным с активностью секретазы, и ноль, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более интегрированных в хромосомы последовательностей, кодирующих белок с нарушенной структурой, ассоциированный с нарушением, связанным с активностью секретазы.A genetically modified animal or cell may contain 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more chromosomal sequences with a disrupted structure encoding a protein associated with a disorder associated with secretase activity, and zero, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more chromosomally integrated sequences encoding a protein with a disrupted structure associated with a disorder associated with secretase activity.
Нацеливание на печень и клетки печени; гемофилияTargeting the liver and liver cells; hemophilia
Предусмотрено нацеливание на клетки печени. Его можно осуществлять in vitro или in vivo. Гепатоциты являются предпочтительными. Доставка белка CRISPR может осуществляться посредством вирусных векторов, особенно векторов на основе AAV (и, в частности, AAV2/6). Их можно вводить с помощью внутривенной инъекции.Targeting of liver cells is envisaged. This can be done in vitro or in vivo. Hepatocytes are preferred. Delivery of the CRISPR protein can be done via viral vectors, especially AAV-based vectors (and in particular AAV2/6). These can be administered via intravenous injection.
Предпочтительной мишенью для печени, вне зависимости in vitro или in vivo, является ген альбумина. Он представляет собой так называемую "зону безопасности", поскольку альбумин экспрессируется при очень высоких уровнях, и поэтому некоторое снижение продукции альбумина после успешного редактирования генов является допустимым. Он также является предпочтительным, поскольку высокие уровни экспрессии, наблюдаемые при работе промотора/энхансера альбумина, обеспечивают достижение полезных уровней корректной или трансгенной продукции (из вставленной донорской матрицы) даже в случае, если редактируют лишь небольшую часть гепатоцитов.The preferred liver target, whether in vitro or in vivo, is the albumin gene. It represents a so-called "safety zone" because albumin is expressed at very high levels, and therefore some reduction in albumin production after successful gene editing is acceptable. It is also preferred because the high expression levels seen with the albumin promoter/enhancer ensure that useful levels of correct or transgene production (from the inserted donor template) are achieved even when only a small proportion of hepatocytes are edited.
Интрон 1 альбумина, как было показано Wechsler et al. (представлено на 57-м ежегодном собрании и выставке Американского общества гематологии - резюме доступно онлайн по адресу https://ash.confex.com/ash/2015/webprogram/Paper86495.html и размещено 6 декабря 2015 г.), является подходящим целевым сайтом. В их исследовании были использованы "цинковые пальцы" для разрезания ДНК в целевом сайте, и подходящие направляющие последовательности можно получить для управления расщеплением в том же сайте с помощью белка CRISPR.Intron 1 of albumin was shown by Wechsler et al. (presented at the 57th Annual Meeting and Exposition of the American Society of Hematology - abstract available online at https://ash.confex.com/ash/2015/webprogram/Paper86495.html and posted December 6, 2015) to be a suitable target site. Their study used zinc fingers to cut DNA at the target site, and suitable guide sequences can be generated to direct cleavage at the same site using the CRISPR protein.
Использование мишеней в высокоэкспрессируемых генах (генах с высокоактивными энхансерами/промоторами), такими как альбумин, может также обеспечивать использование не содержащей промоторов донорской матрицы, как описано Wechsler et al., и это также является широко применимым за пределами нацеливания на печень. Известны другие примеры высокоэкспрессируемых генов.The use of targets in highly expressed genes (genes with highly active enhancers/promoters), such as albumin, can also allow the use of a promoter-free donor template, as described by Wechsler et al., and this is also widely applicable beyond liver targeting. Other examples of highly expressed genes are known.
Нарушения со стороны крови, связанные с печенью, в частности, гемофилия, а именно гемофилия BBlood disorders involving the liver, in particular hemophilia, namely hemophilia B
Успешное редактирование генов гепатоцитов было достигнуто у мышей (как in vitro, так и in vivo) и у отличных от человека приматов (in vivo), показывающее, что лечение нарушений со стороны крови посредством редактирования гена/конструирования генома в гепатоцитах является возможным. В частности, экспрессия человеческого гена F9 (hF9) в гепатоцитах была показана у отличных от человека приматов, указывая на возможность лечения гемофилии B у людей.Successful gene editing of hepatocytes has been achieved in mice (both in vitro and in vivo) and in non-human primates (in vivo), demonstrating that treatment of blood disorders through gene editing/genome engineering in hepatocytes is feasible. In particular, expression of the human F9 gene (hF9) in hepatocytes has been demonstrated in non-human primates, suggesting the possibility of treating hemophilia B in humans.
Wechsler et al. представили на 57-м ежегодном собрании и выставке Американского общества гематологии (резюме размещено 6 декабря 2015 г. и доступно онлайн по адресу https://ash.confex.com/ash/2015/webprogram/Paper86495.html), что они успешно экспрессировали человеческий F9 (hF9) из гепатоцитов, взятых у отличных от человека приматов, посредством редактирования гена in vivo. Это было достигнуто с помощью 1) двух нуклеаз с "цинковыми пальцами" (ZFN), нацеливающихся на интрон 1 локуса альбумина, и 2) конструкции донорской матрицы человеческого F9. ZFN и донорскую матрицу кодировали на отдельных векторах на основе гепатотропного аденоассоциированного вируса серотипа 2/6 (AAV2/6), вводили внутривенно, что приводило к целевой вставке откорректированной копии гена hF9 в локус альбумина в части гепатоцитов печени.Wechsler et al. presented at the 57th Annual Meeting and Exposition of the American Society of Hematology (abstract posted December 6, 2015, and available online at https://ash.confex.com/ash/2015/webprogram/Paper86495.html) that they successfully expressed human F9 (hF9) from hepatocytes from non-human primates via in vivo gene editing. This was achieved using 1) two zinc finger nucleases (ZFNs) targeting intron 1 of the albumin locus and 2) a human F9 donor template construct. ZFN and donor template were encoded on separate hepatotropic adeno-associated virus serotype 2/6 (AAV2/6)-based vectors and administered intravenously, resulting in targeted insertion of a corrected copy of the hF9 gene into the albumin locus of a subset of liver hepatocytes.
Локус альбумина выбирали в качестве "предохранителя", поскольку продукция этого наиболее представленного белка плазмы превышает 10 г/день, и умеренные снижения таких уровней являются хорошо переносимыми. Гепатоциты с отредактированным геномом продуцировали hFIX (hF9) в терапевтических количествах, в отличие от альбумина, управляемого высокоактивным энхансером/промотором. Была показана подвергаемая нацеливанию интеграция трансгена hF9 в локус альбумина и сплайсинг этого гена в транскрипт альбумина.The albumin locus was chosen as a "safety net" because production of this most abundant plasma protein exceeds 10 g/day and modest reductions in such levels are well tolerated. Genome-edited hepatocytes produced hFIX (hF9) in therapeutic amounts, in contrast to albumin driven by a highly active enhancer/promoter. Targeted integration of the hF9 transgene into the albumin locus and splicing of this gene into the albumin transcript were demonstrated.
Исследования у мышей: мышам C57BL/6 вводили основу (n=20) или векторы на основе AAV2/6 (n=25), кодирующие мышиные суррогатные реагенты, при 1,0 x1013 векторных геномов (vg)/кг посредством инъекции в хвостовую вену. Анализ ELISA hFIX плазмы у обработанных мышей показал максимальные уровни 50-1053 нг/мл, которые сохранялись в течение 6-месячного исследования. Анализ активности FIX из плазмы мышей подтвердил биоактивность, соразмерную уровням экспрессии.Mouse studies: C57BL/6 mice were treated with backbone (n=20) or AAV2/6-based vectors (n=25) encoding mouse surrogate reagents at 1.0 x1013 vector genomes (vg)/kg via tail vein injection. Plasma hFIX ELISA analysis of treated mice showed peak levels of 50-1053 ng/mL that were maintained over the 6-month study. Analysis of FIX activity from mouse plasma confirmed bioactivity commensurate with expression levels.
Исследования у отличных от человека приматов (NHP): одна внутривенная совместная инфузия векторов на основе AAV2/6, кодирующих нацеленные на альбумин-специфичные ZFN NHP, и донорской матрицы человеческого F9 при 1,2x1013 vg/кг (n=5/группа) приводила к уровню >50 нг/мл (>1% от нормы) в этой модели с участием крупных животных. Применение более высоких доз AAV2/6 (до 1,5x1014 vg/кг включительно) приводило к уровням hFIX до 1000 нг/мл включительно (или 20% от нормы) у нескольких животных и до 2000 нг/мл (или 50% от нормы) у одного животного в течение исследования (3 месяца).Studies in non-human primates (NHPs): A single intravenous co-infusion of AAV2/6-based vectors encoding NHP albumin-targeting ZFNs and human F9 donor matrix at 1.2x1013 vg/kg (n=5/group) resulted in levels >50 ng/mL (>1% of normal) in this large animal model. Administration of higher doses of AAV2/6 (up to and including 1.5x1014 vg/kg) resulted in hFIX levels up to and including 1000 ng/mL (or 20% of normal) in several animals and up to 2000 ng/mL (or 50% of normal) in one animal over the course of the study (3 months).
Лечение хорошо переносилось у мышей и NHP, без значимых токсикологических результатов, связанных с лечением AAV2/6 ZFN + донор у обоих видов при терапевтических дозах. После этого Sangamo (Калифорния, США) подал заявку в FDA и получил разрешение на проведение первого в мире клинического исследования на человеке с целью применения редактирования генома in vivo. Оно проводится в дополнение к разрешению EMEA лечения на основе генной терапии Glybera недостаточности липопротеинлипазы.The treatment was well tolerated in mice and NHPs, with no significant toxicological findings associated with AAV2/6 ZFN+ donor treatment in either species at therapeutic doses. Sangamo (CA, USA) has since applied to and received FDA approval to conduct the world’s first human clinical trial to apply in vivo genome editing. This is in addition to EMEA approval of Glybera, a gene therapy-based treatment for lipoprotein lipase deficiency.
Соответственно, предпочтительно в некоторых вариантах осуществления, что применяют любое или все из следующего:Accordingly, it is preferred in some embodiments that any or all of the following are used:
векторы на основе AAV (в частности, AAV2/6), предпочтительно вводимые с помощью внутривенной инъекции;AAV-based vectors (in particular AAV2/6), preferably administered by intravenous injection;
альбумин в качестве мишени для редактирования гена/вставки трансгена/матрицы - особенно в интроне 1 альбумина;albumin as a target for gene editing/transgene/matrix insertion - especially in intron 1 of albumin;
донорскую матрицу человеческого F9; и/илиdonor matrix of human F9; and/or
не содержащую промотора донорскую матрицу.promoter-free donor matrix.
Гемофилия BHemophilia B
Соответственно, в некоторых вариантах осуществления предпочтительно, что настоящее изобретение применяют для лечения гемофилии B. Например, предпочтительно, что предусмотрена матрица, и что она представляет собой человеческий ген F9. Предполагается, что матрица hF9 содержит wt или "не содержащую ошибок" версию hF9, поэтому лечение является эффективным.Accordingly, in some embodiments, it is preferred that the present invention is used to treat hemophilia B. For example, it is preferred that a template is provided, and that it is a human F9 gene. It is believed that the hF9 template contains a wt or "error-free" version of hF9, so that the treatment is effective.
В альтернативном варианте осуществления версия F9, приводящая к гемофилии В, может быть доставлена с тем, чтобы создать модельный организм, клетку или линию клеток (например, модельный организм, клетку или линию клеток мыши или отличных от человека приматов), модельный организм, клетку или линию клеток, имеющую или несущую фенотип гемофилии B, т.е. неспособность продуцировать F9 wt.In an alternative embodiment, the hemophilia B version of F9 may be delivered to generate a model organism, cell, or cell line (e.g., a mouse or non-human primate model organism, cell, or cell line), a model organism, cell, or cell line having or carrying the hemophilia B phenotype, i.e., an inability to produce wt F9.
Гемофилия AHemophilia A
В некоторых вариантах осуществления ген F9 (фактор IX) может быть замещен геном F8 (фактор VIII), описанным в данном документе, приводя к лечению гемофилии A (посредством получения не содержащего ошибок гена F8) и/или созданию модельного организма, клетки или линии клеток с гемофилией A (посредством получения содержащего ошибки гена F8, версии, приводящей к гемофилии А).In some embodiments, the F9 (factor IX) gene may be replaced with the F8 (factor VIII) gene described herein, resulting in a treatment for hemophilia A (by producing an error-free F8 gene) and/or the creation of a model organism, cell, or cell line with hemophilia A (by producing an error-containing F8 gene, a version that results in hemophilia A).
Гемофилия CHemophilia C
В некоторых вариантах осуществления ген F9 (фактор IX) может быть замещен геном F11 (фактор XI), описанным в данном документе, приводя к лечению гемофилии С (посредством получения не содержащего ошибок гена F11) и/или созданию модельного организма, клетки, или линии клеток с гемофилией С (посредством получения содержащего ошибки гена F11, версии, приводящей к гемофилии С).In some embodiments, the F9 (factor IX) gene may be replaced with the F11 (factor XI) gene described herein, resulting in a treatment for hemophilia C (by producing an error-free F11 gene) and/or the creation of a model organism, cell, or cell line for hemophilia C (by producing an error-containing F11 gene, a version that results in hemophilia C).
Другие состоянияOther conditions
Муковисцидоз (CF)Cystic fibrosis (CF)
В некоторых вариантах осуществления предусмотрено лечение, профилактика и диагностика муковисцидоза. Мишенью предпочтительно является ген SCNN1A или CFTR. Это описано в WO2015157070, раскрытие которого включено в данный документ посредством ссылки.In some embodiments, treatment, prevention and diagnosis of cystic fibrosis are provided. The target is preferably the SCNN1A or CFTR gene. This is described in WO2015157070, the disclosure of which is incorporated herein by reference.
Рак и CAR-TCancer and CAR-T
В некоторых вариантах осуществления предусмотрено лечение, профилактика и диагностика муковисцидоза. Мишенью предпочтительно является один или несколько из генов FAS, BID, CTLA4, PDCD1, CBLB, PTPN6, TRAC или TRBC. Онкологическое заболевание может представлять собой одно или несколько из лимфомы, хронического лимфоцитарного лейкоза (CLL), B-клеточного острого лимфоцитарного лейкоза (B-ALL), острого лимфобластного лейкоза, острого миелоидного лейкоза, неходжкинской лимфомы (NHL), диффузной крупноклеточной лимфомы (DLCL), множественной миеломы, почечно-клеточной карциномы (RCC), нейробластомы, колоректального рака, рака молочной железы, рака яичников, меланомы, саркомы, рака предстательной железы, рака легких, рака пищевода, гепатоцеллюлярной карциномы, рака поджелудочной железы, астроцитомы, мезотелиомы, рака головы и шеи и медуллобластомы. Это можно осуществлять с помощью сконструированной Т-клетки с химерным антигенным рецептором (CAR). Это описано в WO2015161276, раскрытие которого включено в данный документ посредством ссылки.In some embodiments, treatment, prevention and diagnosis of cystic fibrosis are provided. The target is preferably one or more of the FAS, BID, CTLA4, PDCD1, CBLB, PTPN6, TRAC or TRBC genes. The cancer may be one or more of lymphoma, chronic lymphocytic leukemia (CLL), B-cell acute lymphocytic leukemia (B-ALL), acute lymphoblastic leukemia, acute myeloid leukemia, non-Hodgkin's lymphoma (NHL), diffuse large cell lymphoma (DLCL), multiple myeloma, renal cell carcinoma (RCC), neuroblastoma, colorectal cancer, breast cancer, ovarian cancer, melanoma, sarcoma, prostate cancer, lung cancer, esophageal cancer, hepatocellular carcinoma, pancreatic cancer, astrocytoma, mesothelioma, head and neck cancer, and medulloblastoma. This can be done using an engineered chimeric antigen receptor (CAR) T cell. This is described in WO2015161276, the disclosure of which is incorporated herein by reference.
Вирус простого герпеса 1 и 2 типаHerpes simplex virus types 1 and 2
В некоторых вариантах осуществления предусмотрено лечение, профилактика и диагностика HSV-1 (вируса простого герпеса 1). Мишенью предпочтительно является ген UL19, UL30, UL48 или UL50 в HSV-1. Это описано в WO2015153789, раскрытие которого включено в данный документ посредством ссылки.In some embodiments, treatment, prevention and diagnosis of HSV-1 (herpes simplex virus 1) are provided. The target is preferably the UL19, UL30, UL48 or UL50 gene in HSV-1. This is described in WO2015153789, the disclosure of which is incorporated herein by reference.
В других вариантах осуществления предусмотрено лечение, профилактика и диагностика HSV-2 (вируса простого герпеса 2). Мишенью предпочтительно является ген UL19, UL30, UL48 или UL50 в HSV-2. Это описано в WO2015153791, раскрытие которого включено в данный документ посредством ссылки.In other embodiments, treatment, prevention and diagnosis of HSV-2 (herpes simplex virus 2) are provided. The target is preferably the UL19, UL30, UL48 or UL50 gene in HSV-2. This is described in WO2015153791, the disclosure of which is incorporated herein by reference.
Настоящее изобретение может быть дополнительно проиллюстрировано и расширено на основе аспекта разработки и применения CFISPR-Cas9, как изложено в следующих статьях, тем самым включенных в данный документ посредством ссылки и, в частности, он относится к доставке комплекса белка CRISPR и вариантам применения РНК-направляемой эндонуклеазы в клетках и организмах:The present invention can be further illustrated and expanded based on the aspect of development and use of CFISPR-Cas9 as set forth in the following articles, hereby incorporated by reference herein and, in particular, it relates to delivery of the CRISPR protein complex and uses of the RNA-guided endonuclease in cells and organisms:
Multiplex genome engineering using CRISPR/Cas systems. Cong, L., Ran, F.A., Cox, D., Lin, S., Barretto, R., Habib, N., Hsu, P.D., Wu, X., Jiang, W., Marraffini, L.A., & Zhang, F. Science Feb 15;339(6121):819-23 (2013);Multiplex genome engineering using CRISPR/Cas systems. Cong, L., Ran, F.A., Cox, D., Lin, S., Barretto, R., Habib, N., Hsu, P.D., Wu, X., Jiang, W., Marraffini, L.A., & Zhang, F. Science Feb 15;339(6121):819-23 (2013);
RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Jiang, W., Bikard, D., Cox, D., Zhang, F., Marraffini, L.A. Nat Biotechnol Mar; 31(3):233-9 (2013);RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Jiang, W., Bikard, D., Cox, D., Zhang, F., Marraffini, L.A. Nat Biotechnol Mar; 31(3):233-9 (2013);
One-Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR/Cas-Mediated Genome Engineering. Wang H., Yang H., Shivalila CS., Dawlaty MM., Cheng AW., Zhang F., Jaenisch R. Cell May 9;153(4):910-8 (2013);One-Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR/Cas-Mediated Genome Engineering. Wang H., Yang H., Shivalila CS., Dawlaty MM., Cheng AW., Zhang F., Jaenisch R. Cell May 9;153(4):910-8 (2013);
Optical control of mammalian endogenous transcription and epigenetic states. Konermann S, Brigham MD, Trevino AE, Hsu PD, Heidenreich M, Cong L, Platt RJ, Scott DA, Church GM, Zhang F. Nature. Aug 22;500(7463):472-6. doi: 10.1038/Nature12466. Epub 2013 Aug 23 (2013);Optical control of mammalian endogenous transcription and epigenetic states. Konermann S, Brigham MD, Trevino AE, Hsu PD, Heidenreich M, Cong L, Platt RJ, Scott DA, Church GM, Zhang F. Nature. Aug 22;500(7463):472-6. doi: 10.1038/Nature12466. Epub 2013 Aug 23 (2013);
Double Nicking by RNA-Guided CRISPR Cas9 for Enhanced Genome Editing Specificity. Ran, FA., Hsu, PD., Lin, CY., Gootenberg, JS., Konermann, S., Trevino, AE., Scott, DA., Inoue, A., Matoba, S., Zhang, Y., & Zhang, F. Cell Aug 28. pii: S0092-8674(13)01015-5 (2013-A);Double Nicking by RNA-Guided CRISPR Cas9 for Enhanced Genome Editing Specificity. Ran, F.A., Hsu, P.D., Lin, C.Y., Gootenberg, J.S., Konermann, S., Trevino, A.E., Scott, D.A., Inoue, A., Matoba, S., Zhang, Y., & Zhang, F. Cell Aug 28. pii: S0092-8674(13)01015-5 (2013-A);
DNA targeting specificity of RNA-guided Cas9 nucleases. Hsu, P., Scott, D., Weinstein, J., Ran, FA., Konermann, S., Agarwala, V., Li, Y., Fine, E., Wu, X., Shalem, O., Cradick, TJ., Marraffini, LA., Bao, G., & Zhang, F. Nat Biotechnol doi:10.1038/nbt.2647 (2013);DNA targeting specificity of RNA-guided Cas9 nucleases. Hsu, P., Scott, D., Weinstein, J., Ran, F.A., Konermann, S., Agarwala, V., Li, Y., Fine, E., Wu, X., Shalem, O., Cradick, T.J., Marraffini, L.A., Bao, G., & Zhang, F. Nat Biotechnol doi:10.1038/nbt.2647 (2013);
Genome engineering using the CRISPR-Cas9 system. Ran, FA., Hsu, PD., Wright, J., Agarwala, V., Scott, DA., Zhang, F. Nature Protocols Nov;8(11):2281-308 (2013-B);Genome engineering using the CRISPR-Cas9 system. Ran, F.A., Hsu, P.D., Wright, J., Agarwala, V., Scott, D.A., Zhang, F. Nature Protocols Nov;8(11):2281-308 (2013-B);
Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells. Shalem, O., Sanjana, NE., Hartenian, E., Shi, X., Scott, DA., Mikkelson, T., Heckl, D., Ebert, BL., Root, DE., Doench, JG., Zhang, F. Science Dec 12. (2013). [Электронная публикация, предшествующая печатной];Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells. Shalem, O., Sanjana, NE., Hartenian, E., Shi, X., Scott, DA., Mikkelson, T., Heckl, D., Ebert, BL., Root, DE., Doench, JG., Zhang, F. Science Dec 12. (2013). [Online publication ahead of print];
Crystal structure of cas9 in complex with guide RNA and target DNA. Nishimasu, H., Ran, FA., Hsu, PD., Konermann, S., Shehata, SI., Dohmae, N., Ishitani, R., Zhang, F., Nureki, O. Cell Feb 27, 156(5):935-49 (2014);Crystal structure of cas9 in complex with guide RNA and target DNA. Nishimasu, H., Ran, F.A., Hsu, P.D., Konermann, S., Shehata, S.I., Dohmae, N., Ishitani, R., Zhang, F., Nureki, O. Cell Feb 27, 156(5):935-49 (2014);
Genome-wide binding of the CRISPR endonuclease Cas9 in mammalian cells. Wu X., Scott DA., Kriz AJ., Chiu AC., Hsu PD., Dadon DB., Cheng AW., Trevino AE., Konermann S., Chen S., Jaenisch R., Zhang F., Sharp PA. Nat Biotechnol. Apr 20. doi: 10.1038/nbt.2889 (2014);Genome-wide binding of the CRISPR endonuclease Cas9 in mammalian cells. Wu X., Scott DA., Kriz AJ., Chiu AC., Hsu PD., Dadon DB., Cheng AW., Trevino AE., Konermann S., Chen S., Jaenisch R., Zhang F., Sharp PA. Nat Biotechnol. Apr 20. doi: 10.1038/nbt.2889 (2014);
CRISPR-Cas9 Knockin Mice for Genome Editing and Cancer Modeling. Platt RJ, Chen S, Zhou Y, Yim MJ, Swiech L, Kempton HR, Dahlman JE, Parnas O, Eisenhaure TM, Jovanovic M, Graham DB, Jhunjhunwala S, Heidenreich M, Xavier RJ, Langer R, Anderson DG, Hacohen N, Regev A, Feng G, Sharp PA, Zhang F. Cell 159(2): 440-455 DOI: 10.1016/j.cell.2014.09.014(2014);CRISPR-Cas9 Knockin Mice for Genome Editing and Cancer Modeling. Platt RJ, Chen S, Zhou Y, Yim MJ, Swiech L, Kempton HR, Dahlman JE, Parnas O, Eisenhaure TM, Jovanovic M, Graham DB, Jhunjhunwala S, Heidenreich M, Xavier RJ, Langer R, Anderson DG, Hacohen N, Regev A, Feng G, Sharp PA, Zhang F. Cell 159(2): 440-455 DOI: 10.1016/j.cell.2014.09.014(2014);
Development and Applications of CRISPR-Cas9 for Genome Engineering, Hsu PD, Lander ES, Zhang F., Cell. Jun 5;157(6):1262-78 (2014).Development and Applications of CRISPR-Cas9 for Genome Engineering, Hsu PD, Lander ES, Zhang F, Cell. Jun 5;157(6):1262-78 (2014).
Genetic screens in human cells using the CRISPR/Cas9 system, Wang T, Wei JJ, Sabatini DM, Lander ES., Science. January 3; 343(6166): 80-84. doi:10.1126/science.1246981 (2014);Genetic screens in human cells using the CRISPR/Cas9 system, Wang T, Wei JJ, Sabatini DM, Lander ES., Science. January 3; 343(6166): 80-84. doi:10.1126/science.1246981 (2014);
Rational design of highly active sgRNAs for CRISPR-Cas9-mediated gene inactivation, Doench JG, Hartenian E, Graham DB, Tothova Z, Hegde M, Smith I, Sullender M, Ebert BL, Xavier RJ, Root DE., (published online 3 September 2014) Nat Biotechnol. Dec;32(12):1262-7 (2014);Rational design of highly active sgRNAs for CRISPR-Cas9-mediated gene inactivation, Doench JG, Hartenian E, Graham DB, Tothova Z, Hegde M, Smith I, Sullender M, Ebert BL, Xavier RJ, Root DE., (published online 3 September 2014) Nat Biotechnol. Dec;32(12):1262-7 (2014);
In vivo interrogation of gene function in the mammalian brain using CRISPR-Cas9, Swiech L, Heidenreich M, Banerjee A, Habib N, Li Y, Trombetta J, Sur M, Zhang F., (published online 19 October 2014) Nat Biotechnol. Jan;33(1):102-6 (2015);In vivo interrogation of gene function in the mammalian brain using CRISPR-Cas9, Swiech L, Heidenreich M, Banerjee A, Habib N, Li Y, Trombetta J, Sur M, Zhang F., (published online 19 October 2014) Nat Biotechnol. Jan;33(1):102-6 (2015);
Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex, Konermann S, Brigham MD, Trevino AE, Joung J, Abudayyeh OO, Barcena C, Hsu PD, Habib N, Gootenberg JS, Nishimasu H, Nureki O, Zhang F., Nature. Jan 29;517(7536):583-8 (2015).Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex, Konermann S, Brigham MD, Trevino AE, Joung J, Abudayyeh OO, Barcena C, Hsu PD, Habib N, Gootenberg JS, Nishimasu H, Nureki O, Zhang F., Nature. Jan 29;517(7536):583-8 (2015).
A split-Cas9 architecture for inducible genome editing and transcription modulation, Zetsche B, Volz SE, Zhang F., (published online 02 February 2015) Nat Biotechnol. Feb;33(2):139-42 (2015);A split-Cas9 architecture for inducible genome editing and transcription modulation, Zetsche B, Volz SE, Zhang F., (published online 02 February 2015) Nat Biotechnol. Feb;33(2):139-42 (2015);
Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth and Metastasis, Chen S, Sanjana NE, Zheng K, Shalem O, Lee K, Shi X, Scott DA, Song J, Pan JQ, Weissleder R, Lee H, Zhang F, Sharp PA. Cell 160, 1246-1260, March 12, 2015 (multiplex screen in mouse), иGenome-wide CRISPR Screen in a Mouse Model of Tumor Growth and Metastasis, Chen S, Sanjana NE, Zheng K, Shalem O, Lee K, Shi X, Scott DA, Song J, Pan JQ, Weissleder R, Lee H, Zhang F, Sharp PA. Cell 160, 1246-1260, March 12, 2015 (multiplex screen in mouse), and
In vivo genome editing using Staphylococcus aureus Cas9, Ran FA, Cong L, Yan WX, Scott DA, Gootenberg JS, Kriz AJ, Zetsche B, Shalem O, Wu X, Makarova KS, Koonin EV, Sharp PA, Zhang F., (published online 01 April 2015), Nature. Apr 9;520(7546):186-91 (2015).In vivo genome editing using Staphylococcus aureus Cas9, Ran FA, Cong L, Yan WX, Scott DA, Gootenberg JS, Kriz AJ, Zetsche B, Shalem O, Wu X, Makarova KS, Koonin EV, Sharp PA, Zhang F., (published online 01 April 2015), Nature. Apr 9;520(7546):186-91 (2015).
Shalem et al., "High-throughput functional genomics using CRISPR-Cas9," Nature Reviews Genetics 16, 299-311 (May 2015).Shalem et al., “High-throughput functional genomics using CRISPR-Cas9,” Nature Reviews Genetics 16, 299-311 (May 2015).
Xu et al., "Sequence determinants of improved CRISPR sgRNA design," Genome Research 25, 1147-1157 (August 2015).Xu et al., “Sequence determinants of improved CRISPR sgRNA design,” Genome Research 25, 1147–1157 (August 2015).
Parnas et al., "A Genome-wide CRISPR Screen in Primary Immune Cells to Dissect Regulatory Networks," Cell 162, 675-686 (July 30, 2015).Parnas et al., "A Genome-wide CRISPR Screen in Primary Immune Cells to Dissect Regulatory Networks," Cell 162, 675-686 (July 30, 2015).
Ramanan et al., CRISPR/Cas9 cleavage of viral DNA efficiently suppresses hepatitis B virus," Scientific Reports 5:10833. doi: 10.1038/srep10833 (June 2, 2015)Ramanan et al., CRISPR/Cas9 cleavage of viral DNA efficiently suppresses hepatitis B virus," Scientific Reports 5:10833. doi: 10.1038/srep10833 (June 2, 2015)
Nishimasu et al., Crystal Structure of Staphylococcus aureus Cas9," Cell 162, 1113-1126 (Aug. 27, 2015)Nishimasu et al., Crystal Structure of Staphylococcus aureus Cas9," Cell 162, 1113-1126 (Aug. 27, 2015)
BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis, Canver et al., Nature 527(7577):192-7 (Nov. 12, 2015) doi: 10.1038/nature15521. Epub 2015 Sep 16.BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis, Canver et al., Nature 527(7577):192-7 (Nov. 12, 2015) doi: 10.1038/nature15521. Epub 2015 Sep 16.
Cpf1 Is a Single RNA-Guided Endonuclease of a Class 2 CRISPR-Cas System, Zetsche et al., Cell 163, 759-71 (Sep 25, 2015).Cpf1 Is a Single RNA-Guided Endonuclease of a Class 2 CRISPR-Cas System, Zetsche et al., Cell 163, 759-71 (Sep 25, 2015).
Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems, Shmakov et al., Molecular Cell, 60(3), 385-397 doi: 10.1016/j.molcel.2015.10.008 Epub October 22, 2015.Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems, Shmakov et al., Molecular Cell, 60(3), 385-397 doi: 10.1016/j.molcel.2015.10.008 Epub October 22, 2015.
Rationally engineered Cas9 nucleases with improved specificity, Slaymaker et al., Science 2016 Jan 1 351(6268): 84-88 doi: 10.1126/science.aad5227. Электронная публикация 1 декабря 2015 г. [Электронная публикация, предшествующая печатной],Rationally engineered Cas9 nucleases with improved specificity, Slaymaker et al., Science 2016 Jan 1 351(6268): 84–88 doi: 10.1126/science.aad5227. Online publication 1 December 2015. [Online publication precedes print publication],
каждая из которых включена в данный документ посредством ссылки, может быть рассмотрена при практическом осуществлении настоящего изобретения и описана вкратце ниже.each of which is incorporated herein by reference, may be considered in the practice of the present invention and is described briefly below.
Cong et al. сконструировали системы CRISPR-Cas II типа на основе как Cas9 Streptococcus thermophilus, так и Cas9 Streptococcus pyogenes для применения в эукариотических клетках и продемонстрировали, что нуклеазы Cas9 могут управляться короткими РНК с индукцией точного расщепления ДНК в клетках человека и мыши. Их исследование дополнительно показало, что Cas9, превращенный в фермент, вносящий однонитевой разрыв, можно применять для облегчения репарации с участием гомологичной рекомбинации в эукариотических клетках с минимальной мутагенной активностью. Кроме того, их исследование продемонстрировало, что в одном массиве CRISPR могут быть закодированы несколько направляющих последовательностей для обеспечения одновременного редактирования в нескольких сайтах эндогенных локусов генома в геноме млекопитающих, что демонстрирует легкую программируемость и широкое применение технологии нуклеаз, направляемых РНК. Эта возможность применения РНК для программирования специфичного к последовательности расщепления ДНК в клетках определила новый класс инструментов для конструирования генома. Данные исследования дополнительно показали, что другие локусы CRISPR, вероятно, можно пересадить в клетки млекопитающих, и они могут также опосредовать расщепление генома млекопитающих. Важно отметить, что можно предусмотреть дополнительное улучшение некоторых аспектов системы CRISPR-Cas для повышения ее эффективности и универсальности.Cong et al. constructed type II CRISPR-Cas systems based on both Streptococcus thermophilus Cas9 and Streptococcus pyogenes Cas9 for use in eukaryotic cells and demonstrated that Cas9 nucleases can be guided by short RNAs to induce precise DNA cleavage in human and mouse cells. Their study further demonstrated that Cas9 engineered into a single-strand break-inducing enzyme can be used to facilitate homologous recombination repair in eukaryotic cells with minimal mutagenic activity. Furthermore, their study demonstrated that multiple guide sequences can be encoded in a single CRISPR array to enable simultaneous editing at multiple sites of endogenous genomic loci in the mammalian genome, demonstrating the facile programmability and broad applicability of RNA-guided nuclease technology. This ability to use RNA to program sequence-specific DNA cleavage in cells has defined a new class of genome engineering tools. These studies further demonstrate that other CRISPR loci are likely to be transplanted into mammalian cells and may also mediate mammalian genome cleavage. Importantly, further improvements to certain aspects of the CRISPR-Cas system are possible to enhance its efficiency and versatility.
Jiang et al. применяли эндонуклеазу Cas9, ассоциированную с короткими палиндромными повторами, регулярно расположенными группами (CRISPR), образующую комплекс с двойными РНК для введения точных мутаций в геномы Streptococcus pneumoniae и Escherichia coli. Подход опирался на расщеплении в целевом сайте генома под управлением системы двойная РНК:Cas9 для уничтожения немутированных клеток и устранял необходимость в селектируемых маркерах или системах негативного отбора. В исследовании сообщалось о перепрограммировании специфичности системы двойная РНК:Cas9 путем изменения последовательности короткой РНК CRISPR (crRNA) для внесения одно- или многонуклеотидных изменений, выполняемых с помощью матриц редактирования. Исследование показало, что одновременное использование двух crRNA обеспечивало мультиплексный мутагенез. Кроме того, когда подход применяли в сочетании с рекомбинационной инженерией, у S. рneumoniа практически 100% клеток, извлеченных с помощью описанного подхода, содержали желаемую мутацию, а у E. сoli 65% извлеченных клеток содержали мутацию.Jiang et al. used the clustered regularly interspaced short palindromic repeats (CRISPR)-associated endonuclease Cas9 complexed with dual RNAs to introduce precise mutations into the genomes of Streptococcus pneumoniae and Escherichia coli. The approach relied on cleavage at the target site of the genome, guided by the dual RNA:Cas9 system, to kill unmutated cells and eliminated the need for selectable markers or negative selection systems. The study reported reprogramming the specificity of the dual RNA:Cas9 system by altering the CRISPR short RNA (crRNA) sequence to introduce single- or multi-nucleotide changes, driven by editing templates. The study showed that the simultaneous use of two crRNAs enabled multiplexed mutagenesis. Furthermore, when the approach was used in combination with recombinational engineering, in S. pneumoniae, nearly 100% of the cells recovered using the described approach contained the desired mutation, and in E. coli, 65% of the recovered cells contained the mutation.
Wang et al. (2013) использовали систему CRISPR/Cas для одностадийного получения мышей, несущих мутации в нескольких генах, которых традиционно получали в несколько стадий, с помощью последовательной рекомбинации в эмбриональных стволовых клетках и/или продолжительного интеркроссинга мышей с одной мутацией. Система CRISPR/Cas будет значительно ускорять исследование функционально избыточных генов и эпистатических генных взаимодействий in vivo.Wang et al. (2013) used the CRISPR/Cas system to generate mice carrying mutations in multiple genes in a single step, which were traditionally generated in several steps, using serial recombination in embryonic stem cells and/or continuous intercrossing of mice with a single mutation. The CRISPR/Cas system will greatly accelerate the study of functionally redundant genes and epistatic gene interactions in vivo.
Konermann et al. (2013) изучали существующую в данной области необходимость в гибких и надежных технологиях, позволяющих осуществлять оптическое и химическое модулирование фермента Cas9 CRISPR на основе ДНК-связывающих доменов, а также эффекторов, подобных активаторам транскрипции.Konermann et al. (2013) explored the need in the field for flexible and robust technologies to enable optical and chemical modulation of the Cas9 CRISPR enzyme based on DNA-binding domains and transcription activator-like effectors.
Ran et al. (2013-А) описали подход, в котором мутантную никазу Cas9 применяли в сочетании с парными направляющими РНК для внесения целевых двухнитевых разрывов. Это относится к вопросу о том, что нуклеаза Cas9 из микробной системы CRISPR-Cas направляется на конкретные локусы генома направляющей последовательностью, которая может допускать некоторые несовпадения с ДНК-мишенью и, таким образом, способствует нежелательному нецелевому мутагенезу. Поскольку отдельные однонитевые разрывы в геноме подвергаются высокоточной репарации, одновременное внесение однонитевых разрывов с помощью соответствующим образом смещенных друг относительно друга направляющих РНК является необходимым для образования двухнитевых разрывов и увеличивает количество специфически распознаваемых оснований для расщепления мишени. Авторы продемонстрировали, что применение парного внесения однонитевых разрывов может снижать нецелевую активность в линиях клеток в 50-1500 раз и облегчать нокаут генов в зиготах мышей без уменьшения эффективности целевого расщепления. Данная гибкая стратегия обеспечивает большое разнообразие применений редактирования генома, требующих высокой специфичности.Ran et al. (2013-A) described an approach in which a mutant Cas9 nickase was used in combination with paired guide RNAs to introduce targeted double-strand breaks. This addresses the issue that the Cas9 nuclease from the microbial CRISPR-Cas system is targeted to specific genomic loci by a guide sequence that may tolerate some mismatches with the target DNA and thus promote unwanted off-target mutagenesis. Since individual single-strand breaks in the genome are subject to high-fidelity repair, simultaneous introduction of single-strand breaks by appropriately offset guide RNAs is necessary for double-strand break formation and increases the number of specifically recognized bases for target cleavage. The authors demonstrated that the use of pairwise introduction of single-strand breaks can reduce off-target activity in cell lines by 50- to 1500-fold and facilitate gene knockout in mouse zygotes without reducing the efficiency of on-target cleavage. This flexible strategy enables a wide variety of genome editing applications requiring high specificity.
Hsu et al. (2013) охарактеризовали специфичность целенаправленного воздействия SpCas9 в клетках человека, чтобы предоставить информацию для выбора целевых сайтов и избежать нецелевых эффектов. В исследовании оценивали > 700 вариантов направляющей РНК и уровней мутаций по типу вставок/делеций, индуцированных SpCas9, в >100 прогнозируемых нецелевых локусах генома в клетках 293T и 293FT. Авторы показали, что SpCas9 допускает несовпадения между направляющей РНК и целевой ДНК в различных положениях в зависимости от последовательности с чувствительностью к количеству, положению и распределению несовпадений. Авторы дополнительно показали, что на опосредованное SpCas9 расщепление не влияет метилирование ДНК и что для сведения к минимуму нецелевых модификаций можно подобрать дозу SpCas9 и sgRNA. Кроме того, для облегчения применений в геномной инженерии млекопитающих авторы сообщили о получении инструментального программного обеспечения на веб-основе для управления выбором и подтверждением целевых последовательностей, а также анализов нецелевых явлений.Hsu et al. (2013) characterized the targeting specificity of SpCas9 in human cells to inform target site selection and avoid off-target effects. The study assessed >700 guide RNA variants and SpCas9-induced insertion/deletion mutation rates at >100 predicted off-target loci across the genome in 293T and 293FT cells. The authors showed that SpCas9 tolerates mismatches between guide RNA and target DNA at different positions in a sequence-dependent manner with sensitivity to the number, position, and distribution of mismatches. The authors further showed that SpCas9-mediated cleavage is not affected by DNA methylation and that the dosage of SpCas9 and sgRNA can be tailored to minimize off-target modifications. Furthermore, to facilitate applications in mammalian genome engineering, the authors reported the development of a web-based software tool to manage target sequence selection and confirmation, as well as off-target event analyses.
Ran et al. (2013-B) описали набор инструментов для опосредованного Cas9 редактирования генома посредством негомологичного соединения концов (NHEJ) или репарации с участием гомологичной рекомбинации (HDR) в клетках млекопитающих, а также создания модифицированных линий клеток для последующих функциональных исследований. Для сведения к минимуму нецелевого расщепления авторы дополнительно описали стратегию внесения двойных однонитевых разрывов с помощью мутантной никазы Cas9 с парными направляющими РНК. Протокол, представленный авторами, является полученным экспериментальным путем руководством по выбору целевых сайтов, оценке эффективности расщепления и анализу нецелевой активности. Исследования показали, что начиная с конструирования мишени, модификации генов можно достигнуть в течение всего лишь 1-2 недель, и модифицированные клональные линии клеток можно получить в течение 2-3 недель.Ran et al. (2013-B) described a toolkit for Cas9-mediated genome editing via non-homologous end joining (NHEJ) or homologous recombination repair (HDR) in mammalian cells, and generation of modified cell lines for downstream functional studies. To minimize off-target cleavage, the authors additionally described a strategy for introducing double-strand breaks using a mutant Cas9 nickase with paired guide RNAs. The protocol presented by the authors provides an experimentally derived guide to selecting target sites, assessing cleavage efficiency, and analyzing off-target activity. Studies have shown that from target engineering, gene modifications can be achieved in as little as 1-2 weeks, and modified clonal cell lines can be generated within 2-3 weeks.
Shalem et al. описали новый способ исследования функций генов в полногеномном масштабе. Их исследования показали, что доставка библиотеки CRISPR-Cas9 для нокаута в масштабе генома (GeCKO), целенаправленно воздействующей на 18080 генов, с 64751 уникальной направляющей последовательностью обеспечивала скрининг путем как положительного, так и отрицательного отбора в клетках человека. Во-первых, авторы показали применение библиотеки GeCKO для идентификации генов, существенных для жизнеспособности клеток у раковых и плюрипотентных стволовых клеток. Далее, в модели меланомы, авторы провели скрининг генов, утрата функций которых вовлечена в устойчивость к вемурафенибу, терапевтическому средству, ингибирующему мутантную протеинкиназу BRAF. Их исследования показали, что кандидаты высшего ранга включали ранее подтвержденные гены NF1 и MED12, а также новые хиты NF2, CUL3, TADA2B и TADA1. Авторы наблюдали высокий уровень согласованности между независимыми направляющими РНК, осуществляющими нацеливание на один и тот же ген, и высоким показателем подтверждения хитов и, таким образом, продемонстрировали перспективность скрининга с помощью Cas9 в масштабе генома.Shalem et al. describe a new way to probe gene function at a genome-wide scale. Their studies showed that delivery of a genome-wide CRISPR-Cas9 knockout (GeCKO) library targeting 18,080 genes with 64,751 unique targeting sequences enabled screening by both positive and negative selection in human cells. First, the authors demonstrated the use of the GeCKO library to identify genes essential for cell survival in cancer and pluripotent stem cells. Next, in a melanoma model, the authors screened for genes whose loss of function is involved in resistance to vemurafenib, a therapeutic that inhibits mutant protein kinase BRAF. Their studies showed that the top-ranking candidates included previously validated genes NF1 and MED12, as well as novel hits NF2, CUL3, TADA2B, and TADA1. The authors observed a high level of concordance between independent guide RNAs targeting the same gene and a high hit confirmation rate, thus demonstrating the promise of Cas9-based genome-scale screening.
Nishimasu et al. сообщали о кристаллической структуре Cas9 Streptococcus pyogenes в комплексе с sgRNA и ее целевой ДНК при разрешающей способности в 2,5 A°. В структуре была выявлена двудольная архитектура, образованная долей распознавания мишени и нуклеазной долей, обеспечивающих размещение гетеродуплекса sgRNA:ДНК в положительно заряженной бороздке на поверхности их соприкосновения. При том, что лопасть распознавания является существенной для связывания sgRNA и ДНК, нуклеазная доля содержит нуклеазные домены HNH и RuvC, расположенные надлежащим образом для расщепления комплементарной и некомплементарной нитей целевой ДНК соответственно. Нуклеазная доля также содержит карбоксиконцевой домен, отвечающий за взаимодействие с мотивом, смежным с протоспейсером (PAM). Эти структурные анализы с высокой разрешающей способностью и сопутствующие функциональные анализы выявили молекулярный механизм целенаправленного воздействия Cas9, направляемых РНК, на ДНК, с созданием таким образом предпосылок для рационального конструирования новых универсальных технологий редактирования генома.Nishimasu et al. reported the crystal structure of Streptococcus pyogenes Cas9 in complex with sgRNA and its target DNA at a resolution of 2.5 Å. The structure revealed a bilobed architecture formed by the target recognition lobe and the nuclease lobe, which mediate the placement of the sgRNA:DNA heteroduplex in the positively charged groove at their interface. While the recognition lobe is essential for sgRNA and DNA binding, the nuclease lobe contains the HNH and RuvC nuclease domains, which are positioned appropriately to cleave the complementary and non-complementary strands of the target DNA, respectively. The nuclease lobe also contains a carboxy-terminal domain responsible for interaction with the protospacer adjacent motif (PAM). These high-resolution structural analyses and accompanying functional analyses have revealed the molecular mechanism of RNA-guided Cas9 targeting of DNA, thus paving the way for the rational design of new general-purpose genome editing technologies.
Wu et al. производили полногеномное картирование сайтов связывания для каталитически неактивного Cas9 (dCas9) из Streptococcus pyogenes, который вводили с одиночными направляющими РНК (sgRNA) в эмбриональные стволовые клетки мыши (mESC). Авторы показали, что каждая из четырех тестируемых sgRNA осуществляет нацеливание dCas9 на сайты генома в количестве от нескольких десятков до нескольких тысяч, что часто характеризуется наличием 5-нуклеотидного затравочного участка в sgRNA и мотива NGG, смежного с протоспейсером (PAM). Недоступность хроматина снижает связывание dCas9 с другими сайтами с последовательностями, комплементарными затравочной; таким образом, 70% нецелевых сайтов ассоциированы с генами. Авторы показали, что целенаправленное секвенирование 295 сайтов связывания для dCas9 в mESC, трансфицированных каталитически активным Cas9, выявило мутацию, превышающую фоновые уровни, только в одном сайте. Авторы предложили модель связывания с Cas9 и опосредованного им расщепления с двумя состояниями, в которой последовательность, комплементарная затравочной, запускает связывание, но для расщепления необходимо образование многочисленных пар с целевой ДНК.Wu et al. performed genome-wide binding site mapping for catalytically inactive Cas9 (dCas9) from Streptococcus pyogenes delivered with single guide RNAs (sgRNAs) into mouse embryonic stem cells (mESCs). The authors showed that each of the four sgRNAs tested targets dCas9 to tens to thousands of sites in the genome, often characterized by the presence of a 5-nucleotide seed region in the sgRNA and a protospacer adjacent motif (PAM) NGG. Chromatin inaccessibility reduces dCas9 binding to other sites with sequences complementary to the seed; thus, 70% of off-target sites are associated with genes. The authors showed that targeted sequencing of 295 dCas9 binding sites in mESCs transfected with catalytically active Cas9 revealed a mutation above background levels at only one site. The authors proposed a two-state model of Cas9 binding and cleavage in which a sequence complementary to a seed triggers binding, but cleavage requires multiple pairing with the target DNA.
Platt et al. получили Cre-зависимую мышь с нокином Cas9. Авторы показали редактирование генома in vivo, а также ex vivo с помощью доставки направляющей РНК на основе аденоассоциированного вируса (AAV), лентивируса или частиц в нейроны, иммунные клетки и эндотелиальные клетки.Platt et al. generated a Cre-dependent Cas9 knockin mouse and demonstrated genome editing in vivo as well as ex vivo by delivering adeno-associated virus (AAV), lentivirus, or particle-based guide RNA to neurons, immune cells, and endothelial cells.
Публикация Hsu et al. (2014) представляет собой обзорную статью, в которой описывается в целом история CRISPR-Cas9 от йогурта до редактирования генома, в том числе генетического скрининга клеток.The publication by Hsu et al. (2014) is a review article that describes the overall history of CRISPR-Cas9 from yogurt to genome editing, including genetic screening of cells.
Публикация Wang et al. (2014) связана с подходом на основе объединенного генетического скрининга с изучением потери функции, применимого как для положительного, так и отрицательного отбора, в котором используется библиотека полногеномных лентивирусных одиночных направляющих РНК (sgRNA).The publication by Wang et al. (2014) reported a pooled loss-of-function genetic screening approach applicable to both positive and negative selection using a whole-genome lentiviral single guide RNA (sgRNA) library.
Doench et al. создали пул sgRNA, покрывающих все возможные целевые сайты панели из шести эндогенных мышиных и трех эндогенных человеческих генов и количественно оценили их способность образовывать нуль-аллели своего целевого гена с помощью окрашивания антител и проточной цитометрии. Авторы показали, что оптимизация PAM повышала активность и также обеспечивала онлайн-средство для конструирования sgRNA.Doench et al. generated a pool of sgRNAs covering all possible target sites of a panel of six endogenous mouse and three endogenous human genes and quantified their ability to form null alleles of their target gene using antibody staining and flow cytometry. The authors showed that PAM optimization increased activity and also provided an online tool for sgRNA design.
Swiech et al. показывают, что AAV-опосредованное редактирование генома SpCas9 может обеспечивать обратные генетические исследования функции гена в головном мозге.Swiech et al. show that AAV-mediated SpCas9 genome editing can enable reverse genetic studies of gene function in the brain.
Konermann et al. (2015) описывают способность присоединять множественные эффекторные домены, например, активатор транскрипции, функциональные и эпигеномные регуляторы в определенных положениях на ведущей последовательности, например, стволе или тетра-петле с линкерами и без них.Konermann et al. (2015) describe the ability to attach multiple effector domains, such as transcriptional activator, functional and epigenomic regulators, at specific positions on the leader sequence, such as the stem or tetra-loop, with and without linkers.
Zetsche et al. показывают, что фермент Cas9 может быть расщеплен на два и, таким образом, сборка Cas9 для активации может быть контролируемой.Zetsche et al. show that the Cas9 enzyme can be cleaved into two and thus the assembly of Cas9 for activation can be controlled.
Публикация Chen et al. связана с множественным скринингом посредством демонстрации того, что в результате полногеномного скрининга CRISPR-Cas9 in vivo у мышей обнаружены гены, регулирующие метастазирование в легких.The publication by Chen et al. advances the multiplex screen by demonstrating that a genome-wide in vivo CRISPR-Cas9 screen in mice identified genes that regulate lung metastasis.
Публикация Ran et al. (2015) относится к SaCas9 и его способности редактировать геномы и демонстрирует невозможность экстраполяции исходя из биохимических анализов. Публикация Shalem et al. (2015) описывает пути, в которых слияния каталитически неактивного Cas9 (dCas9) используют для синтетической репрессии (CRISPRi) или активации (CRISPRa) экспрессии, показывая успехи применения Cas9 для полногеномного скрининга, в том числе упорядоченных и объединенных скринингов, подходов к нокауту, которые инактивируют геномные локусы, и стратегий, с помощью которых модулируют транскрипционную активность.The paper by Ran et al. (2015) addresses SaCas9 and its ability to edit genomes, demonstrating the impossibility of extrapolating from biochemical assays. The paper by Shalem et al. (2015) describes ways in which catalytically inactive Cas9 (dCas9) fusions are used to synthetically repress (CRISPRi) or activate (CRISPRa) expression, showing advances in the use of Cas9 for genome-wide screening, including ordered and pooled screens, knockout approaches that inactivate genomic loci, and strategies that modulate transcriptional activity.
Публикация Shalem et al. (2015) описывает пути, в которых слияния каталитически неактивного Cas9 (dCas9) используют для синтетической репрессии (CRISPRi) или активации (CRISPRa) экспрессии, показывая успехи применения Cas9 для полногеномного скрининга, в том числе упорядоченных и объединенных скринингов, подходов к нокауту, которые инактивируют геномные локусы, и стратегий, с помощью которых модулируют транскрипционную активность.The publication by Shalem et al. (2015) describes ways in which catalytically inactive Cas9 (dCas9) fusions are used to synthetically repress (CRISPRi) or activate (CRISPRa) expression, showing advances in the use of Cas9 for genome-wide screens, including ordered and pooled screens, knockout approaches that inactivate genomic loci, and strategies that modulate transcriptional activity.
Xu et al. (2015) оценивали характеристики ДНК-последовательности, которые способствуют эффективности одиночной направляющей РНК (sgRNA) при скрининге на основе CRISPR. Авторы исследовали эффективность нокаута с помощью CRISPR/Cas9 и нуклеотидного предпочтения в сайте расщепления. Авторы также обнаружили, что предпочтение последовательности для CRISPRi/a значительно отличается от таковой для нокаута с помощью CRISPR/Cas9.Xu et al. (2015) evaluated DNA sequence characteristics that contribute to the efficiency of single guide RNA (sgRNA) in CRISPR-based screening. The authors examined the efficiency of CRISPR/Cas9 knockout and the nucleotide preference at the cleavage site. The authors also found that the sequence preference for CRISPRi/a was significantly different from that for CRISPR/Cas9 knockout.
Parnas et al. (2015) ввели полногеномные объединенные библиотеки CRISPR-Cas9 в дендритные клетки (DC) с целью выявления генов, которые контролируют индукцию фактора некроза опухоли (Tnf) с помощью бактериального липополисахарида (LPS). Известные регуляторы передачи сигналов с участием Tlr4 и ранее неизвестные кандидаты были идентифицированы и классифицированы на три функциональных модуля с различными эффектами по отношению к классическим ответам на LPS.Parnas et al. (2015) introduced whole-genome CRISPR-Cas9 pooled libraries into dendritic cells (DCs) to identify genes that control tumor necrosis factor (Tnf) induction by bacterial lipopolysaccharide (LPS). Known regulators of Tlr4 signaling and previously unknown candidates were identified and classified into three functional modules with distinct effects on classical LPS responses.
Ramanan et al (2015) показали расщепление вирусной эписомальной ДНК (cccDNA) в инфицированных клетках. Геном HBV существует в ядрах инфицированных гепатоцитов в виде двухнитевых эписомальных молекул ДНК с размером 3,2 т.о., называемых ковалентно связанной кольцевой ДНК (cccDNA), которая является основным компонентов в жизненном цикле HBV, репликация которого не ингибируется при применении существующих видов терапии. Авторы показали, что sgRNA, специфично нацеливающася на высококонсервативные области HBV, устойчиво подавляет вирусную репликацию и расщепляет cccDNA.Ramanan et al (2015) demonstrated cleavage of viral episomal DNA (cccDNA) in infected cells. The HBV genome exists in the nuclei of infected hepatocytes as 3.2-kb double-stranded episomal DNA molecules called covalently linked circular DNA (cccDNA), which is a major component in the HBV life cycle and whose replication is not inhibited by existing therapies. The authors showed that sgRNA specifically targeting highly conserved regions of HBV consistently suppressed viral replication and cleaved cccDNA.
Nishimasu et al. (2015) описали кристаллические структуры SaCas9 в комплексе с одиночной РНК (sgRNA) и ее двухнитевыми ДНК-мишенями, содержащими 5'-TTGAAT-3' PAM и 5'-TTGGGT-3' PAM. Структурное сравнение SaCas9 с SpCas9 указало как на структурную консервативность, так и на изменчивость, объясняя их различные специфичности PAM и ортологическое распознавание sgRNA.Nishimasu et al. (2015) reported crystal structures of SaCas9 in complex with single RNA (sgRNA) and its double-stranded DNA targets containing 5′-TTGAAT-3′ PAM and 5′-TTGGGT-3′ PAM. Structural comparison of SaCas9 with SpCas9 indicated both structural conservation and variability, explaining their different PAM specificities and orthologous sgRNA recognition.
Canver et al. (2015) продемонстрировали функциональное исследование на основе CRISPR-Cas9 некодирующих геномных элементов. Авторы разработали объединенные библиотеки направляющей РНК CRISPR-Cas9 для выполнения in situ насыщающего мутагенеза человеческих и мышиных энхансеров BCL11A, которые обнаружили критические характеристики энхансеров.Canver et al. (2015) demonstrated a CRISPR-Cas9-based functional study of non-coding genomic elements. The authors designed pooled CRISPR-Cas9 guide RNA libraries to perform in situ saturation mutagenesis of human and mouse BCL11A enhancers, revealing critical features of the enhancers.
Zetsche et al. (2015) описали характеристику Cpf1, нуклеазы CRISPR класса 2 из Francisella novicida U112, с признаками, отличными от Cas9. Cpf1 представляет собой одиночную направляемую РНК эндонуклеазу, у которой отсутствует tracrRNA, которая использует мотив, смежный с протоспейсером, с высоким содержанием T и расщепляет ДНК посредством ступенчатого разрыва двухнитевой ДНК.Zetsche et al. (2015) described the characterization of Cpf1, a class 2 CRISPR nuclease from Francisella novicida U112, with features distinct from Cas9. Cpf1 is a single RNA-guided endonuclease that lacks tracrRNA, utilizes a protospacer-adjacent motif with high T content, and cleaves DNA via a staggered double-strand DNA break.
Shmakov et al. (2015) описали три различных системы CRISPR-Cas класса 2. Ферменты двух систем CRISPR (C2c1 и C2c3) содержат RuvC-подобные эндонуклеазные домены, отличные от Cpf1. В отличие от Cpf1, C2c1 зависит как от crRNA, так и от tracrRNA, для расщепления ДНК. Третий фермент (C2c2) содержит два предполагаемых домена с HEPN РНКазой и является tracrRNA-независимым.Shmakov et al. (2015) described three different class 2 CRISPR-Cas systems. The enzymes of two CRISPR systems (C2c1 and C2c3) contain RuvC-like endonuclease domains distinct from Cpf1. Unlike Cpf1, C2c1 depends on both crRNA and tracrRNA to cleave DNA. The third enzyme (C2c2) contains two putative HEPN RNase domains and is tracrRNA-independent.
Slaymaker et al. (2016) описали применение направляемого структурой конструирования белков для улучшения специфичности Cas9 (SpCas9) Streptococcus pyogenes. Авторы разработали "повышенную специфичность" вариантов SpCas9 (eSpCas9), которые сохраняли устойчивое целевое расщепление при сниженных нецелевых эффектах.Slaymaker et al. (2016) described the use of structure-guided protein engineering to improve the specificity of Streptococcus pyogenes Cas9 (SpCas9). The authors developed "enhanced specificity" SpCas9 (eSpCas9) variants that retained robust on-target cleavage with reduced off-target effects.
Также публикация "Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing", Shengdar Q. Tsai, Nicolas Wyvekens, Cyd Khayter, Jennifer A. Foden, Vishal Thapar, Deepak Reyon, Mathew J. Goodwin, Martin J. Aryee, J. Keith Joung Nature Biotechnology 32(6): 569-77 (2014) относится к направляемым димерной РНК нуклеазам FokI, которые распознают продленные последовательности и могут редактировать эндогенные гены с высокой эффективностью в человеческих клетках.Also, the publication "Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing", Shengdar Q. Tsai, Nicolas Wyvekens, Cyd Khayter, Jennifer A. Foden, Vishal Thapar, Deepak Reyon, Mathew J. Goodwin, Martin J. Aryee, J. Keith Joung Nature Biotechnology 32(6): 569–77 (2014) refers to dimeric RNA-guided FokI nucleases that recognize extended sequences and can edit endogenous genes with high efficiency in human cells.
По отношению к общей информации о системах CRISPR-Cas, все их компоненты и способы доставки таких компонентов, включая способы, материалы, средства доставки, векторы, частицы, AAV и их получение и применение с учетом количеств и составов являются применимыми в практическом осуществлении настоящего изобретения, ссылаясь настоящим на: патенты США №№ 8697359, 8771945, 8795965, 8865406, 8871445, 8889356, 8889418, 8895308, 8906616, 8932814, 8945839, 8993233 и 8999641; публикации заявки на патент США US 2014-0310830 (заявка на патент США с регистрационным номером 14/105031), US 2014-0287938 A1 (заявка на патент США с регистрационным номером 14/213991), US 2014-0273234 A1 (заявка на патент США с регистрационным номером 14/293,674), US2014-0273232 A1 (заявка на патент США с регистрационным номером 14/290575), US 2014-0273231 (заявка на патент США с регистрационным номером 14/259420), US 2014-0256046 A1 (заявка на патент США с регистрационным номером 14/226274), US 2014-0248702 A1 (заявка на патент США с регистрационным номером 14/258458), US 2014-0242700 A1 (заявка на патент США с регистрационным номером 14/222930), US 2014-0242699 A1 (заявка на патент США с регистрационным номером 14/183512), US 2014-0242664 A1 (заявка на патент США с регистрационным номером 14/104990), US 2014-0234972 A1 (заявка на патент США с регистрационным номером 14/183471), US 2014-0227787 A1 (заявка на патент США с регистрационным номером 14/256912), US 2014-0189896 A1 (заявка на патент США с регистрационным номером 14/105035), US 2014-0186958 (заявка на патент США с регистрационным номером 14/105017), US 2014-0186919 A1 (заявка на патент США с регистрационным номером 14/104977), US 2014-0186843 A1 (заявка на патент США с регистрационным номером 14/104900), US 2014-0179770 A1 (заявка на патент США с регистрационным номером 14/104837) и US 2014-0179006 A1 (заявка на патент США с регистрационным номером 14/183486), US 2014-0170753 (заявка на патент США с регистрационным номером 14/183429); US 2015-0184139 (заявка на патент США с регистрационным номером 14/324,960); 14/054414 заявки на европейские патенты EP 2 771 468 (EP13818570.7), EP 2 764 103 (EP13824232.6) и EP 2 784 162 (EP14170383.5); и публикации заявки на патенты согласно PCT WO 2014/093661 (PCT/US2013/074743), WO 2014/093694 (PCT/US2013/074790), WO 2014/093595 (PCT/US2013/074611), WO 2014/093718 (PCT/US2013/074825), WO 2014/093709 (PCT/US2013/074812), WO 2014/093622 (PCT/US2013/074667), WO 2014/093635 (PCT/US2013/074691), WO 2014/093655 (PCT/US2013/074736), WO 2014/093712 (PCT/US2013/074819), WO 2014/093701 (PCT/US2013/074800), WO 2014/018423 (PCT/US2013/051418), WO 2014/204723 (PCT/US2014/041790), WO 2014/204724 (PCT/US2014/041800), WO 2014/204725 (PCT/US2014/041803), WO 2014/204726 (PCT/US2014/041804), WO 2014/204727 (PCT/US2014/041806), WO 2014/204728 (PCT/US2014/041808), WO 2014/204729 (PCT/US2014/041809), WO 2015/089351 (PCT/US2014/069897), WO 2015/089354 (PCT/US2014/069902), WO 2015/089364 (PCT/US2014/069925), WO 2015/089427 (PCT/US2014/070068), WO 2015/089462 (PCT/US2014/070127), WO 2015/089419 (PCT/US2014/070057), WO 2015/089465 (PCT/US2014/070135), WO 2015/089486 (PCT/US2014/070175), PCT/US2015/051691, PCT/US2015/051830. Ссылка также делается на предварительные заявки на патенты США 61/758468; 61/802174; 61/806375; 61/814263; 61/819803 и 61/828130, поданные 30 января 2013 г.; 15 марта 2013 г.; 28 марта 2013 г.; 20 апреля 2013 г.; 6 мая 2013 г. и 28 мая 2013 г. соответственно. Ссылка также делается на предварительную заявку на патент США 61/836123, поданную 17 июня 2013 г. Ссылка дополнительно делается на предварительные заявки на патенты США 61/835931, 61/835936, 61/835973, 61/836080, 61/836101 и 61/836127, каждая из которых подана 17 июня 2013 г. Дополнительно ссылаются на предварительные заявки на патенты США 61/862468 и 61/862355, поданные 5 августа 2013 г.; 61/871301, поданную 28 августа 2013 г.; 61/960777, поданную 25 сентября 2013 г., и 61/961980, поданную 28 октября 2013 г. Ссылка еще дополнительно делается на: PCT/US2014/62558, поданный 28 октября 2014 г., и предварительные заявки на патенты США с серийными номерами 61/915148, 61/915150, 61/915153, 61/915203, 61/915251, 61/915301, 61/915267, 61/915260 и 61/915397, каждая из которых подана 12 декабря 2013 г.; 61/757972 и 61/768959, поданные 29 января 2013 г. и 25 февраля 2013 г.; 62/010888 и 62/010879, каждая из которых подана 11 июня 2014 г.; 62/010329, 62/010439 и 62/010441, каждая из которых подана 10 июня 2014 г.; 61/939228 и 61/939242, каждая из которых подана 12 февраля 2014 г.; 61/980012, поданная 15 апреля 2014 г.; 62/038358, поданная 17 августа 2014 г.; 62/055484, 62/055460 и 62/055487, каждая из которых подана 25 сентября 2014 г.; и 62/069243, поданная 27 октября 2014 г. Ссылаются на заявку согласно PCT, в которой, помимо прочих, указаны Соединенные Штаты Америки, заявку под № PCT/US14/41806, поданную 10 июня 2014 г. Ссылаются на предварительную заявку на патент США 61/930214, поданную 22 января 2014 г. Ссылаются на заявку согласно PCT, в которой, помимо прочих, указаны Соединенные Штаты Америки, заявку под № PCT/US14/41806, поданную 10 июня 2014 г.With respect to the general information on CRISPR-Cas systems, all components thereof and methods of delivering such components, including methods, materials, delivery vehicles, vectors, particles, AAVs and their production and use taking into account the amounts and compositions are applicable in the practice of the present invention, reference is hereby made to: U.S. Patent Nos. 8,697,359, 8,771,945, 8,795,965, 8,865,406, 8,871,445, 8,889,356, 8,889,418, 8,895,308, 8,906,616, 8,932,814, 8,945,839, 8,993,233 and 8,999,641; US Patent Application Publications US 2014-0310830 (US Patent Application Serial Number 14/105,031), US 2014-0287938 A1 (US Patent Application Serial Number 14/213,991), US 2014-0273234 A1 (US Patent Application Serial Number 14/293,674), US2014-0273232 A1 (US Patent Application Serial Number 14/290,575), US 2014-0273231 (US Patent Application Serial Number 14/259,420), US 2014-0256046 A1 (US Patent Application Serial Number 14/226274), US 2014-0248702 A1 (US Patent Application Serial Number 14/258458), US 2014-0242700 A1 (US Patent Application Serial Number 14/222930), US 2014-0242699 A1 (US Patent Application Serial Number 14/183512), US 2014-0242664 A1 (US Patent Application Serial Number 14/104990), US 2014-0234972 A1 (US Patent Application Serial Number 14/183471), US 2014-0227787 A1 (US Patent Application Serial Number 14/256,912), US 2014-0189896 A1 (US Patent Application Serial Number 14/105,035), US 2014-0186958 (US Patent Application Serial Number 14/105,017), US 2014-0186919 A1 (US Patent Application Serial Number 14/104,977), US 2014-0186843 A1 (US Patent Application Serial Number 14/104,900), US 2014-0179770 A1 (US Patent Application Serial Number 14/104,837), and US 2014-0179006 A1 (US Patent Application Serial Number 14/183,486), US 2014-0170753 (US patent application serial number 14/183,429); US 2015-0184139 (US patent application serial number 14/324,960); 14/054,414 European patent applications EP 2 771 468 (EP13818570.7), EP 2 764 103 (EP13824232.6) and EP 2 784 162 (EP14170383.5); and PCT patent application publications WO 2014/093661 (PCT/US2013/074743), WO 2014/093694 (PCT/US2013/074790), WO 2014/093595 (PCT/US2013/074611), WO 2014/093718 (PCT/US2013/074825), WO 2014/093709 (PCT/US2013/074812), WO 2014/093622 (PCT/US2013/074667), WO 2014/093635 (PCT/US2013/074691), WO 2014/093655 (PCT/US2013/074736), WO 2014/093712 (PCT/US2013/074819), WO 2014/093701 (PCT/US2013/074800), WO 2014/018423 (PCT/US2013/051418), WO 2014/204723 (PCT/US2014/041790), WO 2014/204724 (PCT/US2014/041800), WO 2014/204725 (PCT/US2014/041803), WO 2014/204726 (PCT/US2014/041804), WO 2014/204727 (PCT/US2014/041806), WO 2014/204728 (PCT/US2014/041808), WO 2014/204729 (PCT/US2014/041809), WO 2015/089351 (PCT/US2014/069897), WO 2015/089354 (PCT/US2014/069902), WO 2015/089364 (PCT/US2014/069925), WO 2015/089427 (PCT/US2014/070068), WO 2015/089462 (PCT/US2014/070127), WO 2015/089419 (PCT/US2014/070057), WO 2015/089465 (PCT/US2014/070135), WO 2015/089486 (PCT/US2014/070175), PCT/US2015/051691, PCT/US2015/051830. Reference is also made to U.S. Provisional Patent Applications 61/758,468; 61/802,174; 61/806,375; 61/814,263; 61/819,803; and 61/828,130, filed January 30, 2013; March 15, 2013; March 28, 2013; April 20, 2013; May 6, 2013; and May 28, 2013, respectively. Reference is also made to U.S. Provisional Patent Application No. 61/836,123, filed June 17, 2013. Reference is further made to U.S. Provisional Patent Applications 61/835,931, 61/835,936, 61/835,973, 61/836,080, 61/836,101, and 61/836,127, each filed June 17, 2013. Further reference is made to U.S. Provisional Patent Applications 61/862,468 and 61/862,355, filed August 5, 2013; 61/871,301, filed August 28, 2013; 61/960,777, filed September 25, 2013, and 61/961,980, filed October 28, 2013. Reference is further made to: PCT/US2014/62558, filed October 28, 2014, and U.S. Provisional Patent Applications Serial Nos. 61/915,148, 61/915,150, 61/915,153, 61/915,203, 61/915,251, 61/915,301, 61/915,267, 61/915,260, and 61/915,397, each filed December 12, 2013; 61/757,972 and 61/768,959, each filed January 29, 2013 and February 25, 2013; 62/010888 and 62/010879, each filed June 11, 2014; 62/010329, 62/010439, and 62/010441, each filed June 10, 2014; 61/939228 and 61/939242, each filed February 12, 2014; 61/980012, filed April 15, 2014; 62/038358, filed August 17, 2014; 62/055,484, 62/055,460, and 62/055,487, each filed September 25, 2014; and 62/069,243, filed October 27, 2014. Reference is made to a PCT application designating, among others, the United States of America, Application No. PCT/US14/41806, filed June 10, 2014. Reference is made to U.S. Provisional Patent Application No. 61/930,214, filed January 22, 2014. Reference is made to a PCT application designating, among others, the United States of America, Application No. PCT/US14/41806, filed June 10, 2014.
Также упоминается заявка на патент США 62/180709, поданная 17 июня 2015 г., PROTECTED GUIDE RNAS (PGRNAS); заявка на патент США 62/091455, поданная 12 декабря 2014 г., PROTECTED GUIDE RNAS (PGRNAS); заявка на патент США 62/096708, поданная 24 декабря 2014 г., PROTECTED GUIDE RNAS (PGRNAS); заявки на патент США 62/091462, поданная 12 декабря 2014 г., 62/096324, поданная 23 декабря 2014 г., 62/180681, поданная 17 июня 2015 г., и 62/237496, поданная 5 октября 2015 г., DEAD GUIDES FOR CRISPR TRANSCRIPTION FACTORS; заявки на патент США 62/091456, поданная 12 декабря 2014 г. и 62/180692, поданная 17 июня 2015 г., ESCORTED AND FUNCTIONALIZED GUIDES FOR CRISPR-CAS SYSTEMS; заявки на патент США 62/091461, поданная 12 декабря 2014 г., DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR GENOME EDITING AS TO HEMATOPOETIC STEM CELLS (HSC); заявка на патент США 62/094903, поданная 19 декабря 2014 г., UNBIASED IDENTIFICATION OF DOUBLE-STRAND BREAKS AND GENOMIC REARRANGEMENT BY GENOME-WISE INSERT CAPTURE SEQUENCING; заявка на патент США 62/096761, поданная 24 декабря 2014 г., ENGINEERING OF SYSTEMS, METHODS AND OPTIMIZED ENZYME AND GUIDE SCAFFOLDS FOR SEQUENCE MANIPULATION; заявка на патент США 62/098059, поданная 30 декабря 2014 г., 62/181641, поданная 18 июня 2015 г., и 62/181667, поданная 18 июня 2015 г., RNA-TARGETING SYSTEM; заявка на патент США 62/096656, поданная 24 декабря 2014 г., и 62/181151, поданная 17 июня 2015 г., CRISPR HAVING OR ASSOCIATED WITH DESTABILIZATION DOMAINS; заявка на патент США 62/096697, поданная 24 декабря 2014 г., CRISPR HAVING OR ASSOCIATED WITH AAV; заявка на патент США 62/098158, поданная 30 декабря 2014 г., ENGINEERED CRISPR COMPLEX INSERTIONAL TARGETING SYSTEMS; заявка на патент США 62/151052, поданная 22 апреля 2015 г., CELLULAR TARGETING FOR EXTRACELLULAR EXOSOMAL REPORTING; заявка на патент США 62/054490, поданная 24 сентября 2014 г., DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS; заявка на патент США 61/939154, поданная 12 февраля 2014 г., SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; заявка на патент США 62/055484, поданная 25 сентября 2014 г., SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; заявка на патент США 62/087537, поданная 4 декабря 2014 г., SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; заявка на патент США 62/054651, поданная 24 сентября 2014 г., DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO; заявка на патент США 62/067886, поданная 23 октября 2014 г., DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO; заявки на патент США 62/054675, поданная 24 сентября 2014 г., и 62/181002, поданная 17 июня 2015 г., DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN NEURONAL CELLS/TISSUES; заявка на патент США 62/054528, поданная 24 сентября 2014 г., DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN IMMUNE DISEASES OR DISORDERS; заявка на патент США 62/055454, поданная 25 сентября 2014 г., DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING CELL PENETRATION PEPTIDES (CPP); заявка на патент США 62/055460, поданная 25 сентября 2014 г., MULTIFUNCTIONAL-CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES; заявка на патент США 62/087475, поданная 4 декабря 2014 г., и 62/181690, поданная 18 июня 2015 г., FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; заявка на патент США 62/055487, поданная 25 сентября 2014 г., FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; заявки на патент США 62/087546, поданная 4 декабря 2014 г., и 62/181687, поданная 18 июня 2015 г., MULTIFUNCTIONAL CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES; и заявка на патент США 62/098285, поданная 30 декабря 2014 г., CRISPR MEDIATED IN VIVO MODELING AND GENETIC SCREENING OF TUMOR GROWTH AND METASTASIS.Also referenced is U.S. Patent Application Serial No. 62/180,709, filed June 17, 2015, PROTECTED GUIDE RNAS (PGRNAS); U.S. Patent Application Serial No. 62/091,455, filed December 12, 2014, PROTECTED GUIDE RNAS (PGRNAS); U.S. Patent Application Serial No. 62/096,708, filed December 24, 2014, PROTECTED GUIDE RNAS (PGRNAS); U.S. Patent Applications 62/091,462, filed December 12, 2014, 62/096,324, filed December 23, 2014, 62/180,681, filed June 17, 2015, and 62/237,496, filed October 5, 2015, DEAD GUIDES FOR CRISPR TRANSCRIPTION FACTORS; U.S. Patent Applications 62/091,456, filed December 12, 2014, and 62/180,692, filed June 17, 2015, ESCORTED AND FUNCTIONALIZED GUIDES FOR CRISPR-CAS SYSTEMS; U.S. Patent Application Serial No. 62/091,461, filed December 12, 2014, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR GENOME EDITING AS TO HEMATOPOETIC STEM CELLS (HSC); U.S. Patent Application Serial No. 62/094,903, filed December 19, 2014, UNBIASED IDENTIFICATION OF DOUBLE-STRAND BREAKS AND GENOMIC REARRANGEMENT BY GENOME-WISE INSERT CAPTURE SEQUENCING; U.S. Patent Application Serial No. 62/096,761, filed December 24, 2014, ENGINEERING OF SYSTEMS, METHODS AND OPTIMIZED ENZYME AND GUIDE SCAFFOLDS FOR SEQUENCE MANIPULATION; U.S. Patent Application Nos. 62/098,059, filed December 30, 2014, 62/181,641, filed June 18, 2015, and 62/181,667, filed June 18, 2015, RNA-TARGETING SYSTEM; U.S. Patent Application Nos. 62/096,656, filed December 24, 2014, and 62/181,151, filed June 17, 2015, CRISPR HAVING OR ASSOCIATED WITH DESTABILIZATION DOMAINS; U.S. Patent Application No. 62/096,697, filed December 24, 2014, CRISPR HAVING OR ASSOCIATED WITH AAV; U.S. Patent Application 62/098,158, filed December 30, 2014, ENGINEERED CRISPR COMPLEX INSERTIONAL TARGETING SYSTEMS; U.S. Patent Application 62/151,052, filed April 22, 2015, CELLULAR TARGETING FOR EXTRACELLULAR EXOSOMAL REPORTING; U.S. Patent Application 62/054,490, filed September 24, 2014, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS; U.S. Patent Application Ser. No. 61/939,154, filed February 12, 2014, SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; U.S. Patent Application Ser. No. 62/055,484, filed September 25, 2014, SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; U.S. Patent Application Ser. No. 62/087,537, filed December 4, 2014, SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; U.S. Patent Application 62/054,651, filed September 24, 2014, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO; U.S. Patent Application 62/067,886, filed October 23, 2014, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO; U.S. Patent Applications 62/054,675, filed September 24, 2014, and 62/181,002, filed June 17, 2015, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN NEURONAL CELLS/TISSUES; U.S. Patent Application 62/054,528, filed September 24, 2014, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN IMMUNE DISEASES OR DISORDERS; U.S. Patent Application 62/055,454, filed September 25, 2014, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING CELL PENETRATION PEPTIDES (CPP); U.S. Patent Application 62/055,460, filed September 25, 2014, MULTIFUNCTIONAL-CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES; U.S. Patent Application Nos. 62/087,475, filed December 4, 2014, and 62/181,690, filed June 18, 2015, FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; U.S. Patent Application No. 62/055,487, filed September 25, 2014, FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; U.S. Patent Applications 62/087,546, filed December 4, 2014, and 62/181,687, filed June 18, 2015, MULTIFUNCTIONAL CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES; and U.S. Patent Application 62/098,285, filed December 30, 2014, CRISPR MEDIATED IN VIVO MODELING AND GENETIC SCREENING OF TUMOR GROWTH AND METASTASIS.
Упоминаются заявки на патенты США 62/181659, поданная 18 июня 2015 г., и 62/207318, поданная 19 августа 2015 г., ENGINEERING AND OPTIMIZATION OF SYSTEMS, METHODS, ENZYME AND GUIDE SCAFFOLDS OF CAS9 ORTHOLOGS AND VARIANTS FOR SEQUENCE MANIPULATION. Упоминаются заявки на патенты США 62/181663, поданная 18 июня 2015 г., и 62/245264, поданная 22 октября 2015 г., NOVEL CRISPR ENZYMES AND SYSTEMS, заявки на патенты США 62/181675, поданные 18 июня 2015 г., 62/285349, поданная 22 октября 2015 г., 62/296522, поданная 17 февраля 2016 г., и 62/320231, поданная 8 апреля 2016 г., NOVEL CRISPR ENZYMES AND SYSTEMS, заявка на патент США 62/232067, поданная 24 сентября 2015 г., заявка на патент США, поданная 14/975085, 18 декабря 2015 г., европейская заявка на патент №16150428.7, заявка на патент США 62/205733, поданная 16 августа 2015 г., заявка на патент США 62/201542, поданная 5 августа 2015 г., заявка на патент США 62/193507, поданная 16 июля 2015 г., и заявка на патент США 62/181739, поданная 18 июня 2015 г., каждая из которых имеет название NOVEL CRISPR ENZYMES AND SYSTEMS, и заявка на патент США 62/245270, поданная 22 октября 2015 г., NOVEL CRISPR ENZYMES AND SYSTEMS. Также упоминается заявка на патент США 61/939256, поданная 12 февраля 2014 г., и WO 2015/089473 (PCT/US2014/070152), поданная 12 декабря 2014 г., каждая из которых имеет название ENGINEERING OF SYSTEMS, METHODS AND OPTIMIZED GUIDE COMPOSITIONS WITH NEW ARCHITECTURES FOR SEQUENCE MANIPULATION. Также упоминается PCT/US2015/045504, поданная 15 августа 2015 г., заявка на патент США 62/180699, поданная 17 июня 2015 г., и заявка на патент США 62/038358, поданная 17 августа 2014 г., каждая из которых имеет название GENOME EDITING USING CAS9 NICKASES.Reference is made to U.S. Patent Applications 62/181,659, filed June 18, 2015, and 62/207,318, filed August 19, 2015, ENGINEERING AND OPTIMIZATION OF SYSTEMS, METHODS, ENZYME AND GUIDE SCAFFOLDS OF CAS9 ORTHOLOGS AND VARIANTS FOR SEQUENCE MANIPULATION. Reference is made to U.S. Patent Applications 62/181,663, filed June 18, 2015, and 62/245,264, filed October 22, 2015, NOVEL CRISPR ENZYMES AND SYSTEMS, U.S. Patent Applications 62/181,675, filed June 18, 2015, 62/285,349, filed October 22, 2015, 62/296,522, filed February 17, 2016, and 62/320,231, filed April 8, 2016, NOVEL CRISPR ENZYMES AND SYSTEMS, U.S. Patent Application 62/232,067, filed September 24, 2015, U.S. Patent Application 14/975,085, filed December 18, 2015, European Patent Application No. 16150428.7, U.S. Patent Application 62/205,733, filed August 16, 2015, U.S. Patent Application 62/201542, filed August 5, 2015, U.S. Patent Application 62/193,507, filed July 16, 2015, and U.S. Patent Application 62/181,739, filed June 18, 2015, each entitled NOVEL CRISPR ENZYMES AND SYSTEMS, and U.S. Patent Application 62/245,270, filed October 22, 2015, NOVEL CRISPR ENZYMES AND SYSTEMS. Also referenced is U.S. Patent Application No. 61/939,256, filed February 12, 2014, and WO 2015/089473 (PCT/US2014/070152), filed December 12, 2014, each titled ENGINEERING OF SYSTEMS, METHODS AND OPTIMIZED GUIDE COMPOSITIONS WITH NEW ARCHITECTURES FOR SEQUENCE MANIPULATION. Also referenced are PCT/US2015/045504, filed August 15, 2015, U.S. Patent Application 62/180,699, filed June 17, 2015, and U.S. Patent Application 62/038,358, filed August 17, 2014, each of which is titled GENOME EDITING USING CAS9 NICKASES.
Каждое из данных патентов, публикаций патентов и заявок, а также все документы, цитируемые в них или во время их рассмотрения ("документы, цитируемые в заявке"), и все документы, цитируемые или упомянутые в документах, цитируемых в заявке, вместе с любыми инструкциями, описаниями, характеристиками продукта и технологическими картами для любых продуктов, упомянутыми в них или в любом документе, упомянутом в них и включенном с помощью ссылки в данный документ, настоящим включены в данный документ с помощью ссылки и могут быть использованы в практическом осуществлении настоящего изобретения. Все документы (например, данные патенты, публикации патентов и заявки, а также цитируемые в заявках документы) включены в данный документ посредством ссылки в такой же мере, как если бы конкретно и отдельно было указано, что каждый отдельный документ включен посредством ссылки.Each of these patents, patent publications, and applications, and all documents cited therein or during the pendency thereof (the "application cited documents"), and all documents cited or referred to in the documents cited in the application, together with any instructions, descriptions, product specifications, and flow charts for any products mentioned therein or in any document referred to therein and incorporated by reference herein, are hereby incorporated by reference herein and may be used in the practice of the present invention. All documents (e.g., these patents, patent publications, and applications, and documents cited in the applications) are hereby incorporated by reference to the same extent as if each individual document was specifically and individually indicated to be incorporated by reference.
Кроме того, упоминается заявка согласно PCT PCT/US14/70057, ссылка на номер дела у патентного поверенного 47627.99.2060 и BI-2013/107, под названием "DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS" (заявляется приоритет по одной или нескольких или всех из предварительных заявок на патент США: 62/054490, поданной 24 сентября 2014 г.; 62/010441, поданной 10 июня 2014 г.; и 61/915118, 61/915215 и 61/915148, каждая из которых подана 12 декабря 2013 г.) ("the Particle Delivery PCT"), включенная в данный документ посредством ссылки, в отношении способа получения комплекса sgRNA-и-белок Cas9, содержащего частицу, включающего добавление смеси, содержащей sgRNA и белок Cas9 (и необязательно матрицу для HDR) к смеси, содержащей, состоящей главным образом из или состоящей из поверхностно-активного вещества, фосфолипида, биоразлагаемого полимера, липопротеина и спирта; и частицы из такого способа. Например, где белок Cas9 и sgRNA смешивали вместе при подходящем молярном соотношении, например, 3:1-1:3, или 2:1-1:2, или 1:1, при подходящей температуре, например, 15-30°C, например, 20-25°C, например, комнатной температуре, в течение подходящего периода времени, например, 15-45, как, например, 30 минут, преимущественно в стерильном буфере без нуклеаз, например, 1X PBS. В отдельности, компоненты частиц, такие как или включающие поверхностно-активное вещество, например, катионный липид, например, 1,2-диолеоил-3-триметиламмонийпропан (DOTAP); фосфолипид, например, димиристоилфосфатидилхолин (DMPC); биоразлагаемый полимер, такой как полимер этиленгликоля или PEG, и липопротеин, такой как липопротеин низкой плотности, например, холестерин, растворяли в спирте, преимущественно C1-6алкиловом спирте, таком как метанол, этанол, изопропанол, например, 100% этанол. Два раствора смешивали вместе с образованием частиц, содержащих комплексы Cas9-sgRNA. Соответственно, можно обеспечивать предварительное образование комплекса sgRNA с белком Cas9 перед составлением целого комплекса в частице. Составы можно получать с различным молярным соотношением различных компонентов, известных как способствующие доставке нуклеиновой кислоты в клетки (например, 1,2-диолеоил-3-триметиламмоний-пропан (DOTAP), 1,2-дитетрадеканоил-sn-глицеро-3-фосфохолин (DMPC), полиэтиленгликоль (PEG) и холестерин). Например, молярные соотношения DOTAP: DMPC: PEG: холестерин могут быть следующими: DOTAP 100, DMPC 0, PEG 0, холестерин 0; или DOTAP 90, DMPC 0, PEG 10, холестерин 0; или DOTAP 90, DMPC 0, PEG 5, холестерин 5. DOTAP 100, DMPC 0, PEG 0, холестерин 0. Данная заявка, соответственно, охватывает смешивание sgRNA, белка Cas9 и компонентов, которые образуют частицу; а также частицы, полученные в результате такого добавления. Аспекты настоящего изобретения могут охватывать частицы; например, частицы с применением способа, аналогичного таковому в "Particle Delivery PCT", например, путем добавления смеси, содержащей sgRNA и/или Cas9, как в настоящем изобретении, и компоненты, которые образуют частицу, например, как в "Particle Delivery PCT", с образованием частицы и частиц в результате такого смешивания (или, конечно же, другие частицы, содержащие sgRNA и/или Cas9, как в настоящем изобретении).Also cited is PCT application PCT/US14/70057, Attorney Docket No. 47627.99.2060 and BI-2013/107, entitled "DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS" (claiming priority to one or more or all of U.S. Provisional Patent Applications 62/054,490, filed September 24, 2014; 62/010,441, filed June 10, 2014; and 61/915,118, 61/915,215, and 61/915,148, each filed December 12, 2013) ("the Particle Delivery PCT"), incorporated herein by reference, regarding a method for producing an sgRNA-and-Cas9 protein complex comprising a particle, comprising adding a mixture comprising sgRNA and Cas9 protein (and optionally a matrix for HDR) to a mixture comprising, consisting essentially of, or consisting of a surfactant, a phospholipid, a biodegradable polymer, a lipoprotein, and an alcohol; and the particles from such method. For example, wherein the Cas9 protein and sgRNA are mixed together at a suitable molar ratio, such as 3:1-1:3, or 2:1-1:2, or 1:1, at a suitable temperature, such as 15-30°C, such as 20-25°C, such as room temperature, for a suitable period of time, such as 15-45, such as 30 minutes, preferably in a sterile nuclease-free buffer, such as 1X PBS. Individually, particle components such as or including a surfactant, such as a cationic lipid, such as 1,2-dioleoyl-3-trimethylammoniumpropane (DOTAP); a phospholipid, such as dimyristoylphosphatidylcholine (DMPC); a biodegradable polymer such as ethylene glycol polymer or PEG and a lipoprotein such as low density lipoprotein, for example cholesterol, were dissolved in an alcohol, preferably a C 1-6 alkyl alcohol such as methanol, ethanol, isopropanol, for example 100% ethanol. The two solutions were mixed together to form particles containing Cas9-sgRNA complexes. Accordingly, it is possible to provide a pre-complex of sgRNA with Cas9 protein before assembling the entire complex in the particle. The formulations can be prepared with different molar ratios of various components known to facilitate the delivery of nucleic acid to cells (e.g. 1,2-dioleoyl-3-trimethylammonium propane (DOTAP), 1,2-ditetradecanoyl-sn-glycero-3-phosphocholine (DMPC), polyethylene glycol (PEG) and cholesterol). For example, the molar ratios of DOTAP: DMPC: PEG: cholesterol can be as follows: DOTAP 100, DMPC 0, PEG 0, cholesterol 0; or DOTAP 90, DMPC 0, PEG 10, cholesterol 0; or DOTAP 90, DMPC 0, PEG 5, cholesterol 5. DOTAP 100, DMPC 0, PEG 0, cholesterol 0. This application accordingly encompasses mixing of sgRNA, Cas9 protein and components that form a particle; as well as particles obtained as a result of such addition. Aspects of the present invention can encompass particles; for example, particles using a method similar to that in "Particle Delivery PCT", for example by adding a mixture containing sgRNA and/or Cas9, as in the present invention, and components that form a particle, for example as in "Particle Delivery PCT", to form a particle and particles as a result of such mixing (or, of course, other particles containing sgRNA and/or Cas9, as in the present invention).
Настоящее изобретение далее будет дополнительно описано с помощью следующих неограничивающих примеров.The present invention will now be further described by means of the following non-limiting examples.
ПримерыExamples
Следующие примеры служат для иллюстрации настоящего изобретения, описанного в данном документе. Также следует понимать, что научное обоснование, описанное ниже, которое послужило причиной исследований, не следует ограничивать объектом изобретения, заявляемым любым способом, или накладывать какое-либо механистическое или другое требование.The following examples serve to illustrate the present invention as described herein. It should also be understood that the scientific basis described below, which motivated the studies, should not be limited by the subject matter of the invention claimed in any way or impose any mechanistic or other requirement.
Научное обоснованиеScientific justification
Без привязки к какой-либо теории, описанной в данном документе, авторы настоящего изобретения изобрели стратегию модификации Cas9 (SpCas9) Streptococcus pyogenes для получения модифицированных вариантов фермента SpCas9, которые характеризуется целевой специфичностью. То же самое обоснование может быть применимо к любому ортологу Cas9. Эта повышенная специфичность может быть достигнута в вариантах, которые характеризовались сниженной активностью по отношению к не подвергаемым нацеливанию (нецелевым) локусам, но в то же время сохраняли соответствующую активность по отношению к предполагаемому целевому локусу. Активность в анализах, описанных ниже, связанная с нуклеазной активностью, проявляется по расщеплению ДНК, что измеряется при образовании ВСТАВОК/ДЕЛЕЦИЙ. Предполагается, что такая активность связана со способностью комплекса CRISPR (другими словами, комплекса между ферментом Cas9 и направляющей РНК) связываться с соответствующим сайтом на ДНК. Таким образом, можно ожидать, что снижение активности в отношении не подвергаемого нацеливанию сайта, происходит в результате сниженного связывания комплекса CRISPR в этом сайте. Модифицированные ферменты Cas9, которые характеризуются сниженной активностью в отношении не подвергаемых нацеливанию локусов по сравнению с немодифицированными (например, дикого типа) ферментами, таким образом, могут связываться хуже с нецелевыми сайтами. Публикация Nishimasu et al. (Cell, 2014, 156(5), pp935-49) описывает кристаллическую структуру при разрешении 2,5Å вариантного фермента SpCas9 в комплексе с одиночной направляющей РНК (sgRNA), имеющей длину 98 нуклеотидов, и участком целевой ДНК, имеющим длину 23 нуклеотида. На основании этих структурных данных авторы настоящего изобретения идентифицировали положительно-заряженную область, расположенную между доменами RuvC-III и HNH. Авторы сделали заключение, что бороздка может приспосабливать не подвергаемую нацеливанию нить после нарушения нормального спаривания оснований по Уотсону и Крику при связывании фермента Cas9 с соответствующим участком ДНК. Положительно заряженные остатки этой области Cas9 могут функционировать для стабилизации взаимодействия между ферментом и ДНК в результате взаимодействия с отрицательно зараженным фосфодиэфирным остовом не подвергаемой нацеливанию нити ДНК. Авторы настоящего изобретения выдвигают гипотезу о том, что в результате замещения положительно заряженных остатков Cas9 взаимодействия с не подвергаемой нацеливанию нитью могут быть нарушены. Достаточное нарушение этого взаимодействия может сохранять соответствующую активность по отношению к целевым сайтам, однако снижать активность фермента по отношению к не подвергаемым нацеливанию сайтам (который, как обычно будет ожидаться, характеризуется более слабыми взаимодействиями с направляющей последовательностью за счет одного или нескольких ошибочно спаренных оснований по сравнению с целевой последовательностью). Авторы настоящего изобретения неожиданным образом обнаружили, что модификация Cas9 может действительно снижать нецелевую активность. См. также фигуру 1, и ее описание в данном документе.Without wishing to be bound by any theory described herein, the inventors of the present invention have devised a strategy for modifying Streptococcus pyogenes Cas9 (SpCas9) to produce modified variants of the SpCas9 enzyme that have target specificity. The same rationale can be applied to any Cas9 ortholog. This increased specificity can be achieved in variants that have reduced activity at non-targeted loci while retaining adequate activity at the intended target locus. Activity in the assays described below, related to nuclease activity, is demonstrated by DNA cleavage as measured by the formation of INSERTIONS/DELETIONS. It is believed that such activity is related to the ability of the CRISPR complex (in other words, the complex between the Cas9 enzyme and the guide RNA) to bind to the appropriate site on DNA. Thus, the reduced activity at the off-target site might be expected to result from reduced binding of the CRISPR complex at that site. Modified Cas9 enzymes that exhibit reduced activity at off-target loci compared to unmodified (e.g., wild-type) enzymes may thus have poorer binding to off-target sites. The publication by Nishimasu et al. (Cell, 2014, 156(5), pp935-49) describes a crystal structure at 2.5 Å resolution of a variant SpCas9 enzyme in complex with a 98-nucleotide single guide RNA (sgRNA) and a 23-nucleotide target DNA region. Based on these structural data, we identified a positively charged region located between the RuvC-III and HNH domains. The authors reasoned that the groove may accommodate the non-targetable strand following disruption of normal Watson-Crick base pairing upon binding of the Cas9 enzyme to the target DNA region. Positively charged residues in this region of Cas9 may function to stabilize the interaction between the enzyme and DNA by interacting with the negatively charged phosphodiester backbone of the non-targetable DNA strand. The present inventors hypothesize that by substituting positively charged residues in Cas9, interactions with the non-targetable strand may be disrupted. Sufficient disruption of this interaction may retain adequate activity toward target sites but reduce enzyme activity toward non-targetable sites (which would typically be expected to have weaker interactions with the guide sequence due to one or more mismatches compared to the target sequence). The present inventors have surprisingly found that modification of Cas9 can indeed reduce off-target activity. See also Figure 1, and its description herein.
Дополнительно к открытию того, что замена положительно заряженных остатков нарушает взаимодействия остова ДНК и приводит к сниженной активности фермента по отношению к не подвергаемым нацеливанию сайтам, при этом сохраняется соответствующая активность по отношению к целевым сайтам, упоминается публикация Kleinstiver BP et al. Авторы описывают вариант с тройной заменой (R661A/Q695A/Q926A) и вариант с четверной заменой (N497A/R661A/Q695A/Q926A) SpCas9, содержащие мутации в домене REC1. Замены включают остатки, которые сконструированы с целью разрыва водородных связей в фосфатном остове ДНК, и мутанты, как описано, имеют высокую целевую активность и минимальную нецелевую активность. (см., Kleinstiver BP et al., High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects. Nature 2016 Jan 28;529(7587):490-5. doi: 10.1038/nature16526. Epub от 6 января 2016 г.In addition to the discovery that substitution of positively charged residues disrupts DNA backbone interactions and results in reduced enzyme activity at non-targeted sites while maintaining adequate activity at target sites, Kleinstiver BP et al. describe a triple-substitution (R661A/Q695A/Q926A) and a quadruple-substitution (N497A/R661A/Q695A/Q926A) variant of SpCas9 containing mutations in the REC1 domain. The substitutions involve residues that are designed to disrupt hydrogen bonds in the phosphate backbone of DNA, and the mutants are reported to have high on-target activity and minimal off-target activity. (See, Kleinstiver BP et al., High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects. Nature 2016 Jan 28;529(7587):490-5. doi: 10.1038/nature16526. Epub January 6, 2016
Кроме того, авторы настоящего изобретения выдвигают гипотезу о том, что может быть выполнена модификация аминокислотных остатков фермента CRISPR, которая может оказывать влияние на повышение стабильности взаимодействия между ферментом и не подвергаемой нацеливанию нитью после нарушения нормального спаривания основания по Уотсону и Крику при связывании фермента Cas9 с соответствующим участком ДНК. Например, замена положительно заряженной аминокислотой аминокислотного остатка, который в немодифицированном ферменте не заряжен положительно, может оказывать эффект стабилизации взаимодействия между ферментом и не подвергаемой нацеливанию нитью в результате повышения суммарного положительного заряда фермента. Таким образом, предполагается, что более высокий суммарный положительный заряд в соответствующих областях фермента обеспечивает более сильное взаимодействие с отрицательно заряженным фосфодиэфирным остовом не подвергаемой нацеливаню нити ДНК. Аминокислоты, которые в немодифицированном ферменте не являются положительно заряженными, могут представлять собой, например, аминокислоты, которые нейтрально заряжены, отрицательно заряжены, гидрофобные и т.д. Такие аминокислоты могут быть замещены положительно заряженной аминокислотой для достижения желаемого эффекта. Вышеописанные функциональные эффекты основаны на сложных и взаимосвязанных электростатических и термодинамических положениях. Таким образом, предполагается, что вышеописанные функциональные эффекты можно комбинировать. Таким образом, фермент CRISPR может быть модифицирован таким образом, что повышается активность фермента по отношению к мишени, а также снижается активность по отношению к одной или несколькими нецелевым элементам. Например, предполагается, что могут быть выполнены модификации, которые способствуют повышенной целевой активности, в то же время могут быть выполнены модификации которые снижают нецелевую активность. Таким образом, могут быть получены синергические эффекты.In addition, the inventors hypothesize that modification of amino acid residues of the CRISPR enzyme can be performed that can have the effect of increasing the stability of the interaction between the enzyme and the non-targeted strand after disruption of the normal Watson-Crick base pairing upon binding of the Cas9 enzyme to the corresponding region of DNA. For example, substitution of a positively charged amino acid for an amino acid residue that is not positively charged in the unmodified enzyme can have the effect of stabilizing the interaction between the enzyme and the non-targeted strand by increasing the net positive charge of the enzyme. Thus, it is assumed that a higher net positive charge in the corresponding regions of the enzyme provides a stronger interaction with the negatively charged phosphodiester backbone of the non-targeted strand of DNA. Amino acids that are not positively charged in the unmodified enzyme can be, for example, amino acids that are neutrally charged, negatively charged, hydrophobic, etc. Such amino acids can be replaced by a positively charged amino acid to achieve the desired effect. The above-described functional effects are based on complex and interrelated electrostatic and thermodynamic positions. Thus, it is assumed that the above-described functional effects can be combined. Thus, the CRISPR enzyme can be modified in such a way that the activity of the enzyme with respect to the target is increased, and also the activity with respect to one or more non-target elements is reduced. For example, it is assumed that modifications can be made that promote increased target activity, while modifications can be made that reduce non-target activity. In this way, synergistic effects can be obtained.
Предполагается, что любой из функциональных эффектов, описанных выше, может быть достигнут с помощью модификации аминокислот в вышеупомянутой бороздке, однако также с помощью модификации аминокислот вблизи бороздки или за ее пределами.It is proposed that any of the functional effects described above can be achieved by modifying amino acids in the above-mentioned groove, but also by modifying amino acids near the groove or outside it.
Пример 1. Материалы и способыExample 1. Materials and methods
Получение мутантов SpCas9Production of SpCas9 mutants
Хотя это должно быть очевидно из полного контекста настоящего изобретения, аббревиатура "SpCas9" обозначает Cas9 Streptococcus pyogenes, а аббревиатура "SaCas9" обозначает Cas9 Staphyloccocus aureus. Модифицированные варианты SpCas9 и SaCas9, например, модифицированные аланиновые варианты, создавали с помощью мутагенеза на основе ПЦР с применением известных методик. Другие методики могут включать получение молекулы нуклеиновой кислоты, кодирующей Cas9, но при этом изменен(изменены) соответствующий(соответствующие) кодон(кодоны), ответственный(ответственные) за мутацию(мутации) или модификацию(модификации) белка, чтобы экспрессировался модифицированный или мутированный Cas9, например, с помощью векторной системы экспрессии, такой как бактериальная система экспрессии или система экспрессии на основе вирусного вектора. Затем модифицированный или мутированный Cas9, экспрессированный таким образом, можно легко очистить. Модифицированные или мутированные Cas9 по настоящему изобретению можно применять в системах CRISPR-Cas и в любом применении систем CRISPR-Cas; и предпочтительно они имеют преимущество, заключающееся в сниженных, или практически отсутствующих, или, по сути, отсутствующих, или отсутствующих нецелевых эффектах и/или повышенных целевых эффектах. В соответствии с этим, Cas9 по настоящему изобретению или систему CRISPR-Cas по настоящему изобретению с Cas9 по настоящему изобретению можно доставлять с помощью системы доставки, которая может представлять собой один или несколько векторов, включая обсуждаемый в данном документе.)Although it should be obvious from the full context of the present invention, the abbreviation "SpCas9" refers to Streptococcus pyogenes Cas9 and the abbreviation "SaCas9" refers to Staphyloccocus aureus Cas9. Modified variants of SpCas9 and SaCas9, for example modified alanine variants, have been created by PCR-based mutagenesis using known techniques. Other techniques may include obtaining a nucleic acid molecule encoding Cas9, but altering the corresponding codon(s) responsible for the mutation(s) or modification(s) of the protein so that the modified or mutated Cas9 is expressed, for example, using a vector expression system such as a bacterial expression system or a viral vector expression system. The modified or mutated Cas9 expressed in this manner can then be readily purified. The modified or mutated Cas9 of the present invention can be used in CRISPR-Cas systems and in any application of CRISPR-Cas systems; and preferably have the advantage of reduced or virtually absent or essentially absent or absent off-target effects and/or increased on-target effects. Accordingly, the Cas9 of the present invention or the CRISPR-Cas system of the present invention with the Cas9 of the present invention can be delivered using a delivery system, which can be one or more vectors, including the one discussed herein.)
Система для тестирования активности модифицированных Cas9System for testing the activity of modified Cas9
Модифицированные ферменты Cas9 тестировали с помощью совместной трансфекции плазмиды, кодирующей мутантный Cas9, и плазмиды, кодирующей sgRNA (только целевую), в клетки HEK293T или HEK293FT. Клетки трансфицировали при конфлюэнтности 90-95% с применением Lipofectamine 2000, выращивали при 37°C и 5% CO2 в течение примерно 72 ч. и собирали. Целевые и нецелевые локусы генома амплифицировали с помощью ПЦР и анализировали с применением секвенирования нового поколения (NGS). % вставок/делеций для целевых и нецелевых локусов рассчитывали исходя из данных секвенирования. Мутантов SpCas9 тестировали с локусами генома, показанными в таблице A. Мутантов SaCas9 тестировали с помощью NGS с применением направляющей EMX101 и OT1 - OT3 из Ran at al. 2015. Биохимические анализы или анализы с использованием нуклеазы SURVEYOR не проводили (все данные получены на основании NGS; ср.. Sidi-Chen, "Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth and Metastasis," Cell 160(6): 1246-1260, DOI: http://dx.doi.org/10.1016/j.cell.2015.02.038, 12 March 2015).Modified Cas9 enzymes were tested by co-transfection of a plasmid encoding the mutant Cas9 and a plasmid encoding the sgRNA (target only) into HEK293T or HEK293FT cells. Cells were transfected at 90-95% confluence using Lipofectamine 2000, grown at 37°C and 5% CO2 for ∼72 h, and harvested. Target and off-target genomic loci were amplified by PCR and analyzed using next-generation sequencing (NGS). % insertions/deletions for target and off-target loci were calculated from the sequencing data. SpCas9 mutants were tested with the genomic loci shown in Table A. SaCas9 mutants were tested by NGS using the EMX101 guide and OT1 - OT3 from Ran at al. 2015. Biochemical or SURVEYOR nuclease assays were not performed (all data were obtained from NGS; cf. Sidi-Chen, "Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth and Metastasis," Cell 160(6): 1246–1260, DOI: http://dx.doi.org/10.1016/j.cell.2015.02.038, 12 March 2015).
Анализ вставок/делецийInsertion/deletion analysis
Анализы вставок/делеций проводили с помощью нацеленного глубокого секвенирования и анализировали, как описано ранее (Hsu, P. D. et al. (2013) DNA targeting specificity of RNA-guided Cas9 nucleases. Nat. Biotechnol. 31, 827-832). Клетки собирали через примерно 3 дня после трансфекции. Геномную ДНК экстрагировали с применением набора для экстракции ДНК QuickExtract (Epicentre) путем ресуспендирования осажденных клеток в QuickExtract (80 мкл на лунку в 24-луночном планшете или 20 мкл на лунку в 96-луночном планшете), с последующей инкубацией при 65°C в течение 15 мин., 68°C в течение 15 мин. и 98°C в течение 10-15 мин. ПЦР-фрагменты для NGS-анализа получали в реакциях двухстадийной ПЦР. Вкратце, праймеры c ПЦР-основами для второго раунда амплификации применяли для амплификации представляющих интерес участков генома (таблица 2), с последующим применением способа ПЦР с перекрывающимися праймерами для прикрепления адапторов Illumina P5, а также уникальных специфичных для образца штрихкодов к продукту первого раунда ПЦР.Insertion/deletion analyses were performed by targeted deep sequencing and analyzed as described previously (Hsu, P. D. et al. (2013) DNA targeting specificity of RNA-guided Cas9 nucleases. Nat. Biotechnol. 31, 827–832). Cells were harvested approximately 3 days post-transfection. Genomic DNA was extracted using the QuickExtract DNA Extraction Kit (Epicentre) by resuspending the pelleted cells in QuickExtract (80 μl/well in a 24-well plate or 20 μl/well in a 96-well plate), followed by incubation at 65°C for 15 min, 68°C for 15 min, and 98°C for 10–15 min. PCR fragments for NGS analysis were generated in two-step PCR reactions. Briefly, second-round PCR backbone primers were used to amplify genomic regions of interest (Table 2), followed by overlapping PCR to attach Illumina P5 adaptors as well as unique sample-specific barcodes to the first-round PCR product.
Пример 2. Первоначальный анализ SpCas9 c одиночными мутациями (целевые последовательности EMX1 и VEGFA).Example 2. Initial analysis of SpCas9 with single mutations (EMX1 and VEGFA target sequences).
49 первоначальных SpCas9 с одиночными точечными мутациями получали и тестировали в отношении образования вставок/делеций. Целевые последовательности в данном примере представляли собой последовательности из генов EMX1 и VEGFA. Как целевые, так и нецелевые последовательности показаны в таблице A ниже, с указанием последовательностей PAM. В случае нецелевой последовательности несовпадения с целевой последовательностью показаны жирным шрифтом и подчеркнуты. Результаты показаны на фигурах 2A и 2B.49 original SpCas9 with single point mutations were generated and tested for insertion/deletion formation. The target sequences in this example were sequences from the EMX1 and VEGFA genes. Both target and off-target sequences are shown in Table A below, with PAM sequences indicated. For off-target sequences, mismatches to the target sequence are shown in bold and underlined. The results are shown in Figures 2A and 2B.
Для следующих мутантов показана сниженная активность в отношении нецелевых сайтов по сравнению с ферментом дикого типа (см. фигуры 2A и 2B).The following mutants showed reduced activity at off-target sites compared to the wild-type enzyme (see Figures 2A and 2B).
R63AR63A
H415AH415A
H447AH447A
R778AR778A
R780AR780A
Q807AQ807A
K810AK810A
R832AR832A
K848AK848A
K855AK855A
K968AK968A
R976AR976A
H982AH982A
K1000AK1000A
K1003AK1003A
K1047AK1047A
R1060AR1060A
K1107AK1107A
R1114AR1114A
K1118AK1118A
K1200AK1200A
Пример 3. Дальнейший анализ SpCas9 с одиночными мутациямиExample 3. Further analysis of SpCas9 with single mutations
Несколько модифицированных ферментов SpCas9 с одиночными точечными мутациями, идентифицированных в примере 2, дополнительно тестировали в отношении образования вставок/делеций с помощью третьей направляющей последовательности и дополнительных нецелевых локусов. Целевые и нецелевые последовательности показаны в таблице A ниже, с указанием последовательностей PAM. В случае нецелевой последовательности несовпадения с целевой последовательностью показаны подчеркиванием и жирным шрифтом. Результаты показаны на фигуре 3. Модифицированные ферменты SpCas9, протестированные в данном примере, были следующими:Several modified SpCas9 enzymes with single point mutations identified in Example 2 were further tested for insertion/deletion formation using a third guide sequence and additional off-target loci. The target and off-target sequences are shown in Table A below, with PAM sequences indicated. In the case of an off-target sequence, mismatches to the target sequence are shown underlined and in bold. The results are shown in Figure 3. The modified SpCas9 enzymes tested in this Example were as follows:
R780AR780A
K810AK810A
K848AK848A
K855AK855A
R976AR976A
H982AH982A
K1003AK1003A
R1060AR1060A
Как показано на фигуре 3, для всех восьми модифицированных ферментов показана сниженная активность в отношении нецелевых сайтов по сравнению с немодифицированным (дикого типа) ферментом (SpCas9).As shown in Figure 3, all eight modified enzymes showed reduced activity at off-target sites compared to the unmodified (wild-type) enzyme (SpCas9).
Пример 4. Дальнейший анализ SpCas9 с одиночными мутациями (целевая последовательность VEGFA1).Example 4. Further analysis of SpCas9 with single mutations (target sequence VEGFA1).
Несколько модифицированных ферментов SpCas9 с одиночными точечными мутациями, включая мутантов, описанных в примере 2, тестировали в отношении образования вставок/делеций для второй отличающейся целевой последовательности, в данном случае VEGFA1 представляет собой последовательность гена VEGFA. Модифицированные ферменты SpCas9, протестированные в данном примере, были следующими:Several modified SpCas9 enzymes with single point mutations, including the mutants described in Example 2, were tested for the formation of insertions/deletions for a second distinct target sequence, in this case VEGFA1 is the VEGFA gene sequence. The modified SpCas9 enzymes tested in this example were as follows:
R780AR780A
K810AK810A
K848AK848A
K855AK855A
R976AR976A
H982AH982A
K1003AK1003A
R1060AR1060A
H1240AH1240A
H1311AH1311A
Целевые и нецелевые последовательности показаны в таблице A ниже, с указанием последовательностей PAM. В случае нецелевой последовательности несовпадения с целевой последовательностью показаны подчеркиванием и жирным шрифтом. Результаты показаны на фигуре 3.The target and non-target sequences are shown in Table A below, with PAM sequences indicated. In the case of a non-target sequence, mismatches to the target sequence are shown underlined and in bold. The results are shown in Figure 3.
Пример 5. Анализ комбинационных мутантов SpCas9Example 5. Analysis of combination mutants of SpCas9
Двадцать четыре модифицированных фермента SpCas9 с двойными точечными мутациями и 14 модифицированных ферментов с тройными точечными мутациями получали и тестировали в отношении образования вставок/делеций для двух отличающихся целевых последовательностей, в данном случае последовательностей генов EMX1 и VEGFA (VEGFA3 представляет собой последовательность в VEGFA). Целевые и нецелевые последовательности показаны в таблице A ниже, с указанием последовательностей PAM. В случае нецелевой последовательности несовпадения с целевой последовательностью показаны жирным шрифтом и подчеркнуты. Протестированные мутанты и результаты показаны на фигурах 4 и 5; звездочка на фигурах 4 и 5 указывает на вариант осуществления, который в настоящем изобретении считается преимущественным. Как показано на фигурах 4 и 5, для всех мутантов показано значительное снижение активности в отношении нецелевых локусов OT 46, OT4 и OT18 по сравнению с ферментом дикого типа. Для нескольких комбинационных мутантов дополнительно показано снижение активности в отношении всех четырех нецелевых локусов, при этом с сохранением целевой активности, аналогичной WT; они представляли собой следующие.Twenty-four modified SpCas9 enzymes with double point mutations and 14 modified enzymes with triple point mutations were prepared and tested for insertion/deletion formation at two different target sequences, in this case the EMX1 and VEGFA gene sequences (VEGFA3 is a sequence in VEGFA). The target and off-target sequences are shown in Table A below, with PAM sequences indicated. In the case of an off-target sequence, mismatches to the target sequence are shown in bold and underlined. The mutants tested and the results are shown in Figures 4 and 5; an asterisk in Figures 4 and 5 indicates an embodiment that is considered advantageous in the present invention. As shown in Figures 4 and 5, all mutants showed a significant reduction in activity at the off-target loci OT 46, OT4 and OT18 compared to the wild-type enzyme. Several combination mutants additionally showed reduced activity at all four non-target loci while maintaining target activity similar to WT; these were as follows.
Таблица A. Направляющие для SpCas9 (целевые и нецелевые локусы для SpCas9; красным цветом указаны несовпадения в нецелевых последовательностях; вертикальная линия | указывает на сайт разреза SpCas9; нецелевые последовательности исключаются с помощью мутации/модификации по настоящему изобретению)Table A. SpCas9 Guides (SpCas9 target and off-target loci; red indicates mismatches in off-target sequences; vertical line | indicates SpCas9 cut site; off-target sequences are excluded by mutation/modification according to the present invention)
Таблица B. Описанные мутации в SpCas9 (процитированные документы включены посредством ссылки; сохраняется право в явной форме отказаться от любой из этих мутаций отдельно, и, следует обратить внимание, что ни для одной из известных мутаций не раскрыто или не высказано предположение, касающееся получения сниженного нецелевого эффекта и/или повышенной способности модифицировать один или несколько целевых локусов по сравнению с немодифицированным ферментом, при этом оговаривается, что K1107A, KES→GG и KES→KG у Anders et al могут обеспечивать специфичность в отношении несовпадений в положениях 1 и 2 sgRNA, НО за счет умеренно сниженной эффективности целевого разрезания, и они также не приводят более подробное описание характеристик специфичности, так что общее утверждение, что эти известные мутанты не являются раскрытыми или предполагаемыми, при этом настоящее изобретение остается действительным; и, оговаривается, что настоящее изобретение может включать любую мутацию/модификацию из таблицы, приведенной ниже, в сочетании с модификацией/мутацией, которая обеспечивает сниженный нецелевой эффект при условии, что добавление одной или нескольких из мутаций/модификаций, приведенных ниже, не оказывает неблагоприятного влияния на эффект, обеспечивающий сниженную способность модифицировать нецелевые локусы и/или повышенную способность модифицировать один или несколько целевых локусов, достигаемый в настоящем изобретении): Table B. Disclosed mutations in SpCas9 (the cited documents are incorporated by reference; the right to expressly disclaim any of these mutations individually is reserved, and it should be noted that none of the known mutations are disclosed or suggested to provide a reduced off-target effect and/or an increased ability to modify one or more target loci compared to the unmodified enzyme, with the caveat that K1107A, KES→GG and KES→KG of Anders et al may provide specificity for mismatches at positions 1 and 2 of sgRNA BUT at the cost of moderately reduced target cleavage efficiency, and they also do not provide a more detailed description of the specificity characteristics, so the general statement that these known mutants are not disclosed or suggested remains valid for the present invention; and it is stipulated that the present invention may include any mutation/modification from the table below in combination with a modification/mutation that provides reduced off-target effect, provided that the addition of one or more of the mutations/modifications listed below does not adversely affect the effect of reduced ability to modify off-target loci and/or increased ability to modify one or more target loci achieved in the present invention):
Пример 6. Анализ дополнительных мутантов SpCas9 (целевая последовательность VEGFA3)Example 6. Analysis of additional SpCas9 mutants (VEGFA3 target sequence)
Получали несколько дополнительных модифицированных ферментов SpCas9 с одиночными точечными мутациями и тестировали их в отношении образования вставок/делеций с применением целевой последовательности VEGFA3, которая представляет собой последовательность гена VEGFA. Модифицированные ферменты SpCas9, протестированные в данном примере, были такими, как показано ниже:Several additional modified SpCas9 enzymes with single point mutations were generated and tested for insertion/deletion formation using the VEGFA3 target sequence, which is the VEGFA gene sequence. The modified SpCas9 enzymes tested in this example were as follows:
Как показано на фигуре 2, для нескольких мутантов показано значительное снижение активности в отношении обоих нецелевых локусов OT1 и OT4 по сравнению с ферментом дикого типа. Для нескольких мутантов дополнительно показано снижение активности в отношении всех трех нецелевых локусов по сравнению с ферментом дикого типа, они представляли собой следующее:As shown in Figure 2, several mutants showed significant reductions in activity at both the OT1 and OT4 off-target loci compared to the wild-type enzyme. Several mutants additionally showed reductions in activity at all three off-target loci compared to the wild-type enzyme, these were as follows:
Пример 7. Анализ мутантов SaCas9 (целевая последовательность EMX101)Example 7. Analysis of SaCas9 mutants (EMX101 target sequence)
Получали несколько модифицированных ферментов SaCas9 с одиночными точечными мутациями и тестировали их в отношении образования вставок/делеций с применением целевой последовательности, которая представляет собой последовательность из гена EMX101. Целевые и нецелевые последовательности показаны в таблице C ниже, с указанием последовательности PAM. В случае нецелевой последовательности несовпадения с целевой последовательностью показаны жирным шрифтом и подчеркнуты. Модифицированные ферменты SaCas9, протестированные в данном примере, представляли собой аланиновых мутантов, показанных ниже:Several modified SaCas9 enzymes with single point mutations were generated and tested for insertion/deletion formation using a target sequence, which is a sequence from the EMX101 gene. The target and off-target sequences are shown in Table C below, with the PAM sequence indicated. For the off-target sequence, mismatches to the target sequence are shown in bold and underlined. The modified SaCas9 enzymes tested in this example were the alanine mutants shown below:
K518AK518A
K523AK523A
K525AK525A
H557AH557A
R561AR561A
K572AK572A
R686AR686A
K687AK687A
K692AK692A
R694AR694A
H700AH700A
K751AK751A
Как показано на фигуре 6, для нескольких мутантов показано значительное снижение активности в отношении обоих нецелевых последовательностей OT2 и OT3 по сравнению с ферментом дикого типа. Для нескольких мутантов дополнительно показано снижение активности в отношении всех трех нецелевых локусов по сравнению с ферментом дикого типа, они представляли собой следующее:As shown in Figure 6, several mutants showed significant reductions in activity at both the OT2 and OT3 off-target sequences compared to the wild-type enzyme. Several mutants additionally showed reductions in activity at all three off-target loci compared to the wild-type enzyme, these were as follows:
K523AK523A
K525AK525A
R561AR561A
K572AK572A
R694AR694A
H700AH700A
Таблица C. Информация о последовательностях, включая PAM, для направляющих, применяемых для валидации мутаций SaCas9 (красным цветом указаны несовпадения в нецелевых последовательностях; нецелевые последовательности исключаются с помощью мутации/модификации по настоящему изобретению)Table C. Sequence information, including PAMs, for guides used to validate SaCas9 mutations (mismatches in off-target sequences are indicated in red; off-target sequences are excluded by the mutation/modification of the present invention)
На фигуре 7 представлены дополнительные данные, касающиеся следующих мутантов SaCas9, раскрытых в данном документе.Figure 7 provides additional data regarding the following SaCas9 mutants disclosed herein.
Мутанты R245A, R480A, R499A, R650A и R654A были эффективными в отношении снижения нецелевых эффектов, при этом R480A, R499A и R245A были особенно эффективными.Mutants R245A, R480A, R499A, R650A and R654A were effective in reducing off-target effects, with R480A, R499A and R245A being particularly effective.
Пример 8. Перечень модифицированных ферментов Cas9Example 8. List of modified Cas9 enzymes
Что касается SpCas9, одиночные и комбинационные мутанты, перечисленные в данном документе, включая вышеупомянутые примеры, на данный момент считаются преимущественными, поскольку продемонстрировали предпочтительное улучшение специфичности. Мутанты SpCas9 и SaCas9, включая протестированные и иным образом упомянутые в настоящем изобретении, перечислены ниже в таблицах 1-7.With respect to SpCas9, the single and combination mutants listed herein, including the above-mentioned examples, are currently considered advantageous because they have demonstrated a preferential improvement in specificity. SpCas9 and SaCas9 mutants, including those tested and otherwise mentioned in the present invention, are listed below in Tables 1-7.
Таблица 1. Перечень четверных мутантов SpCas9 Table 1. List of quadruple mutants of SpCas9
Таблица 2. Перечень одиночных мутантов SpCas9Table 2. List of single mutants of SpCas9
заменаThe remainder and
replacement
Таблица 3. Перечень двойных и тройных мутантов SpCas9Table 3. List of double and triple mutants of SpCas9
Таблица 4. Перечень одиночных мутантов SaCas9Table 4. List of single mutants of SaCas9
Таблица 5. Перечень одиночных мутантов SaCas9Table 5. List of single mutants of SaCas9
Типичные примеры мутантов SpCas9 перечислены в таблице 6 ниже.Typical examples of SpCas9 mutants are listed in Table 6 below.
Таблица 6. Перечень одиночных мутантов SpCas9Table 6. List of single mutants of SpCas9
заменаThe remainder and
replacement
В таблице 7 ниже представлены мутанты, приведенные в качестве примера в настоящем изобретении, включая упомянутые в примерах.Table 7 below shows mutants exemplified in the present invention, including those mentioned in the examples.
Тройные мутантыTriple mutants
Пример 9. Модификация Cas9 для усиления целевой активностиExample 9. Modification of Cas9 to enhance target activity
Изначально изобретатели осуществили модификации в отношении незаряженных аминокислот, расположенных в бороздке между доменами RuvC-III и HNH SpCas9. Аминокислоты, подлежащие модифицированию, включали аминокислоты с незаряженными боковыми цепями, включая серин, треонин, аспарагин и глутамин. Некоторые аминокислоты изменяли на положительно заряженные аминокислоты, такие как аргинин или лизин. Эффект таких изменений одиночных аминокислот в SpCas9 в отношении образования вставок/делеций в целевых локусах оценивали с помощью секвенирования нового поколения, как описано выше. Отбирали предпочтительные мутации с повышенной/усиленной целевой активностью по сравнению с немодифицированным ферментом. Изобретатели оценивали двойные и тройные мутации, описываемые выше. Отбирали особенно предпочтительные мутации с усиленной целевой активностью.Initially, the inventors performed modifications to uncharged amino acids located in the groove between the RuvC-III and HNH domains of SpCas9. The amino acids to be modified included amino acids with uncharged side chains, including serine, threonine, asparagine, and glutamine. Some amino acids were changed to positively charged amino acids, such as arginine or lysine. The effect of such single amino acid changes in SpCas9 on the formation of insertions/deletions at target loci was assessed using next-generation sequencing as described above. Favorable mutations with increased/enhanced target activity compared to the unmodified enzyme were selected. The inventors evaluated double and triple mutations as described above. Particularly favorable mutations with enhanced target activity were selected.
Изобретатели оценивали такие мутации в SaCas9 так же, как описано для SpCas9. Отбирали особенно предпочтительные мутации с усиленной целевой активностью.The inventors evaluated such mutations in SaCas9 in the same way as described for SpCas9. Particularly favorable mutations with enhanced target activity were selected.
Изобретатели расширили зону модификаций на незаряженные аминокислоты, расположенные вблизи бороздки между доменами RuvC-III и HNH SpCas9 и за ее пределами. И в этом случае эффект этих изменений в отношении образования вставок/делеций в целевых локусах оценивали с помощью анализа с использованием нуклеазы SURVEYOR, как описано выше. Отбирали предпочтительные мутации с повышенной/усиленной целевой активностью по сравнению с немодифицированным ферментом. Аналогичные анализы проводили для SaCas9.The inventors extended the modification zone to uncharged amino acids located near the groove between the RuvC-III and HNH domains of SpCas9 and beyond. Again, the effect of these changes on the formation of insertions/deletions at the target loci was assessed using the SURVEYOR nuclease assay as described above. Favorable mutations with increased/enhanced target activity compared to the unmodified enzyme were selected. Similar analyses were performed for SaCas9.
Изобретатели комбинировали мутации SpCas9, которые демонстрировали усиленную целевую активность, с мутациями, которые демонстрировали сниженную нецелевую активность. И в этом случае эффект этих изменений в отношении образования вставок/делеций в целевых локусах оценивали с помощью анализа с использованием нуклеазы SURVEYOR, как описано выше. Отбирали особенно предпочтительные мутации с повышенной/усиленной целевой активностью и сниженной нецелевой активностью по сравнению с немодифицированным ферментом. Аналогичные анализы проводили для SpCas9.The inventors combined SpCas9 mutations that showed enhanced on-target activity with mutations that showed reduced off-target activity. Again, the effect of these changes on insertion/deletion formation at target loci was assessed using the SURVEYOR nuclease assay described above. Particularly favorable mutations with increased/enhanced on-target activity and reduced off-target activity compared to the unmodified enzyme were selected. Similar assays were performed for SpCas9.
Пример 10. Анализ мутантов SpCas9 (множественные целевые последовательности)Example 10. Analysis of SpCas9 mutants (multiple target sequences)
Три мутанта, K855A (одиночная мутация), а также TM14 и TM15 (оба тройных мутанта), тестировали в отношении образования вставок/делеций с применением целевых последовательностей EMX101, EMX1.1, EMX1.2, EMX1.3, EMX1.8, EMX1.10, DNMT1.1, DNMT1.2, DNMT1.4, DNMT1.7, VEGFA4, VEGFA5 и VEGFA3. Как показано на фигуре 10, для всех трех мутантов показана активность в отношении мишени и низкая нецелевая активность в отношении OT4.Three mutants, K855A (single mutation) and TM14 and TM15 (both triple mutants), were tested for insertion/deletion formation using the target sequences of EMX101, EMX1.1, EMX1.2, EMX1.3, EMX1.8, EMX1.10, DNMT1.1, DNMT1.2, DNMT1.4, DNMT1.7, VEGFA4, VEGFA5, and VEGFA3. As shown in Figure 10, all three mutants showed on-target activity and low off-target activity against OT4.
Расширенную группу из одиночных, двойных и тройных мутантов тестировали в отношении образования вставок/делеций с применением целевых последовательностей EMX101, EMX1.1, EMX1.2, EMX1.3, EMX1.8, EMX1.10, DNMT1.1, DNMT1.2, DNMT1.4, DNMT1.7, VEGFA4, VEGFA5 и VEGFA3. Мутанты включали E779L, R780A, K810A, K848A, K855A, R976A, H982A, DM11, DM17, DM19, DM20, DM23, DM24, DM25, DM35, DM40, TM14, TM15 и TM16. На фигуре 11 обобщена активность в отношении целевой последовательности и нецелевая активность в отношении OT4. Таким образом, наблюдалось снижение активности в отношении почти всех оцененных нецелевых локусов генома, а также в отношении обширной панели несовпадающих направляющих.An expanded panel of single, double, and triple mutants were tested for insertion/deletion formation using target sequences of EMX101, EMX1.1, EMX1.2, EMX1.3, EMX1.8, EMX1.10, DNMT1.1, DNMT1.2, DNMT1.4, DNMT1.7, VEGFA4, VEGFA5, and VEGFA3. Mutants included E779L, R780A, K810A, K848A, K855A, R976A, H982A, DM11, DM17, DM19, DM20, DM23, DM24, DM25, DM35, DM40, TM14, TM15, and TM16. Figure 11 summarizes the on-target and off-target activity for OT4. Thus, decreased activity was observed at nearly all off-target loci assessed in the genome, as well as at a large panel of mismatched guides.
Пример 11. Анализ мутантов SpCas9 (целевая последовательность VEGFA3 и нецелевые последовательности)Example 11. Analysis of SpCas9 mutants (VEGFA3 target sequence and non-target sequences)
Получали несколько мутантных модифицированных ферментов SpCas9 и тестировали их в отношении образования вставок/делеций с применением целевой последовательности, которая представляет собой последовательность из гена VEGFA3. Модифицированные ферменты SpCas9, протестированные в данном примере, включали:Several mutant modified SpCas9 enzymes were generated and tested for insertion/deletion formation using a target sequence that is a sequence from the VEGFA3 gene. The modified SpCas9 enzymes tested in this example included:
R780AR780A
K848AK848A
K1000AK1000A
K848A R1060AK848A R1060A
R780A R1114AR780A R1114A
H982A K1003A R1060AH982A K1003A R1060A
R63A K848A R1060AR63A K848A R1060A
R63A K855A R1060A E610GR63A K855A R1060A E610G
K1107AK1107A
T13I R63A K810AT13I R63A K810A
R63A K855AR63A K855A
R63A H982AR63A H982A
G12D R63A R1060AG12D R63A R1060A
H415A K848AH415A K848A
H415A K848AH415A K848A
R780A R1114AR780A R1114A
K848A K1107AK848A K1107A
K848A E1108AK848A E1108A
S1109AS1109A
R63A E610G K855A R1060AR63A E610G K855A R1060A
R63A K848A R1060AR63A K848A R1060A
Как показано на фигурах 12 и 13, для нескольких мутантов показано значительное снижение активности в отношении одного или нескольких из трех нецелевых локусов OT1, OT4 и OT18 по сравнению с ферментом дикого типа. Для нескольких мутантов дополнительно показано снижение активности в отношении всех трех нецелевых локусов по сравнению с ферментом дикого типа. Они включали:As shown in Figures 12 and 13, several mutants showed significant reductions in activity at one or more of the three off-target loci OT1, OT4, and OT18 compared to the wild-type enzyme. Several mutants additionally showed reductions in activity at all three off-target loci compared to the wild-type enzyme. These included:
R780A R1114AR780A R1114A
H982A K1003A K1129EH982A K1003A K1129E
R63A K855A R1060A E610GR63A K855A R1060A E610G
K1107AK1107A
R63A K855AR63A K855A
R63A H982AR63A H982A
K848A K1107AK848A K1107A
R63A E610G K855A R1060AR63A E610G K855A R1060A
R63A K848A R1060AR63A K848A R1060A
Пример 12. Анализ мутантов SpCas9 (целевая последовательность EMX1.3 и нецелевые последовательности)Example 12. Analysis of SpCas9 mutants (EMX1.3 target sequence and non-target sequences)
Несколько мутантных модифицированных ферментов SpCas9 тестировали в отношении образования вставок/делеций с применением целевой последовательности, которая представляет собой последовательность EMX1.3. Модифицированные ферменты SpCas9, протестированные в данном примере, включали:Several mutant modified SpCas9 enzymes were tested for insertion/deletion formation using the target sequence, which is the EMX1.3 sequence. The modified SpCas9 enzymes tested in this example included:
N14KN14K
E779LE779L
E809KE809K
L813RL813R
S845KS845K
L847RL847R
D849AD849A
D861KD861K
E977KE977K
I978KI978K
N979LN979L
N980KN980K
Как показано на фигуре 14, для определенных мутантов показана высокая целевая активность, а среди них отличия в специфичности относительно нецелевых последовательностей OT14, OT23, OT35, OT46 и OT53. Для определенных мутантов продемонстрирована более высокая специфичность, чем у дикого типа, для других продемонстрирована высокая активность в отношении нецелевых последовательностей.As shown in Figure 14, certain mutants showed high target activity, and among them, differences in specificity for the off-target sequences OT14, OT23, OT35, OT46, and OT53. Certain mutants showed higher specificity than the wild type, while others showed high activity for the off-target sequences.
Пример 13. Анализ мутантов SpCas9 (целевая последовательность EMX1.3)Example 13. Analysis of SpCas9 mutants (EMX1.3 target sequence)
Несколько мутантных модифицированных ферментов SpCas9 тестировали в отношении образования вставок/делеций с применением направляющих с несовпадениями, причем целевая последовательность представляет собой последовательность EMX1.3. Три модифицированных фермента SpCas9, протестированные в данном примере, включали:Several mutant modified SpCas9 enzymes were tested for insertion/deletion formation using mismatch guides, with the target sequence being the EMX1.3 sequence. The three modified SpCas9 enzymes tested in this example were:
K855AK855A
K810A, K1003A, R1060AK810A, K1003A, R1060A
K848A, K1003A, R1060AK848A, K1003A, R1060A
Результаты показаны на фигуре 15.The results are shown in Figure 15.
Пример 14. Усиленные мутанты Cas9 характеризуются высокой активностью и специфичностьюExample 14. Enhanced Cas9 mutants are characterized by high activity and specificity
У шести из 29 точечных мутантов нецелевая активность снижалась по меньшей мере в 10 раз по сравнению с SpCas9 дикого типа (WT), при этом сохранялась эффективность целевого расщепления, а у 6 других специфичность улучшалась в 2-5 раз. У этих мутантов также проявлялась усиленная специфичность при тестировании на втором локусе, VEGFA(1) (фиг. 15D). Хотя некоторые точечные мутанты были более специфичными, чем SpCas9 WT при нацеливании на EMX1(1) и VEGFA(1), нецелевые вставки/делеции все еще обнаруживались (~0,1%) (фиг. 15D). Для дальнейшего улучшения специфичности заявители осуществляли комбинационный мутагенез с применением лучших точечных мутантов, идентифицированных в ходе первоначального скрининга. Восемь из 35 комбинационных мутантов сохраняли целевую активность, присущую дикому типу, и демонстрировали необнаруживаемые уровни нецелевых вставок/делеций в EMX1(1) OT1, VEGFA(1) OT1 и VEGFA(2) OT2 (фиг. 15E). Чтобы убедиться в том, что наблюдаемое повышение специфичности не было обусловлено сниженной целевой активностью, заявители измерили образование целевых вставок/делеций в 10 целевых локусах с применением 16 лучших мутантов (фиг. 15F), определенных по комбинации целевой и нецелевой активности. Заявители наблюдали высокую эффективность и специфичность в случае трех мутантов: SpCas9 (K855A), SpCas9 (K810A/K1003A/R1060A) (также называемого eSpCas9(1.0)) и SpCas9 (K848A/K1003A/R1060A) (также называемого eSpCas9(1.1)). Эти три варианта выбрали для дальнейшего анализа.Six of the 29 point mutants had at least 10-fold reduced off-target activity compared to wild-type (WT) SpCas9 while maintaining on-target cleavage efficiency, and 6 others had improved specificity by 2-5-fold. These mutants also exhibited enhanced specificity when tested at a second locus, VEGFA(1) (Fig. 15D). Although some point mutants were more specific than WT SpCas9 in targeting EMX1(1) and VEGFA(1), off-target insertions/deletions were still detected (~0.1%) (Fig. 15D). To further improve specificity, we performed combinatorial mutagenesis using the best point mutants identified in the initial screen. Eight of the 35 combination mutants retained wild-type on-target activity and exhibited undetectable levels of off-target insertions/deletions in EMX1(1) OT1, VEGFA(1) OT1, and VEGFA(2) OT2 (Fig. 15E). To ensure that the observed increase in specificity was not due to reduced on-target activity, we measured on-target insertion/deletion formation at 10 target loci using the top 16 mutants (Fig. 15F), determined by a combination of on-target and off-target activity. The applicants observed high efficiency and specificity in the case of three mutants: SpCas9(K855A), SpCas9(K810A/K1003A/R1060A) (also called eSpCas9(1.0)) and SpCas9(K848A/K1003A/R1060A) (also called eSpCas9(1.1)). These three variants were selected for further analysis.
Для оценки того, сохраняли ли в целом SpCas9 (K855A), eSpCas9(1.0) и eSpCas9(1.1) эффективную нуклеазную активность, заявители измеряли образование целевых вставок/делеций в 24 целевых сайтах, охватывающих 10 различных локусов генома (фиг. 16A). Все три мутанта обеспечивали уровни вставок/делеций, аналогичные таковым для SpCas9 WT, в случае большинства целевых сайтов (фиг. 16B). Для тестирования того, могли ли улучшения специфичности быть объяснены сниженной экспрессией Cas9, заявители осуществили вестерн-блоттинг в отношении SpCas9 и обнаружили, что все три мутанта экспрессировались эквивалентно или на более высоких уровнях, чем SpCas9 WT (фиг. 16C). Это показало,что улучшения специфичности не были обусловлены сниженными уровнями экспрессии белка.To assess whether SpCas9(K855A), eSpCas9(1.0), and eSpCas9(1.1) generally retained efficient nuclease activity, we measured the formation of targeted insertions/deletions at 24 target sites spanning 10 different genomic loci (Figure 16A). All three mutants produced insertion/deletion levels similar to SpCas9 WT at most target sites (Figure 16B). To test whether the improvements in specificity could be explained by reduced Cas9 expression, we performed Western blotting on SpCas9 and found that all three mutants were expressed at levels equivalent to or higher than SpCas9 WT (Figure 16C). This demonstrated that the improvements in specificity were not due to reduced protein expression levels.
Затем заявители сравнили специфичность трех мутантов с SpCas9 WT с применением усеченных направляющих последовательностей (18 нуклеотидов для EMX1(1) и 17 нуклеотидов для VEGFA(1)), что, как было показано, снижает образование нецелевых вставок/делеций. Для всех трех мутантов наблюдали сниженное расщепление во всех оцененных нецелевых сайтах. Более того, eSpCas9(1.0) и eSpCas9(1.1) приводили к исключению 20 из 24 этих сайтов. В отличие от этого, SpCas9 WT с усеченными направляющими приводил к исключению 14 из 24 сайтов, но также к повышению нецелевой активности в 5 сайтах по сравнению с SpCas9 WT с направляющими полной длины.We then compared the specificity of the three mutants with WT SpCas9 using truncated guide sequences (18 nt for EMX1(1) and 17 nt for VEGFA(1)), which have been shown to reduce the formation of off-target insertions/deletions. All three mutants showed reduced cleavage at all off-target sites assessed. Moreover, eSpCas9(1.0) and eSpCas9(1.1) resulted in the exclusion of 20 of 24 of these sites. In contrast, WT SpCas9 with truncated guides resulted in the exclusion of 14 of 24 sites, but also increased off-target activity at 5 sites compared to WT SpCas9 with full-length guides.
Для оценки толерантности SpCas9 (K855A), eCas9(1.0) и eCas9(1.1) в отношении целевых сайтов с несовпадениями заявители систематически осуществляли мутирование направляющей последовательности VEGFA(1) для введения несовпадений одиночных и двойных оснований в различные положения (фиг. 17A-C). По сравнению с SpCas9 WT все три мутанта индуцировали более низкие уровни вставок/делеций при применении направляющих с несовпадениями. Следует отметить, что eSpCas9(1.0) и eSpCas9(1.1) индуцировали более низкие уровни вставок/делеций даже при несовпадениях одиночного основания, расположенных за пределами 7-12 п. о. затравочной последовательности. С учетом того, что заявители не наблюдали никаких отличий между eSpCas9(1.0) и eSpCas9(1.1) с точки зрения специфичности, SpCas9 (K855A) и eSpCas9(1.1) выбрали для дальнейшего анализа на основании целевой эффективности.To assess the tolerance of SpCas9(K855A), eCas9(1.0), and eCas9(1.1) to mismatch target sites, we systematically mutated the VEGFA(1) guide sequence to introduce single and double base mismatches at different positions (Fig. 17A-C). Compared to SpCas9 WT, all three mutants induced lower insertion/deletion rates when using mismatch guides. Notably, eSpCas9(1.0) and eSpCas9(1.1) induced lower insertion/deletion rates even at single base mismatches located outside the 7-12 bp of the seed sequence. Given that the applicants did not observe any differences between eSpCas9(1.0) and eSpCas9(1.1) in terms of specificity, SpCas9(K855A) and eSpCas9(1.1) were selected for further analysis based on target potency.
Специфичность полногеномного редактирования с помощью SpCas9 (K855A) и eSpCas9(1.1) оценивали с применением BLESS (прямое in situ мечение разрывов, обогащение на стрептавидине и секвенирование нового поколения, с помощью которого количественно оценивают двухнитевых разрывы (DSB) ДНК по всему геному (фиг. 17A). Клетки собирали через примерно 24 ч. после трансфекции и проводили BLESS. Вкратце, всего 10 миллионов клеток фиксировали для выделения ядер и пермеабилизации и затем обрабатывали с помощью протеиназы K в течение 4 мин. при 37°C перед инактивацией с помощью PMSF. DSB в подвергнутых депротеинизации ядрах метили с помощью 200 мМ гибридизируемых проксимальных линкеров в течение ночи. После расщепления подвергнутых мечению ядер с помощью протеиназы K, хроматин механически рассекали с помощью 26G иглы перед обработкой ультразвуком (BioRuptor, 20 мин. на высокой скорости, 50% коэффициент заполнения). В общей сложности 20 мкг рассеченного хроматина захватывали на гранулах со стрептавидином, промывали и лигировали с 200 мМ дистального линкера. Линкерные шпильки затем отщепляли с помощью расщепления под действием I-SceI в течение 4 ч. при 37°C, и продукты подвергали обогащению с помощью ПЦР на протяжении 18 циклов перед переходом к получению библиотеки с помощью набора TruSeq Nano LT (Illumina). Для получения отрицательного контроля клетки подвергали ложной трансфекции с помощью Lipofectamine 2000 и ДНК pUC19 и обрабатывали параллельно на протяжении анализа.The specificity of whole-genome editing by SpCas9(K855A) and eSpCas9(1.1) was assessed using BLESS (direct in situ break labeling, streptavidin enrichment, and next-generation sequencing), which quantifies DNA double-strand breaks (DSBs) throughout the genome (Fig. 17A). Cells were harvested approximately 24 h post-transfection and BLESS was performed. Briefly, a total of 10 million cells were fixed for nuclear isolation and permeabilization and then treated with proteinase K for 4 min at 37°C before inactivation with PMSF. DSBs in stripped nuclei were labeled with 200 mM hybridizable proximal linkers overnight. Following digestion of labeled nuclei with proteinase K, chromatin was mechanically sheared with a 26G needle before sonication (BioRuptor, 20 min at high speed, 50% fill factor). A total of 20 μg of sheared chromatin was captured on streptavidin beads, washed, and ligated with 200 mM distal linker. Linker hairpins were then cleaved by I-SceI digestion for 4 h at 37°C, and products were enriched by PCR for 18 cycles before proceeding to library preparation using the TruSeq Nano LT kit (Illumina). As a negative control, cells were mock transfected with Lipofectamine 2000 and pUC19 DNA and processed in parallel throughout the assay.
Расчет балла DSB для отделения фоновых DSB от истинных разрывов, индуцированных Cas9, проводили как описано ранее (Ran et al, Nature 2015), и сортировка локусов на основании балла DSB выявила главные нецелевые сайты, которые были ранее идентифицированы для этих мишеней sgRNA. Чтобы обеспечить дополнительную возможность обнаружения за пределами этих главных нецелевых локусов, исходя из предварительных данных Cas9-BLESS, авторами настоящего изобретения было обнаружено, что алгоритм поиска гомологии мог помочь дополнительно идентифицировать настоящие DSB, индуцированные Cas9. С помощью алгоритма поиска гомологии осуществляли поиск направляющей последовательности с самым лучшим совпадением в пределах участка генома длиной 50 нуклеотидов по обе стороны от середины кластера DSB, идентифицированного в BLESS, для всех последовательностей PAM, представляющих собой NGG и NAG. Балл, основанный на гомологии, рассчитывали с помощью следующих весовых значений: совпадение между sgRNA и последовательностью генома дает балл +3, несовпадение составляет -1, тогда как вставка или делеция между sgRNA и последовательностью генома оценивается в -5. В связи с этим, целевая последовательность с полной направляющей длиной 20 п. о. + PAM будет иметь балл 69. Конечный балл гомологии для кластера DSB устанавливали как максимальный балл для всех возможных последовательностей. Путем применения этих взвешенных значений было эмпирически обнаружено, что истинные нецелевые локусы (для которых вставки/делеции идентифицировали с помощью нацеленного глубокого секвенирования) и фоновые DSB полностью разделялись, когда для балла гомологии применяли граничное значение >50. Применение данного критерия гомологии в отношении 200 главных локусов DSB, определенных с помощью BLESS, позволило дополнительно отличать нецелевые локусы от фоновых DSB.Calculation of DSB score to separate background DSBs from true Cas9-induced breaks was performed as described previously (Ran et al, Nature 2015), and sorting of loci based on DSB score identified top off-target sites that had been previously identified for these sgRNA targets. To provide additional detection capability beyond these top off-target loci, based on preliminary Cas9-BLESS data, we found that a homology search algorithm could further identify true Cas9-induced DSBs. The homology search algorithm searched for the best-matching guide sequence within a 50-nt genomic region on either side of the middle of the DSB cluster identified in BLESS for all PAM sequences representing NGG and NAG. The homology-based score was calculated using the following weighting values: a match between sgRNA and genomic sequence gives a score of +3, a mismatch is -1, while an insertion or deletion between sgRNA and genomic sequence is scored as -5. Therefore, a target sequence with a full 20 bp guide length + PAM would have a score of 69. The final homology score for a DSB cluster was set as the maximum score for all possible sequences. By applying these weighting values, it was empirically found that true off-target loci (for which insertions/deletions were identified by targeted deep sequencing) and background DSBs were completely separated when a cutoff value of >50 was applied for the homology score. Applying this homology criterion to the top 200 DSB loci identified by BLESS allowed further discrimination of off-target loci from background DSBs.
Заявители проанализировали действие обоих мутантов на мишени EMX1(1) и VEGFA(1) и сравнили эти результаты с SpCas9 WT (фиг. 17B). Оба SpCas9(K855A) и eSpCas9(1.1) проявляли снижение нецелевого полногеномного расщепления и не приводили к образованию каких-либо новых нецелевых сайтов (фиг. 17C-D).Applicants analyzed the effects of both mutants on the EMX1(1) and VEGFA(1) targets and compared these results with SpCas9 WT (Fig. 17B). Both SpCas9(K855A) and eSpCas9(1.1) exhibited a reduction in off-target whole-genome cleavage and did not result in the formation of any new off-target sites (Fig. 17C-D).
Пример 15. Механизм нацеливания и нуклеазная активность Cas9Example 15. Targeting mechanism and nuclease activity of Cas9
Нецелевое разрезание происходит, когда сила связывания Cas9 с не подвергаемой нацеливанию нитью ДНК превышает силы повторной гибридизации ДНК. В соответствии с данной моделью, мутации, разработанные для ослабления взаимодействий между Cas9 и некомплементарной нитью ДНК, приводят к существенному улучшению специфичности. Модель также позволяет предположить, что, наоборот, специфичность может быть снижена путем усиления взаимодействий между Cas9 и не подвергаемой нацеливанию нитью. В соответствии с данной моделью получали два мутанта, S845K и L847R, каждый из которых проявлял сниженную специфичность (фиг. 24).Off-target cleavage occurs when the binding strength of Cas9 to the non-targeted DNA strand exceeds the DNA rehybridization forces. According to this model, mutations designed to weaken interactions between Cas9 and the non-complementary DNA strand result in significant improvements in specificity. The model also suggests that, conversely, specificity can be reduced by strengthening interactions between Cas9 and the non-targeted strand. Two mutants, S845K and L847R, were generated according to this model, each of which exhibited reduced specificity (Fig. 24).
Пример 16. Специфичность Cas9 Staphylococcus aureus (SaCas9)Example 16. Specificity of Staphylococcus aureus Cas9 (SaCas9)
Аналогичные стратегии также можно применять для других белков семейства Cas9. Версию Cas9 (SaCas9) Staphylococcus aureus с улучшенной специфичностью получали аналогично eSpCas9. Мутантов по одиночным и двойным аминокислотным остаткам в бороздке между доменами RuvC и HNH подвергали скринингу на сниженное нецелевое разрезание. Мутантов с улучшенной специфичностью комбинировали с получением варианта SaCas9, который сохранял целевое разрезание сайта 7 EMX и характеризовался значительно сниженным нецелевым разрезанием (фиг. 25). На кристаллической структуре SaCas9 показана бороздка между доменами HNH и RuvC, которую подвергали мутированию для конструирования нуклеаз с улучшенной специфичностью.Similar strategies can also be applied to other Cas9 family proteins. A specificity-enhanced version of Staphylococcus aureus Cas9 (SaCas9) was generated in a manner similar to eSpCas9. Single and double amino acid residue mutants in the groove between the RuvC and HNH domains were screened for reduced off-target cleavage. The specificity-enhanced mutants were combined to generate a SaCas9 variant that retained on-target cleavage of EMX site 7 and had significantly reduced off-target cleavage (Fig. 25). The crystal structure of SaCas9 shows the groove between the HNH and RuvC domains mutated to construct nucleases with improved specificity.
Пример 17. Активация HBG1Example 17. Activation of HBG1
Комплексы, содержащие мутанты spCas9 или spCas9 c различными направляющими РНК, тестировали в отношении активации HBG1. На фигуре 31 показана активация под действием комплексов, содержащих молекулы Cas9, лишенные нуклеазной активности (например, dCas9, R780A/K810A и R780A/K855A; см. также фиг. 4), или под действием комплексов с нуклеаза-компетентными Cas9 (например, немутированными spCas9 (px165), R780A, K810A или K848A с укороченными (т.е. "длиной 15 п. о.") направляющими РНК. Мутант R780A является исключительным в том, что демонстрирует активацию при применении всех трех протестированных направляющих.Complexes containing spCas9 mutants or spCas9 with different guide RNAs were tested for HBG1 activation. Figure 31 shows activation by complexes containing Cas9 molecules lacking nuclease activity (e.g., dCas9, R780A/K810A, and R780A/K855A; see also Figure 4) or by complexes with nuclease-competent Cas9 (e.g., unmutated spCas9(px165), R780A, K810A, or K848A with truncated (i.e., "15 bp long") guide RNAs. The R780A mutant is exceptional in that it shows activation with all three guides tested.
Приме 18. Опосредованная частицами доставка компонентов CRISPR-Cas9 в гемопоэтические стволовые клетки (HSC)Example 18. Particle-mediated delivery of CRISPR-Cas9 components to hematopoietic stem cells (HSC)
Заявители продемонстрировали, что Cas9 может быть доставлен в клетки посредством частиц. Для многих терапевтических средств на основе нуклеиновой кислоты может требоваться одновременная доставка как одной или нескольких sgRNA, так и нуклеазы Cas9. В соответствии с этим, заявители продемонстрировали возможность доставки комплекса из модифицированного фермента Cas9 и sgRNA таким способом.Applicants have demonstrated that Cas9 can be delivered into cells via particles. Many nucleic acid-based therapeutics may require the simultaneous delivery of both one or more sgRNAs and the Cas9 nuclease. Accordingly, applicants have demonstrated the feasibility of delivering a complex of modified Cas9 enzyme and sgRNA in this manner.
Модифицированный фермент Cas9 тестировали при совместной доставке с одной или несколькими направляющими РНК в клетки посредством частиц. sgRNA, нацеливающуюся на ген EMX1, смешивали с eSpCas9(1.1) (K848A, K1003A, R1060A) при молярном соотношении 1:1 при комнатной температуре в течение 30 минут в стерильном, не содержащем нуклеаз 1X PBS. Контроль представлял собой ту же sgRNA, смешанную с SpCas9. Отдельно в 100% этаноле растворяли DOTAP, DMPC, PEG и холестерин. Два раствора смешивали вместе с образованием частиц, содержащих комплексы Cas9-sgRNA. После образования частиц HSC в 96-луночных планшетах трансфицировали с помощью 15 мкг белка Cas9 на лунку. Через три дня после трансфекции HSC собирали и оценивали специфичность полногеномного редактирования с применением BLESS, а нецелевые локусы идентифицировали с помощью алгоритма поиска гомологии. Количественно оценивали число целевых вставок и делеций (вставок/делеций) в локусе EMX1 и вставок/делеций в множественных нецелевых сайтах. eSpCas9(1.1) проявлял снижение полногеномного нецелевого расщепления и отсутствие новых нецелевых сайтов.The modified Cas9 enzyme was tested for co-delivery with one or more guide RNAs into cells via particles. sgRNA targeting the EMX1 gene was mixed with eSpCas9(1.1) (K848A, K1003A, R1060A) at a 1:1 molar ratio at room temperature for 30 min in sterile, nuclease-free 1X PBS. The control was the same sgRNA mixed with SpCas9. DOTAP, DMPC, PEG, and cholesterol were dissolved separately in 100% ethanol. The two solutions were mixed together to form particles containing Cas9-sgRNA complexes. After particle formation, HSCs in 96-well plates were transfected with 15 μg Cas9 protein per well. Three days after transfection, HSCs were harvested and the specificity of whole-genome editing was assessed using BLESS, and off-target loci were identified using a homology search algorithm. The number of on-target insertions and deletions (I/D) at the EMX1 locus and I/D at multiple off-target sites were quantified. eSpCas9(1.1) exhibited reduced whole-genome off-target cleavage and no new off-target sites.
Пример 19. Опосредованная частицами доставка компонентов CRISPR-Cas9 в гемопоэтические стволовые клетки (HSC) и репарация HBBExample 19. Particle-mediated delivery of CRISPR-Cas9 components to hematopoietic stem cells (HSCs) and HBB repair
Две sgRNA, нацеливающиеся на последовательности по обе стороны от обычной точечной мутации GAG->GTG в гене бета-глобина (HBB), смешивали с eSpCas9(1.1) (K848A, K1003A, R1060A) при молярном соотношении sgRNA и фермента, составляющем 1:1, при комнатной температуре в течение 30 минут в стерильном, не содержащем нуклеаз 1X PBS. Контроль представлял собой ту же sgRNA, смешанную с SpCas9. Отдельно в 100% этаноле растворяли DOTAP, DMPC, PEG и холестерин. Эти два раствора и нуклеиновую кислоту-матрицу для исправления точечной мутации GAG->GTG смешивали для образования частиц, содержащих комплексы Cas9-sgRNA и матрицу. После образования частиц HSC в 96-луночных планшетах трансфицировали с помощью 15 мкг белка Cas9 на лунку. Через три дня после трансфекции HSC собирали и тестировали в отношении репарации точечной мутации GAG->GTG. Затем подвергнутые исправлению клетки оценивали в отношении специфичности полногеномного редактирования с применением BLESS, а нецелевые локусы идентифицировали с помощью алгоритма поиска гомологии. Количественно оценивали вставки/делеции в множественных нецелевых сайтах. eSpCas9(1.1) проявлял снижение полногеномного нецелевого расщепления и отсутствие новых нецелевых сайтов.Two sgRNAs targeting sequences on either side of the common GAG->GTG point mutation in the beta globin (HBB) gene were mixed with eSpCas9(1.1) (K848A, K1003A, R1060A) at a 1:1 molar ratio of sgRNA to enzyme at room temperature for 30 min in sterile nuclease-free 1X PBS. The control was the same sgRNA mixed with SpCas9. DOTAP, DMPC, PEG, and cholesterol were separately dissolved in 100% ethanol. These two solutions and the template nucleic acid to correct the GAG->GTG point mutation were mixed to form particles containing Cas9-sgRNA complexes and template. Following particle formation, HSCs in 96-well plates were transfected with 15 μg Cas9 protein per well. Three days post-transfection, HSCs were harvested and tested for GAG->GTG point mutation repair. Corrected cells were then assessed for whole-genome editing specificity using BLESS and off-target loci were identified using a homology search algorithm. Insertions/deletions at multiple off-target sites were quantified. eSpCas9(1.1) exhibited reduced whole-genome off-target cleavage and no new off-target sites.
Таблица направляющих последовательностей и праймеров для NGSTable of guide sequences and primers for NGS
SpCas9 дикого типаSpCas9 wild type
ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAAATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCC CAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGAT ACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGG CACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCC CACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGC CAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGG GCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTT CTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTG CTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCC CATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCA TTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGAAACAGCAGATTCGCCTGGATG ACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCC AAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTT CAAGACCAACCGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCT GCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAAACCTATGCCC ACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGT CCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCC GGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAA GGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACC TGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAA GCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCC GAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGAC AAGCTGATCCGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGC CGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAA GTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGG ATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGA AAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGAT CACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCG GAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGC AGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACC GGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAG GTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAA
>K855A>K855A
ATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACGCGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAAATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACA GCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCC CTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACG ACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTAGAGA AAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGC TGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAG CTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACG ACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTG AGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCT ACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGAC AACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCGCATCCCCTACT ACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATG ACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCC TGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAA GATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACA GAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAG CAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGCG ATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAA ATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGC AGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCC ATCGACAACGCGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAA AGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAAC ACTAAGTACGACGAGAATGACAAGCTGATCCGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCC ACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATC GGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAAACGGCGAAACCGGGGAGATCGTGT GGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAG CTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGC TGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAA AACGGCCGGAAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATA ATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAG CACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAG AGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAA
eSpCas9(1.0)eSpCas9(1.0)
ATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGGCCCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTGCGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGGCGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACA GCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGC CCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGAC GACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAG AAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAG CTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCA GCTGCCCGGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGAC GACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCT GAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGC TACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCG ACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTA CTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGA TGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTT CCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGG AAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGA CAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACA AGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGG CGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATC GAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGC TGCAGAACGAGGCCCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGAC TCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGA GAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATG AACACTAAGTACGACGAGAATGACAAGCTGATCCGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACG CCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTGCGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAA ATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGGCGCCTCTGATCGAGACAAAACGGCGAAACCGGGGAGATCG TGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGAT AAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAG AGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTG GAAAACGGCCGGAAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGG ATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAAC AAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCA AAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG
eSpCas9(1.1)eSpCas9(1.1)
ATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGGCGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTGCGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGGCGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAAATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACA GCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCC CTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACG ACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTAGAGA AAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGC TGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAG CTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACG ACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTG AGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCT ACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGAC AACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCGCATCCCCTACT ACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATG ACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCC TGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAA GATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACA GAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAG CAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGCG ATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAA ATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGC AGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGGCGGACGACTCC ATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAA AGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAAC ACTAAGTACGACGAGAATGACAAGCTGATCCGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCC ACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTGCGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATC GGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGGCGCCTCTGATCGAGACAAAACGGCGAAACCGGGGAGATCGTGT GGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAG CTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGC TGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAA AACGGCCGGAAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATA ATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAG CACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAG AGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAA
Имея, таким образом, подробное описание предпочтительных вариантов осуществления настоящего изобретения, следует понимать, что настоящее изобретение, определяемое в вышеприведенных разделах, не должно ограничиваться конкретными деталями, изложенными в вышеприведенном описании, поскольку возможны их многочисленные очевидные варианты без отступления от сущности или объема настоящего изобретения.Having thus described in detail the preferred embodiments of the present invention, it is to be understood that the present invention, as defined in the foregoing sections, should not be limited to the specific details set forth in the foregoing description, since many obvious variations thereof are possible without departing from the spirit or scope of the present invention.
--->--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE LIST
<110> THE BROAD INSTITUTE, INC.<110> THE BROAD INSTITUTE, INC.
MASSACHUSETTS INSTITUTE OF TECHNOLOGY MASSACHUSETTS INSTITUTE OF TECHNOLOGY
<120> МУТАЦИИ ФЕРМЕНТА CRISPR, УМЕНЬШАЮЩИЕ НЕЦЕЛЕВЫЕ ЭФФЕКТЫ<120> CRISPR MUTATIONS THAT REDUCE OFF-TARGET EFFECTS
<130> 47627.99.2017<130> 47627.99.2017
<140><140>
<141><141>
<150> 62/269,876<150> 62/269,876
<151> 2015-12-18<151> 2015-12-18
<150> 62/255,256<150> 62/255,256
<151> 2015-11-13<151> 2015-11-13
<150> 62/237,360<150> 62/237,360
<151> 2015-10-05<151> 2015-10-05
<150> 62/207,312<150> 62/207,312
<151> 2015-08-19<151> 2015-08-19
<150> 62/181,453<150> 62/181,453
<151> 2015-06-18<151> 2015-06-18
<160> 547<160> 547
<170> PatentIn версия 3.5<170> PatentIn version 3.5
<210> 1<210> 1
<211> 4<211> 4
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности:<223> /note="Description of artificial sequence:
синтетический пептид"synthetic peptide"
<400> 1<400> 1
Gly Gly Gly SerGly Gly Gly Ser
11
<210> 2<210> 2
<211> 15<211> 15
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности:<223> /note="Description of artificial sequence:
синтетический пептид"synthetic peptide"
<400> 2<400> 2
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly SerGly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 151 5 10 15
<210> 3<210> 3
<211> 30<211> 30
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический полипептид"synthetic polypeptide"
<400> 3<400> 3
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser GlyGly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 151 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly SerGly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25 3020 25 30
<210> 4<210> 4
<211> 45<211> 45
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический полипептид"synthetic polypeptide"
<400> 4<400> 4
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser GlyGly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 151 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly GlyGly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 3020 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly SerGly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
35 40 4535 40 45
<210> 5<210> 5
<211> 60<211> 60
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический полипептид"synthetic polypeptide"
<400> 5<400> 5
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser GlyGly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 151 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly GlyGly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 3020 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly GlyGly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
35 40 4535 40 45
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly SerGly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
50 55 6050 55 60
<210> 6<210> 6
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(20)<222> (1)..(20)
<223> a, c, t или g<223> a, c, t or g
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 6<400> 6
nnnnnnnnnn nnnnnnnnnn ngg nnnnnnnnnn nnnnnnnnnn ngg
2323
<210> 7<210> 7
<211> 15<211> 15
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(12)<222> (1)..(12)
<223> a, c, t или g<223> a, c, t or g
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (13)..(13)<222> (13)..(13)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 7<400> 7
nnnnnnnnnn nnngg nnnnnnnnnn nnngg
1515
<210> 8<210> 8
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(20)<222> (1)..(20)
<223> a, c, t или g<223> a, c, t or g
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 8<400> 8
nnnnnnnnnn nnnnnnnnnn ngg nnnnnnnnnn nnnnnnnnnn ngg
2323
<210> 9<210> 9
<211> 14<211> 14
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(11)<222> (1)..(11)
<223> a, c, t или g<223> a, c, t or g
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (12)..(12)<222> (12)..(12)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 9<400> 9
nnnnnnnnnn nngg nnnnnnnnnn nngg
1414
<210> 10<210> 10
<211> 27<211> 27
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(20)<222> (1)..(20)
<223> a, c, t или g<223> a, c, t or g
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(22)<222> (21)..(22)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 10<400> 10
nnnnnnnnnn nnnnnnnnnn nnagaaw nnnnnnnnnn nnnnnnnnnn nnagaaw
2727
<210> 11<210> 11
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(12)<222> (1)..(12)
<223> a, c, t или g<223> a, c, t or g
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (13)..(14)<222> (13)..(14)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 11<400> 11
nnnnnnnnnn nnnnagaaw nnnnnnnnnn nnnnagaaw
1919
<210> 12<210> 12
<211> 27<211> 27
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(20)<222> (1)..(20)
<223> a, c, t или g<223> a, c, t or g
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(22)<222> (21)..(22)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 12<400> 12
nnnnnnnnnn nnnnnnnnnn nnagaaw nnnnnnnnnn nnnnnnnnnn nnagaaw
2727
<210> 13<210> 13
<211> 18<211> 18
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(11)<222> (1)..(11)
<223> a, c, t или g<223> a, c, t or g
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (12)..(13)<222> (12)..(13)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 13<400> 13
nnnnnnnnnn nnnagaaw nnnnnnnnnn nnnagaaw
1818
<210> 14<210> 14
<211> 25<211> 25
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(20)<222> (1)..(20)
<223> a, c, t или g<223> a, c, t or g
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (24)..(24)<222> (24)..(24)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 14<400> 14
nnnnnnnnnn nnnnnnnnnn nggng nnnnnnnnnn nnnnnnnnnn nggng
2525
<210> 15<210> 15
<211> 17<211> 17
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(12)<222> (1)..(12)
<223> a, c, t или g<223> a, c, t or g
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (13)..(13)<222> (13)..(13)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (16)..(16)<222> (16)..(16)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 15<400> 15
nnnnnnnnnn nnnggng nnnnnnnnnn nnnggng
1717
<210> 16<210> 16
<211> 25<211> 25
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(20)<222> (1)..(20)
<223> a, c, t или g<223> a, c, t or g
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (24)..(24)<222> (24)..(24)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 16<400> 16
nnnnnnnnnn nnnnnnnnnn nggng nnnnnnnnnn nnnnnnnnnn nggng
2525
<210> 17<210> 17
<211> 16<211> 16
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(11)<222> (1)..(11)
<223> a, c, t или g<223> a, c, t or g
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (12)..(12)<222> (12)..(12)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (15)..(15)<222> (15)..(15)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 17<400> 17
nnnnnnnnnn nnggng nnnnnnnnnn nnggng
1616
<210> 18<210> 18
<211> 137<211> 137
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический полинуклеотид"synthetic polynucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(20)<222> (1)..(20)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 18<400> 18
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt tagaaataaa tcttgcagaa nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt tagaaataaa tcttgcagaa
6060
gctacaaaga taaggcttca tgccgaaatc aacaccctgt cattttatgg cagggtgttt gctacaaaga taaggcttca tgccgaaatc aacaccctgt cattttatgg cagggtgttt
120120
tcgttattta atttttt tcgttattta atttttt
137137
<210> 19<210> 19
<211> 123<211> 123
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический полинуклеотид"synthetic polynucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(20)<222> (1)..(20)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 19<400> 19
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag
6060
gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttcgt tatttaattt gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttcgt tatttaattt
120120
ttt ttt
123123
<210> 20<210> 20
<211> 110<211> 110
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический полинуклеотид"synthetic polynucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(20)<222> (1)..(20)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 20<400> 20
nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag
6060
gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttttt gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttttt
110110
<210> 21<210> 21
<211> 102<211> 102
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический полинуклеотид"synthetic polynucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(20)<222> (1)..(20)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 21<400> 21
nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc
6060
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tt cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tt
102102
<210> 22<210> 22
<211> 88<211> 88
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(20)<222> (1)..(20)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 22<400> 22
nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc
6060
cgttatcaac ttgaaaaagt gttttttt cgttatcaac ttgaaaaagt gttttttt
8888
<210> 23<210> 23
<211> 76<211> 76
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(20)<222> (1)..(20)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 23<400> 23
nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc
6060
cgttatcatt tttttt cgttatcatt tttttt
7676
<210> 24<210> 24
<211> 7<211> 7
<212> БЕЛОК<212> PROTEIN
<213> Вирус обезьян 40<213> Monkey virus 40
<400> 24<400> 24
Pro Lys Lys Lys Arg Lys ValPro Lys Lys Lys Arg Lys Val
1 51 5
<210> 25<210> 25
<211> 16<211> 16
<212> БЕЛОК<212> PROTEIN
<213> Неустановленное<213> Unspecified
<220><220>
<221> источник<221> source
<223> /примечание="Описание незивестного: Последовательность <223> /note="Description of the unknown: Sequence
двусоставного NLS из нуклеоплазмина""two-part NLS from nucleoplasmin"
<400> 25<400> 25
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys LysLys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 151 5 10 15
<210> 26<210> 26
<211> 9<211> 9
<212> БЕЛОК<212> PROTEIN
<213> Неустановленное<213> Unspecified
<220><220>
<221> источник<221> source
<223> /примечание="Описание незивестного: Последовательность NLS из <223> /note="Description of unknown: NLS sequence from
C-myc"C-myc"
<400> 26<400> 26
Pro Ala Ala Lys Arg Val Lys Leu AspPro Ala Ala Lys Arg Val Lys Leu Asp
1 51 5
<210> 27<210> 27
<211> 11<211> 11
<212> БЕЛОК<212> PROTEIN
<213> Неустановленное<213> Unspecified
<220><220>
<221> источник<221> source
<223> /примечание="Описание незивестного: Последовательность NLS из <223> /note="Description of unknown: NLS sequence from
C-myc"C-myc"
<400> 27<400> 27
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser ProArg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 101 5 10
<210> 28<210> 28
<211> 38<211> 38
<212> БЕЛОК<212> PROTEIN
<213> Homo sapiens<213> Homo sapiens
<400> 28<400> 28
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly GlyAsn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 151 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys ProArg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 3020 25 30
Arg Asn Gln Gly Gly TyrArg Asn Gln Gly Gly Tyr
3535
<210> 29<210> 29
<211> 42<211> 42
<212> БЕЛОК<212> PROTEIN
<213> Неустановленное<213> Unspecified
<220><220>
<221> источник<221> source
<223> /примечание="Описание незивестного: Последовательность домена <223> /note="Description of unknown: Domain sequence
IBB из импортина-альфа"IBB from importin-alpha"
<400> 29<400> 29
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu LeuArg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 151 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys LysArg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 3020 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn ValAsp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 4035 40
<210> 30<210> 30
<211> 8<211> 8
<212> БЕЛОК<212> PROTEIN
<213> Неустановленное<213> Unspecified
<220><220>
<221> источник<221> source
<223> /примечание="Описание незивестного: Последовательность из <223> /note="Description of the unknown: Sequence of
T-белка миомы"T-protein myoma"
<400> 30<400> 30
Val Ser Arg Lys Arg Pro Arg ProVal Ser Arg Lys Arg Pro Arg Pro
1 51 5
<210> 31<210> 31
<211> 8<211> 8
<212> БЕЛОК<212> PROTEIN
<213> Неустановленное<213> Unspecified
<220><220>
<221> источник<221> source
<223> /примечание="Описание незивестного: Последовательность из <223> /note="Description of the unknown: Sequence of
T-белка миомы"T-protein myoma"
<400> 31<400> 31
Pro Pro Lys Lys Ala Arg Glu AspPro Pro Lys Lys Ala Arg Glu Asp
1 51 5
<210> 32<210> 32
<211> 8<211> 8
<212> БЕЛОК<212> PROTEIN
<213> Homo sapiens<213> Homo sapiens
<400> 32<400> 32
Pro Gln Pro Lys Lys Lys Pro LeuPro Gln Pro Lys Lys Lys Pro Leu
1 51 5
<210> 33<210> 33
<211> 12<211> 12
<212> БЕЛОК<212> PROTEIN
<213> Mus musculus<213> Mus musculus
<400> 33<400> 33
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala ProSer Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 101 5 10
<210> 34<210> 34
<211> 5<211> 5
<212> БЕЛОК<212> PROTEIN
<213> Вирус гриппа<213> Influenza virus
<400> 34<400> 34
Asp Arg Leu Arg ArgAsp Arg Leu Arg Arg
1 51 5
<210> 35<210> 35
<211> 7<211> 7
<212> БЕЛОК<212> PROTEIN
<213> Вирус гриппа<213> Influenza virus
<400> 35<400> 35
Pro Lys Gln Lys Lys Arg LysPro Lys Gln Lys Lys Arg Lys
1 51 5
<210> 36<210> 36
<211> 10<211> 10
<212> БЕЛОК<212> PROTEIN
<213> Вирус гепатита дельта<213> Hepatitis delta virus
<400> 36<400> 36
Arg Lys Leu Lys Lys Lys Ile Lys Lys LeuArg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 101 5 10
<210> 37<210> 37
<211> 10<211> 10
<212> БЕЛОК<212> PROTEIN
<213> Mus musculus<213> Mus musculus
<400> 37<400> 37
Arg Glu Lys Lys Lys Phe Leu Lys Arg ArgArg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 101 5 10
<210> 38<210> 38
<211> 20<211> 20
<212> БЕЛОК<212> PROTEIN
<213> Homo sapiens<213> Homo sapiens
<400> 38<400> 38
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys LysLys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 151 5 10 15
Lys Ser Lys LysLys Ser Lys Lys
2020
<210> 39<210> 39
<211> 17<211> 17
<212> БЕЛОК<212> PROTEIN
<213> Homo sapiens<213> Homo sapiens
<400> 39<400> 39
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr LysArg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 151 5 10 15
LysLys
<210> 40<210> 40
<211> 12<211> 12
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический пептид"synthetic peptide"
<400> 40<400> 40
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly SerGly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
1 5 101 5 10
<210> 41<210> 41
<211> 7<211> 7
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический пептид"synthetic peptide"
<400> 41<400> 41
Ala Glu Ala Ala Ala Lys AlaAla Glu Ala Ala Ala Lys Ala
1 51 5
<210> 42<210> 42
<211> 5<211> 5
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический пептид"synthetic peptide"
<400> 42<400> 42
Gly Gly Gly Gly SerGly Gly Gly Gly Ser
1 51 5
<210> 43<210> 43
<211> 10<211> 10
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический пептид"synthetic peptide"
<400> 43<400> 43
Gly Gly Gly Gly Ser Gly Gly Gly Gly SerGly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 101 5 10
<210> 44<210> 44
<211> 20<211> 20
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический пептид"synthetic peptide"
<400> 44<400> 44
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser GlyGly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 151 5 10 15
Gly Gly Gly SerGly Gly Gly Ser
2020
<210> 45<210> 45
<211> 25<211> 25
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический пептид"synthetic peptide"
<400> 45<400> 45
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser GlyGly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 151 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly SerGly Gly Gly Ser Gly Gly Gly Gly Ser
20 2520 25
<210> 46<210> 46
<211> 35<211> 35
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический полипептид"synthetic polypeptide"
<400> 46<400> 46
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser GlyGly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 151 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly GlyGly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 3020 25 30
Gly Gly SerGly Gly Ser
3535
<210> 47<210> 47
<211> 40<211> 40
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический полипептид"synthetic polypeptide"
<400> 47<400> 47
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser GlyGly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 151 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly GlyGly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 3020 25 30
Gly Gly Ser Gly Gly Gly Gly SerGly Gly Ser Gly Gly Gly Gly Ser
35 4035 40
<210> 48<210> 48
<211> 50<211> 50
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический полипептид"synthetic polypeptide"
<400> 48<400> 48
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser GlyGly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 151 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly GlyGly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 3020 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly GlyGly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
35 40 4535 40 45
Gly SerGly Ser
5050
<210> 49<210> 49
<211> 55<211> 55
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический полипептид"synthetic polypeptide"
<400> 49<400> 49
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser GlyGly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 151 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly GlyGly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 3020 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly GlyGly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
35 40 4535 40 45
Gly Ser Gly Gly Gly Gly SerGlySer GlyGlyGlyGlySer
50 5550 55
<210> 50<210> 50
<211> 12<211> 12
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический пептид"synthetic peptide"
<220><220>
<221> МОДИФИЦИРОВАННЫЙ_ОСТАТОК<221> MODIFIED_RESIDUE
<222> (2)..(2)<222> (2)..(2)
<223> Ahx<223> Ahh
<220><220>
<221> МОДИФИЦИРОВАННЫЙ_ОСТАТОК<221> MODIFIED_RESIDUE
<222> (5)..(5)<222> (5)..(5)
<223> Ahx<223> Ahh
<220><220>
<221> МОДИФИЦИРОВАННЫЙ_ОСТАТОК<221> MODIFIED_RESIDUE
<222> (8)..(8)<222> (8)..(8)
<223> Ahx<223> Ahh
<220><220>
<221> МОДИФИЦИРОВАННЫЙ_ОСТАТОК<221> MODIFIED_RESIDUE
<222> (11)..(11)<222> (11)..(11)
<223> Ahx<223> Ahh
<400> 50<400> 50
Arg Xaa Arg Arg Xaa Arg Arg Xaa Arg Arg Xaa ArgArg Xaa Arg Arg Xaa Arg Arg Xaa Arg Arg Xaa Arg
1 5 101 5 10
<210> 51<210> 51
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 51<400> 51
gagtccgagc agaagaagaa gagtccgagc agaagaagaa
2020
<210> 52<210> 52
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 52<400> 52
gagtcctagc aggagaagaa gagtcctagc aggagaagaa
2020
<210> 53<210> 53
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 53<400> 53
gagtctaagc agaagaagaa gagtctaagc agaagaagaa
2020
<210> 54<210> 54
<211> 12<211> 12
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 54<400> 54
guuuuagagc ua guuuuagagc ua
1212
<210> 55<210> 55
<211> 9<211> 9
<212> БЕЛОК<212> PROTEIN
<213> Неустановленное<213> Unspecified
<220><220>
<221> источник<221> source
<223> /примечание="Описание незивестного: Пептид, относящийся к <223> /note="Description of unknown: Peptide related to
семейству пептидов, содержащих мотив LAGLIDADG"family of peptides containing the LAGLIDADG motif"
<400> 55<400> 55
Leu Ala Gly Leu Ile Asp Ala Asp GlyLeu Ala Gly Leu Ile Asp Ala Asp Gly
1 51 5
<210> 56<210> 56
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 56<400> 56
gagtccgagc agaagaagaa ggg gagtccgagc agaagaagaa ggg
2323
<210> 57<210> 57
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 57<400> 57
gagtctaagc agaagaagaa gag gagtctaagc agaagaagaa gag
2323
<210> 58<210> 58
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 58<400> 58
gagttagagc agaagaagaa agg gagttagagc agaagaagaa agg
2323
<210> 59<210> 59
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 59<400> 59
gggtgggggg agtttgctcc tgg gggtgggggg agtttgctcc tgg
2323
<210> 60<210> 60
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 60<400> 60
gggagggtgg agtttgctcc tgg ggggagggtgg agtttgctcc tgg
2323
<210> 61<210> 61
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 61<400> 61
cgggggaggg agtttgctcc tgg cggggggaggg agtttgctcc tgg
2323
<210> 62<210> 62
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 62<400> 62
ggtgagtgag tgtgtgcgtg tgg ggtgagtgag tgtgtgcgtg tgg
2323
<210> 63<210> 63
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 63<400> 63
ggtgagtgag tgtgtgtgtg agg ggtgagtgag tgtgtgtgtg agg
2323
<210> 64<210> 64
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 64<400> 64
agtgagtgag tgtgtgtgtg ggg agtgagtgag tgtgtgtgtg ggg
2323
<210> 65<210> 65
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 65<400> 65
gctgagtgag tgtatgcgtg tgg gctgagtgag tgtatgcgtg tgg
2323
<210> 66<210> 66
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 66<400> 66
gttgagtgaa tgtgtgcgtg agg gttgagtgaa tgtgtgcgtg agg
2323
<210> 67<210> 67
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 67<400> 67
tgtgggtgag tgtgtgcgtg agg tgtgggtgag tgtgtgcgtg agg
2323
<210> 68<210> 68
<211> 27<211> 27
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 68<400> 68
ggcctcccca aagcctggcc agggagt ggcctcccca aagcctggcc agggagt
2727
<210> 69<210> 69
<211> 27<211> 27
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 69<400> 69
gacctcccca tagcctggcc agggagg gacctcccca tagcctggcc agggagg
2727
<210> 70<210> 70
<211> 27<211> 27
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 70<400> 70
ggcctgccca aggcctgacc aagggaa ggcctgccca aggcctgacc aagggaa
2727
<210> 71<210> 71
<211> 26<211> 26
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 71<400> 71
ggcctcccaa agccaggcca ggggga ggcctcccaa agccaggcca ggggga
2626
<210> 72<210> 72
<211> 32<211> 32
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 72<400> 72
atggtctcac cggtgccacc atggactata ag atggtctcac cggtgccacc atggactata ag
3232
<210> 73<210> 73
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 73<400> 73
atggtctcag gcgaacagcc gcgagagaat gaagcggat atggtctcag gcgaacagcc gcgagagaat gaagcggat
3939
<210> 74<210> 74
<211> 38<211> 38
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 74<400> 74
atggtctcag gcgatgaagc ggatcgaaga gggcatca atggtctcag gcgatgaagc ggatcgaaga gggcatca
3838
<210> 75<210> 75
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 75<400> 75
atggtctcag gcgaacgaga agctgtacct gtactacctg atggtctcag gcgaacgaga agctgtacct gtactacctg
4040
<210> 76<210> 76
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 76<400> 76
atggtctcag gcgctgtacc tgtactacct gcagaatgg atggtctcag gcgctgtacc tgtactacct gcagaatgg
3939
<210> 77<210> 77
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 77<400> 77
atggtctcag ccctgtccga ctacgatgtg gaccatatc atggtctcag ccctgtccga ctacgatgtg gaccatatc
3939
<210> 78<210> 78
<211> 42<211> 42
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 78<400> 78
atggtctcag ccgacgactc catcgacaac aaggtgctga cc atggtctcag ccgacgactc catcgacaac aaggtgctga cc
4242
<210> 79<210> 79
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 79<400> 79
atggtctcag cagtgctgac cagaagcgac aagaaccggg atggtctcag cagtgctgac cagaagcgac aagaaccggg
4040
<210> 80<210> 80
<211> 36<211> 36
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 80<400> 80
atggtctcac gcaagcgaca agaaccgggg caagag atggtctcac gcaagcgaca agaaccgggg caagag
3636
<210> 81<210> 81
<211> 34<211> 34
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 81<400> 81
atggtctcac gcgaaccggg gcaagagcga caac atggtctcac gcgaaccggg gcaagagcga caac
3434
<210> 82<210> 82
<211> 34<211> 34
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 82<400> 82
atggtctcac gcgagcgaca acgtgccctc cgaa atggtctcac gcgagcgaca acgtgccctc cgaa
3434
<210> 83<210> 83
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 83<400> 83
atggtctcag cgctggtgtc cgatttccgg aaggatttc atggtctcag cgctggtgtc cgatttccgg aaggatttc
3939
<210> 84<210> 84
<211> 48<211> 48
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 84<400> 84
atggtctcag cggatttcca gttttacaaa gtgcgcgaga tcaacaac atggtctcag cggatttcca gttttacaaa gtgcgcgaga tcaacaac
4848
<210> 85<210> 85
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 85<400> 85
atggtctcac gcagtgcgcg agatcaacaa ctaccacca atggtctcac gcagtgcgcg agatcaacaa ctaccacca
3939
<210> 86<210> 86
<211> 38<211> 38
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 86<400> 86
atggtctcat ggccgagatc aacaactacc accacgcc atggtctcat ggccgagatc aacaactacc accacgcc
3838
<210> 87<210> 87
<211> 31<211> 31
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 87<400> 87
atggtctcac gcccacgccc acgacgccta c atggtctcac gcccacgccc acgacgccta c
3131
<210> 88<210> 88
<211> 33<211> 33
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 88<400> 88
atggtctcac gccgcccacg acgcctacct gaa atggtctcac gccgcccacg acgcctacct gaa
3333
<210> 89<210> 89
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 89<400> 89
atggtctcag cggtgtacga cgtgcggaag atgatcg atggtctcag cggtgtacga cgtgcggaag atgatcg
3737
<210> 90<210> 90
<211> 35<211> 35
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 90<400> 90
atggtctcac gcgaccgaga ttaccctggc caacg atggtctcac gcgaccgaga ttaccctggc caacg
3535
<210> 91<210> 91
<211> 35<211> 35
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 91<400> 91
atggtctcag cgcggcctct gatcgagaca aacgg atggtctcag cgcggcctct gatcgagaca aacgg
3535
<210> 92<210> 92
<211> 35<211> 35
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 92<400> 92
atggtctcag gcgcctctga tcgagacaaa cggcg atggtctcag gcgcctctga tcgagacaaa cggcg
3535
<210> 93<210> 93
<211> 36<211> 36
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 93<400> 93
atggtctcag cgctggaaag cgagttcgtg tacggc atggtctcag cgctggaaag cgagttcgtg tacggc
3636
<210> 94<210> 94
<211> 36<211> 36
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 94<400> 94
atggtctcac gcctatgaga agctgaaggg ctcccc atggtctcac gcctatgaga agctgaaggg ctcccc
3636
<210> 95<210> 95
<211> 31<211> 31
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 95<400> 95
atggtctcag gcgctgaagg gctcccccga g atggtctcag gcgctgaagg gctcccccga g
3131
<210> 96<210> 96
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 96<400> 96
atggtctcac gcagtgctgt ccgcctacaa caagcac atggtctcac gcagtgctgt ccgcctacaa caagcac
3737
<210> 97<210> 97
<211> 35<211> 35
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 97<400> 97
atggtctcac gcgcaccggg ataagcccat cagag atggtctcac gcgcaccggg ataagcccat cagag
3535
<210> 98<210> 98
<211> 36<211> 36
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 98<400> 98
atggtctcaa ggcccgggat aagcccatca gagagc atggtctcaa ggcccgggat aagcccatca gagagc
3636
<210> 99<210> 99
<211> 36<211> 36
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 99<400> 99
atggtctcag cggataagcc catcagagag caggcc atggtctcag cggataagcc catcagagag caggcc
3636
<210> 100<210> 100
<211> 33<211> 33
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 100<400> 100
atggtctcag cgcccatcag agagcaggcc gag atggtctcag cgcccatcag agagcaggcc gag
3333
<210> 101<210> 101
<211> 38<211> 38
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 101<400> 101
atggtctcac gcagagcagg ccgagaatat catccacc atggtctcac gcagagcagg ccgagaatat catccacc
3838
<210> 102<210> 102
<211> 38<211> 38
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 102<400> 102
atggtctcac gccctgttta ccctgaccaa tctgggag atggtctcac gccctgttta ccctgaccaa tctggggag
3838
<210> 103<210> 103
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 103<400> 103
atggtctcac gcgtactttg acaccaccat cgaccgg atggtctcac gcgtactttg acaccaccat cgaccgg
3737
<210> 104<210> 104
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 104<400> 104
atggtctcac gccgagtcta tcctgcccaa gaggaacag atggtctcac gccgagtcta tcctgcccaa gaggaacag
3939
<210> 105<210> 105
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 105<400> 105
atggtctcaa gcctctatcc tgcccaagag gaacagcga atggtctcaa gcctctatcc tgcccaagag gaacagcga
3939
<210> 106<210> 106
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 106<400> 106
atggtctcag gccatcctgc ccaagaggaa cagcgataa atggtctcag gccatcctgc ccaagaggaa cagcgataa
3939
<210> 107<210> 107
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 107<400> 107
atggtctcac gagtctatcc tgcccaagag gaacagcga atggtctcac gagtctatcc tgcccaagag gaacagcga
3939
<210> 108<210> 108
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 108<400> 108
atggtctcaa tctatcctgc ccaagaggaa cagcgataa atggtctcaa tctatcctgc ccaagaggaa cagcgataa
3939
<210> 109<210> 109
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 109<400> 109
atggtctcag atcctgccca agaggaacag cgataagct atggtctcag atcctgccca agaggaacag cgataagct
3939
<210> 110<210> 110
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 110<400> 110
atggtctcaa ggcatcctgc ccaagaggaa cagcgataa atggtctcaa ggcatcctgc ccaagaggaa cagcgataa
3939
<210> 111<210> 111
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 111<400> 111
atggtctcac ggcatcctgc ccaagaggaa cagcgataa atggtctcac ggcatcctgc ccaagaggaa cagcgataa
3939
<210> 112<210> 112
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 112<400> 112
atggtctcac gccgagagaa tgaagcggat cgaagaggg atggtctcac gccgagagaa tgaagcggat cgaagaggg
3939
<210> 113<210> 113
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 113<400> 113
atggtctcag gcccggatcg aagagggcat caaagagct atggtctcag gcccggatcg aagagggcat caaagagct
3939
<210> 114<210> 114
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 114<400> 114
atggtctcag gccatcgaag agggcatcaa agagctggg atggtctcag gccatcgaag agggcatcaa agagctggg
3939
<210> 115<210> 115
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 115<400> 115
atggtctcac gccgagctgg gcagccagat cctgaaaga atggtctcac gccgagctgg gcagccagat cctgaaaga
3939
<210> 116<210> 116
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 116<400> 116
atggtctcag gccgaacacc ccgtggaaaa cacccagct atggtctcag gccgaacacc ccgtggaaaa cacccagct
3939
<210> 117<210> 117
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 117<400> 117
atggtctcac gccctgatta cccagagaaa gttcgacaa atggtctcac gccctgatta cccagagaaa gttcgacaa
3939
<210> 118<210> 118
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 118<400> 118
atggtctcag gccaacagcg ataagctgat cgccagaaa atggtctcag gccaacagcg ataagctgat cgccagaaa
3939
<210> 119<210> 119
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 119<400> 119
atggtctcat gccctgatcg ccagaaagaa ggactggga atggtctcat gccctgatcg ccagaaagaa ggactggga
3939
<210> 120<210> 120
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 120<400> 120
atggtctcat gcctactccc tgttcgagct ggaaaacgg atggtctcat gcctactccc tgttcgagct ggaaaacgg
3939
<210> 121<210> 121
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 121<400> 121
atggtctcac gccctgaaga gaaccgccag aagaagata atggtctcac gccctgaaga gaaccgccag aagaagata
3939
<210> 122<210> 122
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 122<400> 122
atggtctcac gccttccggg gccacttcct gatcgaggg atggtctcac gccttccggg gccacttcct gatcgaggg
3939
<210> 123<210> 123
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 123<400> 123
atggtctcac gccggccact tcctgatcga gggcgacct atggtctcac gccggccact tcctgatcga gggcgacct
3939
<210> 124<210> 124
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 124<400> 124
atggtctcag gccaccttcg acaacggcag catccccca atggtctcag gccaccttcg acaacggcag catccccca
3939
<210> 125<210> 125
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 125<400> 125
atggtctcac gccctgggag agctgcacgc cattctgcg atggtctcac gccctgggag agctgcacgc cattctgcg
3939
<210> 126<210> 126
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 126<400> 126
atggtctcac gccatcccct actacgtggg ccctctggc atggtctcac gccatcccct actacgtggg ccctctggc
3939
<210> 127<210> 127
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 127<400> 127
atggtctcaa gcctacccta agctggaaag cgagttcgt atggtctcaa gcctacccta agctggaaag cgagttcgt
3939
<210> 128<210> 128
<211> 38<211> 38
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 128<400> 128
atggtctcaa attcttactt tttctttttt gcctggcc atggtctcaa attcttactt tttctttttt gcctggcc
3838
<210> 129<210> 129
<211> 34<211> 34
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 129<400> 129
atggtctcac gcctgtccct tctgggtggt ctgg atggtctcac gcctgtccct tctgggtggt ctgg
3434
<210> 130<210> 130
<211> 35<211> 35
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 130<400> 130
atggtctcac gcctcgcggc tgttcttctg tccct atggtctcac gcctcgcggc tgttcttctg tccct
3535
<210> 131<210> 131
<211> 34<211> 34
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 131<400> 131
atggtctcac gccagctggg tgttttccac gggg atggtctcac gccagctggg tgttttccac gggg
3434
<210> 132<210> 132
<211> 38<211> 38
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 132<400> 132
atggtctcac gcctcgttct gcagctgggt gttttcca atggtctcac gcctcgttct gcagctgggt gttttcca
3838
<210> 133<210> 133
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 133<400> 133
atggtctcag ggcgttgatg tccagttcct ggtccac atggtctcag ggcgttgatg tccagttcct ggtccac
3737
<210> 134<210> 134
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 134<400> 134
atggtctcac ggccagaaag ctctgaggca cgatatggtc cac atggtctcac ggccagaaag ctctgaggca cgatatggtc cac
4343
<210> 135<210> 135
<211> 46<211> 46
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 135<400> 135
atggtctcac tgcgttgtcg atggagtcgt ccttcagaaa gctctg atggtctcac tgcgttgtcg atggagtcgt ccttcagaaa gctctg
4646
<210> 136<210> 136
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 136<400> 136
atggtctcat gcggtcagca ccttgttgtc gatggagtc atggtctcat gcggtcagca ccttgttgtc gatggagtc
3939
<210> 137<210> 137
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 137<400> 137
atggtctcac gcgtcgcttc tggtcagcac cttgttg atggtctcac gcgtcgcttc tggtcagcac cttgttg
3737
<210> 138<210> 138
<211> 34<211> 34
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 138<400> 138
atggtctcac gcgccccggt tcttgtcgct tctg atggtctcac gcgccccggt tcttgtcgct tctg
3434
<210> 139<210> 139
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 139<400> 139
atggtctcag cgcggacttc agggtgatca ctttcacttc atggtctcag cgcggacttc agggtgatca ctttcacttc
4040
<210> 140<210> 140
<211> 35<211> 35
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 140<400> 140
atggtctcac cgcccggaaa tcggacacca gcttg atggtctcac cgcccggaaa tcggacacca gcttg
3535
<210> 141<210> 141
<211> 45<211> 45
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 141<400> 141
atggtctcat gcgtaaaact ggaaatcctt ccggaaatcg gacac atggtctcat gcgtaaaact ggaaatcctt ccggaaatcg gacac
4545
<210> 142<210> 142
<211> 46<211> 46
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 142<400> 142
atggtctcag ccactttgta aaactggaaa tccttccgga aatcgg atggtctcag ccactttgta aaactggaaa tccttccgga aatcgg
4646
<210> 143<210> 143
<211> 45<211> 45
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 143<400> 143
atggtctcag gcgtagttgt tgatctcgcg cactttgtaa aactg atggtctcag gcgtagttgt tgatctcgcg cactttgtaa aactg
4545
<210> 144<210> 144
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 144<400> 144
atggtctcag gcgtggtagt tgttgatctc gcgcactttg atggtctcag gcgtggtagt tgttgatctc gcgcactttg
4040
<210> 145<210> 145
<211> 35<211> 35
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 145<400> 145
atggtctcac cgcgtagtcg ccgtacacga actcg atggtctcac cgcgtagtcg ccgtacacga actcg
3535
<210> 146<210> 146
<211> 50<211> 50
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 146<400> 146
atggtctcac gcgaaaaagt tcatgatgtt gctgtagaag aagtacttgg atggtctcac gcgaaaaagt tcatgatgtt gctgtagaag aagtacttgg
5050
<210> 147<210> 147
<211> 31<211> 31
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 147<400> 147
atggtctcag cgcccggatc tcgccgttgg c atggtctcag cgcccggatc tcgccgttgg c
3131
<210> 148<210> 148
<211> 33<211> 33
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 148<400> 148
atggtctcac gccttccgga tctcgccgtt ggc atggtctcac gccttccgga tctcgccgtt ggc
3333
<210> 149<210> 149
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 149<400> 149
atggtctcag cgcagggtac tttttgatca gggcggttc atggtctcag cgcagggtac tttttgatca gggcggttc
3939
<210> 150<210> 150
<211> 36<211> 36
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 150<400> 150
atggtctcag gcgctggcca ggtacaggaa gttcac atggtctcag gcgctggcca ggtacaggaa gttcac
3636
<210> 151<210> 151
<211> 36<211> 36
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 151<400> 151
atggtctcac gcctcatagt ggctggccag gtacag atggtctcac gcctcatagt ggctggccag gtacag
3636
<210> 152<210> 152
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 152<400> 152
atggtctcat gcgtccagat tagcgtcggc caggatc atggtctcat gcgtccagat tagcgtcggc caggatc
3737
<210> 153<210> 153
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 153<400> 153
atggtctcac gcgttgtagg cggacagcac tttgtcc atggtctcac gcgttgtagg cggacagcac tttgtcc
3737
<210> 154<210> 154
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 154<400> 154
atggtctcag ccttgttgta ggcggacagc actttgtcc atggtctcag ccttgttgta ggcggacagc actttgtcc
3939
<210> 155<210> 155
<211> 35<211> 35
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 155<400> 155
atggtctcac cgcgtgcttg ttgtaggcgg acagc atggtctcac cgcgtgcttg ttgtaggcgg acagc
3535
<210> 156<210> 156
<211> 35<211> 35
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 156<400> 156
atggtctcag cgcatcccgg tgcttgttgt aggcg atggtctcag cgcatcccgg tgcttgttgt aggcg
3535
<210> 157<210> 157
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 157<400> 157
atggtctcat gcgatgggct tatcccggtg cttgttgtag atggtctcat gcgatgggct tatcccggtg cttgttgtag
4040
<210> 158<210> 158
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 158<400> 158
atggtctcag gcgatgatat tctcggcctg ctctctgatg atggtctcag gcgatgatat tctcggcctg ctctctgatg
4040
<210> 159<210> 159
<211> 30<211> 30
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 159<400> 159
atggtctcac gcgaaggcgg caggggctcc atggtctcac gcgaaggcgg caggggctcc
3030
<210> 160<210> 160
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 160<400> 160
atggtctcag gcgctgaagc cgcctgtctg cacctcggt atggtctcag gcgctgaagc cgcctgtctg cacctcggt
3939
<210> 161<210> 161
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 161<400> 161
atggtctcag gctttgctga agccgcctgt ctgcacctc atggtctcag gctttgctga agccgcctgt ctgcacctc
3939
<210> 162<210> 162
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 162<400> 162
atggtctcag gcctctttgc tgaagccgcc tgtctgcac atggtctcag gcctctttgc tgaagccgcc tgtctgcac
3939
<210> 163<210> 163
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 163<400> 163
atggtctcac tcgctgaagc cgcctgtctg cacctcggt atggtctcac tcgctgaagc cgcctgtctg cacctcggt
3939
<210> 164<210> 164
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 164<400> 164
atggtctcaa gatttgctga agccgcctgt ctgcacctc atggtctcaa gatttgctga agccgcctgt ctgcacctc
3939
<210> 165<210> 165
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 165<400> 165
atggtctcag atctctttgc tgaagccgcc tgtctgcac atggtctcag atctctttgc tgaagccgcc tgtctgcac
3939
<210> 166<210> 166
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 166<400> 166
atggtctcag cctttgctga agccgcctgt ctgcacctc atggtctcag cctttgctga agccgcctgt ctgcacctc
3939
<210> 167<210> 167
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 167<400> 167
atggtctcag ccgccgctga agccgcctgt ctgcacctc atggtctcag ccgccgctga agccgcctgt ctgcacctc
3939
<210> 168<210> 168
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 168<400> 168
atggtctcag gcgctgttct tctgtccctt ctgggtggt atggtctcag gcgctgttct tctgtccctt ctgggtggt
3939
<210> 169<210> 169
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 169<400> 169
atggtctcag gccattctct cgcggctgtt cttctgtcc atggtctcag gccattctct cgcggctgtt cttctgtcc
3939
<210> 170<210> 170
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 170<400> 170
atggtctcag gccttcattc tctcgcggct gttcttctg atggtctcag gccttcattc tctcgcggct gttcttctg
3939
<210> 171<210> 171
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 171<400> 171
atggtctcag gcgatgccct cttcgatccg cttcattct atggtctcag gcgatgccct cttcgatccg cttcattct
3939
<210> 172<210> 172
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 172<400> 172
atggtctcag gccaggatct ggctgcccag ctctttgat atggtctcag gccaggatct ggctgcccag ctctttgat
3939
<210> 173<210> 173
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 173<400> 173
atggtctcag gcggcgttca gcagctgccg ccagtagtt atggtctcag gcggcgttca gcagctgccg ccagtagtt
3939
<210> 174<210> 174
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 174<400> 174
atggtctcag gccttgggca ggatagactc tttgctgaa atggtctcag gccttgggca ggatagactc tttgctgaa
3939
<210> 175<210> 175
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 175<400> 175
atggtctcag gcatcgctgt tcctcttggg caggataga atggtctcag gcatcgctgt tcctcttggg caggataga
3939
<210> 176<210> 176
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 176<400> 176
atggtctcag gcaggcagct tgatgatcag gtccttttt atggtctcag gcaggcagct tgatgatcag gtccttttt
3939
<210> 177<210> 177
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 177<400> 177
atggtctcag gcggtggcct cggctgtttc gccgctgtc atggtctcag gcggtggcct cggctgtttc gccgctgtc
3939
<210> 178<210> 178
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 178<400> 178
atggtctcag gcgatcatgt gggccagggc cagatagat atggtctcag gcgatcatgt gggccagggc cagatagat
3939
<210> 179<210> 179
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 179<400> 179
atggtctcag gcgaacttga tcatgtgggc cagggccag atggtctcag gcgaacttga tcatgtgggc cagggccag
3939
<210> 180<210> 180
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 180<400> 180
atggtctcag gcctgcttcc gcagcaggtc ctctctgtt atggtctcag gcctgcttcc gcagcaggtc ctctctgtt
3939
<210> 181<210> 181
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 181<400> 181
atggtctcag gcgatctggt gggggatgct gccgttgtc atggtctcag gcgatctggt gggggatgct gccgttgtc
3939
<210> 182<210> 182
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 182<400> 182
atggtctcag gcgaaggtca ggatcttctc gatcttttc atggtctcag gcgaaggtca ggatcttctc gatcttttc
3939
<210> 183<210> 183
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 183<400> 183
atggtctcag gctttgatca gggcggttcc cacgacggc atggtctcag gctttgatca gggcggttcc cacgacggc
3939
<210> 184<210> 184
<211> 28<211> 28
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 184<400> 184
atgaagacta ccggtgccac catggccc atgaagacta ccggtgccac catggccc
2828
<210> 185<210> 185
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 185<400> 185
atgaagacta gcgtacctga tcgagaagat caagctgca atgaagacta gcgtacctga tcgagaagat caagctgca
3939
<210> 186<210> 186
<211> 36<211> 36
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 186<400> 186
atgaagacta gcgatcaagc tgcacgacat gcagga atgaagacta gcgatcaagc tgcacgacat gcagga
3636
<210> 187<210> 187
<211> 34<211> 34
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 187<400> 187
atgaagacta gcgctgcacg acatgcagga aggc atgaagacta gcgctgcacg acatgcagga aggc
3434
<210> 188<210> 188
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 188<400> 188
atgaagacta gccatcatcc ccagaagcgt gtccttc atgaagacta gccatcatcc ccagaagcgt gtccttc
3737
<210> 189<210> 189
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 189<400> 189
atgaagacta gcaagcgtgt ccttcgacaa cagcttc atgaagacta gcaagcgtgt ccttcgacaa cagcttc
3737
<210> 190<210> 190
<211> 38<211> 38
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 190<400> 190
atgaagacta gcggtgctcg tgaagcagga agaaaaca atgaagacta gcggtgctcg tgaagcagga agaaaaca
3838
<210> 191<210> 191
<211> 42<211> 42
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 191<400> 191
atgaagacta gcgaagtgga agtttaagaa agagcggaac aa atgaagacta gcgaagtgga agtttaagaa agagcggaac aa
4242
<210> 192<210> 192
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 192<400> 192
atgaagacta gcagagcgga acaaggggta caagcac atgaagacta gcagagcgga acaaggggta caagcac
3737
<210> 193<210> 193
<211> 36<211> 36
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 193<400> 193
atgaagacta gcgaacaagg ggtacaagca ccacgc atgaagacta gcgaacaagg ggtacaagca ccacgc
3636
<210> 194<210> 194
<211> 32<211> 32
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 194<400> 194
atgaagacta gcccacgccg aggacgccct ga atgaagacta gcccacgccg aggacgccct ga
3232
<210> 195<210> 195
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 195<400> 195
atgaagacta gcagagatct tcatcacccc ccaccag atgaagacta gcagagatct tcatcacccc ccaccag
3737
<210> 196<210> 196
<211> 33<211> 33
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 196<400> 196
atgaagacta gccaaccggc agaccaacga gcg atgaagacta gccaaccggc agaccaacga gcg
3333
<210> 197<210> 197
<211> 35<211> 35
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 197<400> 197
atgaagacta gcaaagacca acgagcggat cgagg atgaagacta gcaaagacca acgagcggat cgagg
3535
<210> 198<210> 198
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 198<400> 198
atgaagacta gcgttctccg tgcagaaaga cttcatcaac atgaagacta gcgttctccg tgcagaaaga cttcatcaac
4040
<210> 199<210> 199
<211> 34<211> 34
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 199<400> 199
atgaagacta gcccgcctga tgaacctgct gcgg atgaagacta gcccgcctga tgaacctgct gcgg
3434
<210> 200<210> 200
<211> 42<211> 42
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 200<400> 200
atgaagacta aattcttaag cgtaatctgg aacatcgtat gg atgaagacta aattcttaag cgtaatctgg aacatcgtat gg
4242
<210> 201<210> 201
<211> 34<211> 34
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 201<400> 201
atgaagacta acgcggcgtt ctctttgccg gtgg atgaagacta acgcggcgtt ctctttgccg gtgg
3434
<210> 202<210> 202
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 202<400> 202
atgaagacta tcgcctcgat caggtacttg gcgttctctt atgaagacta tcgcctcgat caggtacttg gcgttctctt
4040
<210> 203<210> 203
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 203<400> 203
atgaagacta gcgcgatctt ctcgatcagg tacttggcgt atgaagacta gcgcgatctt ctcgatcagg tacttggcgt
4040
<210> 204<210> 204
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 204<400> 204
atgaagacta tggcgtccac ctcatagttg aaggggttgt atgaagacta tggcgtccac ctcatagttg aaggggttgt
4040
<210> 205<210> 205
<211> 38<211> 38
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 205<400> 205
atgaagacta ttgcggggat gatgtggtcc acctcata atgaagacta ttgcggggat gatgtggtcc acctcata
3838
<210> 206<210> 206
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 206<400> 206
atgaagacta ccgcgttgtt gaagctgttg tcgaaggaca atgaagacta ccgcgttgtt gaagctgttg tcgaaggaca
4040
<210> 207<210> 207
<211> 35<211> 35
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 207<400> 207
atgaagacta tcgcccgcag aaagctggtg aagcc atgaagacta tcgcccgcag aaagctggtg aagcc
3535
<210> 208<210> 208
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 208<400> 208
atgaagacta ctgccttaaa cttccacttc cgccgca atgaagacta ctgccttaaa cttccacttc cgccgca
3737
<210> 209<210> 209
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 209<400> 209
atgaagacta tcgcctcttt cttaaacttc cacttccgcc atgaagacta tcgcctcttt cttaaacttc cacttccgcc
4040
<210> 210<210> 210
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 210<400> 210
atgaagacta gggccttgta ccccttgttc cgctctttc atgaagacta gggccttgta ccccttgttc cgctctttc
3939
<210> 211<210> 211
<211> 39<211> 39
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 211<400> 211
atgaagacta ctgcgtactc ctgctcggtt tcgatctcg atgaagacta ctgcgtactc ctgctcggtt tcgatctcg
3939
<210> 212<210> 212
<211> 41<211> 41
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 212<400> 212
atgaagacta tggccttctg catctcgttg atcattttct g atgaagacta tggccttctg catctcgttg atcattttct g
4141
<210> 213<210> 213
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 213<400> 213
atgaagacta ttgcgttccg cttctgcatc tcgttga atgaagacta ttgcgttccg cttctgcatc tcgttga
3737
<210> 214<210> 214
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 214<400> 214
atgaagacta acgcgttgat gtcccgttct tccagca atgaagacta acgcgttgat gtcccgttct tccagca
3737
<210> 215<210> 215
<211> 37<211> 37
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 215<400> 215
atgaagacta gggcggtggc gtatctggta tccacca atgaagacta gggcggtggc gtatctggta tccacca
3737
<210> 216<210> 216
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 216<400> 216
ggtgagtgag tgtgtgcgtg ngg ggtgagtgag tgtgtgcgtg ngg
2323
<210> 217<210> 217
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 217<400> 217
ggtgagtgag tgtgtgtgtg ngg ggtgagtgag tgtgtgtgtg ngg
2323
<210> 218<210> 218
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 218<400> 218
gctgagtgag tgtatgcgtg ngg gctgagtgag tgtatgcgtg ngg
2323
<210> 219<210> 219
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 219<400> 219
ggtgagtgag tgcgtgcggg ngg ggtgagtgag tgcgtgcggg ngg
2323
<210> 220<210> 220
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 220<400> 220
tgtgggtgag tgtgtgcgtg ngg tgtgggtgag tgtgtgcgtg ngg
2323
<210> 221<210> 221
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 221<400> 221
agtgaatgag tgtgtgtgtg ngg agtgaatgag tgtgtgtgtg ngg
2323
<210> 222<210> 222
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 222<400> 222
tgtgagtaag tgtgtgtgtg ngg tgtgagtaag tgtgtgtgtg ngg
2323
<210> 223<210> 223
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 223<400> 223
actgtgtgag tgtgtgcgtg ngg actgtgtgag tgtgtgcgtg ngg
2323
<210> 224<210> 224
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 224<400> 224
agcgagtggg tgtgtgcgtg ngg agcgagtggg tgtgtgcgtg ngg
2323
<210> 225<210> 225
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 225<400> 225
agtgtgtgag tgtgtgcgtg ngg agtgtgtgag tgtgtgcgtg ngg
2323
<210> 226<210> 226
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 226<400> 226
tgtgggtgag tgtgtgcgtg nga tgtgggtgag tgtgtgcgtg nga
2323
<210> 227<210> 227
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 227<400> 227
agcgagtgag tgtgtgtgtg ngg agcgagtgag tgtgtgtgtg ngg
2323
<210> 228<210> 228
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 228<400> 228
gtagagtgag tgtgtgtgtg ngg gtagagtgag tgtgtgtgtg ngg
2323
<210> 229<210> 229
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 229<400> 229
tgagtgtgag tgtgtgcgtg ngg tgagtgtgag tgtgtgcgtg ngg
2323
<210> 230<210> 230
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 230<400> 230
agagagtgag tgtgtgcatg ngg agagagtgag tgtgtgcatg ngg
2323
<210> 231<210> 231
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 231<400> 231
gttgagtgaa tgtgtgcgtg ngg gttgagtgaa tgtgtgcgtg ngg
2323
<210> 232<210> 232
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 232<400> 232
cgtgagtgag tgtgtacctg ngg cgtgagtgag tgtgtacctg ngg
2323
<210> 233<210> 233
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 233<400> 233
gggtgggggg agtttgctcc ngg gggtgggggg agtttgctcc ngg
2323
<210> 234<210> 234
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 234<400> 234
gggagggtgg agtttgctcc ngg ggggagggtgg agtttgctcc ngg
2323
<210> 235<210> 235
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 235<400> 235
cgggggaggg agtttgctcc ngg cggggggaggg agtttgctcc ngg
2323
<210> 236<210> 236
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 236<400> 236
tagtggaggg agcttgctcc ngg tagtggaggg agcttgctcc ngg
2323
<210> 237<210> 237
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 237<400> 237
gcgtgggggg tgtttgctcc ngg gcgtgggggg tgtttgctcc ngg
2323
<210> 238<210> 238
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 238<400> 238
ttgggggggc agtttgctcc ngg ttggggggggc agtttgctcc ngg
2323
<210> 239<210> 239
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 239<400> 239
gagtccgagc agaagaagaa ngg gagtccgagc agaagaagaa ngg
2323
<210> 240<210> 240
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 240<400> 240
gagttagagc agaagaagaa ngg gagttagagc agaagaagaa ngg
2323
<210> 241<210> 241
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 241<400> 241
gagtctaagc agaagaagaa nag gagtctaagc agaagaagaa nag
2323
<210> 242<210> 242
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 242<400> 242
gaggccgagc agaaaaagga ngg gaggccgagc agaaaaagga ngg
2323
<210> 243<210> 243
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 243<400> 243
aagtctgagc acaagaagaa ngg aagtctgagc acaagaagaa ngg
2323
<210> 244<210> 244
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 244<400> 244
gagtcctagc aggagaagaa nag gagtcctagc aggagaagaa nag
2323
<210> 245<210> 245
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 245<400> 245
acgtctgagc agaagaagaa ngg acgtctgagc agaagaagaa ngg
2323
<210> 246<210> 246
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 246<400> 246
gtcacctcca atgactaggg ngg gtcacctcca atgactaggg ngg
2323
<210> 247<210> 247
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 247<400> 247
gggcaaccac aaacccacga ngg gggcaaccac aaacccacga ngg
2323
<210> 248<210> 248
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 248<400> 248
gcttgtccct ctgtcaatgg ngg gcttgtccct ctgtcaatgg ngg
2323
<210> 249<210> 249
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 249<400> 249
gcgccaccgg ttgatgtgat ngg gcgccaccgg ttgatgtgat ngg
2323
<210> 250<210> 250
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 250<400> 250
gacatcgatg tcctccccat ngg gacatcgatg tcctccccat ngg
2323
<210> 251<210> 251
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 251<400> 251
gcctccccaa agcctggcca ngg gcctccccaa agcctggcca ngg
2323
<210> 252<210> 252
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 252<400> 252
gccccgggct tcaagccctg ngg gccccgggct tcaagccctg ngg
2323
<210> 253<210> 253
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 253<400> 253
ggcagagtgc tgcttgctgc ngg ggcagagtgc tgcttgctgc ngg
2323
<210> 254<210> 254
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 254<400> 254
gctaaagagg gaatgggctt ngg gctaaagagg gaatgggctt ngg
2323
<210> 255<210> 255
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 255<400> 255
gtttgggagg tcagaaatag ngg gtttgggagg tcagaaatag ngg
2323
<210> 256<210> 256
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 256<400> 256
gttggagcgg ggagaaggcc ngg gttggagcgg ggagaaggcc ngg
2323
<210> 257<210> 257
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 257<400> 257
gaggctgggg tggaggtgtt ngg gaggctgggg tggaggtgtt ngg
2323
<210> 258<210> 258
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 258<400> 258
gtgggtgagt gagtgcgtgc ngg gtgggtgagt gagtgcgtgc ngg
2323
<210> 259<210> 259
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 259<400> 259
gattcctggt gccagaaaca ngg gattcctggt gccagaaaca ngg
2323
<210> 260<210> 260
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 260<400> 260
gggcagtttg ctcctggcac ngg gggcagtttg ctcctggcac ngg
2323
<210> 261<210> 261
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 261<400> 261
ggagagaggc tcccatcacg ngg ggagagaggc tcccatcacg ngg
2323
<210> 262<210> 262
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 262<400> 262
gagaagagaa gtggggtggg ngg gagaagagaa gtggggtggg ngg
2323
<210> 263<210> 263
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 263<400> 263
gtgtgtgtgt gagggtgtaa ngg gtgtgtgtgt gagggtgtaa ngg
2323
<210> 264<210> 264
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 264<400> 264
ggtgagtgag tgtgtgtgtg ngg ggtgagtgag tgtgtgtgtg ngg
2323
<210> 265<210> 265
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (21)..(21)<222> (21)..(21)
<223> a, c, t, g, неизвестное или другое<223> a, c, t, g, unknown or other
<400> 265<400> 265
gaagaatgga cagaactctg ngg gaagaatgga cagaactctg ngg
2323
<210> 266<210> 266
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 266<400> 266
ccatctcatc cctgcgtgtc tccgcgtcct tcgagagtga ggac ccatctcatc cctgcgtgtc tccgcgtcct tcgagagtga ggac
4444
<210> 267<210> 267
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 267<400> 267
ccatctcatc cctgcgtgtc tccagggacc cctctgacag act ccatctcatc cctgcgtgtc tccagggacc cctctgacag act
4343
<210> 268<210> 268
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 268<400> 268
ccatctcatc cctgcgtgtc tccgcccatt tctcctttga ggt ccatctcatc cctgcgtgtc tccgcccatt tctcctttga ggt
4343
<210> 269<210> 269
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 269<400> 269
ccatctcatc cctgcgtgtc tcccctccca caggaatttg aag ccatctcatc cctgcgtgtc tcccctccca caggaatttg aag
4343
<210> 270<210> 270
<211> 45<211> 45
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 270<400> 270
ccatctcatc cctgcgtgtc tcctgtcacc acacagttac cacct ccatctcatc cctgcgtgtc tcctgtcacc acacagttac cacct
4545
<210> 271<210> 271
<211> 46<211> 46
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 271<400> 271
ccatctcatc cctgcgtgtc tccataaggg gcaagttctg ggctat ccatctcatc cctgcgtgtc tccataaggg gcaagttctg ggctat
4646
<210> 272<210> 272
<211> 46<211> 46
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 272<400> 272
ccatctcatc cctgcgtgtc tcctgatgaa gctgcctttc ctaagc ccatctcatc cctgcgtgtc tcctgatgaa gctgcctttc ctaagc
4646
<210> 273<210> 273
<211> 42<211> 42
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 273<400> 273
ccatctcatc cctgcgtgtc tcctctgcca gatccttagg cg ccatctcatc cctgcgtgtc tcctctgcca gatccttagg cg
4242
<210> 274<210> 274
<211> 41<211> 41
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 274<400> 274
ccatctcatc cctgcgtgtc tccgacgtct gggtcccgag c ccatctcatc cctgcgtgtc tccgacgtct gggtcccgag c
4141
<210> 275<210> 275
<211> 45<211> 45
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 275<400> 275
ccatctcatc cctgcgtgtc tcctcctgtg gaacaaccag acacc ccatctcatc cctgcgtgtc tcctcctgtg gaacaaccag acacc
4545
<210> 276<210> 276
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 276<400> 276
ccatctcatc cctgcgtgtc tccaagctgc tggctttcct aag ccatctcatc cctgcgtgtc tccaagctgc tggctttcct aag
4343
<210> 277<210> 277
<211> 41<211> 41
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 277<400> 277
ccatctcatc cctgcgtgtc tccaggaccc aggtttgcac t ccatctcatc cctgcgtgtc tccaggaccc aggtttgcac t
4141
<210> 278<210> 278
<211> 47<211> 47
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 278<400> 278
ccatctcatc cctgcgtgtc tccatgatta gaaacctgca ctcccag ccatctcatc cctgcgtgtc tccatgatta gaaacctgca ctcccag
4747
<210> 279<210> 279
<211> 42<211> 42
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 279<400> 279
ccatctcatc cctgcgtgtc tccgtgggca ccaggagcgt ag ccatctcatc cctgcgtgtc tccgtgggca ccaggagcgt ag
4242
<210> 280<210> 280
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 280<400> 280
ccatctcatc cctgcgtgtc tccggcctcg ggaaacttac aat ccatctcatc cctgcgtgtc tccggcctcg ggaaacttac aat
4343
<210> 281<210> 281
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 281<400> 281
ccatctcatc cctgcgtgtc tccagtgcct tgcacaaata ggc ccatctcatc cctgcgtgtc tccagtgcct tgcacaaata ggc
4343
<210> 282<210> 282
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 282<400> 282
ccatctcatc cctgcgtgtc tccctgccat tgtgaacagt gct ccatctcatc cctgcgtgtc tccctgccat tgtgaacagt gct
4343
<210> 283<210> 283
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 283<400> 283
ccatctcatc cctgcgtgtc tccaagcaac tccagtccca aat ccatctcatc cctgcgtgtc tccaagcaac tccagtccca aat
4343
<210> 284<210> 284
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 284<400> 284
ccatctcatc cctgcgtgtc tcccctgcag gtgtctcctt ttc ccatctcatc cctgcgtgtc tcccctgcag gtgtctcctt ttc
4343
<210> 285<210> 285
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 285<400> 285
ccatctcatc cctgcgtgtc tccacttctt gggcagtgat gga ccatctcatc cctgcgtgtc tccacttctt gggcagtgat gga
4343
<210> 286<210> 286
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 286<400> 286
ccatctcatc cctgcgtgtc tcctgcaaag ctaagcagag atgc ccatctcatc cctgcgtgtc tcctgcaaag ctaagcagag atgc
4444
<210> 287<210> 287
<211> 45<211> 45
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 287<400> 287
ccatctcatc cctgcgtgtc tccgcagaga tgcctatgcc tacat ccatctcatc cctgcgtgtc tccgcagaga tgcctatgcc tacat
4545
<210> 288<210> 288
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 288<400> 288
ccatctcatc cctgcgtgtc tccacatgcg attctgcagg gaa ccatctcatc cctgcgtgtc tccacatgcg attctgcagg gaa
4343
<210> 289<210> 289
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 289<400> 289
ccatctcatc cctgcgtgtc tcccaaagta caaacggcag aagc ccatctcatc cctgcgtgtc tcccaaagta caaacggcag aagc
4444
<210> 290<210> 290
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 290<400> 290
ccatctcatc cctgcgtgtc tccttctgag ggctgctacc tgt ccatctcatc cctgcgtgtc tccttctgag ggctgctacc tgt
4343
<210> 291<210> 291
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 291<400> 291
ccatctcatc cctgcgtgtc tcccacggcc tttgcaaata gag ccatctcatc cctgcgtgtc tcccacggcc tttgcaaata gag
4343
<210> 292<210> 292
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 292<400> 292
ccatctcatc cctgcgtgtc tcctgggaga gagacccctt ctt ccatctcatc cctgcgtgtc tcctgggaga gagacccctt ctt
4343
<210> 293<210> 293
<211> 46<211> 46
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 293<400> 293
ccatctcatc cctgcgtgtc tccgttctga cattcctcct gaggga ccatctcatc cctgcgtgtc tccgttctga cattcctcct gaggga
4646
<210> 294<210> 294
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 294<400> 294
ccatctcatc cctgcgtgtc tccccagact cagtaaagcc tgga ccatctcatc cctgcgtgtc tccccagact cagtaaagcc tgga
4444
<210> 295<210> 295
<211> 46<211> 46
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 295<400> 295
ccatctcatc cctgcgtgtc tccggccctt cctctgtact ctatac ccatctcatc cctgcgtgtc tccggccctt cctctgtact ctatac
4646
<210> 296<210> 296
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 296<400> 296
ccatctcatc cctgcgtgtc tccccaatgg ggaggacatc gat ccatctcatc cctgcgtgtc tccccaatgg ggaggacatc gat
4343
<210> 297<210> 297
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 297<400> 297
ccatctcatc cctgcgtgtc tccccaatgg ggaggacatc gat ccatctcatc cctgcgtgtc tccccaatgg ggaggacatc gat
4343
<210> 298<210> 298
<211> 41<211> 41
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 298<400> 298
ccatctcatc cctgcgtgtc tccaacccac gagggcagag t ccatctcatc cctgcgtgtc tccaacccac gagggcagag t
4141
<210> 299<210> 299
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 299<400> 299
ccatctcatc cctgcgtgtc tcccaaagta caaacggcag aagc ccatctcatc cctgcgtgtc tcccaaagta caaacggcag aagc
4444
<210> 300<210> 300
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 300<400> 300
ccatctcatc cctgcgtgtc tcccaaagta caaacggcag aagc ccatctcatc cctgcgtgtc tcccaaagta caaacggcag aagc
4444
<210> 301<210> 301
<211> 41<211> 41
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 301<400> 301
ccatctcatc cctgcgtgtc tccaacccac gagggcagag t ccatctcatc cctgcgtgtc tccaacccac gagggcagag t
4141
<210> 302<210> 302
<211> 41<211> 41
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 302<400> 302
ccatctcatc cctgcgtgtc tccaacccac gagggcagag t ccatctcatc cctgcgtgtc tccaacccac gagggcagag t
4141
<210> 303<210> 303
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 303<400> 303
ccatctcatc cctgcgtgtc tccccaatgg ggaggacatc gat ccatctcatc cctgcgtgtc tccccaatgg ggaggacatc gat
4343
<210> 304<210> 304
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 304<400> 304
ccatctcatc cctgcgtgtc tccaagcaac tccagtccca aat ccatctcatc cctgcgtgtc tccaagcaac tccagtccca aat
4343
<210> 305<210> 305
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 305<400> 305
ccatctcatc cctgcgtgtc tccaagcaac tccagtccca aat ccatctcatc cctgcgtgtc tccaagcaac tccagtccca aat
4343
<210> 306<210> 306
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 306<400> 306
ccatctcatc cctgcgtgtc tccgcgtctt cgagagtgag gac ccatctcatc cctgcgtgtc tccgcgtctt cgagagtgag gac
4343
<210> 307<210> 307
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 307<400> 307
ccatctcatc cctgcgtgtc tcccctccca caggaatttg aag ccatctcatc cctgcgtgtc tcccctccca caggaatttg aag
4343
<210> 308<210> 308
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 308<400> 308
ccatctcatc cctgcgtgtc tcccctccca caggaatttg aag ccatctcatc cctgcgtgtc tcccctccca caggaatttg aag
4343
<210> 309<210> 309
<211> 48<211> 48
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 309<400> 309
ccatctcatc cctgcgtgtc tcctgttaaa aacacaacat cagtgcat ccatctcatc cctgcgtgtc tcctgttaaa aacacaacat cagtgcat
4848
<210> 310<210> 310
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 310<400> 310
ccatctcatc cctgcgtgtc tccacatgcg attctgcagg gaa ccatctcatc cctgcgtgtc tccacatgcg attctgcagg gaa
4343
<210> 311<210> 311
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 311<400> 311
ccatctcatc cctgcgtgtc tccacttctt gggcagtgat gga ccatctcatc cctgcgtgtc tccacttctt gggcagtgat gga
4343
<210> 312<210> 312
<211> 41<211> 41
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 312<400> 312
ccatctcatc cctgcgtgtc tccaggaccc aggtttgcac t ccatctcatc cctgcgtgtc tccaggaccc aggtttgcac t
4141
<210> 313<210> 313
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 313<400> 313
ccatctcatc cctgcgtgtc tccagggacc cctctgacag act ccatctcatc cctgcgtgtc tccagggacc cctctgacag act
4343
<210> 314<210> 314
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 314<400> 314
ccatctcatc cctgcgtgtc tccagggacc cctctgacag act ccatctcatc cctgcgtgtc tccagggacc cctctgacag act
4343
<210> 315<210> 315
<211> 46<211> 46
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 315<400> 315
ccatctcatc cctgcgtgtc tccggccctt cctctgtact ctatac ccatctcatc cctgcgtgtc tccggccctt cctctgtact ctatac
4646
<210> 316<210> 316
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 316<400> 316
cctctctatg ggcagtcggt gatgggggag agggacacac agat cctctctatg ggcagtcggt gatgggggag agggacacac agat
4444
<210> 317<210> 317
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 317<400> 317
cctctctatg ggcagtcggt gatgcacacc cacaccctca taca cctctctatg ggcagtcggt gatgcacacc cacaccctca taca
4444
<210> 318<210> 318
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 318<400> 318
cctctctatg ggcagtcggt gatgagccac agaggtggag actg cctctctatg ggcagtcggt gatgagccac agaggtggag actg
4444
<210> 319<210> 319
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 319<400> 319
cctctctatg ggcagtcggt gatggcaccc caacacctac atct cctctctatg ggcagtcggt gatggcaccc caacacctac atct
4444
<210> 320<210> 320
<211> 46<211> 46
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 320<400> 320
cctctctatg ggcagtcggt gatggggaat ctaatgtatg gcatgg cctctctatg ggcagtcggt gatggggaat ctaatgtatg gcatgg
4646
<210> 321<210> 321
<211> 46<211> 46
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 321<400> 321
cctctctatg ggcagtcggt gatgtgtgac ccaaaagatt cccacc cctctctatg ggcagtcggt gatgtgtgac ccaaaagatt cccacc
4646
<210> 322<210> 322
<211> 49<211> 49
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 322<400> 322
cctctctatg ggcagtcggt gatgcacagg cactaacttc ttcagccta cctctctatg ggcagtcggt gatgcacagg cactaacttc ttcagccta
4949
<210> 323<210> 323
<211> 42<211> 42
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 323<400> 323
cctctctatg ggcagtcggt gatgccccag caaaacgcac tg cctctctatg ggcagtcggt gatgccccag caaaacgcac tg
4242
<210> 324<210> 324
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 324<400> 324
cctctctatg ggcagtcggt gatgccacac acagcgtctt ccg cctctctatg ggcagtcggt gatgccacac acagcgtctt ccg
4343
<210> 325<210> 325
<211> 48<211> 48
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 325<400> 325
cctctctatg ggcagtcggt gatgtcaaag ctgtatcccc attgccta cctctctatg ggcagtcggt gatgtcaaag ctgtatcccc attgccta
4848
<210> 326<210> 326
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 326<400> 326
cctctctatg ggcagtcggt gatgagcaac gagacgttaa ccc cctctctatg ggcagtcggt gatgagcaac gagacgttaa ccc
4343
<210> 327<210> 327
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 327<400> 327
cctctctatg ggcagtcggt gatgttctgc cactggctta gctt cctctctatg ggcagtcggt gatgttctgc cactggctta gctt
4444
<210> 328<210> 328
<211> 49<211> 49
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 328<400> 328
cctctctatg ggcagtcggt gatggtaagt gaatctctgt ctgtctcat cctctctatg ggcagtcggt gatggtaagt gaatctctgt ctgtctcat
4949
<210> 329<210> 329
<211> 47<211> 47
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 329<400> 329
cctctctatg ggcagtcggt gatgcaggag gttaaatccc tcctcca cctctctatg ggcagtcggt gatgcaggag gttaaatccc tcctcca
4747
<210> 330<210> 330
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 330<400> 330
cctctctatg ggcagtcggt gatggtttcc cccatgcttt tctt cctctctatg ggcagtcggt gatggtttcc cccatgcttt tctt
4444
<210> 331<210> 331
<211> 42<211> 42
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 331<400> 331
cctctctatg ggcagtcggt gatggaaggg ttggtttgga ag cctctctatg ggcagtcggt gatggaaggg ttggtttgga ag
4242
<210> 332<210> 332
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 332<400> 332
cctctctatg ggcagtcggt gatgaggcat gagccactga gact cctctctatg ggcagtcggt gatgaggcat gagccactga gact
4444
<210> 333<210> 333
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 333<400> 333
cctctctatg ggcagtcggt gatgccctag tgactgccgt ctg cctctctatg ggcagtcggt gatgccctag tgactgccgt ctg
4343
<210> 334<210> 334
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 334<400> 334
cctctctatg ggcagtcggt gatggccaca gtcgtgtcat cttg cctctctatg ggcagtcggt gatggccaca gtcgtgtcat cttg
4444
<210> 335<210> 335
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 335<400> 335
cctctctatg ggcagtcggt gatgtacaag gtgagcctgg gtct cctctctatg ggcagtcggt gatgtacaag gtgagcctgg gtct
4444
<210> 336<210> 336
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 336<400> 336
cctctctatg ggcagtcggt gatggaaaga aagccccacc ctcg cctctctatg ggcagtcggt gatggaaaga aagccccacc ctcg
4444
<210> 337<210> 337
<211> 45<211> 45
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 337<400> 337
cctctctatg ggcagtcggt gatgcaccct cgctctttta gtctc cctctctatg ggcagtcggt gatgcaccct cgctctttta gtctc
4545
<210> 338<210> 338
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 338<400> 338
cctctctatg ggcagtcggt gatgtcagag ggtgctgtct gtct cctctctatg ggcagtcggt gatgtcagag ggtgctgtct gtct
4444
<210> 339<210> 339
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 339<400> 339
cctctctatg ggcagtcggt gatggttgcc caccctagtc attg cctctctatg ggcagtcggt gatggttgcc caccctagtc attg
4444
<210> 340<210> 340
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 340<400> 340
cctctctatg ggcagtcggt gatggcccaa tcattgatgc tttt cctctctatg ggcagtcggt gatggcccaa tcattgatgc tttt
4444
<210> 341<210> 341
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 341<400> 341
cctctctatg ggcagtcggt gatgggcttt cacaaggatg cagt cctctctatg ggcagtcggt gatgggcttt cacaaggatg cagt
4444
<210> 342<210> 342
<211> 48<211> 48
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 342<400> 342
cctctctatg ggcagtcggt gatgtcctgc tctcacttag actttctc cctctctatg ggcagtcggt gatgtcctgc tctcacttag actttctc
4848
<210> 343<210> 343
<211> 58<211> 58
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 343<400> 343
cctctctatg ggcagtcggt gatgatggct tacatattta ttagataaaa tgtattcc cctctctatg ggcagtcggt gatgatggct tacatattta ttagataaaa tgtattcc
5858
<210> 344<210> 344
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 344<400> 344
cctctctatg ggcagtcggt gatgtggccc cagtctctct tcta cctctctatg ggcagtcggt gatgtggccc cagtctctct tcta
4444
<210> 345<210> 345
<211> 45<211> 45
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 345<400> 345
cctctctatg ggcagtcggt gatgtgccag tgcctcaaga atgtc cctctctatg ggcagtcggt gatgtgccag tgcctcaaga atgtc
4545
<210> 346<210> 346
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 346<400> 346
cctctctatg ggcagtcggt gatgtccagc ttgggcccac cctctctatg ggcagtcggt gatgtccagc ttgggcccac
4040
<210> 347<210> 347
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 347<400> 347
cctctctatg ggcagtcggt gatgtccagc ttgggcccac cctctctatg ggcagtcggt gatgtccagc ttgggcccac
4040
<210> 348<210> 348
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 348<400> 348
cctctctatg ggcagtcggt gatggaggag aaggccaagt ggtc cctctctatg ggcagtcggt gatggaggag aaggccaagt ggtc
4444
<210> 349<210> 349
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 349<400> 349
cctctctatg ggcagtcggt gatggttgcc caccctagtc attg cctctctatg ggcagtcggt gatggttgcc caccctagtc attg
4444
<210> 350<210> 350
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 350<400> 350
cctctctatg ggcagtcggt gatggttgcc caccctagtc attg cctctctatg ggcagtcggt gatggttgcc caccctagtc attg
4444
<210> 351<210> 351
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 351<400> 351
cctctctatg ggcagtcggt gatggaggag aaggccaagt ggtc cctctctatg ggcagtcggt gatggaggag aaggccaagt ggtc
4444
<210> 352<210> 352
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 352<400> 352
cctctctatg ggcagtcggt gatggaggag aaggccaagt ggtc cctctctatg ggcagtcggt gatggaggag aaggccaagt ggtc
4444
<210> 353<210> 353
<211> 40<211> 40
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 353<400> 353
cctctctatg ggcagtcggt gatgtccagc ttgggcccac cctctctatg ggcagtcggt gatgtccagc ttgggcccac
4040
<210> 354<210> 354
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 354<400> 354
cctctctatg ggcagtcggt gatgccctag tgactgccgt ctg cctctctatg ggcagtcggt gatgccctag tgactgccgt ctg
4343
<210> 355<210> 355
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 355<400> 355
cctctctatg ggcagtcggt gatgccctag tgactgccgt ctg cctctctatg ggcagtcggt gatgccctag tgactgccgt ctg
4343
<210> 356<210> 356
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 356<400> 356
cctctctatg ggcagtcggt gatgggggag agggacacac agat cctctctatg ggcagtcggt gatgggggag agggacacac agat
4444
<210> 357<210> 357
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 357<400> 357
cctctctatg ggcagtcggt gatggcaccc caacacctac atct cctctctatg ggcagtcggt gatggcaccc caacacctac atct
4444
<210> 358<210> 358
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 358<400> 358
cctctctatg ggcagtcggt gatggcaccc caacacctac atct cctctctatg ggcagtcggt gatggcaccc caacacctac atct
4444
<210> 359<210> 359
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 359<400> 359
cctctctatg ggcagtcggt gatgcgtgtt ccccagagtg actt cctctctatg ggcagtcggt gatgcgtgtt ccccagagtg actt
4444
<210> 360<210> 360
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 360<400> 360
cctctctatg ggcagtcggt gatgtcagag ggtgctgtct gtct cctctctatg ggcagtcggt gatgtcagag ggtgctgtct gtct
4444
<210> 361<210> 361
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 361<400> 361
cctctctatg ggcagtcggt gatgtacaag gtgagcctgg gtct cctctctatg ggcagtcggt gatgtacaag gtgagcctgg gtct
4444
<210> 362<210> 362
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 362<400> 362
cctctctatg ggcagtcggt gatgttctgc cactggctta gctt cctctctatg ggcagtcggt gatgttctgc cactggctta gctt
4444
<210> 363<210> 363
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 363<400> 363
cctctctatg ggcagtcggt gatgcacacc cacaccctca taca cctctctatg ggcagtcggt gatgcacacc cacaccctca taca
4444
<210> 364<210> 364
<211> 44<211> 44
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 364<400> 364
cctctctatg ggcagtcggt gatgcacacc cacaccctca taca cctctctatg ggcagtcggt gatgcacacc cacaccctca taca
4444
<210> 365<210> 365
<211> 45<211> 45
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический праймер"Synthetic primer"
<400> 365<400> 365
cctctctatg ggcagtcggt gatgtgccag tgcctcaaga atgtc cctctctatg ggcagtcggt gatgtgccag tgcctcaaga atgtc
4545
<210> 366<210> 366
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 366<400> 366
ggtgagtgag tgtgtgcgtg tgg ggtgagtgag tgtgtgcgtg tgg
2323
<210> 367<210> 367
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 367<400> 367
gctgagtgag tgtatgcgtg tgg gctgagtgag tgtatgcgtg tgg
2323
<210> 368<210> 368
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 368<400> 368
tgtgggtgag tgtgtgcgtg agg tgtgggtgag tgtgtgcgtg agg
2323
<210> 369<210> 369
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 369<400> 369
agagagtgag tgtgtgcatg agg agagagtgag tgtgtgcatg agg
2323
<210> 370<210> 370
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 370<400> 370
agtgagtgag tgtgtgtgtg ggg agtgagtgag tgtgtgtgtg ggg
2323
<210> 371<210> 371
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 371<400> 371
ggtgagtgag tgtgtgtgtg agg ggtgagtgag tgtgtgtgtg agg
2323
<210> 372<210> 372
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 372<400> 372
ggtgagtgag tgcgtgcggg tgg ggtgagtgag tgcgtgcggg tgg
2323
<210> 373<210> 373
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 373<400> 373
agtgtgtgag tgtgtgcgtg tgg agtgtgtgag tgtgtgcgtg tgg
2323
<210> 374<210> 374
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 374<400> 374
tgtgagtaag tgtgtgtgtg tgg tgtgagtaag tgtgtgtgtg tgg
2323
<210> 375<210> 375
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 375<400> 375
ggtgagtgtg tgtgtgcatg tgg ggtgagtgtg tgtgtgcatg tgg
2323
<210> 376<210> 376
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 376<400> 376
gttgagtgaa tgtgtgcgtg agg gttgagtgaa tgtgtgcgtg agg
2323
<210> 377<210> 377
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 377<400> 377
gtgagtgagt gtgtgtgtgt gag gtgagtgagt gtgtgtgtgt gag
2323
<210> 378<210> 378
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 378<400> 378
agcgagtggg tgtgtgcgtg ggg agcgagtggg tgtgtgcgtg ggg
2323
<210> 379<210> 379
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 379<400> 379
ggtgagtgag tgtgtgcgtg tgg ggtgagtgag tgtgtgcgtg tgg
2323
<210> 380<210> 380
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 380<400> 380
gctgagtgag tgtatgcgtg tgg gctgagtgag tgtatgcgtg tgg
2323
<210> 381<210> 381
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 381<400> 381
tgtgggtgag tgtgtgcgtg agg tgtgggtgag tgtgtgcgtg agg
2323
<210> 382<210> 382
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 382<400> 382
agagagtgag tgtgtgcatg agg agagagtgag tgtgtgcatg agg
2323
<210> 383<210> 383
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 383<400> 383
agtgagtgag tgtgtgtgtg ggg agtgagtgag tgtgtgtgtg ggg
2323
<210> 384<210> 384
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 384<400> 384
ggtgagtgag tgtgtgtgtg agg ggtgagtgag tgtgtgtgtg agg
2323
<210> 385<210> 385
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 385<400> 385
ggtgagtgag tgcgtgcggg tgg ggtgagtgag tgcgtgcggg tgg
2323
<210> 386<210> 386
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 386<400> 386
agtgtgtgag tgtgtgcgtg tgg agtgtgtgag tgtgtgcgtg tgg
2323
<210> 387<210> 387
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 387<400> 387
tgtgagtaag tgtgtgtgtg tgg tgtgagtaag tgtgtgtgtg tgg
2323
<210> 388<210> 388
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 388<400> 388
ggtgagtgtg tgtgtgcatg tgg ggtgagtgtg tgtgtgcatg tgg
2323
<210> 389<210> 389
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 389<400> 389
gttgagtgaa tgtgtgcgtg agg gttgagtgaa tgtgtgcgtg agg
2323
<210> 390<210> 390
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 390<400> 390
gtgagtgagt gtgtgtgtgt gag gtgagtgagt gtgtgtgtgt gag
2323
<210> 391<210> 391
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 391<400> 391
agcgagtggg tgtgtgcgtg ggg agcgagtggg tgtgtgcgtg ggg
2323
<210> 392<210> 392
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 392<400> 392
ggtgagtgag tgtgtgcgtg tgg ggtgagtgag tgtgtgcgtg tgg
2323
<210> 393<210> 393
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 393<400> 393
gctgagtgag tgtatgcgtg tgg gctgagtgag tgtatgcgtg tgg
2323
<210> 394<210> 394
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 394<400> 394
tgtgggtgag tgtgtgcgtg agg tgtgggtgag tgtgtgcgtg agg
2323
<210> 395<210> 395
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 395<400> 395
agagagtgag tgtgtgcatg agg agagagtgag tgtgtgcatg agg
2323
<210> 396<210> 396
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 396<400> 396
agtgagtgag tgtgtgtgtg ggg agtgagtgag tgtgtgtgtg ggg
2323
<210> 397<210> 397
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 397<400> 397
ggtgagtgag tgtgtgtgtg agg ggtgagtgag tgtgtgtgtg agg
2323
<210> 398<210> 398
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 398<400> 398
ggtgagtgag tgcgtgcggg tgg ggtgagtgag tgcgtgcggg tgg
2323
<210> 399<210> 399
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 399<400> 399
agtgtgtgag tgtgtgcgtg tgg agtgtgtgag tgtgtgcgtg tgg
2323
<210> 400<210> 400
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 400<400> 400
tgtgagtaag tgtgtgtgtg tgg tgtgagtaag tgtgtgtgtg tgg
2323
<210> 401<210> 401
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 401<400> 401
ggtgagtgtg tgtgtgcatg tgg ggtgagtgtg tgtgtgcatg tgg
2323
<210> 402<210> 402
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 402<400> 402
gttgagtgaa tgtgtgcgtg agg gttgagtgaa tgtgtgcgtg agg
2323
<210> 403<210> 403
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 403<400> 403
gtgagtgagt gtgtgtgtgt gag gtgagtgagt gtgtgtgtgt gag
2323
<210> 404<210> 404
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 404<400> 404
agcgagtggg tgtgtgcgtg ggg agcgagtggg tgtgtgcgtg ggg
2323
<210> 405<210> 405
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 405<400> 405
gagtccgagc agaagaagaa ggg gagtccgagc agaagaagaa ggg
2323
<210> 406<210> 406
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 406<400> 406
gagttagagc agaagaagaa agg gagttagagc agaagaagaa agg
2323
<210> 407<210> 407
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 407<400> 407
gagtctaagc agaagaagaa gag gagtctaagc agaagaagaa gag
2323
<210> 408<210> 408
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 408<400> 408
aagtctgagc acaagaagaa tgg aagtctgagc acaagaagaa tgg
2323
<210> 409<210> 409
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 409<400> 409
gagtcctagc aggagaagaa gag gagtcctagc aggagaagaa gag
2323
<210> 410<210> 410
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 410<400> 410
gagtccgagc agaagaagaa ggg gagtccgagc agaagaagaa ggg
2323
<210> 411<210> 411
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 411<400> 411
gagttagagc agaagaagaa agg gagttagagc agaagaagaa agg
2323
<210> 412<210> 412
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 412<400> 412
gagtctaagc agaagaagaa gag gagtctaagc agaagaagaa gag
2323
<210> 413<210> 413
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 413<400> 413
aagtctgagc acaagaagaa tgg aagtctgagc acaagaagaa tgg
2323
<210> 414<210> 414
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 414<400> 414
gagtcctagc aggagaagaa gag gagtcctagc aggagaagaa gag
2323
<210> 415<210> 415
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 415<400> 415
gagtccgagc agaagaagaa ggg gagtccgagc agaagaagaa ggg
2323
<210> 416<210> 416
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 416<400> 416
gagttagagc agaagaagaa agg gagttagagc agaagaagaa agg
2323
<210> 417<210> 417
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 417<400> 417
gagtctaagc agaagaagaa gag gagtctaagc agaagaagaa gag
2323
<210> 418<210> 418
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 418<400> 418
aagtctgagc acaagaagaa tgg aagtctgagc acaagaagaa tgg
2323
<210> 419<210> 419
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 419<400> 419
gagtcctagc aggagaagaa gag gagtcctagc aggagaagaa gag
2323
<210> 420<210> 420
<211> 4203<211> 4203
<212> ДНК<212> DNA
<213> Staphylococcus aureus<213> Staphylococcus aureus
<400> 420<400> 420
atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc cgacaagaag atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc cgacaagaag
6060
tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag
120120
tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag
180180
aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg
240240
aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag
300300
atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc
360360
ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac
420420
gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac
480480
agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc
540540
cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg
600600
ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc
660660
ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat
720720
ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggaaacct gattgccctg ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggaaacct gattgccctg
780780
agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg
840840
cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac
900900
cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac
960960
atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga
10201020
tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct
10801080
gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac
11401140
ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac
12001200
ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc
12601260
ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg
13201320
cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg
13801380
accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg accttccgca tcccctacta cgtgggccct ctggccagg gaaacagcag attcgcctgg
14401440
atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag
15001500
ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac
15601560
gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg
16201620
accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag
16801680
aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg
17401740
aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa
18001800
gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag
18601860
gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca
19201920
ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac
19801980
gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg
20402040
aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag
21002100
tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt
21602160
aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt
22202220
gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg
22802280
gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc
23402340
agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc
24002400
gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc gaagaggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc
24602460
cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg
25202520
gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccatat cgtgcctcag gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccatat cgtgcctcag
25802580
agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caagaaccgg agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caagaaccgg
26402640
ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg
27002700
cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag
27602760
agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc
28202820
cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac
28802880
gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc
29402940
gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc
30003000
cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg
30603060
gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag
31203120
agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac
31803180
tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag
32403240
acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg
33003300
aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc
33603360
ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag
34203420
gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg
34803480
gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg
35403540
gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc
36003600
aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc
36603660
gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac
37203720
gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag
37803780
ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac
38403840
tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac
39003900
gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag
39603960
caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc
40204020
aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac
40804080
gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag
41404140
ctgggaggcg acaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag ctgggaggcg acaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag
42004200
taa taa
42034203
<210> 421<210> 421
<211> 4272<211> 4272
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический полинуклеотид"synthetic polynucleotide"
<400> 421<400> 421
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat
6060
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc
120120
gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc
180180
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac
240240
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc
300300
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat
360360
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg
420420
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac
480480
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa
540540
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg
600600
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg
660660
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc
720720
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg
780780
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg
840840
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat
900900
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag
960960
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg
10201020
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg
10801080
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag
11401140
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc
12001200
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa tacattgacg gcggagccag ccadgaagag ttctacaagt tcatcaagcc catcctggaa
12601260
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag
13201320
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc
13801380
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag
14401440
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga
15001500
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg
15601560
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac gtggacaagg gcgcttccgc cccagcttc atcgagcgga tgaccaactt cgataagaac
16201620
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat
16801680
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc
17401740
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg
18001800
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc
18601860
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc
19201920
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg
19801980
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac
20402040
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg
21002100
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat
21602160
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc
22202220
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac
22802280
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg
23402340
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc
24002400
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg
24602460
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg
25202520
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat
25802580
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc
26402640
gtgcctcaga gctttctgaa ggacgactcc atcgacaacg cggtgctgac cagaagcgac gtgcctcaga gctttctgaa ggacgactcc atcgacaacg cggtgctgac cagaagcgac
27002700
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac
27602760
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc
28202820
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg
28802880
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact
29402940
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag
30003000
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac
30603060
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac
31203120
cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg
31803180
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac
32403240
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct
33003300
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc
33603360
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag
34203420
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc
34803480
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat
35403540
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa
36003600
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt
36603660
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac
37203720
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag
37803780
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac
38403840
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag
39003900
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc
39603960
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc
40204020
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct
40804080
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag
41404140
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac
42004200
ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa
42604260
aagaaaaagt aa aagaaaaagt aa
42724272
<210> 422<210> 422
<211> 4269<211> 4269
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический полинуклеотид"synthetic polynucleotide"
<400> 422<400> 422
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat
6060
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc
120120
gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc
180180
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac
240240
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc
300300
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat
360360
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg
420420
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac
480480
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa
540540
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg
600600
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg
660660
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc
720720
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg
780780
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg
840840
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat
900900
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag
960960
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg
10201020
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg
10801080
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag
11401140
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc
12001200
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa tacattgacg gcggagccag ccadgaagag ttctacaagt tcatcaagcc catcctggaa
12601260
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag
13201320
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc
13801380
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag
14401440
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga
15001500
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg
15601560
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac gtggacaagg gcgcttccgc cccagcttc atcgagcgga tgaccaactt cgataagaac
16201620
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat
16801680
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc
17401740
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg
18001800
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc
18601860
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc
19201920
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg
19801980
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac
20402040
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg
21002100
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat
21602160
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc
22202220
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac
22802280
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg
23402340
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc
24002400
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg
24602460
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg
25202520
gaaaacaccc agctgcagaa cgaggccctg tacctgtact acctgcagaa tgggcgggat gaaaacaccc agctgcagaa cgaggccctg tacctgtact acctgcagaa tgggcgggat
25802580
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc
26402640
gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac
27002700
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac
27602760
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc
28202820
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg
28802880
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact
29402940
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag
30003000
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac
30603060
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac
31203120
cctgcgctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg cctgcgctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg
31803180
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac
32403240
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaaggcgcct atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaaggcgcct
33003300
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc
33603360
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag
34203420
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc
34803480
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat
35403540
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa
36003600
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt
36603660
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac
37203720
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag
37803780
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac
38403840
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag
39003900
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc
39603960
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc
40204020
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct
40804080
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag
41404140
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac
42004200
ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa
42604260
aagaaaaag aagaaaaag
42694269
<210> 423<210> 423
<211> 4272<211> 4272
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
синтетический полинуклеотид"synthetic polynucleotide"
<400> 423<400> 423
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat
6060
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc
120120
gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc
180180
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac
240240
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc
300300
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat
360360
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg
420420
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac
480480
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa
540540
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg
600600
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg
660660
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc
720720
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg
780780
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg
840840
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat
900900
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag
960960
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg
10201020
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg
10801080
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag
11401140
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc
12001200
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa tacattgacg gcggagccag ccadgaagag ttctacaagt tcatcaagcc catcctggaa
12601260
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag
13201320
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc
13801380
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag
14401440
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga
15001500
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg
15601560
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac gtggacaagg gcgcttccgc cccagcttc atcgagcgga tgaccaactt cgataagaac
16201620
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat
16801680
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc
17401740
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg
18001800
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc
18601860
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc
19201920
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg
19801980
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac
20402040
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg
21002100
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat
21602160
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc
22202220
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac
22802280
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg
23402340
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc
24002400
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg
24602460
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg
25202520
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat
25802580
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc
26402640
gtgcctcaga gctttctggc ggacgactcc atcgacaaca aggtgctgac cagaagcgac gtgcctcaga gctttctggc ggacgactcc atcgacaaca aggtgctgac cagaagcgac
27002700
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac
27602760
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc
28202820
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg
28802880
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact
29402940
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag
30003000
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac
30603060
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac
31203120
cctgcgctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg cctgcgctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg
31803180
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac
32403240
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaaggcgcct atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaaggcgcct
33003300
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc
33603360
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag
34203420
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc
34803480
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat
35403540
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa
36003600
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt
36603660
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac
37203720
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag
37803780
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac
38403840
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag
39003900
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc
39603960
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc
40204020
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct
40804080
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag
41404140
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac
42004200
ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa
42604260
aagaaaaagt aa aagaaaaagt aa
42724272
<210> 424<210> 424
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 424<400> 424
gagtccgagc agaagaagaa ggg gagtccgagc agaagaagaa ggg
2323
<210> 425<210> 425
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 425<400> 425
gtcacctcca atgactaggg tgg gtcacctcca atgactaggg tgg
2323
<210> 426<210> 426
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 426<400> 426
gacatcgatg tcctccccat tgg gacatcgatg tcctccccat tgg
2323
<210> 427<210> 427
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 427<400> 427
gcctccccaa agcctggcca ggg gcctccccaa agcctggcca ggg
2323
<210> 428<210> 428
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 428<400> 428
gccccgggct tcaagccctg tgg gccccgggct tcaagccctg tgg
2323
<210> 429<210> 429
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 429<400> 429
ggcagagtgc tgcttgctgc tgg ggcagagtgc tgcttgctgc tgg
2323
<210> 430<210> 430
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 430<400> 430
gattcctggt gccagaaaca ggg gattcctggt gccagaaaca ggg
2323
<210> 431<210> 431
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 431<400> 431
ggtgagtgag tgtgtgcgtg tgg ggtgagtgag tgtgtgcgtg tgg
2323
<210> 432<210> 432
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 432<400> 432
gctaaagagg gaatgggctt tgg gctaaagagg gaatgggctt tgg
2323
<210> 433<210> 433
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 433<400> 433
gtttgggagg tcagaaatag ggg gtttgggagg tcagaaatag ggg
2323
<210> 434<210> 434
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 434<400> 434
gagtccgagc agaagaagaa ggg gagtccgagc agaagaagaa ggg
2323
<210> 435<210> 435
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 435<400> 435
gtcacctcca atgactaggg tgg gtcacctcca atgactaggg tgg
2323
<210> 436<210> 436
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 436<400> 436
gggcaaccac aaacccacga ggg gggcaaccac aaacccacga ggg
2323
<210> 437<210> 437
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 437<400> 437
gcttgtccct ctgtcaatgg cgg gcttgtccct ctgtcaatgg cgg
2323
<210> 438<210> 438
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 438<400> 438
gcgccaccgg ttgatgtgat ggg gcgccaccgg ttgatgtgat ggg
2323
<210> 439<210> 439
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 439<400> 439
gacatcgatg tcctccccat tgg gacatcgatg tcctccccat tgg
2323
<210> 440<210> 440
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 440<400> 440
gcctccccaa agcctggcca ggg gcctccccaa agcctggcca ggg
2323
<210> 441<210> 441
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 441<400> 441
gccccgggct tcaagccctg tgg gccccgggct tcaagccctg tgg
2323
<210> 442<210> 442
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 442<400> 442
ggcagagtgc tgcttgctgc tgg ggcagagtgc tgcttgctgc tgg
2323
<210> 443<210> 443
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 443<400> 443
ggtgagtgag tgtgtgcgtg tgg ggtgagtgag tgtgtgcgtg tgg
2323
<210> 444<210> 444
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 444<400> 444
gctaaagagg gaatgggctt tgg gctaaagagg gaatgggctt tgg
2323
<210> 445<210> 445
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 445<400> 445
gtttgggagg tcagaaatag ggg gtttgggagg tcagaaatag ggg
2323
<210> 446<210> 446
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 446<400> 446
gttggagcgg ggagaaggcc agg gttggagcgg ggagaaggcc agg
2323
<210> 447<210> 447
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 447<400> 447
gggtgggggg agtttgctcc tgg gggtgggggg agtttgctcc tgg
2323
<210> 448<210> 448
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 448<400> 448
gtagagtgag tgtgtgtgtg tgg gtagagtgag tgtgtgtgtg tgg
2323
<210> 449<210> 449
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 449<400> 449
gaagaatgga cagaactctg agg gaagaatgga cagaactctg agg
2323
<210> 450<210> 450
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 450<400> 450
gattcctggt gccagaaaca ggg gattcctggt gccagaaaca ggg
2323
<210> 451<210> 451
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 451<400> 451
gtgggtgagt gagtgcgtgc ggg gtgggtgagt gagtgcgtgc ggg
2323
<210> 452<210> 452
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 452<400> 452
gaggctgggg tggaggtgtt ggg gaggctgggg tggaggtgtt ggg
2323
<210> 453<210> 453
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 453<400> 453
ggtgagtgag tgtgtgtgtg agg ggtgagtgag tgtgtgtgtg agg
2323
<210> 454<210> 454
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 454<400> 454
gtgtgtgtgt gagggtgtaa ggg gtgtgtgtgt gagggtgtaa ggg
2323
<210> 455<210> 455
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 455<400> 455
gggcagtttg ctcctggcac agg gggcagtttg ctcctggcac agg
2323
<210> 456<210> 456
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 456<400> 456
ggagagaggc tcccatcacg ggg ggagagaggc tcccatcacg ggg
2323
<210> 457<210> 457
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 457<400> 457
gagaagagaa gtggggtggg ggg gagaagagaa gtggggtggg ggg
2323
<210> 458<210> 458
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 458<400> 458
gtgtgtctgt gtgggtgagt gagtgtgtgc gtgtggggtt gag gtgtgtctgt gtgggtgagt gagtgtgtgc gtgtggggtt gag
4343
<210> 459<210> 459
<211> 43<211> 43
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 459<400> 459
ctcaacccca cacgcacaca ctcactcacc cacacagaca cac ctcaacccca cacgcacaca ctcactcacc cacacagaca cac
4343
<210> 460<210> 460
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 460<400> 460
ggugagugag ugugugcgug ggugagugag ugugugcgug
2020
<210> 461<210> 461
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (20)..(20)<222> (20)..(20)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 461<400> 461
ggugagugag ugugugcgun ggugagugag ugugugcgun
2020
<210> 462<210> 462
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (19)..(19)<222> (19)..(19)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 462<400> 462
ggugagugag ugugugcgng ggugagugag ugugugcgng
2020
<210> 463<210> 463
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (18)..(18)<222> (18)..(18)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 463<400> 463
ggugagugag ugugugcnug ggugagugag ugugugcnug
2020
<210> 464<210> 464
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (17)..(17)<222> (17)..(17)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 464<400> 464
ggugagugag ugugugngug ggugagugag ugugugngug
2020
<210> 465<210> 465
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (16)..(16)<222> (16)..(16)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 465<400> 465
ggugagugag uguguncgug ggugagugag uguguncgug
2020
<210> 466<210> 466
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (15)..(15)<222> (15)..(15)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 466<400> 466
ggugagugag ugugngcgug ggugagugag ugugngcgug
2020
<210> 467<210> 467
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (14)..(14)<222> (14)..(14)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 467<400> 467
ggugagugag ugunugcgug ggugagugag ugunugcgug
2020
<210> 468<210> 468
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (13)..(13)<222> (13)..(13)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 468<400> 468
ggugagugag ugngugcgug ggugagugag ugngugcgug
2020
<210> 469<210> 469
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (12)..(12)<222> (12)..(12)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 469<400> 469
ggugagugag unugugcgug ggugagugag unugugcgug
2020
<210> 470<210> 470
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (11)..(11)<222> (11)..(11)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 470<400> 470
ggugagugag ngugugcgug ggugagugag ngugugcgug
2020
<210> 471<210> 471
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (10)..(10)<222> (10)..(10)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 471<400> 471
ggugagugan ugugugcgug ggugagugan ugugugcgug
2020
<210> 472<210> 472
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (9)..(9)<222> (9)..(9)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 472<400> 472
ggugagugng ugugugcgug ggugagugng ugugugcgug
2020
<210> 473<210> 473
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (8)..(8)<222> (8)..(8)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 473<400> 473
ggugagunag ugugugcgug ggugagunag ugugugcgug
2020
<210> 474<210> 474
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (7)..(7)<222> (7)..(7)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 474<400> 474
ggugagngag ugugugcgug ggugagngag ugugugcgug
2020
<210> 475<210> 475
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (6)..(6)<222> (6)..(6)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 475<400> 475
gguganugag ugugugcgug gguganugag ugugugcgug
2020
<210> 476<210> 476
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (5)..(5)<222> (5)..(5)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 476<400> 476
ggugngugag ugugugcgug ggugngugag ugugugcgug
2020
<210> 477<210> 477
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (4)..(4)<222> (4)..(4)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 477<400> 477
ggunagugag ugugugcgug ggunagugag ugugugcgug
2020
<210> 478<210> 478
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (3)..(3)<222> (3)..(3)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 478<400> 478
ggngagugag ugugugcgug ggngngagugag ugugugcgug
2020
<210> 479<210> 479
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (2)..(2)<222> (2)..(2)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 479<400> 479
gnugagugag ugugugcgug gnugugugag ugugugcgug
2020
<210> 480<210> 480
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<220><220>
<221> модифицированное_основание<221> modified_base
<222> (1)..(1)<222> (1)..(1)
<223> a, c, u, g, неизвестное или другое<223> a, c, u, g, unknown or other
<400> 480<400> 480
ngugagugag ugugugcgug nggagugag ugugugcgug
2020
<210> 481<210> 481
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 481<400> 481
ggugagugag ugugugcgug ggugagugag ugugugcgug
2020
<210> 482<210> 482
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 482<400> 482
ggugagugag ugugugcgug ggugagugag ugugugcgug
2020
<210> 483<210> 483
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 483<400> 483
ggugagugag ugugugcgug ggugagugag ugugugcgug
2020
<210> 484<210> 484
<211> 20<211> 20
<212> РНК<212> RNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 484<400> 484
ggugagugag ugugugcgug ggugagugag ugugugcgug
2020
<210> 485<210> 485
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 485<400> 485
ggtgagtgag tgtgtgcgtg ggtgagtgag tgtgtgcgtg
2020
<210> 486<210> 486
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 486<400> 486
gacgagtgag tgtgtgcgtg gacgagtgag tgtgtgcgtg
2020
<210> 487<210> 487
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 487<400> 487
ggcaagtgag tgtgtgcgtg ggcaagtgag tgtgtgcgtg
2020
<210> 488<210> 488
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 488<400> 488
ggtaggtgag tgtgtgcgtg ggtaggtgag tgtgtgcgtg
2020
<210> 489<210> 489
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 489<400> 489
ggtggatgag tgtgtgcgtg ggtggatgag tgtgtgcgtg
2020
<210> 490<210> 490
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 490<400> 490
ggtgaacgag tgtgtgcgtg ggtgaacgag tgtgtgcgtg
2020
<210> 491<210> 491
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 491<400> 491
ggtgagcaag tgtgtgcgtg ggtgagcaag tgtgtgcgtg
2020
<210> 492<210> 492
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 492<400> 492
ggtgagtagg tgtgtgcgtg ggtgagtagg tgtgtgcgtg
2020
<210> 493<210> 493
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 493<400> 493
ggtgagtgga tgtgtgcgtg ggtgagtgga tgtgtgcgtg
2020
<210> 494<210> 494
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 494<400> 494
ggtgagtgaa cgtgtgcgtg ggtgagtgaa cgtgtgcgtg
2020
<210> 495<210> 495
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 495<400> 495
ggtgagtgag catgtgcgtg ggtgagtgag catgtgcgtg
2020
<210> 496<210> 496
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 496<400> 496
ggtgagtgag tacgtgcgtg ggtgagtgag tacgtgcgtg
2020
<210> 497<210> 497
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 497<400> 497
ggtgagtgag tgcatgcgtg ggtgagtgag tgcatgcgtg
2020
<210> 498<210> 498
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 498<400> 498
ggtgagtgag tgtacgcgtg ggtgagtgag tgtacgcgtg
2020
<210> 499<210> 499
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 499<400> 499
ggtgagtgag tgtgcacgtg ggtgagtgag tgtgcacgtg
2020
<210> 500<210> 500
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 500<400> 500
ggtgagtgag tgtgtatgtg ggtgagtgag tgtgtatgtg
2020
<210> 501<210> 501
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 501<400> 501
ggtgagtgag tgtgtgtatg ggtgagtgag tgtgtgtatg
2020
<210> 502<210> 502
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 502<400> 502
ggtgagtgag tgtgtgcacg ggtgagtgag tgtgtgcacg
2020
<210> 503<210> 503
<211> 20<211> 20
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 503<400> 503
ggtgagtgag tgtgtgcgca ggtgagtgag tgtgtgcgca
2020
<210> 504<210> 504
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 504<400> 504
gagtccgagc agaagaagaa ggg gagtccgagc agaagaagaa ggg
2323
<210> 505<210> 505
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 505<400> 505
gagttagagc agaagaagaa agg gagttagagc agaagaagaa agg
2323
<210> 506<210> 506
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 506<400> 506
gagtctaagc agaagaagaa gag gagtctaagc agaagaagaa gag
2323
<210> 507<210> 507
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 507<400> 507
aagtctgagc acaagaagaa tgg aagtctgagc acaagaagaa tgg
2323
<210> 508<210> 508
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 508<400> 508
gagtcctagc aggagaagaa gag gagtcctagc aggagaagaa gag
2323
<210> 509<210> 509
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 509<400> 509
ggtgagtgag tgtgtgcgtg tgg ggtgagtgag tgtgtgcgtg tgg
2323
<210> 510<210> 510
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 510<400> 510
gctgagtgag tgtatgcgtg tgg gctgagtgag tgtatgcgtg tgg
2323
<210> 511<210> 511
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 511<400> 511
tgtgggtgag tgtgtgcgtg agg tgtgggtgag tgtgtgcgtg agg
2323
<210> 512<210> 512
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 512<400> 512
agagagtgag tgtgtgcatg agg agagagtgag tgtgtgcatg agg
2323
<210> 513<210> 513
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 513<400> 513
ggtgagtgag tgtgtgtgtg agg ggtgagtgag tgtgtgtgtg agg
2323
<210> 514<210> 514
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 514<400> 514
ggtgagtgag tgcgtgcggg tgg ggtgagtgag tgcgtgcggg tgg
2323
<210> 515<210> 515
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 515<400> 515
agtgtgtgag tgtgtgcgtg tgg agtgtgtgag tgtgtgcgtg tgg
2323
<210> 516<210> 516
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 516<400> 516
tgtgagtaag tgtgtgtgtg tgg tgtgagtaag tgtgtgtgtg tgg
2323
<210> 517<210> 517
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 517<400> 517
tgtgagtgag tgtgtgtgtg tga tgtgagtgag tgtgtgtgtg tga
2323
<210> 518<210> 518
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 518<400> 518
agcgagtggg tgtgtgcgtg ggg agcgagtggg tgtgtgcgtg ggg
2323
<210> 519<210> 519
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 519<400> 519
cgtgagtgag tgtgtacctg ggg cgtgagtgag tgtgtacctg ggg
2323
<210> 520<210> 520
<211> 1443<211> 1443
<212> БЕЛОК<212> PROTEIN
<213> Staphylococcus aureus<213> Staphylococcus aureus
<400> 520<400> 520
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser ValAla Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 151 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys PheGly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 3020 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu IleLys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 4535 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg LeuGly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 6050 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile CysLys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 8065 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp SerTyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 9585 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys LysPhe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala TyrHis Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val AspHis Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala HisSer Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn ProMet Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr TyrAsp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp AlaAsn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu AsnLys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly AsnLeu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn PheLeu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr AspAsp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala AspAsp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser AspLeu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala SerIle Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu LysMet Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe PheAla Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala SerAsp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met AspGln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu ArgGly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His LeuLys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro PheGly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg IleLeu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala TrpPro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu GluMet Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met ThrVal Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His SerAsn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val LysLeu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu GlnTyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val ThrLys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe AspVal Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu GlySer Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu AspThr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu ThrAsn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr AlaLeu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg TyrHis Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg AspThr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly PheLys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr PheAla Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser LeuLys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys GlyHis Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met GlyIle Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn GlnArg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg IleThr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His ProGlu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr LeuVal Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn ArgGln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu LysLeu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn ArgAsp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met LysGly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg LysAsn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu AspPhe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile ThrLys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr AspLys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys SerGlu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val ThrLys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Thr
965 970 975965 970 975
Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe IleLys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile
980 985 990980 985 990
Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala GlnLys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln
995 1000 1005995 1000 1005
Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp LysIle Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys
1010 1015 10201010 1015 1020
Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu ValLeu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val
1025 1030 10351025 1030 1035
Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu IleSer Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile
1040 1045 10501040 1045 1050
Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val ValAsn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
1055 1060 10651055 1060 1065
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu PheGly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
1070 1075 10801070 1075 1080
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile AlaVal Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1085 1090 10951085 1090 1095
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe PheLys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1100 1105 11101100 1105 1110
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu AlaTyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1115 1120 11251115 1120 1125
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly GluAsn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1130 1135 11401130 1135 1140
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr ValThr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1145 1150 11551145 1150 1155
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys ThrArg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1160 1165 11701160 1165 1170
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro LysGlu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1175 1180 11851175 1180 1185
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp ProArg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1190 1195 12001190 1195 1200
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser ValLys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1205 1210 12151205 1210 1215
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu LysLeu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1220 1225 12301220 1225 1230
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser SerSer Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1235 1240 12451235 1240 1245
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr LysPhe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1250 1255 12601250 1255 1260
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser LeuGlu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1265 1270 12751265 1270 1275
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala GlyPhe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1280 1285 12901280 1285 1290
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr ValGlu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1295 1300 13051295 1300 1305
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly SerAsn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1310 1315 13201310 1315 1320
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His LysPro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1325 1330 13351325 1330 1335
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser LysHis Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1340 1345 13501340 1345 1350
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser AlaArg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1355 1360 13651355 1360 1365
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu AsnTyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1370 1375 13801370 1375 1380
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala AlaIle Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1385 1390 13951385 1390 1395
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr SerPhe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1400 1405 14101400 1405 1410
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile ThrThr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1415 1420 14251415 1420 1425
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly AspGly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1430 1435 14401430 1435 1440
<210> 521<210> 521
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 521<400> 521
gagtccgagc agaagaagaa ggg gagtccgagc agaagaagaa ggg
2323
<210> 522<210> 522
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 522<400> 522
gagttagagc agaagaagaa agg gagttagagc agaagaagaa agg
2323
<210> 523<210> 523
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 523<400> 523
gagtctaagc agaagaagaa gag gagtctaagc agaagaagaa gag
2323
<210> 524<210> 524
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 524<400> 524
gagtcctagc aggagaagaa tag gagtcctagc aggagaagaa tag
2323
<210> 525<210> 525
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 525<400> 525
gaggccgagc agaagaagaa ggg gaggccgagc agaagaagaa ggg
2323
<210> 526<210> 526
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 526<400> 526
aagtctgagc acaagaagaa cgg aagtctgagc acaagaagaa cgg
2323
<210> 527<210> 527
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 527<400> 527
acgtctgagc agaagaagaa tgg acgtctgagc agaagaagaa tgg
2323
<210> 528<210> 528
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 528<400> 528
gggtgggggg agtttgctcc tgg gggtgggggg agtttgctcc tgg
2323
<210> 529<210> 529
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 529<400> 529
gggagggtgg agtttgctcc tgg ggggagggtgg agtttgctcc tgg
2323
<210> 530<210> 530
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 530<400> 530
gcgtgggggg tgtttgctcc cgg gcgtgggggg tgtttgctcc cgg
2323
<210> 531<210> 531
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 531<400> 531
cgggggaggg agtttgctcc tgg cggggggaggg agtttgctcc tgg
2323
<210> 532<210> 532
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 532<400> 532
tagtggaggg agcttgctcc tgg tagtggaggg agcttgctcc tgg
2323
<210> 533<210> 533
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 533<400> 533
ttgggggggc agtttgctcc tgg ttggggggggc agtttgctcc tgg
2323
<210> 534<210> 534
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 534<400> 534
ggtgagtgag tgtgtgcgtg tgg ggtgagtgag tgtgtgcgtg tgg
2323
<210> 535<210> 535
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 535<400> 535
ggtgagtgag tgtgtgtgtg agg ggtgagtgag tgtgtgtgtg agg
2323
<210> 536<210> 536
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 536<400> 536
tgtgggtgag tgtgtgcgtg agg tgtgggtgag tgtgtgcgtg agg
2323
<210> 537<210> 537
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 537<400> 537
gctgagtgag tgtatgcgtg tgg gctgagtgag tgtatgcgtg tgg
2323
<210> 538<210> 538
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 538<400> 538
ggtgagtgag tgcgtgcggg tgg ggtgagtgag tgcgtgcggg tgg
2323
<210> 539<210> 539
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 539<400> 539
agtgtgtgag tgtgtgcgtg tgg agtgtgtgag tgtgtgcgtg tgg
2323
<210> 540<210> 540
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 540<400> 540
tgtgggtgag tgtgtgcgtg aga tgtgggtgag tgtgtgcgtg aga
2323
<210> 541<210> 541
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 541<400> 541
agtgaatgag tgtgtgtgtg tgg agtgaatgag tgtgtgtgtg tgg
2323
<210> 542<210> 542
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 542<400> 542
agcgagtgag tgtgtgtgtg ggg agcgagtgag tgtgtgtgtg ggg
2323
<210> 543<210> 543
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 543<400> 543
tgtgagtaag tgtgtgtgtg tgg tgtgagtaag tgtgtgtgtg tgg
2323
<210> 544<210> 544
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 544<400> 544
agcgagtggg tgtgtgcgtg ggg agcgagtggg tgtgtgcgtg ggg
2323
<210> 545<210> 545
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 545<400> 545
gtagagtgag tgtgtgtgtg tgg gtagagtgag tgtgtgtgtg tgg
2323
<210> 546<210> 546
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 546<400> 546
actgtgtgag tgtgtgcgtg agg actgtgtgag tgtgtgcgtg agg
2323
<210> 547<210> 547
<211> 23<211> 23
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<221> источник<221> source
<223> /примечание="Описание искусственной последовательности: <223> /note="Description of artificial sequence:
Синтетический олигонуклеотид"Synthetic oligonucleotide"
<400> 547<400> 547
tgagtgtgag tgtgtgcgtg ggg tgagtgtgag tgtgtgcgtg ggg
2323
<---<---
Claims (31)
Applications Claiming Priority (10)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201562181453P | 2015-06-18 | 2015-06-18 | |
| US62/181,453 | 2015-06-18 | ||
| US201562207312P | 2015-08-19 | 2015-08-19 | |
| US62/207,312 | 2015-08-19 | ||
| US201562237360P | 2015-10-05 | 2015-10-05 | |
| US62/237,360 | 2015-10-05 | ||
| US201562255256P | 2015-11-13 | 2015-11-13 | |
| US62/255,256 | 2015-11-13 | ||
| US201562269876P | 2015-12-18 | 2015-12-18 | |
| US62/269,876 | 2015-12-18 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2018101710A Division RU2752834C2 (en) | 2015-06-18 | 2016-06-17 | Crispr enzyme mutations reducing non-targeted effects |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2021120582A RU2021120582A (en) | 2021-09-02 |
| RU2845909C2 true RU2845909C2 (en) | 2025-08-27 |
Family
ID=
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2013176772A1 (en) * | 2012-05-25 | 2013-11-28 | The Regents Of The University Of California | Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription |
| WO2015071474A2 (en) * | 2013-11-18 | 2015-05-21 | Crispr Therapeutics Ag | Crispr-cas system materials and methods |
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2013176772A1 (en) * | 2012-05-25 | 2013-11-28 | The Regents Of The University Of California | Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription |
| WO2015071474A2 (en) * | 2013-11-18 | 2015-05-21 | Crispr Therapeutics Ag | Crispr-cas system materials and methods |
Non-Patent Citations (1)
| Title |
|---|
| YAN M SLAYMAKER et al., Rationally engineered Cas9 nucleases with improved specificity, Science, Epub 2015 Dec 1, v.351, iss. 6268, pp. 84-88. НЕМУДРЫЙ А.А. и др., Системы редактирования геномов TALEN и CRISPR/Cas - инструменты открытий, Acta naturae, 2014, 20, т. 6, N 3(22). * |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12091709B2 (en) | Crispr enzymes and systems | |
| US20250179453A1 (en) | Crispr enzyme mutations reducing off-target effects | |
| US20250215425A1 (en) | Novel crispr enzymes and systems | |
| US11180751B2 (en) | CRISPR enzymes and systems | |
| US20230049737A1 (en) | Genome editing using reverse transcriptase enabled and fully active crispr complexes | |
| US10669540B2 (en) | CRISPR enzymes and systems | |
| US20200263190A1 (en) | Novel crispr enzymes and systems | |
| RU2845909C2 (en) | Crispr enzyme mutations that reduce off-target effects | |
| HK1228925B (en) | Crispr enzyme mutations reducing off-target effects |