[go: up one dir, main page]

RU2842438C1 - Methods of overcoming immunological tolerance using plurality of guide rna - Google Patents

Methods of overcoming immunological tolerance using plurality of guide rna Download PDF

Info

Publication number
RU2842438C1
RU2842438C1 RU2024131507A RU2024131507A RU2842438C1 RU 2842438 C1 RU2842438 C1 RU 2842438C1 RU 2024131507 A RU2024131507 A RU 2024131507A RU 2024131507 A RU2024131507 A RU 2024131507A RU 2842438 C1 RU2842438 C1 RU 2842438C1
Authority
RU
Russia
Prior art keywords
mouse
sequence
human
locus
target
Prior art date
Application number
RU2024131507A
Other languages
Russian (ru)
Inventor
Вера ВОРОНИНА
Линн Макдоналд
Марин ПРИССЕТТ
Ка-Ман Венус ЛАЙ
Ашок БАДИТ
Эндрю Дж. МЕРФИ
Густаво ДРОГЕТТ
Дэвид ФРЭНДЭВЕЙ
Брайан Замбрович
Original Assignee
Регенерон Фармасьютикалс, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Регенерон Фармасьютикалс, Инк. filed Critical Регенерон Фармасьютикалс, Инк.
Application granted granted Critical
Publication of RU2842438C1 publication Critical patent/RU2842438C1/en

Links

Abstract

FIELD: biochemistry.
SUBSTANCE: invention relates to the field of biochemistry, in particular to a method for producing antigen-binding proteins against a foreign antigen of interest, which comprises generating a genetically modified non-human animal that is a mouse or rat, in which the target locus contains a bi-allele modification of the genomic target locus and the expression of the self-antigen is eliminated. Obtaining said mouse or rat involves administering Cas9 protein or nucleic acid encoding Cas9 protein, as well as first and second target nucleotide sequences into the mouse or rat embryo.
EFFECT: invention makes it possible to effectively reduce the time for producing a genetically modified mouse or rat with low tolerance to the foreign antigen of interest, as well as provides a larger amount of antibodies against the foreign antigen of interest.
40 cl, 32 dwg, 24 tbl, 8 ex

Description

ССЫЛКА НА СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ, ПОДАННЫЙ В КАЧЕСТВЕ ТЕКСТОВОГО ФАЙЛА ЧЕРЕЗ EFS WEBLINK TO SEQUENCE LIST SUBMITTED AS TEXT FILE VIA EFS WEB

[0001] Список последовательностей, записанный в файле 497023SEQ.LIST.txt, составляет 38,3 килобайта, был создан 18 мая 2017 года и включен в данный документ посредством ссылки.[0001] The sequence listing, located in file 497023SEQ.LIST.txt, is 38.3 kilobytes in size and was created on May 18, 2017 and is incorporated herein by reference.

УРОВЕНЬ ТЕХНИКИLEVEL OF TECHNOLOGY

[0002] Иммунизация отличных от человека животных (например, грызунов, таких как мыши или крысы), «не своим» белком является широко используемым способом для получения специфических антигенсвязывающих белков, таких как моноклональные антитела. Этот подход, однако, зависит от расхождения в последовательности между нативными белками у отличного от человека животного и иммунизированного белка, чтобы иммунная система отличного от человека животного могла распознавать иммуноген как не свой (то есть, чужеродный). Получение антител против антигенов, имеющих высокую степень гомологии с аутоантигенами, может быть сложной задачей из-за иммунологической толерантности. Поскольку функционально важные участки белков, как правило, практически идентичны у разных видов, иммунологическая толерантность к аутоантигенам часто создает проблему для получения антител к этим ключевым эпитопам.[0002] Immunization of non-human animals (e.g., rodents such as mice or rats) with a "non-self" protein is a widely used method for producing specific antigen-binding proteins such as monoclonal antibodies. This approach, however, depends on sequence divergence between the native proteins of the non-human animal and the immunized protein so that the non-human animal's immune system can recognize the immunogen as non-self (i.e., foreign). Generating antibodies against antigens that have a high degree of homology to self-antigens can be challenging due to immunological tolerance. Because functionally important regions of proteins are typically nearly identical across species, immunological tolerance to self-antigens often poses a challenge for generating antibodies to these key epitopes.

[0003] Хотя был достигнут прогресс в нацеливании на различные геномные локусы, все еще остается много геномных локусов, на которые нельзя эффективно нацелить, или геномные модификации, которые не могут быть эффективно достигнуты с помощью обычных стратегий нацеливания. Система CRISPR/Cas предоставила новый инструмент для редактирования генома, но трудности все еще остаются. Например, трудности могут возникать в некоторых контекстах при попытке создания больших нацеленных геномных делеций или других больших нацеленных генетических модификаций, особенно в эукариотических клетках и организмах.[0003] Although progress has been made in targeting various genomic loci, there are still many genomic loci that cannot be effectively targeted or genomic modifications that cannot be effectively achieved using conventional targeting strategies. The CRISPR/Cas system has provided a new tool for genome editing, but challenges still remain. For example, difficulties may arise in some contexts when attempting to create large targeted genomic deletions or other large targeted genetic modifications, particularly in eukaryotic cells and organisms.

[0004] Кроме того, может быть трудно эффективно продуцировать клетки или животных, которые являются гомозиготными по нацеленной генетической модификации без последующих стадий скрещивания, и некоторые локусы могут быть более трудными для нацеливания, чем другие, для получения гомозиготных нацеленных модификаций. Например, хотя мыши F0-поколения, гетерозиготные для большой нацеленной геномной делеции, иногда могут быть получены с помощью обычных стратегий нацеливания, последующее скрещивание этих гетерозиготных мышей необходимо для получения F1 поколения мышей, которые гомозиготны по делеции. Эти дополнительные стадии скрещивания являются дорогостоящими и трудоемкими.[0004] In addition, it may be difficult to efficiently produce cells or animals that are homozygous for a targeted genetic modification without subsequent breeding steps, and some loci may be more difficult to target than others to produce homozygous targeted modifications. For example, although F0-generation mice heterozygous for a large targeted genomic deletion can sometimes be produced using conventional targeting strategies, subsequent breeding of these heterozygous mice is necessary to produce F1-generation mice that are homozygous for the deletion. These additional breeding steps are expensive and labor-intensive.

СУЩНОСТЬ ИЗОБРЕТЕНИЯESSENCE OF THE INVENTION

[0005] Способы и композиции предназначены для получения отличных от человека животных с уменьшенной толерантностью к чужеродному антигену, представляющему интерес, и для использования таких животных для получения антигенсвязывающих белков, которые связывают интересующий чужеродный антиген. В одном аспекте, изобретение относится к способу получения отличного от человека животного с уменьшенной толерантностью к представляющему интерес чужеродному антигену, включающему: (а) приведение в контакт генома плюрипотентной клетки отличного от человека животного, которая не является эмбрионом на одноклеточной стадии с: (i) белком Cas9: (ii) первой направляющей РНК, которая гибридизуется с последовательностью, распознаваемой первой направляющей РНК в первом геномном локусе-мишени, причем первый геномный локус-мишень влияет на экспрессию первого аутоантигена гомологичного к или обладающего общим представляющим интерес эпитопом с представляющим интерес чужеродным антигеном; и (ш) второй направляющей РНК, которая гибридизуется с последовательностью, распознаваемой второй направляющей РНК в первом геномном локусе-мишени; причем первый геномный локус-мишень модифицирован в паре первой и второй хромосом с получением модифицированной плюрипотентной клетки отличного от человека животного с биаллельной модификацией, при этом экспрессия первого аутоантигена уменьшается; (b) введение модифицированной плюрипотентной клетки отличного от человека животного в эмбрион-хозяин; и (с) имплантацию эмбриона-хозяина суррогатной матери для получения генетически модифицированного F0-поколения отличного от человека животного в котором первый геномный локус-мишень модифицирован в паре первой и второй хромосом, так что экспрессия первого аутоантигена уменьшилось. Необязательно, плюрипотентная клетка представляет собой эмбриональную стволовую (ЭС) клетку. Необязательно, приведение в контакт включает введение белка Cas9, первой направляющей РНК и второй направляющей РНК в плюрипотентную клетку отличного от человека животного посредством нуклеофекции. Необязательно, белок Cas9 вводится в плюрипотентную клетку отличного от человека животного в форме ДНК, кодирующей белок Cas9, первая направляющая РНК вводится в плюрипотентную клетку отличного от человека животного в форме ДНК, кодирующей первую направляющую РНК, а вторая направляющая РНК вводится в плюрипотентную клетку отличного от человека животного в форме ДНК, кодирующей вторую направляющую РНК.[0005] Methods and compositions are provided for producing non-human animals with reduced tolerance to a foreign antigen of interest and for using such animals to produce antigen-binding proteins that bind the foreign antigen of interest. In one aspect, the invention relates to a method for producing a non-human animal with reduced tolerance to a foreign antigen of interest, comprising: (a) contacting the genome of a pluripotent cell of a non-human animal that is not a one-cell stage embryo with: (i) a Cas9 protein: (ii) a first guide RNA that hybridizes to a sequence recognized by the first guide RNA at a first target genomic locus, wherein the first target genomic locus affects the expression of a first autoantigen homologous to or sharing a common epitope of interest with the foreign antigen of interest; and (iii) a second guide RNA that hybridizes to a sequence recognized by the second guide RNA in a first target genomic locus; wherein the first target genomic locus is modified in a pair of first and second chromosomes to produce a modified pluripotent cell of a non-human animal with a biallelic modification, wherein expression of a first self-antigen is reduced; (b) introducing the modified pluripotent cell of a non-human animal into a host embryo; and (c) implanting the host embryo into a surrogate mother to produce a genetically modified F0 generation of a non-human animal in which the first target genomic locus is modified in a pair of first and second chromosomes, such that expression of the first self-antigen is reduced. Optionally, the pluripotent cell is an embryonic stem (ES) cell. Optionally, the contacting comprises introducing the Cas9 protein, the first guide RNA and the second guide RNA into the pluripotent cell of the non-human animal by nucleofection. Optionally, the Cas9 protein is introduced into the pluripotent cell of the non-human animal in the form of DNA encoding the Cas9 protein, the first guide RNA is introduced into the pluripotent cell of the non-human animal in the form of DNA encoding the first guide RNA, and the second guide RNA is introduced into the pluripotent cell of the non-human animal in the form of DNA encoding the second guide RNA.

[0006] В некоторых таких способах, стадия приведения в контакт (а) дополнительно включает приведение в контакт генома с: (iv) третьей направляющей РНК, которая гибридизуется с последовательностью, распознаваемой третьей направляющей РНК в первом геномном локусе-мишени; и/или (v) четвертой направляющей РНК, которая гибридизуется с последовательностью, распознаваемой четвертой направляющей РНК в первом геномном локусе-мишени. В некоторых таких способах, стадия приведения в контакт (а) дополнительно включает приведение в контакт генома с: (iv) третьей направляющей РНК, которая гибридизуется с последовательностью, распознаваемой третьей направляющей РНК во втором геномном локусе-мишени, причем второй геномный локус-мишень влияет на экспрессию первого аутоантигена или второго аутоантигена, гомологичного или разделяющего представляющий интерес эпитоп с представляющим интерес чужеродным антигеном; и/или (v) четвертой направляющей РНК, которая гибридизуется с последовательностью, распознаваемой четвертой направляющей РНК во втором геномном локусе-мишени.[0006] In some such methods, the step of contacting (a) further comprises contacting the genome with: (iv) a third guide RNA that hybridizes to a sequence recognized by the third guide RNA at a first target genomic locus; and/or (v) a fourth guide RNA that hybridizes to a sequence recognized by the fourth guide RNA at a first target genomic locus. In some such methods, the step of contacting (a) further comprises contacting the genome with: (iv) a third guide RNA that hybridizes to a sequence recognized by the third guide RNA at a second target genomic locus, wherein the second target genomic locus affects the expression of a first self-antigen or a second self-antigen that is homologous to or shares an epitope of interest with a foreign antigen of interest; and/or (v) a fourth guide RNA that hybridizes to a sequence recognized by a fourth guide RNA at a second target genomic locus.

[0007] В некоторых таких способах, стадия приведения в контакт (а) дополнительно включает приведение в контакт генома с экзогенной матрицей для репарации, содержащей 5'-плечо гомологии, которое гибридизуется с 5' последовательностью-мишенью в геномном локусе-мишени и 3'-плечо гомологии, которое гибридизуется с 3' последовательностью-мишенью в геномном локусе-мишени. Необязательно, экзогенная матрица для репарации дополнительно содержит вставку нуклеиновой кислоты, фланкированную 5'-плечом гомологии и 3'-плечом гомологии. В некоторых таких способах, вставка нуклеиновой кислоты гомологична или ортологична первому геномному локусу-мишени. В некоторых таких способах, экзогенная матрица для репарации составляет от около 50 нуклеотидов до около 1 т.п.о. в длину. В некоторых таких способах, экзогенная матрица для репарации составляет от около 80 нуклеотидов до около 200 нуклеотидов в длину. В некоторых таких способах, экзогенная матрица для репарации представляет собой одноцепочечный олигодезоксинуклеотид. В некоторых таких способах, экзогенная матрица для репараци представляет собой большой нацеливающий вектор (LTVEC), который имеет длину по меньшей мере 10 т.п.о., и/или экзогенная матрица для репараци представляет собой LTVEC, причем общая сумма 5'- и 3'-плечей гомологии LTVEC имеет длину по меньшей мере 10 т.п.о.[0007] In some such methods, the contacting step (a) further comprises contacting the genome with an exogenous repair template comprising a 5' homology arm that hybridizes to a 5' target sequence at a target genomic locus and a 3' homology arm that hybridizes to a 3' target sequence at a target genomic locus. Optionally, the exogenous repair template further comprises a nucleic acid insert flanked by the 5' homology arm and the 3' homology arm. In some such methods, the nucleic acid insert is homologous or orthologous to the first target genomic locus. In some such methods, the exogenous repair template is from about 50 nucleotides to about 1 kb in length. In some such methods, the exogenous repair template is from about 80 nucleotides to about 200 nucleotides in length. In some such methods, the exogenous repair template is a single-stranded oligodeoxynucleotide. In some such methods, the exogenous repair template is a large targeting vector (LTVEC) that is at least 10 kb in length, and/or the exogenous repair template is an LTVEC, wherein the sum of the 5' and 3' homology arms of the LTVEC is at least 10 kb in length.

[0008] Некоторые из таких способов дополнительно включают: (d) иммунизацию генетически модифицированного F0-поколения отличного от человека животного, полученного на стадии (с), с интересующим чужеродным антигеном; (е) поддержание генетически модифицированного F0-поколения отличного от человека животного в условиях, достаточных для инициирования иммунного ответа на интересующий чужеродный антиген; и (f) получение первой последовательности нуклеиновой кислоты, кодирующей вариабельный домен тяжелой цепи иммуноглобулина человека, и/или второй последовательности нуклеиновой кислоты, кодирующей вариабельный домен легкой цепи иммуноглобулина человека, из генетически модифицированного F0-поколения отличного от человека животного.[0008] Some of these methods further comprise: (d) immunizing the genetically modified F0 generation of the non-human animal obtained in step (c) with a foreign antigen of interest; (e) maintaining the genetically modified F0 generation of the non-human animal under conditions sufficient to initiate an immune response to the foreign antigen of interest; and (f) obtaining a first nucleic acid sequence encoding a human immunoglobulin heavy chain variable domain and/or a second nucleic acid sequence encoding a human immunoglobulin light chain variable domain from the genetically modified F0 generation of the non-human animal.

[0009] В некоторых таких способах, антигенсвязывающие белки против чужеродного антигена, представляющего интерес, полученные после иммунизации генетически модифицированного F0-поколения отличного от человека животного с интересующим чужеродным антигеном, имеют более высокий титр, чем антигенсвязывающие белки, полученные после иммунизации контрольного отличного от человека животного, которые являются диким типом в первом геномном локусе-мишени. В некоторых таких способах, более разнообразный репертуар антигенсвязывающих белков против чужеродного антигена, представляющего интерес, полученные после иммунизации генетически модифицированного F0-поколения отличного от человека животного с интересующим чужеродным антигеном, по сравнению с антигенсвязывающими белками, полученными после иммунизации контрольного отличного от человека животного, которое являются диким типом в первом геномном локусе-мишени.[0009] In some such methods, antigen-binding proteins against a foreign antigen of interest obtained after immunization of a genetically modified F0 generation non-human animal with the foreign antigen of interest have a higher titer than antigen-binding proteins obtained after immunization of a control non-human animal that is wild type at the first genomic target locus. In some such methods, a more diverse repertoire of antigen-binding proteins against a foreign antigen of interest obtained after immunization of a genetically modified F0 generation non-human animal with the foreign antigen of interest are obtained compared to antigen-binding proteins obtained after immunization of a control non-human animal that is wild type at the first genomic target locus.

[00010] В некоторых таких способах, исключается экспрессия первого аутоантигена.[00010] In some such methods, expression of the first autoantigen is excluded.

[00011] В некоторых таких способах, интересующий чужеродный антиген представляет собой ортолог первого аутоантигена. В некоторых таких способах, интересующий чужеродный антиген содержит, состоит по существу, или состоит из всего или части человеческого белка.[00011] In some such methods, the foreign antigen of interest is an ortholog of the first self-antigen. In some such methods, the foreign antigen of interest comprises, consists essentially of, or consists of all or a portion of a human protein.

[00012] В некоторых таких способах, первый геномный локус-мишень модифицируется так, чтобы содержать вставку одного или более нуклеотидов, делецию одного или более нуклеотидов, или замену одного или более нуклеотидов. В некоторых таких способах, первый геномный локус-мишень модифицируется так, чтобы содержать делецию одного или более нуклеотидов. В некоторых таких способах, стадия приведения в контакт (а) включает приведение в контакт генома с экзогенной матрицей для репарации, содержащей 5'-плечо гомологии, которое гибридизуется с 5' последовательностью-мишенью в геномном локусе-мишени, и 3'-плечо гомологии, которое гибридизуется с 3' последовательностью-мишенью в геномном локусе-мишени при условии, что если геном находится в эмбрионе на одноклеточной стадии, экзогенная матрица для репарации составляет не более 5 т.п.о. в длину, причем экзогенная матрица для репарации содержит вставку нуклеиновой кислоты, фланкированную 5'-плечом гомологии и 3'-плечом гомологии, причем вставка нуклеиновой кислоты гомологична или ортологична удаленной последовательности нуклеиновой кислоты, и где вставка нуклеиновой кислоты замещает последовательность удаленной нуклеиновой кислоты. В некоторых таких способах, делеция является точной делецией без случайных вставок и делеций (инделей). В некоторых таких способах, стадия приведения в контакт (а) включает приведение в контакт генома с экзогенной матрицей для репарации, содержащей 5'-плечо гомологии, которое гибридизуется с 5' последовательностью-мишенью в геномном локусе-мишени, и 3'-плечо гомологии, которое гибридизуется с 3' последовательностью-мишенью в геномном локусе-мишени при условии, что если геном находится в эмбрионе на одноклеточной стадии, экзогенная матрица для репарации составляет не более 5 т.п.о. в длину, причем последовательность удаленной нуклеиновой кислоты состоит из последовательности нуклеиновой кислоты между 5'- и 3' последовател ьн остя ми -ми ше нями.[00012] In some such methods, the first genomic target locus is modified to contain an insertion of one or more nucleotides, a deletion of one or more nucleotides, or a substitution of one or more nucleotides. In some such methods, the first genomic target locus is modified to contain a deletion of one or more nucleotides. In some such methods, the contacting step (a) comprises contacting the genome with an exogenous repair template comprising a 5' homology arm that hybridizes to a 5' target sequence in the target genomic locus and a 3' homology arm that hybridizes to a 3' target sequence in the target genomic locus, provided that if the genome is in a one-cell stage embryo, the exogenous repair template is no more than 5 kb. in length, wherein the exogenous repair template comprises a nucleic acid insert flanked by a 5' homology arm and a 3' homology arm, wherein the nucleic acid insert is homologous or orthologous to a deleted nucleic acid sequence, and wherein the nucleic acid insert replaces the deleted nucleic acid sequence. In some such methods, the deletion is an exact deletion with no random insertions or deletions (indels). In some such methods, the contacting step (a) comprises contacting the genome with an exogenous repair template comprising a 5' homology arm that hybridizes to a 5' target sequence at a target genomic locus and a 3' homology arm that hybridizes to a 3' target sequence at a target genomic locus, provided that, if the genome is in a one-cell stage embryo, the exogenous repair template is no more than 5 kb in length, and the removed nucleic acid sequence consists of a nucleic acid sequence between the 5' and 3' target sequences.

[00013] В некоторых таких способах, первый геномный локус-мишень содержит, состоит по существу из, или состоит из всего или части гена, кодирующего первый аутоантиген. В некоторых таких способах, модификация содержит, по существу состоит из, или состоит из гомозиготной делеций всего или части гена, кодирующего первый аутоантиген. В некоторых таких способах, модификация содержит, по существу состоит из, состоит из гомозиготного разрушения стартового кодона гена, кодирующего первый аутоантиген.[00013] In some such methods, the first genomic target locus comprises, consists essentially of, or consists of all or a portion of a gene encoding a first self-antigen. In some such methods, the modification comprises, consists essentially of, or consists of a homozygous deletion of all or a portion of a gene encoding a first self-antigen. In some such methods, the modification comprises, consists essentially of, or consists of a homozygous disruption of a start codon of a gene encoding a first self-antigen.

[00014] В некоторых таких способах, последовательность, распознаваемая первой направляющей РНК содержит старт-кодон для гена, кодирующего первый аутоантиген, или находится в пределах около 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от старт-кодона, а последовательность, распознаваемая второй направляющей РНК содержит стоп-кодон для гена, кодирующего первый аутоантиген, или находится в пределах около 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, или 1000 нуклеотидов от стоп-кодона. Необязательно, последовательность, распознаваемая первой направляющей РНК содержит старт-кодон, а последовательность, распознаваемая второй направляющей РНК содержит стоп-кодон. В некоторых таких способах, последовательность, распознаваемая первой направляющей РНК содержит первый сайт расщепления Cas9, а последовательность, распознаваемая второй направляющей РНК содержит второй сайт расщепления Cas9, причем первый геномный локус-мишень модифицирован, чтобы содержать делецию между первым и вторым сайтом расщепления Cas9. Необязательно, делеция представляет собой точную делецию, причем последовательность удаленной нуклеиновой кислоты состоит из последовательности нуклеиновой кислоты между первым и вторым сайтами расщепления Cas9.[00014] In some such methods, the sequence recognized by the first guide RNA comprises a start codon for a gene encoding a first self-antigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the start codon, and the sequence recognized by the second guide RNA comprises a stop codon for a gene encoding a first self-antigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the stop codon. Optionally, the sequence recognized by the first guide RNA comprises a start codon, and the sequence recognized by the second guide RNA comprises a stop codon. In some such methods, a sequence recognized by a first guide RNA comprises a first Cas9 cleavage site, and a sequence recognized by a second guide RNA comprises a second Cas9 cleavage site, wherein the first target genomic locus is modified to comprise a deletion between the first and second Cas9 cleavage sites. Optionally, the deletion is an exact deletion, wherein the deleted nucleic acid sequence consists of a nucleic acid sequence between the first and second Cas9 cleavage sites.

[00015] В некоторых таких способах, последовательность, распознаваемая первой и второй направляющими РНК, различна, и каждая из последовательности, распознаваемой первой и второй направляющими РНК, содержит старт-кодон для гена, кодирующего первый аутоантиген, или находится в пределах около 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от старт-кодона. Необязательно, каждая из последовательности, распознаваемой первой и второй направляющими РНК, содержит старт-кодон.[00015] In some such methods, the sequence recognized by the first and second guide RNAs is different, and each of the sequence recognized by the first and second guide RNAs comprises a start codon for a gene encoding a first self-antigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of a start codon. Optionally, each of the sequence recognized by the first and second guide RNAs comprises a start codon.

[00016] В некоторых таких способах, последовательность первой нуклеиновой кислоты и/или последовательность второй нуклеиновой кислоты получают из лимфоцита генетически модифицированного отличного от человека животного или из гибридомы, полученной из лимфоцитов.[00016] In some such methods, the first nucleic acid sequence and/or the second nucleic acid sequence are obtained from a lymphocyte of a genetically modified non-human animal or from a hybridoma derived from lymphocytes.

[00017] В некоторых таких способах, отличное от человека животное содержит гуманизированный локус иммуноглобулина. В некоторых таких способах, отличное от человека животное представляет собой грызуна. В некоторых таких способах, грызун представляет собой мышь. Необязательно, линия мыши содержит линию BALB/c. Необязательно, указанная линия мышей содержит линии BALB/c, C57BL/6 и 129. Необязательно, линия мыши составляет 50% BALB/c, 25% C57BL/6 и 25% 129. Необязательно, гаплотип МНС мыши представляет собой MHCb/d.[00017] In some such methods, the non-human animal comprises a humanized immunoglobulin locus. In some such methods, the non-human animal is a rodent. In some such methods, the rodent is a mouse. Optionally, the mouse strain comprises a BALB/c strain. Optionally, the mouse strain comprises the BALB/c, C57BL/6, and 129 strains. Optionally, the mouse strain is 50% BALB/c, 25% C57BL/6, and 25% 129. Optionally, the mouse MHC haplotype is MHCb/d.

[00018] В некоторых таких способах, мышь содержит в своих зародышевых линиях неперестроенные генные сегменты вариабельного участка человека, вставленные в эндогенный локус иммуноглобулина мыши. Необязательно, неперестроенные генные сегменты вариабельного участка человека являются генными сегментами тяжелой цепи, а локус иммуноглобулина мыши является локусом тяжелой цепи. Необязательно, неперестроенные генные сегменты вариабельного участка человека являются генными сегментами легкой цепи, а локус иммуноглобулина мыши является локусом легкой цепи. Необязательно, генные сегменты легкой цепи представляют собой генные сегменты легкой цепи каппа или лямбда человека. В некоторых таких способах, мышь содержит в своих зародышевых линиях неперестроенные генные сегменты вариабельного участка человека, функционально связанные с геном константного участка мыши, причем мышь не имеет гена константного участка человека, и причем ген константного участка мыши находится в эндогенном локусе иммуноглобулина мыши. В некоторых таких способах, мышь содержит: (а) гибридный локус тяжелой цепи, содержащий вставку генных сегментов V, D и J тяжелой цепи иммуноглобулина человека, причем генные сегменты V, D и J тяжелой цепи иммуноглобулина человека, функционально связаны с геном тяжелой цепи иммуноглобулина мыши, причем ген тяжелой цепи иммуноглобулина мыши находится в эндогенном локусе иммуноглобулина мыши; и (b) гибридный локус легкой цепи, содержащий вставку генных сегментов V и J легкой цепи иммуноглобулина человека, причем генные сегменты V и J человека функционально связаны с последовательностью гена константного участка легкой цепи иммуноглобулина мыши; причем (а) перестраивается с образованием гибридной последовательности тяжелой цепи, содержащей вариабельный участок человека, функционально связанный с константным участком мыши, и (b) перестраивается с образованием гибридной последовательности легкой цепи, содержащей вариабельный участок человека, функционально связанный с константным участком мыши, и причем мышь неспособна образовывать антитело, которое содержит вариабельный участок человека и константный участок человека. В некоторых таких способах мышь, содержит модификацию локуса тяжелой цепи иммуноглобулина, причем модификация уменьшает или устраняет эндогенную функцию ADAM6, и причем мышь содержит последовательность эктопической нуклеиновой кислоты, кодирующую белок ADAM6 мыши, его ортолог, его гомолог, или его фрагмент, причем белок ADAM6, его ортолог, его гомолог или его фрагмент, функционируют у самца мыши. Необязательно, эктопическая последовательность нуклеиновой кислоты, кодирующая белок ADAM6 мыши, его ортолог, его гомолог или его фрагмент, присутствует в локусе вариабельного участка тяжелой цепи человека. Необязательно, эктопическая последовательность нуклеиновой кислоты, кодирующая белок ADAM6 мыши, его ортолог, его гомолог или его фрагмент, присутствует в месте, отличном от локуса вариабельного участка тяжелой цепи человека.[00018] In some such methods, the mouse comprises in its germ lines unrearranged human variable region gene segments inserted into an endogenous mouse immunoglobulin locus. Optionally, the unrearranged human variable region gene segments are heavy chain gene segments and the mouse immunoglobulin locus is a heavy chain locus. Optionally, the unrearranged human variable region gene segments are light chain gene segments and the mouse immunoglobulin locus is a light chain locus. Optionally, the light chain gene segments are human kappa or lambda light chain gene segments. In some such methods, the mouse comprises in its germ lines unrearranged human variable region gene segments operably linked to a mouse constant region gene, wherein the mouse does not have a human constant region gene, and wherein the mouse constant region gene is in an endogenous mouse immunoglobulin locus. In some such methods, the mouse comprises: (a) a hybrid heavy chain locus comprising an insertion of human immunoglobulin heavy chain V, D, and J gene segments, wherein the human immunoglobulin heavy chain V, D, and J gene segments are operably linked to a mouse immunoglobulin heavy chain gene, wherein the mouse immunoglobulin heavy chain gene is located in an endogenous mouse immunoglobulin locus; and (b) a hybrid light chain locus comprising an insertion of human immunoglobulin light chain V and J gene segments, wherein the human V and J gene segments are operably linked to a mouse immunoglobulin light chain constant region gene sequence; wherein (a) is rearranged to form a hybrid heavy chain sequence comprising a human variable region operably linked to a mouse constant region, and (b) is rearranged to form a hybrid light chain sequence comprising a human variable region operably linked to a mouse constant region, and wherein the mouse is incapable of forming an antibody that comprises a human variable region and a human constant region. In some such methods, the mouse comprises a modification of an immunoglobulin heavy chain locus, wherein the modification reduces or eliminates endogenous ADAM6 function, and wherein the mouse comprises an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, wherein the ADAM6 protein, ortholog thereof, homolog thereof, or fragment thereof is functional in a male mouse. Optionally, the ectopic nucleic acid sequence encoding the mouse ADAM6 protein, its ortholog, its homolog, or a fragment thereof is present in a human heavy chain variable region locus. Optionally, the ectopic nucleic acid sequence encoding the mouse ADAM6 protein, its ortholog, its homolog, or a fragment thereof is present in a location other than a human heavy chain variable region locus.

[00019] В некоторых таких способах, мышь содержит в своей зародышевой линии гуманизированный вариабельный локус легкой цепи иммуноглобулина, содержащий не более одной или не более двух перестроенных последовательностей V/J легкой цепи человека, функционально связанных с константным участком легкой цепи. Необязательно, ген константного участка легкой цепи представляет собой ген мыши. В некоторых таких способах, мышь дополнительно содержит гуманизированный вариабельный локустяжелой цепи иммуноглобулина, содержащий по меньшей мере один неперестроенный V человека, по меньшей мере один неперестроенный D человека, и по меньшей мере один неперестроенный J сегмент человека, функционально связанный с геном константного участка тяжелой цепи. Необязательно, ген константного участка тяжелой цепи представляет собой ген мыши. В некоторых таких способах, мышь содержит гуманизированный вариабельный локус тяжелой цепи иммуноглобулина и гуманизированный вариабельный локус легкой цепи иммуноглобулина, причем мышь экспрессирует одну легкую цепь. В некоторых таких способах, мышь содержит: (а) один перестроенный вариабельный участок легкой цепи иммуноглобулина человека (VL/JL), которая кодирует VL домен легкой цепи иммуноглобулина человека, причем один перестроенный участок VL/JL человека выбирается из генного сегмент Vк1-39/J человека или генного сегмента Vк3-20/J человека; и (b) замещение генных сегментов эндогенной тяжелой цепи (VH) одним или более генными сегментами VH человека, причем генные сегменты VH человека функционально связаны с геном константного участка эндогенной тяжелой цепи (СН), а генные сегменты VH человека способны перестраивать и формировать ген химерной тяжелой цепи человека/мыши. В некоторых таких способах, мышь экспрессирует популяцию антител, а зародышевая линия мыши содержит только один ген вариабельного участка легкой цепи каппа иммуноглобулина, который представляет собой перестроенный ген вариабельного участка легкой цепи каппа зародышевой линии человека, причем мышь является либо гетерозиготной для одного гена вариабельного участка легкой цепи каппа иммуноглобулина при этом он содержит только одну копию, или гомозиготной для одного гена вариабельного участка легкой цепи каппа иммуноглобулина, при этом он содержит две копии, причем мышь характеризуется активным созреванием аффинности, так что: (i) каждый легкая цепь каппа иммуноглобулина популяции содержит вариабельный домен легкой цепи, который кодируется перестроенным геном вариабельного участка легкой цепи каппа зародышевой линии человека, или его соматически мутированным вариантом; (и) популяция содержит антитела, содержащие легкие цепи каппа иммуноглобулина, чей вариабельный домен легкой цепи кодируется перестроенным геном вариабельного участка легкой цепи каппа зародышевой линии человека, и антитела, содержащие легкие цепи каппа иммуноглобулина, чей вариабельный домен легкой цепи кодируется их соматически мутированным варианты; и (iii) мышь образует разнообразный набор соматически мутированных высокоаффинных тяжелых цепей, которые успешно соединяются с легкими цепями каппа иммуноглобулина с образованием антител к популяции. Необязательно, мышь гетерозиготна или гомозиготна в своей зародышевой линии для: (а) вставки в эндогенный локус вариабельного участка легкой цепи иммуноглобулина к мыши перестроенной последовательности Vk/Jk, содержащей: (i) одну последовательность Vk зародышевой линии человека, при этом последовательность Vk зародышевой линии человека представлена в SEQ ID NO: 148 или SEQ, ID NO: 149; и (ii) одну последовательность Jk зародышевой линии человека, причем перестроенная последовательность Vk/Jk функционально связана с эндогенным константным участком к мыши; и (b) вставки в эндогенный локус вариабельного участка тяжелой цепи иммуноглобулина мыши из множества генных сегментов вариабельного участка тяжелой цепи иммуноглобулина человека, причем генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека функционально связаны с константным участком эндогенной тяжелой цепи иммуноглобулина мыши, и генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека способны перестраивать и формировать перестроенный ген тяжелой цепи химерного иммуноглобулина человека/мыши. В некоторых таких способах мышь, содержит модификацию локуса тяжелой цепи иммуноглобулина, причем модификация уменьшает или устраняет эндогенную функцию ADAM6, и причем мышь содержит последовательность эктопической нуклеиновой кислоты, кодирующую белок ADAM6 мыши, его ортолог, его гомолог, или его фрагмент, причем белок ADAM6, его ортолог, его гомолог или его фрагмент, функционируют у самца мыши. Необязательно, эктопическая последовательность нуклеиновой кислоты, кодирующая белок ADAM6 мыши, его ортолог, его гомолог или его фрагмент, присутствует в локусе вариабельного участка тяжелой цепи человека. Необязательно, эктопическая последовательность нуклеиновой кислоты, кодирующая белок ADAM6 мыши, его ортолог, его гомолог или его фрагмент, присутствует в месте, отличном от локуса вариабельного участка тяжелой цепи человека.[00019] In some such methods, the mouse comprises in its germline a humanized immunoglobulin light chain variable locus comprising no more than one or no more than two rearranged human light chain V/J sequences operably linked to a light chain constant region. Optionally, the light chain constant region gene is a mouse gene. In some such methods, the mouse further comprises a humanized immunoglobulin heavy chain variable locus comprising at least one non-rearranged human V, at least one non-rearranged human D, and at least one non-rearranged human J segment operably linked to a heavy chain constant region gene. Optionally, the heavy chain constant region gene is a mouse gene. In some such methods, the mouse comprises a humanized immunoglobulin heavy chain variable locus and a humanized immunoglobulin light chain variable locus, wherein the mouse expresses one light chain. In some such methods, the mouse comprises: (a) one rearranged human immunoglobulin light chain variable region (V L /J L ) that encodes a V L domain of a human immunoglobulin light chain, wherein the one rearranged human V L /J L region is selected from a human Vk1-39/J gene segment or a human Vk3-20/J gene segment; and (b) replacing endogenous heavy chain (V H ) gene segments with one or more human V H gene segments, wherein the human V H gene segments are operably linked to an endogenous heavy chain constant region ( CH ) gene, and the human V H gene segments are capable of rearranging and forming a chimeric human/mouse heavy chain gene. In some such methods, the mouse expresses a population of antibodies, and the germline of the mouse comprises only one immunoglobulin kappa light chain variable region gene that is a rearranged human germline kappa light chain variable region gene, wherein the mouse is either heterozygous for one immunoglobulin kappa light chain variable region gene and comprises only one copy, or homozygous for one immunoglobulin kappa light chain variable region gene and comprises two copies, wherein the mouse is characterized by active affinity maturation, such that: (i) each immunoglobulin kappa light chain of the population comprises a light chain variable domain that is encoded by the rearranged human germline kappa light chain variable region gene, or a somatically mutated variant thereof; (i) the population comprises antibodies comprising immunoglobulin kappa light chains whose light chain variable domain is encoded by a rearranged human germline kappa light chain variable region gene and antibodies comprising immunoglobulin kappa light chains whose light chain variable domain is encoded by somatically mutated variants thereof; and (iii) the mouse produces a diverse set of somatically mutated high-affinity heavy chains that successfully combine with immunoglobulin kappa light chains to form antibodies to the population. Optionally, the mouse is heterozygous or homozygous in its germline for: (a) insertion into an endogenous mouse κ light chain immunoglobulin variable region locus a rearranged Vk/Jk sequence comprising: (i) one human germline Vk sequence, wherein the human germline Vk sequence is shown in SEQ ID NO: 148 or SEQ ID NO: 149; and (ii) one human germline Jk sequence, wherein the rearranged Vk/Jk sequence is operably linked to an endogenous mouse κ constant region; and (b) inserting into an endogenous mouse immunoglobulin heavy chain variable region locus a plurality of human immunoglobulin heavy chain variable region gene segments, wherein the human immunoglobulin heavy chain variable region gene segments are operably linked to an endogenous mouse immunoglobulin heavy chain constant region, and the human immunoglobulin heavy chain variable region gene segments are capable of rearranging and forming a rearranged human/mouse chimeric immunoglobulin heavy chain gene. In some such methods, the mouse comprises a modification of an immunoglobulin heavy chain locus, wherein the modification reduces or eliminates endogenous ADAM6 function, and wherein the mouse comprises an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, wherein the ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof is functional in a male mouse. Optionally, the ectopic nucleic acid sequence encoding the mouse ADAM6 protein, its ortholog, its homolog, or a fragment thereof is present in a human heavy chain variable region locus. Optionally, the ectopic nucleic acid sequence encoding the mouse ADAM6 protein, its ortholog, its homolog, or a fragment thereof is present in a location other than a human heavy chain variable region locus.

[00020] В некоторых таких способах, мышь имеет геном, содержащий модификацию локуса тяжелой цепи иммуноглобулина, причем модификация уменьшает или устраняет функцию эндогенного ADAM6, и мышь дополнительно содержит последовательность нуклеиновой кислоты, кодирующую белок ADAM6 отличного от человека животного, или ортолог, или его гомолог, или функциональный фрагмент соответствующего белка ADAM6. Необязательно, геном мыши содержит: (а) эктопическое размещение гена ADAM6; и (b) локус вариабельного участка тяжелой цепи иммуноглобулина человека, содержащий вставку одного или более генных сегментов VH человека, одного или более генных сегментов DH человека, и одного или более генных сегментов JH человека в эндогенный локус тяжелой цепи отличного от человека животного, причем генные сегменты VH, DH и JH человека функционально связаны с геном константного участка тяжелой цепи; так что мышь характеризуется тем, что: (i) она фертильна; и (ii) когда она иммунизирована антигеном, то продуцирует антитела, содержащие вариабельные домены тяжелой цепи, кодируемые одним или более генными сегментами VH человека, одним или более DH человека, и одним или более JH человека, функционально связанными с константными доменами тяжелой цепи, кодируемыми геном константного участка тяжелой цепи, причем антитела проявляют специфическое связывание с антигеном.[00020] In some such methods, the mouse has a genome comprising a modification of an immunoglobulin heavy chain locus, wherein the modification reduces or eliminates the function of endogenous ADAM6, and the mouse further comprises a nucleic acid sequence encoding an ADAM6 protein of a non-human animal, or an ortholog or homolog thereof, or a functional fragment of the corresponding ADAM6 protein. Optionally, the mouse genome comprises: (a) an ectopic placement of the ADAM6 gene; and (b) a human immunoglobulin heavy chain variable region locus comprising an insertion of one or more human VH gene segments, one or more human DH gene segments, and one or more human JH gene segments into an endogenous heavy chain locus of a non-human animal, wherein the human VH , DH , and JH gene segments are operably linked to a heavy chain constant region gene; such that the mouse is characterized in that: (i) it is fertile; and (ii) when immunized with an antigen, produces antibodies comprising heavy chain variable domains encoded by one or more human V H , one or more human D H , and one or more human J H gene segments operably linked to heavy chain constant domains encoded by a heavy chain constant region gene, wherein the antibodies exhibit specific binding to the antigen.

[00021] В некоторых таких способах, отличное от человека животное представляет собой мышь, которая по меньшей мере частично является производным от линии BALB/c, причем мышь содержит гуманизированный локус иммуноглобулина, причем представляющий интерес чужеродный антиген является полностью или частично белком человека, который является ортологичным первому аутоантигену, и первый геномный локус-мишень содержит весь или часть гена, кодирующего первый аутоантиген, причем первый сайт узнавания направляющей РНК содержит старт-кодон для гена, кодирующего первый аутоантиген, и второй сайт узнавания направляющей РНК содержит стоп-кодон для гена, кодирующего первый аутоантиген, и при этом модификация содержит гомозиготную делецию всего или части гена, кодирующего первый аутоантиген, причем экспрессия первого аутоантигена исключается. Необязательно, мышь содержит: (а) эктопическую последовательность нуклеиновой кислоты, кодирующую белок ADAM6 мыши, его ортолог, его гомолог, или его фрагмент, причем белок ADAM6, его ортолог, его гомолог, или его фрагмент, является функциональным у самца мыши; (b) гибридный локус тяжелой цепи, содержащий вставку генных сегментов V, D и J тяжелой цепи иммуноглобулина человека, причем генные сегменты V, D и J тяжелой цепи иммуноглобулина человека, функционально связаны с геном тяжелой цепи иммуноглобулина мыши, причем ген тяжелой цепи иммуноглобулина мыши находится в эндогенном локусе иммуноглобулина мыши; и (с) гибридный локус легкой цепи, содержащий вставку генных сегментов V и J легкой цепи иммуноглобулина человека, причем генные сегменты V и J человека функционально связаны с последовательностью гена константного участка легкой цепи иммуноглобулина мыши; причем (b) перестраиваются с образованием гибридной последовательности тяжелой цепи, содержащей вариабельный участок человека, функционально связанный с константным участком мыши, и (с) перестраивается с образованием гибридной последовательности легкой цепи, содержащей вариабельный участок человека, функционально связанный с константным участком мыши, и причем мышь неспособна образовывать антитело, которое содержит вариабельный участок человека и константный участок человека. Необязательно, мышь гетерозиготна или гомозиготна в своей зародышевой линии для: (а) эктопической последовательности нуклеиновой кислоты, кодирующей белок ADAM6 мыши, его ортолог, его гомолог, или его фрагмент, причем белок ADAM6, его ортолог, его гомолог, или его фрагмент, являются функционирующим у самца мыши; (b) вставки в эндогенный локус вариабельного участка легкой цепи иммуноглобулина мыши к перестроенной последовательности Vk/Jk, содержащей: (i) одну последовательность Vk зародышевой линии человека, при этом последовательность Vk зародышевой линии человека представлена в SEQ ID NO: 148 или SEQ, ID NO: 149; и (ii) одну последовательность Jk зародышевой линии человека, причем перестроенная последовательность Vk/Jk функционально связана с эндогенным константным участком к мыши; и (с) вставки в эндогенный локус вариабельного участка тяжелой цепи иммуноглобулина мыши из множества генных сегментов вариабельного участка тяжелой цепи иммуноглобулина человека, причем генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека функционально связаны с константным участком эндогенной тяжелой цепи иммуноглобулина мыши, и генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека способны перестраивать и формировать перестроенный ген тяжелой цепи химерного иммуноглобулина человека/мыши.[00021] In some such methods, the non-human animal is a mouse that is at least partially derived from a BALB/c strain, wherein the mouse comprises a humanized immunoglobulin locus, wherein the foreign antigen of interest is all or part of a human protein that is orthologous to a first self-antigen, and the first target genomic locus comprises all or part of a gene encoding the first self-antigen, wherein the first guide RNA recognition site comprises a start codon for the gene encoding the first self-antigen, and the second guide RNA recognition site comprises a stop codon for the gene encoding the first self-antigen, and wherein the modification comprises a homozygous deletion of all or part of the gene encoding the first self-antigen, wherein expression of the first self-antigen is eliminated. Optionally, the mouse comprises: (a) an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, wherein the ADAM6 protein, ortholog thereof, homolog thereof, or a fragment thereof is functional in a male mouse; (b) a hybrid heavy chain locus comprising an insertion of human immunoglobulin heavy chain V, D, and J gene segments, wherein the human immunoglobulin heavy chain V, D, and J gene segments are operably linked to a mouse immunoglobulin heavy chain gene, wherein the mouse immunoglobulin heavy chain gene is located in an endogenous mouse immunoglobulin locus; and (c) a hybrid light chain locus comprising an insertion of human immunoglobulin light chain V and J gene segments, wherein the human V and J gene segments are operably linked to a mouse immunoglobulin light chain constant region gene sequence; wherein (b) is rearranged to form a hybrid heavy chain sequence comprising a human variable region operably linked to a mouse constant region, and (c) is rearranged to form a hybrid light chain sequence comprising a human variable region operably linked to a mouse constant region, and wherein the mouse is incapable of forming an antibody that comprises a human variable region and a human constant region. Optionally, the mouse is heterozygous or homozygous in its germline for: (a) an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, wherein the ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof is functional in a male mouse; (b) an insertion into an endogenous mouse immunoglobulin light chain variable region locus of a rearranged Vk/Jk sequence comprising: (i) one human germline Vk sequence, wherein the human germline Vk sequence is shown in SEQ ID NO: 148 or SEQ ID NO: 149; and (ii) one human germline Jk sequence, wherein the rearranged Vk/Jk sequence is operably linked to an endogenous mouse κ constant region; and (c) inserting into an endogenous mouse immunoglobulin heavy chain variable region locus a plurality of human immunoglobulin heavy chain variable region gene segments, wherein the human immunoglobulin heavy chain variable region gene segments are operably linked to an endogenous mouse immunoglobulin heavy chain constant region, and the human immunoglobulin heavy chain variable region gene segments are capable of rearranging and forming a rearranged chimeric human/mouse immunoglobulin heavy chain gene.

[00022] В некоторых таких способах, в которых отличное от человека животное представляет собой мышь, которая по меньшей мере частично является производным от линии BALB/c, причем мышь содержит гуманизированный локус иммуноглобулина, причем представляющий интерес чужеродный антиген является полностью или частично белком человека, который является ортологичным первому аутоантигену, и первый геномный локус-мишень содержит весь или часть гена, кодирующего первый аутоантиген, причем первый сайт узнавания направляющей РНК содержит старт-кодон для гена, кодирующего первый аутоантиген, и второй сайт узнавания направляющей РНК содержит стоп-кодон для гена, кодирующего первый аутоантиген, и при этом где модификация содержит гомозиготное повреждение стартового кодона для гена, кодирующего первый аутоантиген, при этом экспрессия первого аутоантигена исключается. Необязательно, мышь содержит: (а) эктопическую последовательность нуклеиновой кислоты, кодирующую белок ADAM6 мыши, его ортолог, его гомолог, или его фрагмент, причем белок ADAM6, его ортолог, его гомолог, или его фрагмент, является функциональным у самца мыши; (b) гибридный локус тяжелой цепи, содержащий вставку генных сегментов V, D и J тяжелой цепи иммуноглобулина человека, причем генные сегменты V, D и J тяжелой цепи иммуноглобулина человека, функционально связаны с геном тяжелой цепи иммуноглобулина мыши, причем ген тяжелой цепи иммуноглобулина мыши находится в эндогенном локусе иммуноглобулина мыши; и (с) гибридный локус легкой цепи, содержащий вставку генных сегментов V и J легкой цепи иммуноглобулина человека, причем генные сегменты V и J человека функционально связаны с последовательностью гена константного участка легкой цепи иммуноглобулина мыши; причем (b) перестраиваются с образованием гибридной последовательности тяжелой цепи, содержащей вариабельный участок человека, функционально связанный с константным участком мыши, и (с) перестраивается с образованием гибридной последовательности легкой цепи, содержащей вариабельный участок человека, функционально связанный с константным участком мыши, и причем мышь неспособна образовывать антитело, которое содержит вариабельный участок человека и константный участок человека. Необязательно, мышь гетерозиготна или гомозиготна в своей зародышевой линии для: (а) эктопической последовательности нуклеиновой кислоты, кодирующей белок ADAM6 мыши, его ортолог, его гомолог, или его фрагмент, причем белок ADAM6, его ортолог, его гомолог, или его фрагмент, являются функционирующим у самца мыши; (b) вставки в эндогенный локус вариабельного участка легкой цепи иммуноглобулина мыши к перестроенной последовательности Vk/Jk, содержащей: (i) одну последовательность Vk зародышевой линии человека, при этом последовательность Vk зародышевой линии человека представлена в SEQ ID NO: 148 или SEQ ID NO: 149; и (ii) одну последовательность Jk зародышевой линии человека, причем перестроенная последовательность Vk/Jk функционально связана с эндогенным константным участком к мыши; и (с) вставки в эндогенный локус вариабельного участка тяжелой цепи иммуноглобулина мыши из множества генных сегментов вариабельного участка тяжелой цепи иммуноглобулина человека, причем генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека функционально связаны с константным участком эндогенной тяжелой цепи иммуноглобулина мыши, и генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека способны перестраивать и формировать перестроенный ген тяжелой цепи химерного иммуноглобулина человека/мыши.[00022] In some such methods, wherein the non-human animal is a mouse that is at least partially derived from the BALB/c strain, wherein the mouse comprises a humanized immunoglobulin locus, wherein the foreign antigen of interest is all or part of a human protein that is orthologous to a first self-antigen, and the first target genomic locus comprises all or part of a gene encoding the first self-antigen, wherein the first guide RNA recognition site comprises a start codon for the gene encoding the first self-antigen, and the second guide RNA recognition site comprises a stop codon for the gene encoding the first self-antigen, and wherein the modification comprises a homozygous disruption of the start codon for the gene encoding the first self-antigen, wherein expression of the first self-antigen is eliminated. Optionally, the mouse comprises: (a) an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, wherein the ADAM6 protein, ortholog thereof, homolog thereof, or a fragment thereof is functional in a male mouse; (b) a hybrid heavy chain locus comprising an insertion of human immunoglobulin heavy chain V, D, and J gene segments, wherein the human immunoglobulin heavy chain V, D, and J gene segments are operably linked to a mouse immunoglobulin heavy chain gene, wherein the mouse immunoglobulin heavy chain gene is located in an endogenous mouse immunoglobulin locus; and (c) a hybrid light chain locus comprising an insertion of human immunoglobulin light chain V and J gene segments, wherein the human V and J gene segments are operably linked to a mouse immunoglobulin light chain constant region gene sequence; wherein (b) is rearranged to form a hybrid heavy chain sequence comprising a human variable region operably linked to a mouse constant region, and (c) is rearranged to form a hybrid light chain sequence comprising a human variable region operably linked to a mouse constant region, and wherein the mouse is incapable of forming an antibody that comprises a human variable region and a human constant region. Optionally, the mouse is heterozygous or homozygous in its germline for: (a) an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, wherein the ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof is functional in a male mouse; (b) an insertion into an endogenous mouse immunoglobulin light chain variable region locus of a rearranged Vk/Jk sequence comprising: (i) one human germline Vk sequence, wherein the human germline Vk sequence is shown in SEQ ID NO: 148 or SEQ ID NO: 149; and (ii) one human germline Jk sequence, wherein the rearranged Vk/Jk sequence is operably linked to an endogenous mouse κ constant region; and (c) inserting into an endogenous mouse immunoglobulin heavy chain variable region locus a plurality of human immunoglobulin heavy chain variable region gene segments, wherein the human immunoglobulin heavy chain variable region gene segments are operably linked to an endogenous mouse immunoglobulin heavy chain constant region, and the human immunoglobulin heavy chain variable region gene segments are capable of rearranging and forming a rearranged chimeric human/mouse immunoglobulin heavy chain gene.

[00023] В некоторых способах, плюрипотентная клетка отличного от человека животного представляет собой гибридную клетку, и этот способ дополнительно включает: (а') сравнение последовательности соответствующих первой и второй хромосом в гомологичной паре хромосом в первом геномном локусе-мишени, и выбор участка-мишени в пределах первого геномного локуса-мишени перед стадией приведения в контакт (а) на основе участка-мишени, имеющего более высокий процент идентичности последовательности между соответствующей первой и второй хромосомами в гомологичной хромосомной паре по отношению ко всей или части остального первого геномного локуса-мишени. Необязательно, участок-мишень имеет более высокий процент идентичности последовательности между соответствующей первой и второй хромосомами в гомологичной хромосомной паре относительно остальной части первого геномного локуса-мишени. Необязательно, участок-мишень имеет по меньшей мере 99,9% идентичности последовательностей между соответствующими первой и второй хромосомами, а остальная часть первого геномного локуса-мишени имеет не более чем 99,8% идентичности последовательности между соответствующими первой и второй хромосомами. Необязательно, участок-мишень идентичен в соответствующей первой и второй хромосомах в гомологичной паре хромосом. Необязательно, участок-мишень находится в пределах максимально возможного участка непрерывной идентичности аллельной последовательности в первом геномном локусе-мишени.[00023] In some methods, the non-human pluripotent cell is a hybrid cell, and the method further comprises: (a') comparing the sequence of corresponding first and second chromosomes in a homologous chromosome pair in a first target genomic locus, and selecting a target region within the first target genomic locus prior to the step of contacting (a) based on the target region having a higher percentage of sequence identity between the corresponding first and second chromosomes in the homologous chromosome pair relative to all or a portion of the remainder of the first target genomic locus. Optionally, the target region has a higher percentage of sequence identity between the corresponding first and second chromosomes in the homologous chromosome pair relative to the remainder of the first target genomic locus. Optionally, the target region has at least 99.9% sequence identity between the corresponding first and second chromosomes, and the remainder of the first genomic target locus has no more than 99.8% sequence identity between the corresponding first and second chromosomes. Optionally, the target region is identical in the corresponding first and second chromosomes in a homologous pair of chromosomes. Optionally, the target region is within the maximum possible region of contiguous allelic sequence identity in the first genomic target locus.

[00024] В некоторых таких способах, участок-мишень содержит, по существу состоит из, состоит из последовательности, распознаваемой первой направляющей РНК, и по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п.о., 700 п.о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5' стороне, 3' стороне или каждой стороне последовательности, распознаваемой первой направляющей РНК, и последовательности, распознаваемой второй направляющей РНК, и по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5' стороне, на 3' стороне или на каждой стороне последовательности, распознаваемой второй направляющей РНК. Необязательно, этап (а') включает в себя сравнение двух или более сегментов первого геномного локуса-мишени, причем каждый сегмент содержит, по существу состоит из, состоит из последовательности, распознаваемой другой направляющей РНК, не присутствующей в другом месте в геноме, и по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5' стороне, 3' стороне, или на каждой стороне последовательности, распознаваемой другой направляющей РНК, и выбирается как участок-мишень двух сегментов, имеющих самый высокий процент идентичности последовательности по отношению к другим сегментам. Необязательно, один или более сегментов содержат, состоят по существу из, или состоят из сегментов, соответствующих каждой последовательности, распознаваемой другой направляющей РНК в первом геномном локусе-мишени, но не присутствуют в другом месте в геноме.[00024] In some such methods, the target region comprises, consists essentially of, consists of a sequence recognized by the first guide RNA, and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 t.p.o., 9 t.p.o., 10 t.p.o., 20 t.p.o., 30 t.p.o., 40 t.p.o., 50 t.p.o., 60 t.p.o., 70 t.p.o., 80 t.p.o., 90 t.p.o., 100 t.p.o., 110 t.p.o., 120 t.p.o., 130 t.p.o., 140 t.p.o. or 150 t.p.o. a flanking sequence on the 5' side, the 3' side, or each side of the sequence recognized by the first guide RNA and the sequence recognized by the second guide RNA, and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, or 150 kb of flanking sequence on the 5' side, on the 3' side, or on each side of the sequence recognized by the second guide RNA. Optionally, step (a') comprises comparing two or more segments of the first genomic target locus, each segment comprising, consisting essentially of, consisting of, a sequence recognized by a different guide RNA not present elsewhere in the genome, and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 t.p.o., 6 t.p.o., 7 t.p.o., 8 t.p.o., 9 t.p.o., 10 t.p.o., 20 t.p.o., 30 t.p.o., 40 t.p.o., 50 t.p.o., 60 t.p.o., 70 t.p.o., 80 t.p.o., 90 t.p.o., 100 t.p.o., 110 t.p.o., 120 t.p.o., 130 t.p.o., 140 t.p.o. or 150 t.p.o. flanking sequence on the 5' side, the 3' side, or on each side of a sequence recognized by another guide RNA, and is selected as the target region of the two segments having the highest percentage of sequence identity to the other segments. Optionally, one or more segments comprise, consist essentially of, or consist of segments corresponding to each sequence recognized by another guide RNA at the first target genomic locus, but are not present elsewhere in the genome.

[00025] В некоторых таких способах, участок-мишень содержит, по существу состоит из, или состоит из участка между последовательностями, распознаваемыми первой и второй направляющими РНК. Необязательно, стадия (а') включает в себя сравнение двух или более сегментов первого геномного локуса-мишени, причем каждый сегмент содержит, по существу состоит из, или состоит из участка между парой разных последовательностей, распознаваемых направляющей РНК, причем последовательности, распознаваемые направляющей РНК, не присутствуют в другом месте генома, и выбираются в качестве участка-мишени сегмента, имеющего самый высокий процент идентичности последовательности по сравнению с другими сегментами. Необязательно, один или более сегментов содержат, состоят по существу из, или состоят из сегментов, соответствующих каждой паре разных последовательностей, распознаваемых направляющей РНК в первом геномном локусе-мишени, причем последовательности, распознаваемые направляющей РНК отсутствуют в другом месте генома.[00025] In some such methods, the target region comprises, consists essentially of, or consists of a region between sequences recognized by the first and second guide RNAs. Optionally, step (a') involves comparing two or more segments of the first target genomic locus, wherein each segment comprises, consists essentially of, or consists of a region between a pair of different sequences recognized by the guide RNA, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome, and the segment having the highest percentage of sequence identity compared to the other segments is selected as the target region. Optionally, the one or more segments comprise, consist essentially of, or consist of segments corresponding to each pair of different sequences recognized by the guide RNA in the first target genomic locus, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome.

[00026] В некоторых таких способах, участок-мишень содержит, по существу состоит из, или состоит из участка между последовательностями, распознаваемыми первой и второй направляющими РНК, и по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о фланкирующей последовательности на 5' стороне, 3' стороне, или каждой стороне геномного участка между последовательностями, распознаваемыми первой и второй направляющими РНК. Необязательно, стадия (а') включает в себя сравнение двух или более сегментов первого геномного локуса-мишени, причем каждый сегмент содержит, по существу состоит из, или состоит из участка между парой разных последовательностей, распознаваемых направляющей РНК, и по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5'-стороне, 3'-стороне, или на каждой стороне геномного участка между другой парой последовательностей, распознаваемых направляющей РНК, причем последовательности, распознаваемые направляющей РНК не присутствуют в другом месте генома, и выбираются в качестве участка-мишени сегмента, имеющего самый высокий процент идентичности последовательности относительно других сегментов. Необязательно, один или более сегментов содержат, состоят по существу из, или состоят из сегментов, соответствующих каждой паре разных последовательностей, распознаваемых направляющей РНК в первом геномном локусе-мишени, причем последовательности, распознаваемые направляющей РНК отсутствуют в другом месте генома.[00026] In some such methods, the target region comprises, consists essentially of, or consists of a region between sequences recognized by the first and second guide RNAs and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, or 150 kb of flanking sequence on the 5' side, the 3' side, or each side of the genomic region between the sequences recognized by the first and second guide RNAs. Optionally, step (a') comprises comparing two or more segments of the first target genomic locus, each segment comprising, consisting essentially of, or consisting of a region between a pair of different sequences recognized by a guide RNA and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 t.p.o., 7 t.p.o., 8 t.p.o., 9 t.p.o., 10 t.p.o., 20 t.p.o., 30 t.p.o., 40 t.p.o., 50 t.p.o., 60 t.p.o., 70 t.p.o., 80 t.p.o., 90 t.p.o., 100 t.p.o., 110 t.p.o., 120 t.p.o., 130 t.p.o., 140 t.p.o. or 150 t.p.o. flanking sequences on the 5' side, the 3' side, or on each side of the genomic region between another pair of sequences recognized by the guide RNA, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome, and the segment having the highest percentage of sequence identity relative to the other segments is selected as the target region. Optionally, the one or more segments comprise, consist essentially of, or consist of segments corresponding to each pair of different sequences recognized by the guide RNA at the first genomic target locus, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome.

[00027] В некоторых таких способах, в которых участок-мишень содержит, по существу состоит из, или состоит из по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5' стороне, 3' стороне или каждой стороне геномного участка между последовательностями, распознаваемыми первой и второй направляющими РНК. Необязательно, стадия (а') включает в себя сравнение двух или более несмежных сегментов первого геномного локуса-мишени, причем каждый несмежный сегмент содержит, по существу состоит из, или состоит из по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5'-стороне, 3'-стороне или на каждой стороне геномного участка между парой разных последовательностей, распознаваемых направляющей РНК, причем последовательности, распознаваемые направляющей РНК не присутствуют в другом месте генома, и выбираются в качестве участка-мишени несмежного сегмента, имеющего самый высокий процент идентичности последовательности относительно других несмежных сегментов. Необязательно, один или более несмежных сегментов содержат, состоят по существу из, или состоят из несмежных сегментов, соответствующих каждой паре разных последовательностей, распознаваемых направляющей РНК в первом геномном локусе-мишени, причем последовательности, распознаваемые направляющей РНК отсутствуют в другом месте генома.[00027] In some such methods, wherein the target region comprises, consists essentially of, or consists of at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kbp, 2 kbp, 3 kbp, 4 kbp, 5 kbp, 6 kbp, 7 kbp, 8 kbp, 9 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, or 150 kb of flanking sequence on the 5' side, the 3' side, or each side of the genomic region between the sequences recognized by the first and second guide RNAs. Optionally, step (a') comprises comparing two or more non-contiguous segments of the first target genomic locus, wherein each non-contiguous segment comprises, consists essentially of, or consists of at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 t.p.o., 8 t.p.o., 9 t.p.o., 10 t.p.o., 20 t.p.o., 30 t.p.o., 40 t.p.o., 50 t.p.o., 60 t.p.o., 70 t.p.o., 80 t.p.o., 90 t.p.o., 100 t.p.o., 110 t.p.o., 120 t.p.o., 130 t.p.o., 140 t.p.o. or 150 t.p.o. a flanking sequence on the 5' side, the 3' side, or on each side of the genomic region between a pair of different sequences recognized by the guide RNA, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome, and the non-contiguous segment having the highest percentage of sequence identity relative to the other non-contiguous segments is selected as the target region. Optionally, the one or more non-contiguous segments comprise, consist essentially of, or consist of non-contiguous segments corresponding to each pair of different sequences recognized by the guide RNA at the first genomic target locus, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome.

[00028] В некоторых таких способах, участок-мишень содержит, по существу состоит из, или состоит из по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на каждой стороне геномного участка между последовательностями, распознаваемыми первой и второй направляющими РНК. Необязательно, стадия (а') включает в себя сравнение двух или более несмежных сегментов первого геномного локуса-мишени, причем каждый несмежный сегмент содержит, по существу состоит из, или состоит из по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на каждой стороне геномного участка между парой разных последовательностей, распознаваемых направляющей РНК, причем последовательности, распознаваемые направляющей РНК не присутствуют в другом месте генома, и выбираются в качестве участка-мишени несмежного сегмента, имеющего самый высокий процент идентичности последовательности относительно других несмежных сегментов. Необязательно, один или более несмежных сегментов содержат, состоят по существу из, или состоят из несмежных сегментов, соответствующих каждой паре разных последовательностей, распознаваемых направляющей РНК в первом геномном локусе-мишени, причем последовательности, распознаваемые направляющей РНК отсутствуют в другом месте генома.[00028] In some such methods, the target region comprises, consists essentially of, or consists of at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kbp, 2 kbp, 3 kbp, 4 kbp, 5 kbp, 6 kbp, 7 kbp, 8 kbp, 9 kbp, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, or 150 kb of flanking sequence on each side of the genomic region between the sequences recognized by the first and second guide RNAs. Optionally, step (a') comprises comparing two or more non-contiguous segments of the first target genomic locus, wherein each non-contiguous segment comprises, consists essentially of, or consists of at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 t.p.o., 8 t.p.o., 9 t.p.o., 10 t.p.o., 20 t.p.o., 30 t.p.o., 40 t.p.o., 50 t.p.o., 60 t.p.o., 70 t.p.o., 80 t.p.o., 90 t.p.o., 100 t.p.o., 110 t.p.o., 120 t.p.o., 130 t.p.o., 140 t.p.o. or 150 t.p.o. flanking sequences on each side of the genomic region between a pair of different sequences recognized by the guide RNA, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome, and the non-contiguous segment having the highest percentage of sequence identity relative to the other non-contiguous segments is selected as the target region. Optionally, the one or more non-contiguous segments comprise, consist essentially of, or consist of non-contiguous segments corresponding to each pair of different sequences recognized by the guide RNA at the first genomic target locus, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome.

[00029] В некоторых таких способах, участок-мишень на стадии (а') состоит, по существу состоит из, состоит из участка, фланкированного 5'- и 3'-последовательностями-мишенями. В некоторых таких способах, участок-мишень на стадии (а') состоит, по существу состоит из, состоит из участка, фланкированного и содержащего 5'- и 3'-последовательности-мишени. В некоторых таких способах, участок-мишень на стадии (а') состоит, по существу состоит из, состоит из 5'-последовательности-мишени и/или 3'-последовательности-мишени. Необязательно, геномный локус-мишень на стадии (а') состоит, по существу состоит из, состоит из 5'-последовательности-мишени и 3'-последовательности-мишени. В некоторых таких способах, участок-мишень на стадии (а') содержит, по существу состоит из, или состоит из участка между 5' и 3' последовательностями-мишенями и по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5' стороне, 3' стороне или каждой стороне участка между 5' и 3' последовательностями-мишенями. В некоторых таких способах, участок-мишень на стадии (а') содержит, по существу состоит из, или состоит из участка между 5' и 3' последовательностями-мишенями и по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на каждой стороне участка между 5' и 3' последовательностями-мишенями. В некоторых таких способах, участок-мишень на стадии (а') содержит, по существу состоит из, или состоит из по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5' стороне, 3' стороне или каждой стороне участка между 5' и 3' последовательностями-мишенями. В некоторых таких способах, участок-мишень на стадии (а') содержит, по существу состоит из, или состоит из по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на каждой стороне участка между 5' и 3' последовательностями-мишенями.[00029] In some such methods, the target region of step (a') consists of, consists essentially of, consists of a region flanked by 5' and 3' target sequences. In some such methods, the target region of step (a') consists of, consists essentially of, consists of a region flanked by and comprising 5' and 3' target sequences. In some such methods, the target region of step (a') consists of, consists essentially of, consists of a 5' target sequence and/or a 3' target sequence. Optionally, the target genomic locus of step (a') consists of, consists essentially of, consists of a 5' target sequence and a 3' target sequence. In some such methods, the target region of step (a') comprises, consists essentially of, or consists of a region between the 5' and 3' target sequences and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, or 150 kb of flanking sequence on the 5' side, the 3' side, or each side of the region between the 5' and 3' target sequences. In some such methods, the target region of step (a') comprises, consists essentially of, or consists of a region between the 5' and 3' target sequences and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, or 150 kb of flanking sequence on each side of the region between the 5' and 3' target sequences. In some such methods, the target region of step (a') comprises, consists essentially of, or consists of at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kbp, 2 kbp, 3 kbp, 4 kbp, 5 kbp, 6 kbp, 7 kbp, 8 kbp, 9 kbp, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, or 150 kb of flanking sequence on the 5' side, the 3' side, or each side of the region between the 5' and 3' target sequences. In some such methods, the target region of step (a') comprises, consists essentially of, or consists of at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kbp, 2 kbp, 3 kbp, 4 kbp, 5 kbp, 6 kbp, 7 kbp, 8 kbp, 9 kbp, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, or 150 kb of flanking sequence on each side of the region between the 5' and 3' target sequences.

[00030] В другом аспекте, изобретение относится к способу получения отличного от человека животного с уменьшенной толерантностью к представляющему интерес чужеродному антигену, включающему: (а) приведение в контакт генома эмбриона отличного от человека животного на одноклеточной стадии с: (i) белком Cas9; (ii) первой направляющей РНК, которая гибридизуется с последовательностью, распознаваемой первой направляющей РНК в первом геномном локусе-мишени, причем первый геномный локус-мишень влияет на экспрессию первого аутоантигена гомологичного к или обладающего общим представляющим интерес эпитопом с интересующим чужеродным антигеном; и (iii) второй направляющей РНК, которая гибридизуется с последовательностью, распознаваемой второй направляющей РНК в первом геномном локусе-мишени; причем первый геномный локус-мишень модифицирован в паре первой и второй хромосом для получения биаллельной модификации, причем модифицированный эмбрион отличного от человека животного на одноклеточной стадии, в котором экспрессия первого аутоантигена снижена; и (b) имплантацию модифицированного эмбриона отличного от человека животного на одноклеточной стадии суррогатной матери для получения генетически модифицированного F0-поколения отличного от человека животного в котором первый геномный локус-мишень модифицирован в паре первой и второй хромосом, так что экспрессия первого аутоантигена уменьшена. Необязательно, приведение в контакт включает введение белка Cas9, первой направляющей РНК и второй направляющей РНК в эмбрион отличного от человека животного на одноклеточной стадии посредством нуклеофекции. Необязательно, белок Cas9 вводится в эмбрион отличного от человека животного на одноклеточной стадии в форме ДНК, кодирующей белок Cas9, первая направляющая РНК вводится в эмбрион отличного от человека животного на одноклеточной стадии в форме ДНК, кодирующей первую направляющую РНК, а вторая направляющая РНК вводится в эмбрион отличного от человека животного на одноклеточной стадии в форме ДНК, кодирующей вторую направляющую РНК.[00030] In another aspect, the invention relates to a method of producing a non-human animal with reduced tolerance to a foreign antigen of interest, comprising: (a) contacting the genome of a single-cell stage embryo of a non-human animal with: (i) a Cas9 protein; (ii) a first guide RNA that hybridizes to a sequence recognized by the first guide RNA at a first target genomic locus, wherein the first target genomic locus affects the expression of a first autoantigen homologous to or sharing an epitope of interest with the foreign antigen of interest; and (iii) a second guide RNA that hybridizes to a sequence recognized by the second guide RNA at the first target genomic locus; wherein the first genomic target locus is modified in a pair of first and second chromosomes to produce a biallelic modification, wherein the modified one-cell stage non-human animal embryo has reduced expression of the first autoantigen; and (b) implanting the modified one-cell stage non-human animal embryo into a surrogate mother to produce a genetically modified F0 generation non-human animal wherein the first genomic target locus is modified in a pair of first and second chromosomes such that expression of the first autoantigen is reduced. Optionally, the contacting comprises introducing the Cas9 protein, the first guide RNA and the second guide RNA into the one-cell stage non-human animal embryo by nucleofection. Optionally, the Cas9 protein is introduced into the one-cell stage embryo of a non-human animal in the form of DNA encoding the Cas9 protein, the first guide RNA is introduced into the one-cell stage embryo of a non-human animal in the form of DNA encoding the first guide RNA, and the second guide RNA is introduced into the one-cell stage embryo of a non-human animal in the form of DNA encoding a second guide RNA.

[00031] В некоторых таких способах, стадия приведения в контакт (а) дополнительно включает приведение в контакт генома с: (iv) третьей направляющей РНК, которая гибридизуется с последовательностью, распознаваемой третьей направляющей РНК в первом геномном локусе-мишени; и/или (v) четвертой направляющей РНК, которая гибридизуется с последовательностью, распознаваемой четвертой направляющей РНК в первом геномном локусе-мишени. В некоторых таких способах, стадия приведения в контакт (а) дополнительно включает приведение в контакт генома с: (iv) третьей направляющей РНК, которая гибридизуется с последовательностью, распознаваемой третьей направляющей РНК во втором геномном локусе-мишени, причем второй геномный локус-мишень влияет на экспрессию первого аутоантигена или второго аутоантигена, гомологичного или обладающего общим представляющим интерес эпитопом с интересующим чужеродным антигеном; и/или (v) четвертой направляющей РНК, которая гибридизуется с последовательностью, распознаваемой четвертой направляющей РНК во втором геномном локусе-мишени.[00031] In some such methods, the step of contacting (a) further comprises contacting the genome with: (iv) a third guide RNA that hybridizes to a sequence recognized by the third guide RNA at a first target genomic locus; and/or (v) a fourth guide RNA that hybridizes to a sequence recognized by the fourth guide RNA at a first target genomic locus. In some such methods, the step of contacting (a) further comprises contacting the genome with: (iv) a third guide RNA that hybridizes to a sequence recognized by the third guide RNA at a second target genomic locus, wherein the second target genomic locus affects the expression of a first self-antigen or a second self-antigen that is homologous to or shares an epitope of interest with the foreign antigen of interest; and/or (v) a fourth guide RNA that hybridizes to a sequence recognized by a fourth guide RNA at a second target genomic locus.

[00032] В некоторых таких способах, стадия приведения в контакт (а) дополнительно включает приведение в контакт генома с экзогенной матрицей для репарации, содержащей 5'-плечо гомологии, которое гибридизуется с 5' последовательностью-мишенью в геномном локусе-мишени и 3'-плечо гомологии, которое гибридизуется с 3' последовательностью-мишенью в геномном локусе-мишени, причем экзогенная матрица для репарации находится между около 50 нуклеотидами до около 5 т.п.о. в длину. Необязательно, экзогенная матрица для репарации дополнительно содержит вставку нуклеиновой кислоты, фланкированную 5'-плечом гомологии и 3'-плечом гомологии. В некоторых таких способах, вставка нуклеиновой кислоты гомологична или ортологична первому геномному локусу-мишени. В некоторых таких способах, экзогенная матрица для репарации составляет от около 50 нуклеотидов до около 1 т.п.о. в длину. В некоторых таких способах, экзогенная матрица для репарации составляет от около 80 нуклеотидов до около 200 нуклеотидов в длину. В некоторых таких способах, экзогенная матрица для репарации представляет собой одноцепочечный олигодезоксинуклеотид.[00032] In some such methods, the contacting step (a) further comprises contacting the genome with an exogenous repair template comprising a 5' homology arm that hybridizes to a 5' target sequence at a target genomic locus and a 3' homology arm that hybridizes to a 3' target sequence at a target genomic locus, wherein the exogenous repair template is between about 50 nucleotides to about 5 kb in length. Optionally, the exogenous repair template further comprises a nucleic acid insert flanked by the 5' homology arm and the 3' homology arm. In some such methods, the nucleic acid insert is homologous or orthologous to the first target genomic locus. In some such methods, the exogenous repair template is from about 50 nucleotides to about 1 kb in length. In some such methods, the exogenous repair template is from about 80 nucleotides to about 200 nucleotides in length. In some such methods, the exogenous repair template is a single-stranded oligodeoxynucleotide.

[00033] Некоторые из таких способов дополнительно включают: (с) иммунизацию генетически модифицированного F0-поколения отличного от человека животного, полученного на стадии (b), с интересующим чужеродным антигеном; (d) поддержание генетически модифицированного F0-поколения отличного от человека животного в условиях, достаточных для инициирования иммунного ответа на интересующий чужеродный антиген; и (е) получение первой последовательности нуклеиновой кислоты, кодирующей вариабельный домен тяжелой цепи иммуноглобулина человека, и/или второй последовательности нуклеиновой кислоты, кодирующей вариабельный домен легкой цепи иммуноглобулина человека, из генетически модифицированного F0-поколения отличного от человека животного.[00033] Some of these methods further comprise: (c) immunizing the genetically modified F0 generation of the non-human animal obtained in step (b) with a foreign antigen of interest; (d) maintaining the genetically modified F0 generation of the non-human animal under conditions sufficient to initiate an immune response to the foreign antigen of interest; and (e) obtaining a first nucleic acid sequence encoding a human immunoglobulin heavy chain variable domain and/or a second nucleic acid sequence encoding a human immunoglobulin light chain variable domain from the genetically modified F0 generation of the non-human animal.

[00034] В некоторых таких способах, антигенсвязывающие белки против чужеродного антигена, представляющего интерес, полученные после иммунизации генетически модифицированного F0-поколения отличного от человека животного с интересующим чужеродным антигеном, имеют более высокий титр, чем антигенсвязывающие белки, полученные после иммунизации контрольного отличного от человека животного, которые являются диким типом в первом геномном локусе-мишени. В некоторых таких способах, более разнообразный репертуар антигенсвязывающих белков против чужеродного антигена, представляющего интерес, полученные после иммунизации генетически модифицированного F0-поколения отличного от человека животного с интересующим чужеродным антигеном, по сравнению с антигенсвязывающими белками, полученными после иммунизации контрольного отличного от человека животного, которое являются диким типом в первом геномном локусе-мишени.[00034] In some such methods, antigen-binding proteins against a foreign antigen of interest obtained after immunization of a genetically modified F0 generation non-human animal with the foreign antigen of interest have a higher titer than antigen-binding proteins obtained after immunization of a control non-human animal that is wild type at the first genomic target locus. In some such methods, a more diverse repertoire of antigen-binding proteins against a foreign antigen of interest obtained after immunization of a genetically modified F0 generation non-human animal with the foreign antigen of interest are obtained compared to antigen-binding proteins obtained after immunization of a control non-human animal that is wild type at the first genomic target locus.

[00035] В некоторых таких способах, исключается экспрессия первого аутоантигена.[00035] In some such methods, expression of the first autoantigen is excluded.

[00036] В некоторых таких способах, интересующий чужеродный антиген представляет собой ортолог первого аутоантигена. В некоторых таких способах, интересующий чужеродный антиген содержит, состоит по существу, или состоит из всего или части человеческого белка.[00036] In some such methods, the foreign antigen of interest is an ortholog of the first self-antigen. In some such methods, the foreign antigen of interest comprises, consists essentially of, or consists of all or a portion of a human protein.

[00037] В некоторых таких способах, первый геномный локус-мишень модифицируется так, чтобы содержать вставку одного или более нуклеотидов, делецию одного или более нуклеотидов, или замену одного или более нуклеотидов. В некоторых таких способах, первый геномный локус-мишень модифицируется так, чтобы содержать делецию одного или более нуклеотидов. В некоторых таких способах, стадия приведения в контакт (а) включает приведение в контакт генома с экзогенной матрицей для репарации, содержащей 5'-плечо гомологии, которое гибридизуется с 5' последовательностью-мишенью в геномном локусе-мишени, и 3'-плечо гомологии, которое гибридизуется с 3' последовательностью-мишенью в геномном локусе-мишени при условии, что если геном находится в эмбрионе на одноклеточной стадии, экзогенная матрица для репарации составляет не более 5 т.п.о. в длину, причем экзогенная матрица для репарации содержит вставку нуклеиновой кислоты, фланкированную 5'-плечом гомологии и 3'-плечом гомологии, причем вставка нуклеиновой кислоты гомологична или ортологична удаленной последовательности нуклеиновой кислоты, и где вставка нуклеиновой кислоты замещает последовательность удаленной нуклеиновой кислоты. В некоторых таких способах, делеция является точной делецией без случайных вставок и делеций (инделей). В некоторых таких способах, стадия приведения в контакт (а) включает приведение в контакт генома с экзогенной матрицей для репарации, содержащей 5'-плечо гомологии, которое гибридизуется с 5' последовательностью-мишенью в геномном локусе-мишени, и 3'-плечо гомологии, которое гибридизуется с 3' последовательностью-мишенью в геномном локусе-мишени при условии, что если геном находится в эмбрионе на одноклеточной стадии, экзогенная матрица для репарации составляет не более 5 т.п.о. в длину, причем последовательность удаленной нуклеиновой кислоты состоит из последовательности нуклеиновой кислоты между 5'- и 3' последовательностями-мишенями.[00037] In some such methods, the first target genomic locus is modified to contain an insertion of one or more nucleotides, a deletion of one or more nucleotides, or a substitution of one or more nucleotides. In some such methods, the first target genomic locus is modified to contain a deletion of one or more nucleotides. In some such methods, the contacting step (a) comprises contacting the genome with an exogenous repair template comprising a 5' homology arm that hybridizes to a 5' target sequence in the target genomic locus and a 3' homology arm that hybridizes to a 3' target sequence in the target genomic locus, provided that if the genome is in a one-cell stage embryo, the exogenous repair template is no more than 5 kb. in length, wherein the exogenous repair template comprises a nucleic acid insert flanked by a 5' homology arm and a 3' homology arm, wherein the nucleic acid insert is homologous or orthologous to a deleted nucleic acid sequence, and wherein the nucleic acid insert replaces the deleted nucleic acid sequence. In some such methods, the deletion is an exact deletion with no random insertions or deletions (indels). In some such methods, the step of contacting (a) comprises contacting the genome with an exogenous repair template comprising a 5' homology arm that hybridizes to a 5' target sequence at a target genomic locus and a 3' homology arm that hybridizes to a 3' target sequence at a target genomic locus, provided that, if the genome is in a one-cell stage embryo, the exogenous repair template is no more than 5 kb in length, and the deleted nucleic acid sequence consists of a nucleic acid sequence between the 5' and 3' target sequences.

[00038] В некоторых таких способах, первый геномный локус-мишень содержит, состоит по существу из, или состоит из всего или части гена, кодирующего первый аутоантиген. В некоторых таких способах, модификация содержит, по существу состоит из, или состоит из гомозиготной делеции всего или части гена, кодирующего первый аутоантиген. В некоторых таких способах, модификация содержит, по существу состоит из, состоит из гомозиготного разрушения стартового кодона гена, кодирующего первый аутоантиген.[00038] In some such methods, the first genomic target locus comprises, consists essentially of, or consists of all or a portion of a gene encoding a first self-antigen. In some such methods, the modification comprises, consists essentially of, or consists of a homozygous deletion of all or a portion of a gene encoding a first self-antigen. In some such methods, the modification comprises, consists essentially of, or consists of a homozygous disruption of a start codon of a gene encoding a first self-antigen.

[00039] В некоторых таких способах, последовательность, распознаваемая первой направляющей РНК содержит старт-кодон для гена, кодирующего первый аутоантиген, или находится в пределах около 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от старт-кодона, а последовательность, распознаваемая второй направляющей РНК содержит стоп-кодон для гена, кодирующего первый аутоантиген, или находится в пределах около 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, или 1000 нуклеотидов от стоп-кодона. Необязательно, последовательность, распознаваемая первой направляющей РНК содержит старт-кодон, а последовательность, распознаваемая второй направляющей РНК содержит стоп-кодон. В некоторых таких способах, последовательность, распознаваемая первой направляющей РНК содержит первый сайт расщепления Cas9, а последовательность, распознаваемая второй направляющей РНК содержит второй сайт расщепления Cas9, причем первый геномный локус-мишень модифицирован, чтобы содержать делецию между первым и вторым сайтом расщепления Cas9. Необязательно, делеция представляет собой точную делецию, причем последовательность удаленной нуклеиновой кислоты состоит из последовательности нуклеиновой кислоты между первым и вторым сайтами расщепления Cas9.[00039] In some such methods, the sequence recognized by the first guide RNA comprises a start codon for a gene encoding a first self-antigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the start codon, and the sequence recognized by the second guide RNA comprises a stop codon for a gene encoding a first self-antigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the stop codon. Optionally, the sequence recognized by the first guide RNA comprises a start codon, and the sequence recognized by the second guide RNA comprises a stop codon. In some such methods, a sequence recognized by a first guide RNA comprises a first Cas9 cleavage site, and a sequence recognized by a second guide RNA comprises a second Cas9 cleavage site, wherein the first target genomic locus is modified to comprise a deletion between the first and second Cas9 cleavage sites. Optionally, the deletion is an exact deletion, wherein the deleted nucleic acid sequence consists of a nucleic acid sequence between the first and second Cas9 cleavage sites.

[00040] В некоторых таких способах, последовательность, распознаваемая первой и второй направляющими РНК, различна, и каждая из последовательности, распознаваемой первой и второй направляющими РНК, содержит старт-кодон для гена, кодирующего первый аутоантиген, или находится в пределах около 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от старт-кодона. Необязательно, каждая из последовательности, распознаваемой первой и второй направляющими РНК, содержит старт-кодон.[00040] In some such methods, the sequence recognized by the first and second guide RNAs is different, and each of the sequence recognized by the first and second guide RNAs comprises a start codon for a gene encoding a first self-antigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of a start codon. Optionally, each of the sequence recognized by the first and second guide RNAs comprises a start codon.

[00041] В некоторых таких способах, последовательность первой нуклеиновой кислоты и/или последовательность второй нуклеиновой кислоты получают из лимфоцита генетически модифицированного отличного от человека животного или из гибридомы, полученной из лимфоцитов.[00041] In some such methods, the first nucleic acid sequence and/or the second nucleic acid sequence are obtained from a lymphocyte of a genetically modified non-human animal or from a hybridoma derived from lymphocytes.

[00042] В некоторых таких способах, отличное от человека животное содержит гуманизированный локус иммуноглобулина. В некоторых таких способах, отличное от человека животное представляет собой грызуна. В некоторых таких способах, грызун представляет собой мышь. Необязательно, линия мыши содержит линию BALB/c. Необязательно, указанная линия мышей содержит линии BALB/c, C57BL/6 и 129. Необязательно, линия мыши составляет 50% BALB/c, 25% C57BL/6 и 25% 129. Необязательно, гаплотип МНС мыши представляет собой MHCb/d.[00042] In some such methods, the non-human animal comprises a humanized immunoglobulin locus. In some such methods, the non-human animal is a rodent. In some such methods, the rodent is a mouse. Optionally, the mouse strain comprises a BALB/c strain. Optionally, the mouse strain comprises the BALB/c, C57BL/6, and 129 strains. Optionally, the mouse strain is 50% BALB/c, 25% C57BL/6, and 25% 129. Optionally, the mouse MHC haplotype is MHC b/d .

[00043] В некоторых таких способах, мышь содержит в своих зародышевых линиях неперестроенные генные сегменты вариабельного участка человека, вставленные в эндогенный локус иммуноглобулина мыши. Необязательно, неперестроенные генные сегменты вариабельного участка человека являются генными сегментами тяжелой цепи, а локус иммуноглобулина мыши является локусом тяжелой цепи. Необязательно, неперестроенные генные сегменты вариабельного участка человека являются генными сегментами легкой цепи, а локус иммуноглобулина мыши является локусом легкой цепи. Необязательно, генные сегменты легкой цепи представляют собой генные сегменты легкой цепи каппа или лямбда человека. В некоторых таких способах, мышь содержит в своих зародышевых линиях неперестроенные генные сегменты вариабельного участка человека, функционально связанные с геном константного участка мыши, причем мышь не имеет гена константного участка человека, и причем ген константного участка мыши находится в эндогенном локусе иммуноглобулина мыши. В некоторых таких способах, мышь содержит: (а) гибридный локус тяжелой цепи, содержащий вставку генных сегментов V, D и J тяжелой цепи иммуноглобулина человека, причем генные сегменты V, D и J тяжелой цепи иммуноглобулина человека, функционально связаны с геном тяжелой цепи иммуноглобулина мыши, причем ген тяжелой цепи иммуноглобулина мыши находится в эндогенном локусе иммуноглобулина мыши; и (b) гибридный локус легкой цепи, содержащий вставку генных сегментов V и J легкой цепи иммуноглобулина человека, причем генные сегменты V и J человека функционально связаны с последовательностью гена константного участка легкой цепи иммуноглобулина мыши; причем (а) перестраивается с образованием гибридной последовательности тяжелой цепи, содержащей вариабельный участок человека, функционально связанный с константным участком мыши, и (b) перестраивается с образованием гибридной последовательности легкой цепи, содержащей вариабельный участок человека, функционально связанный с константным участком мыши, и причем мышь неспособна образовывать антитело, которое содержит вариабельный участок человека и константный участок человека. В некоторых таких способах мышь, содержит модификацию локуса тяжелой цепи иммуноглобулина, причем модификация уменьшает или устраняет эндогенную функцию ADAM6, и причем мышь содержит последовательность эктопической нуклеиновой кислоты, кодирующую белок ADAM6 мыши, его ортолог, его гомолог, или его фрагмент, причем белок ADAM6, его ортолог, его гомолог или его фрагмент, функционируют у самца мыши. Необязательно, эктопическая последовательность нуклеиновой кислоты, кодирующая белок ADAM6 мыши, его ортолог, его гомолог или его фрагмент, присутствует в локусе вариабельного участка тяжелой цепи человека. Необязательно, эктопическая последовательность нуклеиновой кислоты, кодирующая белок ADAM6 мыши, его ортолог, его гомолог или его фрагмент, присутствует в месте, отличном от локуса вариабельного участка тяжелой цепи человека.[00043] In some such methods, the mouse comprises in its germ lines unrearranged human variable region gene segments inserted into an endogenous mouse immunoglobulin locus. Optionally, the unrearranged human variable region gene segments are heavy chain gene segments and the mouse immunoglobulin locus is a heavy chain locus. Optionally, the unrearranged human variable region gene segments are light chain gene segments and the mouse immunoglobulin locus is a light chain locus. Optionally, the light chain gene segments are human kappa or lambda light chain gene segments. In some such methods, the mouse comprises in its germ lines unrearranged human variable region gene segments operably linked to a mouse constant region gene, wherein the mouse does not have a human constant region gene, and wherein the mouse constant region gene is in an endogenous mouse immunoglobulin locus. In some such methods, the mouse comprises: (a) a hybrid heavy chain locus comprising an insertion of human immunoglobulin heavy chain V, D, and J gene segments, wherein the human immunoglobulin heavy chain V, D, and J gene segments are operably linked to a mouse immunoglobulin heavy chain gene, wherein the mouse immunoglobulin heavy chain gene is located in an endogenous mouse immunoglobulin locus; and (b) a hybrid light chain locus comprising an insertion of human immunoglobulin light chain V and J gene segments, wherein the human V and J gene segments are operably linked to a mouse immunoglobulin light chain constant region gene sequence; wherein (a) is rearranged to form a hybrid heavy chain sequence comprising a human variable region operably linked to a mouse constant region, and (b) is rearranged to form a hybrid light chain sequence comprising a human variable region operably linked to a mouse constant region, and wherein the mouse is incapable of forming an antibody that comprises a human variable region and a human constant region. In some such methods, the mouse comprises a modification of an immunoglobulin heavy chain locus, wherein the modification reduces or eliminates endogenous ADAM6 function, and wherein the mouse comprises an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, wherein the ADAM6 protein, ortholog thereof, homolog thereof, or fragment thereof is functional in a male mouse. Optionally, the ectopic nucleic acid sequence encoding the mouse ADAM6 protein, its ortholog, its homolog, or a fragment thereof is present in a human heavy chain variable region locus. Optionally, the ectopic nucleic acid sequence encoding the mouse ADAM6 protein, its ortholog, its homolog, or a fragment thereof is present in a location other than a human heavy chain variable region locus.

[00044] В некоторых таких способах, мышь содержит в своей зародышевой линии гуманизированный вариабельный локус легкой цепи иммуноглобулина, содержащий не более одной или не более двух перестроенных последовательностей V/J легкой цепи человека, функционально связанных с константным участком легкой цепи. Необязательно, ген константного участка легкой цепи представляет собой ген мыши. В некоторых таких способах, мышь дополнительно содержит гуманизированный вариабельный локустяжелой цепи иммуноглобулина, содержащий по меньшей мере один неперестроенный V человека, по меньшей мере один неперестроенный D человека, и по меньшей мере один неперестроенный J сегмент человека, функционально связанный с геном константного участка тяжелой цепи. Необязательно, ген константного участка тяжелой цепи представляет собой ген мыши. В некоторых таких способах, мышь содержит гуманизированный вариабельный локус тяжелой цепи иммуноглобулина и гуманизированный вариабельный локус легкой цепи иммуноглобулина, причем мышь экспрессирует одну легкую цепь. В некоторых таких способах, мышь содержит: (а) один перестроенный вариабельный участок легкой цепи иммуноглобулина человека (VL/JL), которая кодирует VL домен легкой цепи иммуноглобулина человека, причем один перестроенный участок VL/JL человека выбирается из генного сегмент Vк1-39/J человека или генного сегмента Vк3-20/J человека; и (b) замещение генных сегментов эндогенной тяжелой цепи (VH) одним или более генными сегментами VH человека, причем генные сегменты VH человека функционально связаны с геном константного участка эндогенной тяжелой цепи (CH), а генные сегменты VH человека способны перестраивать и формировать ген химерной тяжелой цепи человека/мыши. В некоторых таких способах, мышь экспрессирует популяцию антител, а зародышевая линия мыши содержит только один ген вариабельного участка легкой цепи каппа иммуноглобулина, который представляет собой перестроенный ген вариабельного участка легкой цепи каппа зародышевой линии человека, причем мышь является либо гетерозиготной для одного гена вариабельного участка легкой цепи каппа иммуноглобулина при этом он содержит только одну копию, или гомозиготной для одного гена вариабельного участка легкой цепи каппа иммуноглобулина, при этом он содержит две копии, причем мышь характеризуется активным созреванием аффинности, так что: (i) каждый легкая цепь каппа иммуноглобулина популяции содержит вариабельный домен легкой цепи, который кодируется перестроенным геном вариабельного участка легкой цепи каппа зародышевой линии человека, или его соматически мутированным вариантом; (и) популяция содержит антитела, содержащие легкие цепи каппа иммуноглобулина, чей вариабельный домен легкой цепи кодируется перестроенным геном вариабельного участка легкой цепи каппа зародышевой линии человека, и антитела, содержащие легкие цепи каппа иммуноглобулина, чей вариабельный домен легкой цепи кодируется их соматически мутированным варианты; и (iii) мышь образует разнообразный набор соматически мутированных высокоаффинных тяжелых цепей, которые успешно соединяются с легкими цепями каппа иммуноглобулина с образованием антител к популяции. Необязательно, мышь гетерозиготна или гомозиготна в своей зародышевой линии для: (а) вставки в эндогенный локус вариабельного участка легкой цепи иммуноглобулина к мыши перестроенной последовательности Vk/Jk, содержащей: (i) одну последовательность Vk зародышевой линии человека, при этом последовательность Vk зародышевой линии человека представлена в SEQ ID NO: 148 или SEQ ID NO: 149; и (ii) одну последовательность Jk зародышевой линии человека, причем перестроенная последовательность Vk/Jk функционально связана с эндогенным константным участком к мыши; и (b) вставки в эндогенный локус вариабельного участка тяжелой цепи иммуноглобулина мыши из множества генных сегментов вариабельного участка тяжелой цепи иммуноглобулина человека, причем генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека функционально связаны с константным участком эндогенной тяжелой цепи иммуноглобулина мыши, и генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека способны перестраивать и формировать перестроенный ген тяжелой цепи химерного иммуноглобулина человека/мыши. В некоторых таких способах мышь, содержит модификацию локуса тяжелой цепи иммуноглобулина, причем модификация уменьшает или устраняет эндогенную функцию ADAM6, и причем мышь содержит последовательность эктопической нуклеиновой кислоты, кодирующую белок ADAM6 мыши, его ортолог, его гомолог, или его фрагмент, причем белок ADAM6, его ортолог, его голлолог или его фрагмент, функционируют у самца мыши. Необязательно, эктопическая последовательность нуклеиновой кислоты, кодирующая белок ADAM6 мыши, его ортолог, его гомолог или его фрагмент, присутствует в локусе вариабельного участка тяжелой цепи человека. Необязательно, эктопическая последовательность нуклеиновой кислоты, кодирующая белок ADAM6 мыши, его ортолог, его гомолог или его фрагмент, присутствует в месте, отличном от локуса вариабельного участка тяжелой цепи человека.[00044] In some such methods, the mouse comprises in its germline a humanized immunoglobulin light chain variable locus comprising no more than one or no more than two rearranged human light chain V/J sequences operably linked to a light chain constant region. Optionally, the light chain constant region gene is a mouse gene. In some such methods, the mouse further comprises a humanized immunoglobulin heavy chain variable locus comprising at least one non-rearranged human V, at least one non-rearranged human D, and at least one non-rearranged human J segment operably linked to a heavy chain constant region gene. Optionally, the heavy chain constant region gene is a mouse gene. In some such methods, the mouse comprises a humanized immunoglobulin heavy chain variable locus and a humanized immunoglobulin light chain variable locus, wherein the mouse expresses one light chain. In some such methods, the mouse comprises: (a) one rearranged human immunoglobulin light chain variable region (V L /J L ) that encodes a V L domain of a human immunoglobulin light chain, wherein the one rearranged human V L /J L region is selected from a human Vk1-39/J gene segment or a human Vk3-20/J gene segment; and (b) replacing endogenous heavy chain (V H ) gene segments with one or more human V H gene segments, wherein the human V H gene segments are operably linked to an endogenous heavy chain constant region ( CH ) gene, and the human V H gene segments are capable of rearranging and forming a chimeric human/mouse heavy chain gene. In some such methods, the mouse expresses a population of antibodies, and the germline of the mouse comprises only one immunoglobulin kappa light chain variable region gene that is a rearranged human germline kappa light chain variable region gene, wherein the mouse is either heterozygous for one immunoglobulin kappa light chain variable region gene and comprises only one copy, or homozygous for one immunoglobulin kappa light chain variable region gene and comprises two copies, wherein the mouse is characterized by active affinity maturation, such that: (i) each immunoglobulin kappa light chain of the population comprises a light chain variable domain that is encoded by the rearranged human germline kappa light chain variable region gene, or a somatically mutated variant thereof; (i) the population comprises antibodies comprising immunoglobulin kappa light chains whose light chain variable domain is encoded by a rearranged human germline kappa light chain variable region gene and antibodies comprising immunoglobulin kappa light chains whose light chain variable domain is encoded by somatically mutated variants thereof; and (iii) the mouse produces a diverse set of somatically mutated high-affinity heavy chains that successfully combine with immunoglobulin kappa light chains to form antibodies to the population. Optionally, the mouse is heterozygous or homozygous in its germline for: (a) insertion into an endogenous mouse κ light chain immunoglobulin variable region locus a rearranged Vk/Jk sequence comprising: (i) one human germline Vk sequence, wherein the human germline Vk sequence is shown in SEQ ID NO: 148 or SEQ ID NO: 149; and (ii) one human germline Jk sequence, wherein the rearranged Vk/Jk sequence is operably linked to an endogenous mouse κ constant region; and (b) inserting into an endogenous mouse immunoglobulin heavy chain variable region locus a plurality of human immunoglobulin heavy chain variable region gene segments, wherein the human immunoglobulin heavy chain variable region gene segments are operably linked to an endogenous mouse immunoglobulin heavy chain constant region, and the human immunoglobulin heavy chain variable region gene segments are capable of rearranging and forming a rearranged human/mouse chimeric immunoglobulin heavy chain gene. In some such methods, the mouse comprises a modification of an immunoglobulin heavy chain locus, wherein the modification reduces or eliminates endogenous ADAM6 function, and wherein the mouse comprises an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, wherein the ADAM6 protein, the ortholog thereof, the homolog thereof, or a fragment thereof, is functional in a male mouse. Optionally, the ectopic nucleic acid sequence encoding the mouse ADAM6 protein, its ortholog, its homolog, or a fragment thereof is present in a human heavy chain variable region locus. Optionally, the ectopic nucleic acid sequence encoding the mouse ADAM6 protein, its ortholog, its homolog, or a fragment thereof is present in a location other than a human heavy chain variable region locus.

[00045] В некоторых таких способах, мышь имеет геном, содержащий модификацию локуса тяжелой цепи иммуноглобулина, причем модификация уменьшает или устраняет функцию эндогенного ADAM6, и мышь дополнительно содержит последовательность нуклеиновой кислоты, кодирующую белок ADAM6 отличного от человека животного, или ортолог, или его гомолог, или функциональный фрагмент соответствующего белка ADAM6. Необязательно, геном мыши содержит: (а) эктопическое размещение гена ADAM6; и (b) локус вариабельного участка тяжелой цепи иммуноглобулина человека, содержащий вставку одного или более генных сегментов VH человека, одного или более генных сегментов DH человека, и одного или более генных сегментов JH человека в эндогенный локус тяжелой цепи отличного от человека животного, причем генные сегменты VH, DH и JH человека функционально связаны с геном константного участка тяжелой цепи; так что мышь характеризуется тем, что: (i) она фертильна; и (и) когда она иммунизирована антигеном, то продуцирует антитела, содержащие вариабельные домены тяжелой цепи, кодируемые одним или более генными сегментами VH человека, одним или более DH человека, и одним или более JH человека, функционально связанными с константными доменами тяжелой цепи, кодируемыми геном константного участка тяжелой цепи, причем антитела проявляют специфическое связывание с антигеном.[00045] In some such methods, the mouse has a genome comprising a modification of an immunoglobulin heavy chain locus, wherein the modification reduces or eliminates the function of endogenous ADAM6, and the mouse further comprises a nucleic acid sequence encoding an ADAM6 protein of a non-human animal, or an ortholog or homolog thereof, or a functional fragment of the corresponding ADAM6 protein. Optionally, the mouse genome comprises: (a) an ectopic placement of the ADAM6 gene; and (b) a human immunoglobulin heavy chain variable region locus comprising an insertion of one or more human VH gene segments, one or more human DH gene segments, and one or more human JH gene segments into an endogenous heavy chain locus of a non-human animal, wherein the human VH , DH , and JH gene segments are operably linked to a heavy chain constant region gene; such that the mouse is characterized in that: (i) it is fertile; and (and) when immunized with an antigen, produces antibodies comprising heavy chain variable domains encoded by one or more human V H , one or more human D H , and one or more human J H gene segments operably linked to heavy chain constant domains encoded by a heavy chain constant region gene, wherein the antibodies exhibit specific binding to the antigen.

[00046] В некоторых таких способах, отличное от человека животное представляет собой мышь, которая по меньшей мере частично является производным от линии BALB/c, причем мышь содержит гуманизированный локус иммуноглобулина, причем представляющий интерес чужеродный антиген является полностью или частично белком человека, который является ортологичным первому аутоантигену, и первый геномный локус-мишень содержит весь или часть гена, кодирующего первый аутоантиген, причем первый сайт узнавания направляющей РНК содержит старт-кодон для гена, кодирующего первый аутоантиген, и второй сайт узнавания направляющей РНК содержит стоп-кодон для гена, кодирующего первый аутоантиген, и при этом модификация содержит гомозиготную делецию всего или части гена, кодирующего первый аутоантиген, причем экспрессия первого аутоантигена исключается. Необязательно, мышь содержит: (а) эктопическую последовательность нуклеиновой кислоты, кодирующую белок ADAM6 мыши, его ортолог, его гомолог, или его фрагмент, причем белок ADAM6, его ортолог, его гомолог, или его фрагмент, является функциональным у самца мыши; (b) гибридный локус тяжелой цепи, содержащий вставку генных сегментов V, D и J тяжелой цепи иммуноглобулина человека, причем генные сегменты V, D и J тяжелой цепи иммуноглобулина человека, функционально связаны с геном тяжелой цепи иммуноглобулина мыши, причем ген тяжелой цепи иммуноглобулина мыши находится в эндогенном локусе иммуноглобулина мыши; и (с) гибридный локус легкой цепи, содержащий вставку генных сегментов V и J легкой цепи иммуноглобулина человека, причем генные сегменты V и J человека функционально связаны с последовательностью гена константного участка легкой цепи иммуноглобулина мыши; причем (b) перестраиваются с образованием гибридной последовательности тяжелой цепи, содержащей вариабельный участок человека, функционально связанный с константным участком мыши, и (с) перестраивается с образованием гибридной последовательности легкой цепи, содержащей вариабельный участок человека, функционально связанный с константным участком мыши, и причем мышь неспособна образовывать антитело, которое содержит вариабельный участок человека и константный участок человека. Необязательно, мышь гетерозиготна или гомозиготна в своей зародышевой линии для: (а) эктопической последовательности нуклеиновой кислоты, кодирующей белок ADAM6 мыши, его ортолог, его гомолог, или его фрагмент, причем белок ADAM6, его ортолог, его гомолог, или его фрагмент, являются функционирующим у самца мыши; (b) вставки в эндогенный локус вариабельного участка легкой цепи иммуноглобулина мыши к перестроенной последовательности Vk/Jk, содержащей: (i) одну последовательность Vk зародышевой линии человека, при этом последовательность Vk зародышевой линии человека представлена в SEQ ID NO: 148 или SEQ. ID NO: 149; и (ii) одну последовательность Jk зародышевой линии человека, причем перестроенная последовательность Vk/Jk функционально связана с эндогенным константным участком к мыши; и (с) вставки в эндогенный локус вариабельного участка тяжелой цепи иммуноглобулина мыши из множества генных сегментов вариабельного участка тяжелой цепи иммуноглобулина человека, причем генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека функционально связаны с константным участком эндогенной тяжелой цепи иммуноглобулина мыши, и генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека способны перестраивать и формировать перестроенный ген тяжелой цепи химерного иммуноглобулина человека/мыши.[00046] In some such methods, the non-human animal is a mouse that is at least partially derived from a BALB/c strain, wherein the mouse comprises a humanized immunoglobulin locus, wherein the foreign antigen of interest is all or part of a human protein that is orthologous to a first self-antigen, and the first target genomic locus comprises all or part of a gene encoding the first self-antigen, wherein the first guide RNA recognition site comprises a start codon for the gene encoding the first self-antigen, and the second guide RNA recognition site comprises a stop codon for the gene encoding the first self-antigen, and wherein the modification comprises a homozygous deletion of all or part of the gene encoding the first self-antigen, wherein expression of the first self-antigen is eliminated. Optionally, the mouse comprises: (a) an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, wherein the ADAM6 protein, ortholog thereof, homolog thereof, or a fragment thereof is functional in a male mouse; (b) a hybrid heavy chain locus comprising an insertion of human immunoglobulin heavy chain V, D, and J gene segments, wherein the human immunoglobulin heavy chain V, D, and J gene segments are operably linked to a mouse immunoglobulin heavy chain gene, wherein the mouse immunoglobulin heavy chain gene is located in an endogenous mouse immunoglobulin locus; and (c) a hybrid light chain locus comprising an insertion of human immunoglobulin light chain V and J gene segments, wherein the human V and J gene segments are operably linked to a mouse immunoglobulin light chain constant region gene sequence; wherein (b) is rearranged to form a hybrid heavy chain sequence comprising a human variable region operably linked to a mouse constant region, and (c) is rearranged to form a hybrid light chain sequence comprising a human variable region operably linked to a mouse constant region, and wherein the mouse is incapable of forming an antibody that comprises a human variable region and a human constant region. Optionally, the mouse is heterozygous or homozygous in its germline for: (a) an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, wherein the ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof is functional in a male mouse; (b) an insertion into an endogenous mouse immunoglobulin light chain variable region locus of a rearranged Vk/Jk sequence comprising: (i) one human germline Vk sequence, wherein the human germline Vk sequence is shown in SEQ ID NO: 148 or SEQ. ID NO: 149; and (ii) one human germline Jk sequence, wherein the rearranged Vk/Jk sequence is operably linked to an endogenous mouse κ constant region; and (c) inserting into an endogenous mouse immunoglobulin heavy chain variable region locus a plurality of human immunoglobulin heavy chain variable region gene segments, wherein the human immunoglobulin heavy chain variable region gene segments are operably linked to an endogenous mouse immunoglobulin heavy chain constant region, and the human immunoglobulin heavy chain variable region gene segments are capable of rearranging and forming a rearranged chimeric human/mouse immunoglobulin heavy chain gene.

[00047] В некоторых таких способах, в которых отличное от человека животное представляет собой мышь, которая по меньшей мере частично является производным от линии BALB/c, причем мышь содержит гуманизированный локус иммуноглобулина, причем представляющий интерес чужеродный антиген является полностью или частично белком человека, который является ортологичным первому аутоантигену, и первый геномный локус-мишень содержит весь или часть гена, кодирующего первый аутоантиген, причем первый сайт узнавания направляющей РНК содержит старт-кодон для гена, кодирующего первый аутоантиген, и второй сайт узнавания направляющей РНК содержит стоп-кодон для гена, кодирующего первый аутоантиген, и при этом где модификация содержит гомозиготное повреждение стартового кодона для гена, кодирующего первый аутоантиген, при этом экспрессия первого аутоантигена исключается. Необязательно, мышь содержит: (а) эктопическую последовательность нуклеиновой кислоты, кодирующую белок ADAM6 мыши, его ортолог, его гомолог, или его фрагмент, причем белок ADAM6, его ортолог, его гомолог, или его фрагмент, является функциональным у самца мыши; (b) гибридный локус тяжелой цепи, содержащий вставку генных сегментов V, D и J тяжелой цепи иммуноглобулина человека, причем генные сегменты V, D и J тяжелой цепи иммуноглобулина человека, функционально связаны с геном тяжелой цепи иммуноглобулина мыши, причем ген тяжелой цепи иммуноглобулина мыши находится в эндогенном локусе иммуноглобулина мыши; и (с) гибридный локус легкой цепи, содержащий вставку генных сегментов V и J легкой цепи иммуноглобулина человека, причем генные сегменты V и J человека функционально связаны с последовательностью гена константного участка легкой цепи иммуноглобулина мыши; причем (b) перестраиваются с образованием гибридной последовательности тяжелой цепи, содержащей вариабельный участок человека, функционально связанный с константным участком мыши, и (с) перестраивается с образованием гибридной последовательности легкой цепи, содержащей вариабельный участок человека, функционально связанный с константным участком мыши, и причем мышь неспособна образовывать антитело, которое содержит вариабельный участок человека и константный участок человека. Необязательно, мышь гетерозиготна или гомозиготна в своей зародышевой линии для: (а) эктопической последовательности нуклеиновой кислоты, кодирующей белок ADAM6 мыши, его ортолог, его гомолог, или его фрагмент, причем белок ADAM6, его ортолог, его гомолог, или его фрагмент, являются функционирующим у самца мыши; (b) вставки в эндогенный локус вариабельного участка легкой цепи иммуноглобулина мыши к перестроенной последовательности Vk/Jk, содержащей: (i) одну последовательность Vk зародышевой линии человека, при этом последовательность Vk зародышевой линии человека представлена в SEQ ID NO: 148 или SEQ ID NO: 149; и (ii) одну последовательность Jk зародышевой линии человека, причем перестроенная последовательность Vk/Jk функционально связана с эндогенным константным участком к мыши; и (с) вставки в эндогенный локус вариабельного участка тяжелой цепи иммуноглобулина мыши из множества генных сегментов вариабельного участка тяжелой цепи иммуноглобулина человека, причем генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека функционально связаны с константным участком эндогенной тяжелой цепи иммуноглобулина мыши, и генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека способны перестраивать и формировать перестроенный ген тяжелой цепи химерного иммуноглобулина человека/мыши.[00047] In some such methods, wherein the non-human animal is a mouse that is at least partially derived from a BALB/c strain, wherein the mouse comprises a humanized immunoglobulin locus, wherein the foreign antigen of interest is all or part of a human protein that is orthologous to a first self-antigen, and the first target genomic locus comprises all or part of a gene encoding the first self-antigen, wherein the first guide RNA recognition site comprises a start codon for the gene encoding the first self-antigen, and the second guide RNA recognition site comprises a stop codon for the gene encoding the first self-antigen, and wherein the modification comprises a homozygous disruption of the start codon for the gene encoding the first self-antigen, wherein expression of the first self-antigen is eliminated. Optionally, the mouse comprises: (a) an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, wherein the ADAM6 protein, ortholog thereof, homolog thereof, or a fragment thereof is functional in a male mouse; (b) a hybrid heavy chain locus comprising an insertion of human immunoglobulin heavy chain V, D, and J gene segments, wherein the human immunoglobulin heavy chain V, D, and J gene segments are operably linked to a mouse immunoglobulin heavy chain gene, wherein the mouse immunoglobulin heavy chain gene is located in an endogenous mouse immunoglobulin locus; and (c) a hybrid light chain locus comprising an insertion of human immunoglobulin light chain V and J gene segments, wherein the human V and J gene segments are operably linked to a mouse immunoglobulin light chain constant region gene sequence; wherein (b) is rearranged to form a hybrid heavy chain sequence comprising a human variable region operably linked to a mouse constant region, and (c) is rearranged to form a hybrid light chain sequence comprising a human variable region operably linked to a mouse constant region, and wherein the mouse is incapable of forming an antibody that comprises a human variable region and a human constant region. Optionally, the mouse is heterozygous or homozygous in its germline for: (a) an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, wherein the ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof is functional in a male mouse; (b) an insertion into an endogenous mouse immunoglobulin light chain variable region locus of a rearranged Vk/Jk sequence comprising: (i) one human germline Vk sequence, wherein the human germline Vk sequence is shown in SEQ ID NO: 148 or SEQ ID NO: 149; and (ii) one human germline Jk sequence, wherein the rearranged Vk/Jk sequence is operably linked to an endogenous mouse κ constant region; and (c) inserting into an endogenous mouse immunoglobulin heavy chain variable region locus a plurality of human immunoglobulin heavy chain variable region gene segments, wherein the human immunoglobulin heavy chain variable region gene segments are operably linked to an endogenous mouse immunoglobulin heavy chain constant region, and the human immunoglobulin heavy chain variable region gene segments are capable of rearranging and forming a rearranged chimeric human/mouse immunoglobulin heavy chain gene.

[00048] В некоторых способах, эмбрион отличного от человека животного на одноклеточной стадии представляет собой гибридный эмбрион на одноклеточной стадии, и этот способ дополнительно включает: (а') сравнение последовательности соответствующих первой и второй хромосом в гомологичной паре хромосом в первом геномном локусе-мишени, и выбор участка-мишени в пределах первого геномного локуса-мишени перед стадией приведения в контакт (а) на основе участка-мишени, имеющего более высокий процент идентичности последовательности между соответствующей первой и второй хромосомами в гомологичной хромосомной паре по отношению ко всей или части остального первого геномного локуса-мишени. Необязательно, участок-мишень имеет более высокий процент идентичности последовательности между соответствующей первой и второй хромосомами в гомологичной хромосомной паре относительно остальной части первого геномного локуса-мишени. Необязательно, участок-мишень имеет по меньшей мере 99,9% идентичности последовательностей между соответствующими первой и второй хромосомами, а остальная часть первого геномного локуса-мишени имеет не более чем 99,8% идентичности последовательности между соответствующими первой и второй хромосомами. Необязательно, участок-мишень идентичен в соответствующей первой и второй хромосомах в гомологичной паре хромосом. Необязательно, участок-мишень находится в пределах максимально возможного участка непрерывной идентичности аллельной последовательности в первом геномном локусе-мишени.[00048] In some methods, the one-cell stage embryo of a non-human animal is a one-cell stage hybrid embryo, and the method further comprises: (a') comparing the sequence of corresponding first and second chromosomes in a homologous chromosome pair in a first target genomic locus, and selecting a target region within the first target genomic locus prior to the step of contacting (a) based on the target region having a higher percentage of sequence identity between the corresponding first and second chromosomes in the homologous chromosome pair relative to all or a portion of the remainder of the first target genomic locus. Optionally, the target region has a higher percentage of sequence identity between the corresponding first and second chromosomes in the homologous chromosome pair relative to the remainder of the first target genomic locus. Optionally, the target region has at least 99.9% sequence identity between the corresponding first and second chromosomes, and the remainder of the first genomic target locus has no more than 99.8% sequence identity between the corresponding first and second chromosomes. Optionally, the target region is identical in the corresponding first and second chromosomes in a homologous pair of chromosomes. Optionally, the target region is within the maximum possible region of contiguous allelic sequence identity in the first genomic target locus.

[00049] В некоторых таких способах, участок-мишень содержит, по существу состоит из, состоит из последовательности, распознаваемой первой направляющей РНК, и по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5' стороне, 3' стороне или каждой стороне последовательности, распознаваемой первой направляющей РНК, и последовательности, распознаваемой второй направляющей РНК, и по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5' стороне, на 3' стороне или на каждой стороне последовательности, распознаваемой второй направляющей РНК. Необязательно, этап (а') включает в себя сравнение двух или более сегментов первого геномного локуса-мишени, причем каждый сегмент содержит, по существу состоит из, состоит из последовательности, распознаваемой другой направляющей РНК, не присутствующей в другом месте в геноме, и по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5' стороне, 3' стороне, или на каждой стороне последовательности, распознаваемой другой направляющей РНК, и выбирается как участок-мишень двух сегментов, имеющих самый высокий процент идентичности последовательности по отношению к другим сегментам. Необязательно, один или более сегментов содержат, состоят по существу из, или состоят из сегментов, соответствующих каждой последовательности, распознаваемой другой направляющей РНК в первом геномном локусе-мишени, но не присутствуют в другом месте в геноме.[00049] In some such methods, the target region comprises, consists essentially of, consists of a sequence recognized by the first guide RNA, and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 t.p.o., 9 t.p.o., 10 t.p.o., 20 t.p.o., 30 t.p.o., 40 t.p.o., 50 t.p.o., 60 t.p.o., 70 t.p.o., 80 t.p.o., 90 t.p.o., 100 t.p.o., 110 t.p.o., 120 t.p.o., 130 t.p.o., 140 t.p.o. or 150 t.p.o. a flanking sequence on the 5' side, the 3' side, or each side of the sequence recognized by the first guide RNA and the sequence recognized by the second guide RNA, and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, or 150 kb of flanking sequence on the 5' side, on the 3' side, or on each side of the sequence recognized by the second guide RNA. Optionally, step (a') comprises comparing two or more segments of the first genomic target locus, each segment comprising, consisting essentially of, consisting of, a sequence recognized by a different guide RNA not present elsewhere in the genome, and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 t.p.o., 6 t.p.o., 7 t.p.o., 8 t.p.o., 9 t.p.o., 10 t.p.o., 20 t.p.o., 30 t.p.o., 40 t.p.o., 50 t.p.o., 60 t.p.o., 70 t.p.o., 80 t.p.o., 90 t.p.o., 100 t.p.o., 110 t.p.o., 120 t.p.o., 130 t.p.o., 140 t.p.o. or 150 t.p.o. flanking sequence on the 5' side, the 3' side, or on each side of a sequence recognized by another guide RNA, and is selected as the target region of the two segments having the highest percentage of sequence identity to the other segments. Optionally, one or more segments comprise, consist essentially of, or consist of segments corresponding to each sequence recognized by another guide RNA at the first target genomic locus, but are not present elsewhere in the genome.

[00050] В некоторых таких способах, участок-мишень содержит, по существу состоит из, или состоит из участка между последовательностями, распознаваемыми первой и второй направляющими РНК. Необязательно, стадия (а') включает в себя сравнение двух или более сегментов первого геномного локуса-мишени, причем каждый сегмент содержит, по существу состоит из, или состоит из участка между парой разных последовательностей, распознаваемых направляющей РНК, причем последовательности, распознаваемые направляющей РНК, не присутствуют в другом месте генома, и выбираются в качестве участка-мишени сегмента, имеющего самый высокий процент идентичности последовательности по сравнению с другими сегментами. Необязательно, один или более сегментов содержат, состоят по существу из, или состоят из сегментов, соответствующих каждой паре разных последовательностей, распознаваемых направляющей РНК в первом геномном локусе-мишени, причем последовательности, распознаваемые направляющей РНК отсутствуют в другом месте генома.[00050] In some such methods, the target region comprises, consists essentially of, or consists of a region between sequences recognized by the first and second guide RNAs. Optionally, step (a') involves comparing two or more segments of the first target genomic locus, wherein each segment comprises, consists essentially of, or consists of a region between a pair of different sequences recognized by the guide RNA, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome, and the segment having the highest percentage of sequence identity compared to the other segments is selected as the target region. Optionally, the one or more segments comprise, consist essentially of, or consist of segments corresponding to each pair of different sequences recognized by the guide RNA in the first target genomic locus, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome.

[00051] В некоторых таких способах, участок-мишень содержит, по существу состоит из, или состоит из участка между последовательностями, распознаваемыми первой и второй направляющими РНК, и по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о фланкирующей последовательности на 5' стороне, 3' стороне, или каждой стороне геномного участка между последовательностями, распознаваемыми первой и второй направляющими РНК. Необязательно, стадия (а') включает в себя сравнение двух или более сегментов первого геномного локуса-мишени, причем каждый сегмент содержит, по существу состоит из, или состоит из участка между парой разных последовательностей, распознаваемых направляющей РНК, и по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5'-стороне, 3'-стороне, или на каждой стороне геномного участка между другой парой последовательностей, распознаваемых направляющей РНК, причем последовательности, распознаваемые направляющей РНК не присутствуют в другом месте генома, и выбираются в качестве участка-мишени сегмента, имеющего самый высокий процент идентичности последовательности относительно других сегментов. Необязательно, один или более сегментов содержат, состоят по существу из, или состоят из сегментов, соответствующих каждой паре разных последовательностей, распознаваемых направляющей РНК в первом геномном локусе-мишени, причем последовательности, распознаваемые направляющей РНК отсутствуют в другом месте генома.[00051] In some such methods, the target region comprises, consists essentially of, or consists of a region between sequences recognized by the first and second guide RNAs, and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, or 150 kb of flanking sequence on the 5' side, the 3' side, or each side of the genomic region between the sequences recognized by the first and second guide RNAs. Optionally, step (a') comprises comparing two or more segments of the first target genomic locus, each segment comprising, consisting essentially of, or consisting of a region between a pair of different sequences recognized by a guide RNA and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 t.p.o., 7 t.p.o., 8 t.p.o., 9 t.p.o., 10 t.p.o., 20 t.p.o., 30 t.p.o., 40 t.p.o., 50 t.p.o., 60 t.p.o., 70 t.p.o., 80 t.p.o., 90 t.p.o., 100 t.p.o., 110 t.p.o., 120 t.p.o., 130 t.p.o., 140 t.p.o. or 150 t.p.o. flanking sequences on the 5' side, the 3' side, or on each side of the genomic region between another pair of sequences recognized by the guide RNA, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome, and the segment having the highest percentage of sequence identity relative to the other segments is selected as the target region. Optionally, the one or more segments comprise, consist essentially of, or consist of segments corresponding to each pair of different sequences recognized by the guide RNA at the first genomic target locus, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome.

[00052] В некоторых таких способах, в которых участок-мишень содержит, по существу состоит из, или состоит из по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5' стороне, 3' стороне или каждой стороне геномного участка между последовательностями, распознаваемыми первой и второй направляющими РНК. Необязательно, стадия (а') включает в себя сравнение двух или более несмежных сегментов первого геномного локуса-мишени, причем каждый несмежный сегмент содержит, по существу состоит из, или состоит из по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5'-стороне, 3'-стороне или на каждой стороне геномного участка между парой разных последовательностей, распознаваемых направляющей РНК, причем последовательности, распознаваемые направляющей РНК не присутствуют в другом месте генома, и выбираются в качестве участка-мишени несмежного сегмента, имеющего самый высокий процент идентичности последовательности относительно других несмежных сегментов. Необязательно, один или более несмежных сегментов содержат, состоят по существу из, или состоят из несмежных сегментов, соответствующих каждой паре разных последовательностей, распознаваемых направляющей РНК в первом геномном локусе-мишени, причем последовательности, распознаваемые направляющей РНК отсутствуют в другом месте генома.[00052] In some such methods, wherein the target region comprises, consists essentially of, or consists of at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kbp, 2 kbp, 3 kbp, 4 kbp, 5 kbp, 6 kbp, 7 kbp, 8 kbp, 9 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, or 150 kb of flanking sequence on the 5' side, the 3' side, or each side of the genomic region between the sequences recognized by the first and second guide RNAs. Optionally, step (a') comprises comparing two or more non-contiguous segments of the first target genomic locus, wherein each non-contiguous segment comprises, consists essentially of, or consists of at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 t.p.o., 8 t.p.o., 9 t.p.o., 10 t.p.o., 20 t.p.o., 30 t.p.o., 40 t.p.o., 50 t.p.o., 60 t.p.o., 70 t.p.o., 80 t.p.o., 90 t.p.o., 100 t.p.o., 110 t.p.o., 120 t.p.o., 130 t.p.o., 140 t.p.o. or 150 t.p.o. a flanking sequence on the 5' side, the 3' side, or on each side of the genomic region between a pair of different sequences recognized by the guide RNA, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome, and the non-contiguous segment having the highest percentage of sequence identity relative to the other non-contiguous segments is selected as the target region. Optionally, the one or more non-contiguous segments comprise, consist essentially of, or consist of non-contiguous segments corresponding to each pair of different sequences recognized by the guide RNA at the first genomic target locus, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome.

[00053] В некоторых таких способах, участка-мишень содержит, по существу состоит из, или состоит из по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на каждой стороне геномного участка между последовательностями, распознаваемыми первой и второй направляющими РНК. Необязательно, стадия (а') включает в себя сравнение двух или более несмежных сегментов первого геномного локуса-мишени, причем каждый несмежный сегмент содержит, по существу состоит из, или состоит из по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на каждой стороне геномного участка между парой разных последовательностей, распознаваемых направляющей РНК, причем последовательности, распознаваемые направляющей РНК не присутствуют в другом месте генома, и выбираются в качестве участка-мишени несмежного сегмента, имеющего самый высокий процент идентичности последовательности относительно других несмежных сегментов. Необязательно, один или более несмежных сегментов содержат, состоят по существу из, или состоят из несмежных сегментов, соответствующих каждой паре разных последовательностей, распознаваемых направляющей РНК в первом геномном локусе-мишени, причем последовательности, распознаваемые направляющей РНК отсутствуют в другом месте генома.[00053] In some such methods, the target region comprises, consists essentially of, or consists of at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kbp, 2 kbp, 3 kbp, 4 kbp, 5 kbp, 6 kbp, 7 kbp, 8 kbp, 9 kbp, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, or 150 kb of flanking sequence on each side of the genomic region between the sequences recognized by the first and second guide RNAs. Optionally, step (a') comprises comparing two or more non-contiguous segments of the first target genomic locus, wherein each non-contiguous segment comprises, consists essentially of, or consists of at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 t.p.o., 8 t.p.o., 9 t.p.o., 10 t.p.o., 20 t.p.o., 30 t.p.o., 40 t.p.o., 50 t.p.o., 60 t.p.o., 70 t.p.o., 80 t.p.o., 90 t.p.o., 100 t.p.o., 110 t.p.o., 120 t.p.o., 130 t.p.o., 140 t.p.o. or 150 t.p.o. flanking sequences on each side of the genomic region between a pair of different sequences recognized by the guide RNA, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome, and the non-contiguous segment having the highest percentage of sequence identity relative to the other non-contiguous segments is selected as the target region. Optionally, the one or more non-contiguous segments comprise, consist essentially of, or consist of non-contiguous segments corresponding to each pair of different sequences recognized by the guide RNA at the first genomic target locus, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome.

[00054] В некоторых таких способах, участок-мишень на стадии (а') состоит, по существу состоит из, состоит из участка, фланкированного 5'- и 3'-последовательностями-мишенями. В некоторых таких способах, участок-мишень на стадии (а') состоит, по существу состоит из, состоит из участка, фланкированного и содержащего 5'- и 3'-последовательности-мишени. В некоторых таких способах, участок-мишень на стадии (а') состоит, по существу состоит из, состоит из 5'-последовательности-мишени и/или 3'-последовательности-мишени. Необязательно, геномный локус-мишень на стадии (а') состоит, по существу состоит из, состоит из 3'-последовательности-мишени и 3'-последовательности-мишени. В некоторых таких способах, участок-мишень на стадии (а') содержит, по существу состоит из, или состоит из участка между 5' и 3' последовательностями-мишенями и по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5' стороне, 3' стороне или каждой стороне участка между 5' и 3' последовательностями-мишенями. В некоторых таких способах, участок-мишень на стадии (а') содержит, по существу состоит из, или состоит из участка между 5' и 3' последовательностями-мишенями и по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на каждой стороне участка между 5' и 3' последовательностями-мишенями. В некоторых таких способах, участок-мишень на стадии (а') содержит, по существу состоит из, или состоит из по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5' стороне, 3' стороне или каждой стороне участка между 5' и 3' последовательностями-мишенями. В некоторых таких способах, участок-мишень на стадии (а') содержит, по существу состоит из, или состоит из по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1000 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на каждой стороне участка между 5' и 3' последовательностями-мишенями.[00054] In some such methods, the target region of step (a') consists of, consists essentially of, consists of a region flanked by 5' and 3' target sequences. In some such methods, the target region of step (a') consists of, consists essentially of, consists of a region flanked by and comprising 5' and 3' target sequences. In some such methods, the target region of step (a') consists of, consists essentially of, consists of a 5' target sequence and/or a 3' target sequence. Optionally, the target genomic locus of step (a') consists of, consists essentially of, consists of a 3' target sequence and a 3' target sequence. In some such methods, the target region of step (a') comprises, consists essentially of, or consists of a region between the 5' and 3' target sequences and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, or 150 kb of flanking sequence on the 5' side, the 3' side, or each side of the region between the 5' and 3' target sequences. In some such methods, the target region of step (a') comprises, consists essentially of, or consists of a region between the 5' and 3' target sequences and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, or 150 kb of flanking sequence on each side of the region between the 5' and 3' target sequences. In some such methods, the target region of step (a') comprises, consists essentially of, or consists of at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kbp, 2 kbp, 3 kbp, 4 kbp, 5 kbp, 6 kbp, 7 kbp, 8 kbp, 9 kbp, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, or 150 kb of flanking sequence on the 5' side, the 3' side, or each side of the region between the 5' and 3' target sequences. In some such methods, the target region of step (a') comprises, consists essentially of, or consists of at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kbp, 2 kbp, 3 kbp, 4 kbp, 5 kbp, 6 kbp, 7 kbp, 8 kbp, 9 kbp, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, or 150 kb of flanking sequence on each side of the region between the 5' and 3' target sequences.

[00055] В другом аспекте, представлен способ получения антигенсвязывающих белков против представляющего интерес чужеродного антигена, включающий: (а) создание генетически модифицированного отличного от человека животного с пониженной толерантностью к интересующему чужеродному антигену, включающему: (i) введение в эмбрион отличного от человека животного на одноклеточной стадии или плюрипотентную клетку отличного от человека животного, которая не является эмбрионом на одноклеточной стадии: (I) белка Cas9; (II) первой направляющей РНК, которая гибридизуется с последовательностью, распознаваемой первой направляющей РНК в геномном локусе-мишени, причем геномный локус-мишень содержит весь или часть гена, кодирующего аутоантиген, гомологичный или обладающим общим представляющим интерес эпитопом с чужеродным представляющим интерес антигеном; и (III) второй направляющей РНК, которая гибридизуется с последовательностью, распознаваемой второй направляющей РНК в геномном локусе-мишени; причем геномный локус-мишень модифицируется в паре соответствующих первой и второй хромосом для получения модифицированного эмбриона отличного от человека животного на одноклеточной стадии, или модифицированной плюрипотентной клетки отличного от человека животного с биаллельной модификацией, причем экспрессия аутоантигена устраняется; и (ii) получение генетически модифицированного F0-поколения отличного от человека животного из модифицированного эмбриона на одноклеточной стадии отличного от человека или модифицированной плюрипотентной клетки отличного от человека животного, причем геномный локус-мишень модифицирован в паре соответствующих первых и вторых хромосом в генетически модифицированном F0-поколении отличного от человека животного, так что экспрессия аутоантигена устранена; (b) иммунизации генетически модифицированного F0-поколения отличного от человека животного, полученного на этапе (а) с представляющим интерес чужеродным антигеном; и (с) поддержание генетически модифицированного F0-поколения отличного от человека животного в условиях, достаточных для инициирования иммунного ответа на представляющий интерес чужеродный антиген, причем генетически модифицированное F0-поколение отличного от человека животного производит антигенсвязывающие белки против представляющего интерес чужеродного антигена.[00055] In another aspect, a method for producing antigen-binding proteins against a foreign antigen of interest is provided, comprising: (a) creating a genetically modified non-human animal with reduced tolerance to the foreign antigen of interest, comprising: (i) introducing into a one-cell stage embryo of a non-human animal or a pluripotent cell of a non-human animal that is not a one-cell stage embryo: (I) a Cas9 protein; (II) a first guide RNA that hybridizes to a sequence recognized by the first guide RNA at a target genomic locus, wherein the target genomic locus comprises all or a portion of a gene encoding a self-antigen that is homologous to or shares an epitope of interest with a foreign antigen of interest; and (III) a second guide RNA that hybridizes to a sequence recognized by the second guide RNA at the target genomic locus; wherein the target genomic locus is modified in a pair of corresponding first and second chromosomes to produce a modified single-cell stage embryo of a non-human animal or a modified pluripotent cell of a non-human animal with a biallelic modification, wherein expression of the self-antigen is eliminated; and (ii) producing a genetically modified F0 generation of a non-human animal from the modified single-cell stage embryo of a non-human animal or a modified pluripotent cell of a non-human animal, wherein the target genomic locus is modified in a pair of corresponding first and second chromosomes in the genetically modified F0 generation of a non-human animal such that expression of the self-antigen is eliminated; (b) immunizing the genetically modified F0 generation of a non-human animal obtained in step (a) with a foreign antigen of interest; and (c) maintaining the genetically modified F0 generation of the non-human animal under conditions sufficient to initiate an immune response to the foreign antigen of interest, wherein the genetically modified F0 generation of the non-human animal produces antigen-binding proteins against the foreign antigen of interest.

[00056] В некоторых способах, клетка на стадии (a) (i) представляет собой плюрипотентную стволовую клетку отличного от человека животного, и продуцирование генетически модифицированного F0-поколения отличного от человека животного на стадии (a) (ii) включает: (I) введение модифицированной плюрипотентной клетки отличного от человека животного в эмбрион-хозяин; и (II) имплантацию эмбриона-хозяина суррогатной матери для получения генетически модифицированного F0-поколения отличного от человека животного в котором геномный локус-мишень модифицирован в паре соответствующих первой и второй хромосом, так что экспрессия аутоантигена устранена. Необязательно, плюрипотентная клетка представляет собой эмбриональную стволовую (ЭС) клетку. В некоторых способах, клетка на стадии (a) (i) представляет собой эмбрион отличного от человека животного на одноклеточной стадии, и продуцирование генетически модифицированного F0-поколения отличного от человека животного на стадии (a) (ii) включает имплантацию модифицированного эмбриона отличного от человека животного на одноклеточной стадии суррогатной матери для получения генетически модифицированного F0-поколения отличного от человека животного, у которого геномный локус-мишень модифицирован в паре соответствующих первой и второй хромосом, так что экспрессия аутоантигена устранена.[00056] In some methods, the cell in step (a)(i) is a pluripotent stem cell of a non-human animal, and producing a genetically modified F0 generation of the non-human animal in step (a)(ii) comprises: (I) introducing the modified pluripotent cell of the non-human animal into a host embryo; and (II) implanting the host embryo into a surrogate mother to produce a genetically modified F0 generation of the non-human animal in which the target genomic locus is modified in a pair of corresponding first and second chromosomes such that expression of the self-antigen is eliminated. Optionally, the pluripotent cell is an embryonic stem (ES) cell. In some methods, the cell in step (a)(i) is a one-cell stage embryo of a non-human animal, and producing the genetically modified F0 generation of the non-human animal in step (a)(ii) comprises implanting the modified one-cell stage embryo of the non-human animal into a surrogate mother to produce a genetically modified F0 generation of the non-human animal in which the target genomic locus is modified in the pair of corresponding first and second chromosomes such that expression of the self-antigen is eliminated.

[00057] Некоторые из таких способов дополнительно включают получение гибридомы из В-клеток, выделенных из иммунизированного генетически модифицированного F0-поколения отличного от человека животного. Некоторые из таких способов дополнительно включают получение от иммунизированного генетически модифицированного F0-поколения отличного от человека животного первой последовательности нуклеиновой кислоты, кодирующей вариабельный домен тяжелой цепи иммуноглобулина одного из антигенсвязывающих белков против представляющего интерес чужеродного антигена и/или второй последовательности нуклеиновой кислоты, кодирующей вариабельный домен легкой цепи иммуноглобулина одного из антигенсвязывающих белков против представляющего интерес чужеродного антигена. Необязательно, последовательность первой нуклеиновой кислоты и/или последовательность второй нуклеиновой кислоты получают из лимфоцита (например, В-клеток) генетически модифицированного F0-поколения отличного от человека животного или из гибридомы, полученной из лимфоцитов. Необязательно, генетически модифицированное F0-поколение отличного от человека животного, содержит гуманизированный локус иммуноглобулина, и причем первая последовательность нуклеиновой кислоты кодирует вариабельный домен тяжелой цепи иммуноглобулина человека, а вторая последовательность нуклеиновой кислоты кодирует вариабельный домен легкой цепи иммуноглобулина человека.[00057] Some of these methods further comprise obtaining a hybridoma from B cells isolated from an immunized genetically modified F0 generation of a non-human animal. Some of these methods further comprise obtaining from an immunized genetically modified F0 generation of a non-human animal a first nucleic acid sequence encoding a variable domain of an immunoglobulin heavy chain of one of the antigen-binding proteins against a foreign antigen of interest and/or a second nucleic acid sequence encoding a variable domain of an immunoglobulin light chain of one of the antigen-binding proteins against a foreign antigen of interest. Optionally, the first nucleic acid sequence and/or the second nucleic acid sequence are obtained from a lymphocyte (e.g., B cells) of a genetically modified F0 generation of a non-human animal or from a hybridoma obtained from lymphocytes. Optionally, the genetically modified F0 generation of the non-human animal comprises a humanized immunoglobulin locus, and wherein the first nucleic acid sequence encodes a human immunoglobulin heavy chain variable domain and the second nucleic acid sequence encodes a human immunoglobulin light chain variable domain.

[00058] В некоторых таких способах, антигенсвязывающие белки, продуцируемые генетически модифицированным F0-поколением отличного от человека животного, против представляющего интерес чужеродного антигена имеют более высокий титр, чем антигенсвязывающие белки, продуцируемые контрольным отличным от человека животным, которое является диким типом в геномном локусе-мишени после иммунизации контрольного отличного от человека животного представляющего интерес чужеродным антигеном. В некоторых таких способах, более разнообразный генетический репертуар антигенсвязывающих белков против представляющего интерес чужеродного антигена продуцируется генетически модифицированным F0-поколением отличного от человека животного после иммунизации генетически модифицированного F0-поколения отличного от человека животного представляющим интерес чужеродным антигеном по сравнению с антигенсвязывающими белками, продуцируемыми контрольным отличным от человека животным, которое является диким типом в геномном локусе-мишени после иммунизации контрольного отличного от человека животного интересующим чужеродным антигеном. В некоторых таких способах, антигенсвязывающие белки, продуцируемые генетически модифицированным F0-поколением отличного от человека животного, против представляющего интерес чужеродного антигена используют большее разнообразие сегментов тяжелой цепи V гена и/или сегментов легкой цепи V гена по сравнению с антигенсвязывающими белками, продуцируемыми контрольным отличным от человеком животным, которое является диким типом в геномном локусе-мишени после иммунизации контрольного отличного от человека животного представляющего интерес чужеродным антигеном. В некоторых таких способах, некоторые из антигенсвязывающих белков, продуцируемых генетически модифицированным F0-поколением отличных от человека животных, против представляющего интерес чужеродного антигена, перекрестно реагируют с аутоантигеном.[00058] In some such methods, antigen-binding proteins produced by a genetically modified F0 generation of a non-human animal against a foreign antigen of interest have a higher titer than antigen-binding proteins produced by a control non-human animal that is wild type at the target genomic locus after immunization of the control non-human animal with the foreign antigen of interest. In some such methods, a more diverse genetic repertoire of antigen-binding proteins against a foreign antigen of interest is produced by a genetically modified F0 generation of a non-human animal following immunization of the genetically modified F0 generation of a non-human animal with a foreign antigen of interest compared to antigen-binding proteins produced by a control non-human animal that is wild type at the target genomic locus following immunization of the control non-human animal with the foreign antigen of interest. In some such methods, the antigen-binding proteins produced by the genetically modified F0 generation of the non-human animal against the foreign antigen of interest utilize a greater diversity of V gene heavy chain segments and/or V gene light chain segments compared to the antigen-binding proteins produced by a control non-human animal that is wild type at the target genomic locus following immunization of the control non-human animal with the foreign antigen of interest. In some such methods, some of the antigen-binding proteins produced by the genetically modified F0 generation of the non-human animal against the foreign antigen of interest cross-react with the self-antigen.

[00059] В некоторых таких способах, последовательность, распознаваемая первой направляющей РНК, расположена в 5' положении относительно последовательности, распознаваемой второй направляющей РНК в геномном локусе-мишени, и стадия (a) (i) дополнительно включает в себя проведение анализа удерживания для определения того, что число копий равно 2 для участка в 5' положении и в пределах около 1 т.п.о. последовательности, распознаваемой первой направляющей РНК, и/или для участка в 3' положении и в пределах около 1 т.п.о. последовательности, распознаваемой второй направляющей РНК.[00059] In some such methods, the sequence recognized by the first guide RNA is located at a 5' position relative to the sequence recognized by the second guide RNA in the target genomic locus, and step (a)(i) further comprises performing a retention assay to determine that the copy number is 2 for the region at the 5' position and within about 1 kb of the sequence recognized by the first guide RNA and/or for the region at the 3' position and within about 1 kb of the sequence recognized by the second guide RNA.

[00060] В некоторых таких способах, интересующий чужеродный антиген представляет собой ортолог аутоантигена. В некоторых таких способах, интересующий чужеродный антиген содержит весь или части белка человека.[00060] In some such methods, the foreign antigen of interest is an ortholog of a self-antigen. In some such methods, the foreign antigen of interest comprises all or portions of a human protein.

[00061] В некоторых таких способах, геномный локус-мишень модифицируется так, чтобы содержать вставку одного или более нуклеотидов, делецию одного или более нуклеотидов, или замену одного или более нуклеотидов. Необязательно, делеция является точной делецией без случайных вставок и делеций (инделей).[00061] In some such methods, the target genomic locus is modified to contain an insertion of one or more nucleotides, a deletion of one or more nucleotides, or a substitution of one or more nucleotides. Optionally, the deletion is an exact deletion without random insertions and deletions (indels).

[00062] В некоторых таких способах, последовательность, распознаваемая первой направляющей РНК содержит старт-кодон для гена, кодирующего аутоантиген, или находится в пределах около 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от старт-кодона, а последовательность, распознаваемая второй направляющей РНК содержит стоп-кодон для гена, кодирующего аутоантиген, или находится в пределах около 10, 20, 30,40, 50,100, 200, 300, 400, 500, или 1000 нуклеотидов от стоп-кодона. В некоторых таких способах, последовательности, распознаваемые первой и второй направляющими РНК, различны, и каждая из последовательностей, распознаваемых первой и второй направляющими РНК, содержит старт-кодон для гена, кодирующего аутоантиген, или находится в пределах около 10, 20, 30, 40, 50, 100, 200, 300,400, 500 или 1000 нуклеотидов от старт-кодона.[00062] In some such methods, the sequence recognized by the first guide RNA comprises a start codon for a gene encoding an autoantigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the start codon, and the sequence recognized by the second guide RNA comprises a stop codon for a gene encoding an autoantigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the stop codon. In some such methods, the sequences recognized by the first and second guide RNAs are different, and each of the sequences recognized by the first and second guide RNAs comprises a start codon for a gene encoding a self-antigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of a start codon.

[00063] В некоторых таких способах, геномный локус-мишень модифицируют так, чтобы он содержал биаллельную делецию размером между от около 0,1 т.п.о. до около 200 т.п.о. В некоторых таких способах, модификация содержит биаллельную делецию всего или части гена, кодирующего аутоантиген. В некоторых таких способах, модификация содержит биаллельное разрушение старт-кодона гена, кодирующего аутоантиген.[00063] In some such methods, the target genomic locus is modified to contain a biallelic deletion of between about 0.1 kb to about 200 kb in size. In some such methods, the modification comprises a biallelic deletion of all or a portion of a gene encoding an autoantigen. In some such methods, the modification comprises a biallelic disruption of a start codon of a gene encoding an autoantigen.

[00064] В некоторых таких способах, стадия введения (a) (i) дополнительно включает введение в плюрипотентную клетку отличного от человека животного или эмбрион отличного от человека животного на одноклеточной стадии: (iv) третьей направляющей РНК, которая гибридизуется с последовательностью, распознаваемой третьей направляющей РНК в геномном локусе-мишени; и/или (v) четвертой направляющей РНК, которая гибридизуется с последовательностью, распознаваемой четвертой направляющей РНК в геномном локусе-мишени.[00064] In some such methods, the step of introducing (a)(i) further comprises introducing into a pluripotent cell of a non-human animal or a one-cell stage embryo of a non-human animal: (iv) a third guide RNA that hybridizes to a sequence recognized by a third guide RNA at a target genomic locus; and/or (v) a fourth guide RNA that hybridizes to a sequence recognized by a fourth guide RNA at a target genomic locus.

[00065] В некоторых таких способах, клетка на стадии (a) (i) представляет собой плюрипотентную стволовую клетку отличного от человека животного, и все из белка Cas9, первой направляющей РНК, и второй направляющей РНК вводят в плюрипотентную стволовую клетку отличного от человека животного в форме ДНК. В некоторых таких способах, клетка на стадии (a) (i) представляет собой плюрипотентную стволовую клетку отличного от человека животного, и все из белка Cas9, первой направляющей РНК, и второй направляющей РНК вводят в плюрипотентную стволовую клетку отличного от человека животного путем электропорации или нуклеофекции. В некоторых таких способах, клетка на стадии (a) (i) представляет собой эмбрион отличного от человека животного на одноклеточной стадии, и все из белка Cas9, первой направляющей РНК, и второй направляющей РНК вводят в эмбрион отличного от человека животного на одноклеточной стадии в форме РНК. В некоторых таких способах, клетка на стадии (a) (i) представляет собой эмбрион отличного от человека животного на одноклеточной стадии, и все из белка Cas9, первой направляющей РНК, и второй направляющей РНК вводят в эмбрион отличного от человека животного на одноклеточной стадии путем пронуклеарной инъекции или цитоплазматической инъекции.[00065] In some such methods, the cell in step (a)(i) is a pluripotent stem cell of a non-human animal, and all of the Cas9 protein, the first guide RNA, and the second guide RNA are introduced into the pluripotent stem cell of the non-human animal in the form of DNA. In some such methods, the cell in step (a)(i) is a pluripotent stem cell of a non-human animal, and all of the Cas9 protein, the first guide RNA, and the second guide RNA are introduced into the pluripotent stem cell of the non-human animal by electroporation or nucleofection. In some such methods, the cell in step (a)(i) is a one-cell stage embryo of a non-human animal, and all of the Cas9 protein, the first guide RNA, and the second guide RNA are introduced into the one-cell stage embryo of the non-human animal in the form of RNA. In some such methods, the cell in step (a)(i) is a one-cell stage non-human animal embryo, and all of the Cas9 protein, the first guide RNA, and the second guide RNA are introduced into the one-cell stage non-human animal embryo by pronuclear injection or cytoplasmic injection.

[00066] В некоторых таких способах, на стадии (a) (i) не вводится экзогенная матрица для репарации. В некоторых таких способах, стадия введения (a) (i) дополнительно включает введение в плюрипотентную клетку отличного от человека животного или эмбрион отличного от человека животного на одноклеточной стадии экзогенной матрицы для репарации, содержащий 5'-плечо гомологии, которое гибридизуется с 5' последовательностью-мишенью в геномном локусе-мишени, и 3'-плечо гомологии, которое гибридизуется с 3' последовательностью-мишенью в геномном локусе-мишени, при условии, что если клетка на стадии (a) (i) представляет собой эмбрион отличного от человека животного на одноклеточной стадии, экзогенная матрица для репарации составляет не более чем около 5 т.п.о. в длину. Необязательно, экзогенная матрица для репарации дополнительно содержит вставку нуклеиновой кислоты, фланкированную 5'-плечом гомологии и 3'-плечом гомологии. Необязательно, вставка нуклеиновой кислоты гомологична или ортологична геномному локусу-мишени. Необязательно, длина экзогенной матрицы для репарации находится в промежутке от около 50 нуклеотидов до около 1 т.п.о.. Необязательно, длина экзогенной матрицы для репарации находится в промежутке от около 80 нуклеотидов до около 200 нуклеотидов. Необязательно, экзогенная матрица для репарации представляет собой одноцепочечный олигодезоксинуклеотид. Необязательно, клетка на стадии (a) (i) представляет собой плюрипотентную клетку отличного от человека животного, и (а) экзогенная матрица для репараци представляет собой большой нацеливающий вектор (LTVEC), который имеет длину по меньшей мере 10 т.п.о.; или (b) экзогенная матрица для репараци представляет собой LTVEC, причем общая сумма 5'- и 3''-плечей гомологии LTVEC имеет длину по меньшей мере 10 т.п.о. Необязательно, геномный локус-мишень модифицирован, чтобы содержать делецию одного или более нуклеотидов, а последовательность удаленной нуклеиновой кислоты состоит из последовательности нуклеиновой кислоты между 5' и 3' последовательностями-мишенями. Необязательно, экзогенная матрица для репарации содержит вставку нуклеиновой кислоты, фланкированную 5'-плечом гомологии и 3'-плечом гомологии, вставка нуклеиновой кислоты гомологична или ортологична удаленной последовательности нуклеиновой кислоты, геномный локус-мишень модифицирован, чтобы содержать делецию одного или более нуклеотидов, а вставка нуклеиновой кислоты замещает последовательность удаленной нуклеиновой кислоты.[00066] In some such methods, step (a)(i) does not introduce an exogenous repair template. In some such methods, the step of introducing (a)(i) further comprises introducing into a pluripotent cell of a non-human animal or a one-cell stage embryo of a non-human animal an exogenous repair template comprising a 5' homology arm that hybridizes to a 5' target sequence at a target genomic locus and a 3' homology arm that hybridizes to a 3' target sequence at a target genomic locus, with the proviso that if the cell of step (a)(i) is a one-cell stage embryo of a non-human animal, the exogenous repair template is no more than about 5 kb in length. Optionally, the exogenous repair template further comprises a nucleic acid insert flanked by a 5' homology arm and a 3' homology arm. Optionally, the nucleic acid insert is homologous or orthologous to the target genomic locus. Optionally, the exogenous repair template is between about 50 nucleotides and about 1 kb in length. Optionally, the exogenous repair template is between about 80 nucleotides and about 200 nucleotides in length. Optionally, the exogenous repair template is a single-stranded oligodeoxynucleotide. Optionally, the cell in step (a)(i) is a pluripotent cell of a non-human animal, and (a) the exogenous repair template is a large targeting vector (LTVEC) that is at least 10 kb in length; or (b) the exogenous repair template is an LTVEC, wherein the sum of the 5' and 3' homology arms of the LTVEC is at least 10 kb in length. Optionally, the target genomic locus is modified to contain a deletion of one or more nucleotides, and the deleted nucleic acid sequence consists of a nucleic acid sequence between the 5' and 3' target sequences. Optionally, the exogenous repair template comprises a nucleic acid insert flanked by a 5' homology arm and a 3' homology arm, the nucleic acid insert is homologous or orthologous to the deleted nucleic acid sequence, the target genomic locus is modified to contain a deletion of one or more nucleotides, and the nucleic acid insert replaces the deleted nucleic acid sequence.

[00067] В некоторых таких способах, отличное от человека животное содержит гуманизированный локус иммуноглобулина. В некоторых таких способах, отличное от человека животное представляет собой грызуна. Необязательно, грызун представляет собой мышь. Необязательно, линия мыши содержит линию BALB/c. Необязательно, указанная линия мышей содержит линии BALB/c, C57BL/6 и 129. Необязательно, линия мыши составляет 50% BALB/c, 25% C57BL/6 и 25% 129. Необязательно, гаплотип МНС мыши представляет собой MHCb/d.[00067] In some such methods, the non-human animal comprises a humanized immunoglobulin locus. In some such methods, the non-human animal is a rodent. Optionally, the rodent is a mouse. Optionally, the mouse strain comprises a BALB/c strain. Optionally, the mouse strain comprises the BALB/c, C57BL/6, and 129 strains. Optionally, the mouse strain is 50% BALB/c, 25% C57BL/6, and 25% 129. Optionally, the mouse MHC haplotype is MHC b/d .

[00068] В некоторых таких способах, мышь содержит в своих зародышевых линиях неперестроенные генные сегменты вариабельного участка человека, вставленные в эндогенный локус иммуноглобулина мыши. Необязательно, неперестроенные генные сегменты вариабельного участка человека являются генными сегментами тяжелой цепи, а локус иммуноглобулина мыши является локусом тяжелой цепи, и/или в котором неперестроенные генные сегменты вариабельного участка человека являются сегментами легкой цепи каппа или лямбда, и локус иммуноглобулина мыши является локусом легкой цепи. Необязательно, мышь содержит в своих зародышевых линиях неперестроенные генные сегменты вариабельного участка человека, функционально связанные с геном константного участка мыши, причем мыши не имеют ген константного участка человека, и причем ген константного участка мыши находится в эндогенном локусе иммуноглобулина мыши. Необязательно, мышь содержит: (а) гибридный локус тяжелой цепи, содержащий вставку генных сегментов V, D и J тяжелой цепи иммуноглобулина человека, причем генные сегменты V, D и J тяжелой цепи иммуноглобулина человека, функционально связаны с геном тяжелой цепи иммуноглобулина мыши, причем ген тяжелой цепи иммуноглобулина мыши находится в эндогенном локусе иммуноглобулина мыши; и (b) гибридный локус легкой цепи, содержащий вставку генных сегментов V и J легкой цепи иммуноглобулина человека, причем генные сегменты V и J человека функционально связаны с последовательностью гена константного участка легкой цепи иммуноглобулина мыши; причем (а) перестраивается с образованием гибридной последовательности тяжелой цепи, содержащей вариабельный участок человека, функционально связанный с константным участком мыши, и (b) перестраивается с образованием гибридной последовательности легкой цепи, содержащей вариабельный участок человека, функционально связанный с константным участком мыши, и причем мышь неспособна образовывать антитело, которое содержит вариабельный участок человека и константный участок человека.[00068] In some such methods, the mouse comprises in its germ lines unrearranged human variable region gene segments inserted into an endogenous mouse immunoglobulin locus. Optionally, the unrearranged human variable region gene segments are heavy chain gene segments and the mouse immunoglobulin locus is a heavy chain locus, and/or wherein the unrearranged human variable region gene segments are kappa or lambda light chain segments and the mouse immunoglobulin locus is a light chain locus. Optionally, the mouse comprises in its germ lines unrearranged human variable region gene segments operably linked to a mouse constant region gene, wherein the mouse does not have a human constant region gene, and wherein the mouse constant region gene is in an endogenous mouse immunoglobulin locus. Optionally, the mouse comprises: (a) a hybrid heavy chain locus comprising an insertion of human immunoglobulin heavy chain V, D, and J gene segments, wherein the human immunoglobulin heavy chain V, D, and J gene segments are operably linked to a mouse immunoglobulin heavy chain gene, wherein the mouse immunoglobulin heavy chain gene is in an endogenous mouse immunoglobulin locus; and (b) a hybrid light chain locus comprising an insertion of human immunoglobulin light chain V and J gene segments, wherein the human V and J gene segments are operably linked to a mouse immunoglobulin light chain constant region gene sequence; wherein (a) is rearranged to form a hybrid heavy chain sequence comprising a human variable region operably linked to a mouse constant region, and (b) is rearranged to form a hybrid light chain sequence comprising a human variable region operably linked to a mouse constant region, and wherein the mouse is incapable of forming an antibody that comprises a human variable region and a human constant region.

[00069] В некоторых таких способах, мышь содержит в своей зародышевой линии гуманизированный вариабельный локус легкой цепи иммуноглобулина, содержащий не более одной или не более двух перестроенных последовательностей V/J легкой цепи человека, функционально связанных с константным участком легкой цепи мыши, и при этом мышь дополнительно содержит вариабельный локус тяжелой цепи гуманизированного иммуноглобулина, содержащий по меньшей мере один неперестроенный V человека, по меньшей мере один неперестроенный D человека, и по меньшей мере один неперестроенный J сегмент человека, функционально связанный с геном константного участка тяжелой цепи мыши. Необязательно, мышь содержит гуманизированный вариабельный локус тяжелой цепи иммуноглобулина и гуманизированный вариабельный локус легкой цепи иммуноглобулина, причем мышь экспрессирует одну легкую цепь. Необязательно, мышь содержит: (а) один перестроенный вариабельный участок легкой цепи иммуноглобулина человека (VL/JL), которая кодирует VL домен легкой цепи иммуноглобулина человека, причем один перестроенный участок VL/JL человека выбирается из генного сегмента Vк1-39/Jк5 человека или генного сегмента Vк3-20/Jк1 человека; и (b) замещение генных сегментов эндогенной тяжелой цепи (VH) одним или более генными сегментами VH человека, причем генные сегменты VH человека функционально связаны с геном константного участка эндогенной тяжелой цепи (СН), а генные сегменты VH человека способны перестраиваться и формировать ген химерной тяжелой цепи человека/мыши. Необязательно, мышь экспрессирует популяцию антител, а зародышевая линия мыши содержит только один ген вариабельного участка легкой цепи каппа иммуноглобулина, который представляет собой перестроенный ген вариабельного участка легкой цепи каппа зародышевой линии человека, причем мышь является либо гетерозиготной для одного гена вариабельного участка легкой цепи каппа иммуноглобулина при этом он содержит только одну копию, или гомозиготной для одного гена вариабельного участка легкой цепи каппа иммуноглобулина, при этом он содержит две копии, причем мышь характеризуется активным созреванием аффинности, так что: (i) каждый легкая цепь каппа иммуноглобулина популяции содержит вариабельный домен легкой цепи, который кодируется перестроенным геном вариабельного участка легкой цепи каппа зародышевой линии человека, или его соматически мутированным вариантом; (и) популяция содержит антитела, содержащие легкие цепи каппа иммуноглобулина, чей вариабельный домен легкой цепи кодируется перестроенным геном вариабельного участка легкой цепи каппа зародышевой линии человека, и антитела, содержащие легкие цепи каппа иммуноглобулина, чей вариабельный домен легкой цепи кодируется их соматически мутированным варианты; и (iii) мышь образует разнообразный набор соматически мутированных высокоаффинных тяжелых цепей, которые успешно соединяются с легкими цепями каппа иммуноглобулина с образованием антител к популяции. Необязательно, мышь гетерозиготна или гомозиготна в своей зародышевой линии для: (а) вставки в эндогенный локус вариабельного участка легкой цепи иммуноглобулина к мыши перестроенной последовательности Vk/Jk, содержащей: (i) одну последовательность Vk зародышевой линии человека, при этом последовательность Vk зародышевой линии человека представлена в SEQ ID NO: 148 или SEQ ID NO: 149; и (ii) одну последовательность Jk зародышевой линии человека, причем перестроенная последовательность Vk/Jk функционально связана с эндогенным константным участком к мыши; и (b) вставки в эндогенный локус вариабельного участка тяжелой цепи иммуноглобулина мыши из множества генных сегментов вариабельного участка тяжелой цепи иммуноглобулина человека, причем генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека функционально связаны с константным участком эндогенной тяжелой цепи иммуноглобулина мыши, и генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека способны перестраивать и формировать перестроенный ген тяжелой цепи химерного иммуноглобулина человека/мыши.[00069] In some such methods, the mouse comprises in its germline a humanized immunoglobulin light chain variable locus comprising no more than one or no more than two rearranged human light chain V/J sequences operably linked to a mouse light chain constant region, and wherein the mouse further comprises a humanized immunoglobulin heavy chain variable locus comprising at least one non-rearranged human V, at least one non-rearranged human D, and at least one non-rearranged human J segment operably linked to a mouse heavy chain constant region gene. Optionally, the mouse comprises a humanized immunoglobulin heavy chain variable locus and a humanized immunoglobulin light chain variable locus, wherein the mouse expresses one light chain. Optionally, the mouse comprises: (a) one rearranged human immunoglobulin light chain variable region (V L /J L ) that encodes a V L domain of a human immunoglobulin light chain, wherein the one rearranged human V L /J L region is selected from a human Vκ1-39/Jκ5 gene segment or a human Vκ3-20/Jκ1 gene segment; and (b) a replacement of the endogenous heavy chain (V H ) gene segments with one or more human V H gene segments, wherein the human V H gene segments are operably linked to an endogenous heavy chain constant region ( CH ) gene, and the human V H gene segments are capable of rearranging to form a chimeric human/mouse heavy chain gene. Optionally, the mouse expresses a population of antibodies, and the germline of the mouse comprises only one immunoglobulin kappa light chain variable region gene that is a rearranged human germline kappa light chain variable region gene, wherein the mouse is either heterozygous for one immunoglobulin kappa light chain variable region gene wherein it comprises only one copy, or homozygous for one immunoglobulin kappa light chain variable region gene wherein it comprises two copies, wherein the mouse is characterized by active affinity maturation, such that: (i) each immunoglobulin kappa light chain of the population comprises a light chain variable domain that is encoded by a rearranged human germline kappa light chain variable region gene, or a somatically mutated variant thereof; (i) the population comprises antibodies comprising immunoglobulin kappa light chains whose light chain variable domain is encoded by a rearranged human germline kappa light chain variable region gene and antibodies comprising immunoglobulin kappa light chains whose light chain variable domain is encoded by somatically mutated variants thereof; and (iii) the mouse produces a diverse set of somatically mutated high-affinity heavy chains that successfully combine with immunoglobulin kappa light chains to form antibodies to the population. Optionally, the mouse is heterozygous or homozygous in its germline for: (a) insertion into an endogenous mouse κ light chain immunoglobulin variable region locus a rearranged Vk/Jk sequence comprising: (i) one human germline Vk sequence, wherein the human germline Vk sequence is shown in SEQ ID NO: 148 or SEQ ID NO: 149; and (ii) one human germline Jk sequence, wherein the rearranged Vk/Jk sequence is operably linked to an endogenous mouse κ constant region; and (b) insertions into an endogenous mouse immunoglobulin heavy chain variable region locus of a plurality of human immunoglobulin heavy chain variable region gene segments, wherein the human immunoglobulin heavy chain variable region gene segments are operably linked to an endogenous mouse immunoglobulin heavy chain constant region, and the human immunoglobulin heavy chain variable region gene segments are capable of rearranging and forming a rearranged human/mouse chimeric immunoglobulin heavy chain gene.

[00070] В некоторых таких способах мышь, содержит модификацию локуса тяжелой цепи иммуноглобулина, причем модификация уменьшает или устраняет эндогенную функцию ADAM6, причем мышь содержит последовательность эктопической нуклеиновой кислоты, кодирующую белок ADAM6 мыши, его ортолог, его гомолог, или его фрагмент, причем белок ADAM6, его ортолог, его гомолог или его фрагмент, функционируют у самца мыши, и при этом эктопическая последовательность нуклеиновой кислоты, кодирующая белок ADAM6 мыши, его ортолог, его гомолог или его фрагмент, присутствует в локусе вариабельного участка тяжелой цепи человека.[00070] In some such methods, the mouse comprises a modification of an immunoglobulin heavy chain locus, wherein the modification reduces or eliminates endogenous ADAM6 function, wherein the mouse comprises an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, wherein the ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, is functional in a male mouse, and wherein the ectopic nucleic acid sequence encoding the mouse ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, is present in a human heavy chain variable region locus.

[00071] В некоторых таких способах, животное отличное от человека представляет собой мышь, которая по меньшей мере частично является производным от линий BALB/c, и мышь содержит гуманизированный локус иммуноглобулина, причем представляющий интерес чужеродный антиген является всем или частью белка человека, который является ортологичным для аутоантигена, в котором последовательность, распознаваемая первой направляющей РНК содержит старт-кодон для гена, кодирующего аутоантиген, или находится в пределах около 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от старт-кодона, а последовательность, распознаваемая второй направляющей РНК содержит стоп-кодон для гена, кодирующего аутоантиген, или находится в пределах около 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, или 1000 нуклеотидов от стоп-кодона, и причем модификация содержит биаллельную делецию всего или части гена, кодирующего аутоантиген, посредством чего исключается экспрессия аутоантигена. В некоторых таких способах, животное отличное от человека представляет собой мышь, которая по меньшей мере частично является производным от линии BALB/c, и мышь содержит гуманизированный локус иммуноглобулина, причем представляющий интерес чужеродный антиген является всем или частью белка человека, который является ортологичным для аутоантигена, в котором последовательность, распознаваемая первой направляющей РНК, содержит стоп-кодон для гена, кодирующего аутоантиген и последовательность, распознаваемая второй направляющей РНК, содержит стоп-кодон для гена, кодирующего аутоантиген, или находится в пределах около 10, 20, 30,40, 50,100, 200, 300, 400, 500, или 1000 нуклеотидов от стоп-кодона, и причем модификация содержит биаллельное разрушение старт-кодона для гена, кодирующего аутоантиген, причем исключается экспрессия аутоантигена. Необязательно, мышь содержит: (а) эктопическую последовательность нуклеиновой кислоты, кодирующую белок ADAM6 мыши, его ортолог, его гомолог, или его фрагмент, причем белок ADAM6, его ортолог, его гомолог, или его фрагмент, является функциональным у самца мыши; (b) гибридный локус тяжелой цепи, содержащий вставку генных сегментов V, D и J тяжелой цепи иммуноглобулина человека, причем генные сегменты V, D и J тяжелой цепи иммуноглобулина человека, функционально связаны с геном тяжелой цепи иммуноглобулина мыши, причем ген тяжелой цепи иммуноглобулина мыши находится в эндогенном локусе иммуноглобулина мыши; и (с) гибридный локус легкой цепи, содержащий вставку генных сегментов V и J легкой цепи иммуноглобулина человека, причем генные сегменты V и J человека функционально связаны с последовательностью гена константного участка легкой цепи иммуноглобулина мыши; причем (b) перестраивается с образованием гибридной последовательности тяжелой цепи, содержащей вариабельный участок человека, функционально связанный с константным участком мыши, и (с) перестраивается с образованием гибридной последовательности легкой цепи, содержащей вариабельный участок человека, функционально связанный с константным участком мыши, и причем мышь неспособна образовывать антитело, которое содержит вариабельный участок человека и константный участок человека. Необязательно, мышь гетерозиготна или гомозиготна в своей зародышевой линии для: (а) эктопической последовательности нуклеиновой кислоты, кодирующей белок ADAM6 мыши, его ортолог, его гомолог, или его фрагмент, причем белок ADAM6, его ортолог, его гомолог, или его фрагмент, являются функционирующим у самца мыши; (b) вставки в эндогенный локус вариабельного участка легкой цепи иммуноглобулина мыши к перестроенной последовательности Vk/Jk, содержащей: (i) одну последовательность Vk зародышевой линии человека, при этом последовательность Vk зародышевой линии человека представлена в SEQ ID NO: 148 или SEQ ID NO: 149; и (ii) одну последовательность Jk зародышевой линии человека, причем перестроенная последовательность Vk/Jk функционально связана с эндогенным константным участком к мыши; и (с) вставки в эндогенный локус вариабельного участка тяжелой цепи иммуноглобулина мыши из множества генных сегментов вариабельного участка тяжелой цепи иммуноглобулина человека, причем генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека функционально связаны с константным участком эндогенной тяжелой цепи иммуноглобулина мыши, и генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека способны перестраивать и формировать перестроенный ген тяжелой цепи химерного иммуноглобулина человека/мыши.[00071] In some such methods, the non-human animal is a mouse that is at least partially derived from BALB/c strains, and the mouse comprises a humanized immunoglobulin locus, wherein the foreign antigen of interest is all or a portion of a human protein that is orthologous to a self-antigen, wherein the sequence recognized by the first guide RNA comprises a start codon for a gene encoding the self-antigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the start codon, and the sequence recognized by the second guide RNA comprises a stop codon for a gene encoding the self-antigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides from the stop codon, and wherein the modification comprises a biallelic deletion of all or part of the gene encoding the autoantigen, thereby excluding expression of the autoantigen. In some such methods, the non-human animal is a mouse that is at least partially derived from the BALB/c strain, and the mouse comprises a humanized immunoglobulin locus, wherein the foreign antigen of interest is all or a portion of a human protein that is orthologous to an autoantigen, wherein the sequence recognized by the first guide RNA comprises a stop codon for a gene encoding the autoantigen and the sequence recognized by the second guide RNA comprises a stop codon for a gene encoding the autoantigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of a stop codon, and wherein the modification comprises a biallelic disruption of a start codon for a gene encoding the autoantigen, wherein expression of the autoantigen is eliminated. Optionally, the mouse comprises: (a) an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, wherein the ADAM6 protein, ortholog thereof, homolog thereof, or a fragment thereof is functional in a male mouse; (b) a hybrid heavy chain locus comprising an insertion of human immunoglobulin heavy chain V, D, and J gene segments, wherein the human immunoglobulin heavy chain V, D, and J gene segments are operably linked to a mouse immunoglobulin heavy chain gene, wherein the mouse immunoglobulin heavy chain gene is located in an endogenous mouse immunoglobulin locus; and (c) a hybrid light chain locus comprising an insertion of human immunoglobulin light chain V and J gene segments, wherein the human V and J gene segments are operably linked to a mouse immunoglobulin light chain constant region gene sequence; wherein (b) is rearranged to form a hybrid heavy chain sequence comprising a human variable region operably linked to a mouse constant region, and (c) is rearranged to form a hybrid light chain sequence comprising a human variable region operably linked to a mouse constant region, and wherein the mouse is incapable of forming an antibody that comprises a human variable region and a human constant region. Optionally, the mouse is heterozygous or homozygous in its germline for: (a) an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, an ortholog thereof, a homolog thereof, or a fragment thereof, wherein the ADAM6 protein, the ortholog thereof, the homolog thereof, or a fragment thereof is functional in a male mouse; (b) an insertion into an endogenous mouse immunoglobulin light chain variable region locus of a rearranged Vk/Jk sequence comprising: (i) one human germline Vk sequence, wherein the human germline Vk sequence is shown in SEQ ID NO: 148 or SEQ ID NO: 149; and (ii) one human germline Jk sequence, wherein the rearranged Vk/Jk sequence is operably linked to an endogenous mouse κ constant region; and (c) inserting into an endogenous mouse immunoglobulin heavy chain variable region locus a plurality of human immunoglobulin heavy chain variable region gene segments, wherein the human immunoglobulin heavy chain variable region gene segments are operably linked to an endogenous mouse immunoglobulin heavy chain constant region, and the human immunoglobulin heavy chain variable region gene segments are capable of rearranging and forming a rearranged chimeric human/mouse immunoglobulin heavy chain gene.

[00072] В некоторых таких способах, плюрипотентная клетка отличного от человека животного представляет собой гибридную клетку или эмбрион отличного от человека млекопитающего на одноклеточной стадии представляет собой гибридный эмбрион на одноклеточной стадии, и при этом способ дополнительно включает: (а') сравнение последовательности пары соответствующих первой и второй хромосом в геномном локусе-мишени, и выбор участка-мишени в геномном локусе-мишени перед стадией приведения в контакт (а) на основе участка-мишени, имеющего более высокий процент идентичности последовательности между парой соответствующих первой и второй хромосом по отношению ко всей или части остальной части геномного локуса-мишени, причем участок-мишень содержит: последовательность, распознаваемую первой направляющей РНК, и по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6, т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о. или 10 т.п.о. фланкирующей последовательности на 5' стороне, 3' стороне, или каждой стороне последовательности, распознаваемой первой направляющей РНК, и/или последовательности, распознаваемой второй направляющей РНК, и по меньшей мере 10 п. о., 20 п. о., 30 п. о., 40 п. о., 50 п. о., 100 п. о., 200 п. о., 300 п. о., 400 п. о., 500 п. о., 600 п. о., 700 п. о., 800 п. о., 900 п. о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6, т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о. или 10 т.п.о. фланкирующей последовательности на 5' стороне, 3' стороне или каждой стороне последовательности, распознаваемой второй направляющей РНК. Необязательно, участок-мишень имеет более высокий процент идентичности последовательности между соответствующей первой и второй относительно остальной части геномного локуса-мишени. Необязательно, участок-мишень имеет по меньшей мере 99,9% идентичности последовательностей между парой соответствующих первой и второй хромосом, а остальная часть первого геномного локуса-мишени имеет не более чем 99,8% идентичности последовательности между парой соответствующих первой и второй хромосом.[00072] In some such methods, the non-human animal pluripotent cell is a hybrid cell or the non-human mammal embryo at the one-cell stage is a hybrid embryo at the one-cell stage, and wherein the method further comprises: (a') comparing the sequence of a pair of corresponding first and second chromosomes at the target genomic locus, and selecting a target region at the target genomic locus prior to the step of contacting (a) based on the target region having a higher percentage of sequence identity between the pair of corresponding first and second chromosomes relative to all or a portion of the remainder of the target genomic locus, wherein the target region comprises: a sequence recognized by the first guide RNA, and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 p.p., 400 p.p., 500 p.p., 600 p.p., 700 p.p., 800 p.p., 900 p.p., 1 k.p., 2 k.p., 3 k.p., 4 k.p., 5 k.p., 6 k.p., 7 k.p., 8 k.p., 9 k.p. or 10 k.p. flanking sequence on the 5' side, the 3' side, or each side of the sequence recognized by the first guide RNA and/or the sequence recognized by the second guide RNA, and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, or 10 kb of flanking sequence on the 5' side, the 3' side, or each side of the sequence recognized by the second guide RNA. Optionally, the target region has a higher percentage of sequence identity between the corresponding first and second relative to the remainder of the target genomic locus. Optionally, the target region has at least 99.9% sequence identity between a pair of corresponding first and second chromosomes, and the remainder of the first genomic target locus has no more than 99.8% sequence identity between a pair of corresponding first and second chromosomes.

[00073] В другом аспекте, представлены способы получения генетически модифицированного отличного от человека животного с уменьшенной толерантностью представляющего интерес чужеродного антигена, включающие: (а) введение в эмбрион отличного от человека животного на одноклеточной стадии или плюрипотентную клетку отличного от человека животного, которая не является эмбрионом на одноклеточной стадии: (i) белка Cas9; (ii) первой направляющей РНК, которая гибридизуется с последовательностью, распознаваемой первой направляющей РНК в геномном локусе-мишени, причем геномный локус-мишень содержит весь или часть гена, кодирующего аутоантиген, гомологичный или обладающим общим представляющим интерес эпитопом с чужеродным представляющим интерес антигеном; и (iii) второй направляющей РНК, которая гибридизуется с последовательностью, распознаваемой второй направляющей РНК в геномном локусе-мишени; причем геномный локус-мишень модифицируется в паре соответствующих первой и второй хромосом для получения модифицированного эмбриона отличного от человека животного на одноклеточной стадии, или модифицированной плюрипотентной клетки отличного от человека животного с биаллельной модификацией, причем экспрессия аутоантигена устраняется; и (b) получение генетически модифицированного F0-поколения отличного от человека животного из модифицированного эмбриона на одноклеточной стадии отличного от человека или модифицированной плюрипотентной клетки отличного от человека животного, причем геномный локус-мишень модифицирован в паре соответствующих первых и вторых хромосом в генетически модифицированном F0-поколении отличного от человека животного, так что исключается экспрессия аутоантигена.[00073] In another aspect, methods are provided for producing a genetically modified non-human animal with reduced tolerance to a foreign antigen of interest, comprising: (a) introducing into a one-cell stage embryo of a non-human animal or a pluripotent cell of a non-human animal that is not a one-cell stage embryo: (i) a Cas9 protein; (ii) a first guide RNA that hybridizes to a sequence recognized by the first guide RNA at a target genomic locus, wherein the target genomic locus comprises all or a portion of a gene encoding a self-antigen that is homologous to or shares an epitope of interest with a foreign antigen of interest; and (iii) a second guide RNA that hybridizes to a sequence recognized by the second guide RNA at the target genomic locus; wherein the target genomic locus is modified in a pair of corresponding first and second chromosomes to produce a modified single-cell stage embryo of a non-human animal or a modified pluripotent cell of a non-human animal with a biallelic modification, wherein expression of the self-antigen is eliminated; and (b) producing a genetically modified F0 generation of a non-human animal from the modified single-cell stage embryo of a non-human animal or a modified pluripotent cell of a non-human animal, wherein the target genomic locus is modified in a pair of corresponding first and second chromosomes in the genetically modified F0 generation of a non-human animal such that expression of the self-antigen is eliminated.

[00074] Такие способы могут включать, например, любой из вариантов, описанных выше для способов получения антигенсвязывающих белков против представляющего интерес чужеродного антигена. Например, в некоторых способах, клетка на стадии (а) представляет собой плюрипотентную стволовую клетку отличного от человека животного, и продуцирование генетически модифицированного F0-поколения отличного от человека животного настадии (b) включает: (I) введение модифицированной плюрипотентной клетки отличного от человека животного в эмбрион-хозяин; и (II) имплантацию эмбриона-хозяина суррогатной матери для получения генетически модифицированного F0-поколения отличного от человека животного в котором геномный локус-мишень модифицирован в паре соответствующих первой и второй хромосом, так что экспрессия аутоантигена устранена. Необязательно, плюрипотентная клетка представляет собой эмбриональную стволовую (ЭС) клетку. В некоторых таких способах, клетка на стадии (а) представляет собой эмбрион отличного от человека животного на одноклеточной стадии, и продуцирование генетически модифицированного F0-поколения отличного от человека животного на стадии (b) включает имплантацию модифицированного эмбриона отличного от человека животного на одноклеточной стадии суррогатной матери для получения генетически модифицированного F0-поколения отличного от человека животного, у которого геномный локус-мишень модифицирован в паре соответствующих первой и второй хромосом, так что экспрессия аутоантигена устранена. В некоторых таких способах, интересующий чужеродный антиген представляет собой ортолог аутоантигена. В некоторых таких способах, последовательность, распознаваемая первой направляющей РНК содержит старт-кодон для гена, кодирующего аутоантиген, или находится в пределах около 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от старт-кодона, а последовательность, распознаваемая второй направляющей РНК содержит стоп-кодон для гена, кодирующего аутоантиген, или находится в пределах около 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, или 1000 нуклеотидов от стоп-кодона. В некоторых таких способах, последовательности, распознаваемые первой и второй направляющими РНК, различны, и каждая из последовательностей, распознаваемых первой и второй направляющими РНК, содержит старт-кодон для гена, кодирующего аутоантиген, или находится в пределах около 10,20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от старт-кодона. В некоторых таких способах, последовательность, распознаваемая первой направляющей РНК, расположена в 5' положении относительно последовательности, распознаваемой второй направляющей РНК в геномном локусе-мишени, и стадия (a) (i) дополнительно включает в себя выполнение анализа удерживания для определения числа копии для двух участков 5' и в пределах около 1 т.п.о. последовательности, распознаваемой первой направляющей РНК, и/или для участка 3' и в пределах около 1 т.п.о. последовательности, распознаваемой второй направляющей РНК. В некоторых таких способах, модификация содержит биаллельную делецию всего или части гена, кодирующего аутоантиген. В некоторых таких способах, модификация содержит биаллельное разрушение старт-кодона гена, кодирующего аутоантиген. В некоторых таких способах, отличное от человека животное представляет собой мышь.[00074] Such methods may include, for example, any of the variations described above for methods of producing antigen-binding proteins against a foreign antigen of interest. For example, in some methods, the cell in step (a) is a pluripotent stem cell of a non-human animal, and producing a genetically modified F0 generation of the non-human animal in step (b) comprises: (I) introducing the modified pluripotent cell of the non-human animal into a host embryo; and (II) implanting the host embryo into a surrogate mother to produce a genetically modified F0 generation of the non-human animal in which the target genomic locus is modified in a pair of corresponding first and second chromosomes such that expression of the self-antigen is eliminated. Optionally, the pluripotent cell is an embryonic stem (ES) cell. In some such methods, the cell in step (a) is a one-cell stage embryo of a non-human animal, and producing the genetically modified F0 generation of the non-human animal in step (b) comprises implanting the modified one-cell stage embryo of the non-human animal into a surrogate mother to produce a genetically modified F0 generation of the non-human animal in which the target genomic locus is modified in the pair of corresponding first and second chromosomes such that expression of the self-antigen is abolished. In some such methods, the foreign antigen of interest is an ortholog of the self-antigen. In some such methods, the sequence recognized by the first guide RNA comprises a start codon for a gene encoding an autoantigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the start codon, and the sequence recognized by the second guide RNA comprises a stop codon for a gene encoding an autoantigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the stop codon. In some such methods, the sequences recognized by the first and second guide RNAs are different, and each of the sequences recognized by the first and second guide RNAs comprises a start codon for a gene encoding an autoantigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of a start codon. In some such methods, the sequence recognized by the first guide RNA is located at a 5' position relative to the sequence recognized by the second guide RNA in a target genomic locus, and step (a)(i) further comprises performing a retention assay to determine the copy number for two regions 5' and within about 1 kb of the sequence recognized by the first guide RNA and/or for a region 3' and within about 1 kb of the sequence recognized by the first guide RNA. sequence recognized by the second guide RNA. In some such methods, the modification comprises a biallelic deletion of all or part of a gene encoding an autoantigen. In some such methods, the modification comprises a biallelic disruption of a start codon of a gene encoding an autoantigen. In some such methods, the non-human animal is a mouse.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВBRIEF DESCRIPTION OF GRAPHIC MATERIALS

[00075] На фигуре 1 изображен традиционный подход к нарушению иммунологической толерантности у мышей VELOCIMMUNE® (VI-3, гомозиготный гуманизированный как у IgH, так и Igx). В традиционном подходе гетерозиготные нокаутные (нулевые) аллели гена, кодирующего аутоантиген, гомологичный чужеродному антигену-мишени, создаются в эмбриональных стволовых клетках (ЭС) F1H4. Время от проектирования векторов нацеливания до получения F0 мышей, гетерозиготных для нокаута, составляет приблизительно 5 месяцев. Мыши VI-3 затем размножаются до F0 мышей, несущих гетерозиготную нокаутную мутацию у эндогенного гена, кодирующего аутоантиген, гомологичный интересующему чужеродному антигену-мишени. Чтобы получать трижды гомозиготных мышей (гомозиготных нулевых по интересующей мишени и гомозиготных гуманизированных как IgH, так и Igк), подходящих для иммунизации, требуются два последующих поколения разведения. Весь процесс от проектирования векторов нацеливания до получения тройных гомозиготных мышей занимает приблизительно 15-16 месяцев.[00075] Figure 1 depicts a conventional approach to breaking immunological tolerance in VELOCIMMUNE® mice (VI-3, homozygous humanized for both IgH and Igx). In the conventional approach, heterozygous knockout (null) alleles of a gene encoding an autoantigen homologous to a foreign target antigen are generated in F1H4 embryonic stem (ES) cells. The time from design of the targeting vectors to production of F0 mice heterozygous for the knockout is approximately 5 months. The VI-3 mice are then expanded to F0 mice carrying a heterozygous knockout mutation in the endogenous gene encoding an autoantigen homologous to the foreign target antigen of interest. To obtain triply homozygous mice (homozygous null for the target of interest and homozygous humanized for both IgH and Igκ) suitable for immunization, two subsequent generations of breeding are required. The entire process from designing targeting vectors to obtaining triply homozygous mice takes approximately 15-16 months.

[00076] На фигуре 2 изображен ускоренный процесс нарушения иммунологической толерантности у мышей VELOCIMMUNE® (VI-3) или у мышей «универсальная легкая цепь» (ULC или общая легкая цепь). В этом процессе, ЭС-клетки, полученные от мышей VI-3 или ULC, нацелены на создание гетерозиготных нулевых аллелей эндогенного гена, кодирующего аутоантиген, гомологичный представляющему интерес чужеродному антигену-мишени. Для получения гомозиготных нулевых клонов ЭС-клеток VI-3 или ULC требуются последовательные стадии нацеливания.[00076] Figure 2 depicts the accelerated process of breaking immunological tolerance in VELOCIMMUNE® (VI-3) mice or universal light chain (ULC) mice. In this process, ES cells derived from VI-3 or ULC mice are targeted to generate heterozygous null alleles of an endogenous gene encoding a self-antigen homologous to a foreign target antigen of interest. Sequential targeting steps are required to generate homozygous null clones of VI-3 or ULC ES cells.

[00077] На фигуре 3 изображен дополнительный ускоренный процесс нарушения толерантности у мышей VELOCIMMUNE® (VI-3) или у мышей «универсальная легкая цепь» (ULC или общая легкая цепь). В этом процессе, ЭС-клетки VI-3 или ULC нацелены на CRISPR/Cas9 и парные направляющие РНК для получения гомозиготного разрушения эндогенного гена, кодирующего аутоантиген, гомологичный чужеродному антигену-мишени, представляющему интерес в течение одной стадии. TAQMAN® скрининг может включать, например, как анализ на потерю аллеля, так и анализ удерживания.[00077] Figure 3 depicts an additional accelerated tolerance breaking process in VELOCIMMUNE® (VI-3) mice or universal light chain (ULC) mice. In this process, VI-3 or ULC ES cells are targeted with CRISPR/Cas9 and paired guide RNAs to produce homozygous disruption of an endogenous gene encoding a self-antigen homologous to a foreign target antigen of interest in a single step. TAQMAN® screening may include, for example, both an allele loss assay and a retention assay.

[00078] На фигуре 4 изображена общая схема одновременной делеций гена мыши, кодирующего аутоантиген, гомологичный чужеродному антигену-мишени, и его замещение маркером для селекции с помощью неомицина с использованием большого нацеливающего вектора (LTVEC) и спаренных вверх и вниз по ходу транскрипции направляющих РНК (gU и gD). Позиции сайтов расщепления Cas9, управляемые двумя направляющими РНК, обозначены стрелками ниже последовательности гена мыши. Зонды анализа TAQMAN® обозначены горизонтальными линиями, включая зонды для анализа удерживания и зонды для анализа на потерю аллеля (LOA) вверх по ходу, по середине и вниз по ходу транскрипции. Нижняя часть фигуры указывает на ожидаемые целевые типы аллелей.[00078] Figure 4 depicts the general scheme of simultaneous deletion of a mouse gene encoding a self-antigen homologous to a foreign target antigen and its replacement with a neomycin-selectable marker using a large targeting vector (LTVEC) and paired upstream and downstream guide RNAs (gU and gD). The positions of the Cas9 cleavage sites driven by the two guide RNAs are indicated by arrows below the mouse gene sequence. TAQMAN® assay probes are indicated by horizontal lines, including retention assay probes and loss of allele (LOA) assay probes upstream, midstream, and downstream. The bottom of the figure indicates the expected target allele types.

[00079] На фигуре 5 изображена общая схема одновременной делеций мышиного гена, кодирующего аутоантиген, гомологичный чужеродному антигену-мишени, и его замещение маркером для селекции с помощью флоксированного неомицина и lacZ с использованием большого нацеливающего вектора (LTVEC) и трех перекрывающихся направляющих РНК каждая из которых нацеливается на старт-кодон ATG мыши. Направляющие РНК обозначены горизонтальными стрелками, а зонды анализа TAQMAN® обозначены обведенными горизонтальными линиями. Нижняя часть фигуры указывает на ожидаемые целевые типы аллелей.[00079] Figure 5 depicts the general scheme of simultaneous deletion of a mouse gene encoding a self-antigen homologous to a foreign target antigen and its replacement with a selectable marker using floxed neomycin and lacZ using a large targeting vector (LTVEC) and three overlapping guide RNAs, each targeting the mouse ATG start codon. The guide RNAs are indicated by horizontal arrows and the TAQMAN® assay probes are indicated by outlined horizontal lines. The lower portion of the figure indicates the expected target allele types.

[00080] На фигуре 6 изображены данные титра антител для антигена-ллишени человека (мишень 8) у мышей «универсальная легкая цепь» (ULC 1-39) дикого типа и у мышей ULC 1-39, которые являются гомозиготными нулевыми по эндогенному гену, кодирующему ортологический аутоантиген к мишени 8 (аутоантиген 8).[00080] Figure 6 depicts antibody titer data for a human target antigen (target 8) in wild-type universal light chain (ULC 1-39) mice and in ULC 1-39 mice that are homozygous null for the endogenous gene encoding the orthologous autoantigen to target 8 (autoantigen 8).

[00081] На фигуре 7 изображено скрещивание, предпринятое для получения гибридных VGF1 (F1H4) ЭС-клеток (C57BL6 (XB6)/129S6(Y129)).[00081] Figure 7 shows the crossing undertaken to generate hybrid VGF1(F1H4) ES cells (C57BL6(XB6)/129S6(Y129)).

[00082] На фигуре 8 изображена схема одновременной делеции мышиного гена или части гена мыши и замены соответствующей человеческой версии с использованием LTVEC и одного или двух 5'-участков, среднего участка и 3'-участка гРНК. LTVEC изображен в верхней части фигуры, а локус гена мыши изображен в нижней части фигуры. Позиции сайтов расщепления Cas9, управляемые восемью направляющими РНК, обозначены вертикальными стрелками ниже последовательности гена мыши.[00082] Figure 8 depicts a schematic of the simultaneous deletion of a mouse gene or part of a mouse gene and replacement of the corresponding human version using LTVEC and one or two 5' regions, a middle region, and a 3' region of a gRNA. The LTVEC is depicted in the upper portion of the figure, and the mouse gene locus is depicted in the lower portion of the figure. The positions of the Cas9 cleavage sites driven by the eight guide RNAs are indicated by vertical arrows below the mouse gene sequence.

[00083] На фигуре 9А изображена общая схема одновременной делеции мышиного гена и замены соответствующей человеческой версии с использованием LTVEC и двух направляющих РНК (направляющие РНК А и В). LTVEC изображен в верхней части фигуры 9А, а локус гена мыши изображен в нижней части фигуры 9А. Позиции сайтов расщепления Cas9, управляемые двумя направляющими РНК, обозначены стрелками ниже последовательности гена мыши.[00083] Figure 9A depicts a general scheme for the simultaneous deletion of a mouse gene and replacement of the corresponding human version using LTVEC and two guide RNAs (guide RNAs A and B). The LTVEC is depicted in the upper portion of Figure 9A, and the mouse gene locus is depicted in the lower portion of Figure 9A. The positions of the Cas9 cleavage sites driven by the two guide RNAs are indicated by arrows below the mouse gene sequence.

[00084] На фигурах 9 В-9Е изображены уникальные биаллельные модификации (типы аллелей), которые происходят с большей частотой, когда используются две направляющие РНК. Толстые линии с диагональным штрихованием указывают на ген мыши, пунктирные линии указывают на делеции в гене мыши, а толстые черные линии указывают на вставку гена человека. На фигуре 9 В изображены гомозиготные разрушенные аллели (большая CRISPR-индуцированная делеция). На фигуре 9С изображены гомозиготные аллели-мишени. На фигуре 9D изображены гемизиготные аллели-мишени. На фигуре 9Е изображены сложные гетерозиготные аллели.[00084] Figures 9B-9E depict unique biallelic modifications (allele types) that occur at higher frequencies when two guide RNAs are used. The thick diagonally hatched lines indicate the mouse gene, the dashed lines indicate deletions in the mouse gene, and the thick black lines indicate the human gene insertion. Figure 9B depicts homozygous disrupted alleles (large CRISPR-induced deletion). Figure 9C depicts homozygous target alleles. Figure 9D depicts hemizygous target alleles. Figure 9E depicts compound heterozygous alleles.

[00085] На фигуре 10А и 10В изображены ПЦР-анализы, подтверждающие генотипы выбранных клонов. На фигуре 10А изображены результаты анализов ПЦР длинных фрагментов для выбранных клонов ЭС-клеток с использованием праймеров m-Ir-f и m-5'-r, которые устанавливают связь между человеческой вставкой и последовательностями вне тех, которые гомологичны 5'-плечу гомологии, тем самым подтверждая правильность нацеливания. На фигуре 10 В изображены результаты ПЦР анализа 5' Del J, 5' Ins J, Del A+F и Del A+E2. 5' Del J изображает продукты ПЦР с использованием праймеров m-5'-f и m-5-r, который амплифицирует последовательность дикого типа, окружающую сайт расщепления гРНК А, для установления удержания или потери этой последовательности. 5' Ins J изображает продукты ПЦР с использованием праймеров m-5'-f и h-5'-r, которые устанавливают связь между человеческой вставкой и геномом мыши. Анализ даст положительный результат как для целевых, так и для случайных интегрированных клонов. Del А+F изображает ожидаемый размер ампликона (359 п. о.) и фактические полосы для большой делеции, опосредуемые двойным расщеплением гРНК А и F в клонах BO-F10h AW-А8. Del А+Е2 изображает ту же идею для клона ВА-А7. NT указывает на отсутствие шаблона, +/+ указывает на родительский VGF1 гибрид ЭС-клетки контроля дикого типа, Н/+указывает на гетерозиготный гуманизированный генотип, Н/Δ указывает на гемизиготный гуманизированный генотип, Н/Н указывает на гомозиготный гуманизированный генотип, и Δ/Δ указывает на гомозиготный удаленный генотип.[00085] Figures 10A and 10B depict PCR assays confirming the genotypes of the selected clones. Figure 10A depicts the results of long fragment PCR assays for the selected ES cell clones using primers m-Ir-f and m-5'-r, which establish a linkage between the human insert and sequences outside of those homologous to the 5' homology arm, thereby confirming the correct targeting. Figure 10B depicts the results of PCR assays for 5' Del J, 5' Ins J, Del A+F, and Del A+E2. 5' Del J depicts PCR products using primers m-5'-f and m-5-r, which amplifies the wild-type sequence surrounding the gRNA A cleavage site to determine the retention or loss of this sequence. 5' Ins J depicts PCR products using primers m-5'-f and h-5'-r that establish a link between the human insert and the mouse genome. The assay will give a positive result for both targeted and random integrated clones. Del A+F depicts the expected amplicon size (359 bp) and actual bands for the large deletion mediated by double cleavage of gRNAs A and F in clones BO-F10h AW-A8. Del A+E2 depicts the same idea for clone BA-A7. NT indicates no template, +/+ indicates parental VGF1 wild-type control ES cell-ES cell hybrid, H/+ indicates heterozygous humanized genotype, H/Δ indicates hemizygous humanized genotype, H/H indicates homozygous humanized genotype, and Δ/Δ indicates homozygous deleted genotype.

[00086] На фигуре 11А-11С изображен анализ флуоресценции in situ гибридизации (FISH) клонов ЭС-клетки AW-D9 мыши (фигура НА) и BA-D5 (фигура НС), которые были нацелены на Lrp5 гуманизацию LTVEC в сочетании с Cas9 и двумя гРНК, и клона BS-C4 (фигура 11 В), который был нацелен только на LTVEC. Стрелки указывают положение сигналов гибридизации на полосе Вхромосомы 19. Красный сигнал указывает на гибридизациютолькосзондоммыши (пунктирная стрелка, фигура 11 В). Желтый смешанный цветовой сигнал указывает на гибридизацию как с красным зондом мыши, так и с зеленым человеческим зондом. Одна полоса В хромосомы 19, имеющая красный сигнал (пунктирная стрелка) и другая полоса Б хромосомы 19, имеющая желтый сигнал (сплошная стрелка), подтвердила нацеленность на правильный локус и гетерозиготный генотип для клона BS-C4 (фигура 11 В). Полосы В обеих хромосом 19, имеющие желтый сигнал (сплошные стрелки, фигуры НА и НС), подтвердили нацеленность на правильный локус и гомозиготные генотипы для AW-D9 и В5-С4-клонов.[00086] Figures 11A-11C depict fluorescence in situ hybridization (FISH) analysis of mouse ES cell clones AW-D9 (Figure HA) and BA-D5 (Figure HC), which targeted Lrp5 humanization of LTVEC in combination with Cas9 and two gRNAs, and clone BS-C4 (Figure 11B), which targeted LTVEC only. Arrows indicate the position of hybridization signals on chromosome 19 band B. The red signal indicates hybridization with the mouse probe only (dashed arrow, Figure 11B). The yellow mixed color signal indicates hybridization with both the red mouse probe and the green human probe. One band of chromosome 19 B with a red signal (dashed arrow) and another band of chromosome 19 B with a yellow signal (solid arrow) confirmed targeting the correct locus and the heterozygous genotype for clone BS-C4 (Figure 11B). Bands of both chromosome 19 B with a yellow signal (solid arrows, figures HA and HC) confirmed targeting the correct locus and the homozygous genotypes for clones AW-D9 and B5-C4.

[00087] На фигуре 12 изображена схема хромосомы 19 с анализами, предназначенными для изучения событий генной конверсии или митотической рекомбинации, опосредованных двумя направляющими РНК, путем анализа потери гетерозиготности (LOH) в гибридных ЭС-клетках VGF1. Примерные положения числа хромосомных копий зондов количественной ПЦР (CCN) TAQMAN® изображены стрелками. Примерные положения ПЦР-зондов с полиморфизмом структурного варианта (SV) изображены двойной скобкой с их расстояниями (в Мб) от локуса Lrp5, приведенного выше. Примерные положения аллельных дискриминационных зондов TAQMAN® с одиночным нуклеотидным вариантом (SNV) изображены стрелками с их расстояниями (в Мб) от локуса Lrp5, приведенного ниже. Положения последовательностей узнавания гРНК для F, Е2, D, В2 и А изображены диагональными стрелками над изображением гена Lrp5.[00087] Figure 12 depicts a diagram of chromosome 19 with assays designed to study dual guide RNA-mediated gene conversion or mitotic recombination events by loss of heterozygosity (LOH) analysis in VGF1 hybrid ES cells. Exemplary positions of the chromosomal copy number (CCN) TAQMAN® quantitative PCR probes are depicted by arrows. Exemplary positions of the structural variant (SV) polymorphism PCR probes are depicted by double brackets with their distances (in Mb) from the Lrp5 locus shown above. Exemplary positions of the single nucleotide variant (SNV) allelic discriminatory TAQMAN® probes are depicted by arrows with their distances (in Mb) from the Lrp5 locus shown below. The positions of the gRNA recognition sequences for F, E2, D, B2, and A are shown as diagonal arrows above the Lrp5 gene image.

[00088] На фигуре 13А и 13 В изображен анализ флуоресценции in situ гибридизации (FISH) клонов ЭС-клеток мыши Q-E9 (фигура 13А) и О-Е3 (фигура 13 В), которые были нацелены на Нс гуманизацию LTVEC в сочетании с Cas9 и двумя гРНК. Стрелки указывают положение сигналов гибридизации на полосе В хромосомы 2. Красный сигнал указывает на гибридизацию только с зондом мыши (пунктирная стрелка, фигура 13А). Желтый смешанный цветовой сигнал указывает на гибридизацию как с красным зондом мыши, так и с зеленым человеческим зондом (сплошная стрелка). Одна полоса В хромосомы 2, имеющая красный сигнал (пунктирная стрелка) и другая полоса В хромосомы 2, имеющая желтый сигнал (сплошная стрелка), подтвердила нацеленность на правильный локус и гетерозиготный генотип для клона Q-E9 (фигура 13А). Полосы В обеих хромосом 2, имеющие желтый сигнал (сплошные стрелки, фигура 13 В), подтвердили нацеленность на правильный локус и гомозиготные генотипы для О-Е3 клона.[00088] Figures 13A and 13B depict fluorescence in situ hybridization (FISH) analysis of mouse ES cell clones Q-E9 (Figure 13A) and O-E3 (Figure 13B) that were targeted to HC humanization of LTVEC in combination with Cas9 and two gRNAs. Arrows indicate the position of the hybridization signals on chromosome 2 band B. The red signal indicates hybridization to the mouse probe only (dashed arrow, Figure 13A). The yellow mixed color signal indicates hybridization to both the mouse red probe and the human green probe (solid arrow). One chromosome 2 band B having a red signal (dashed arrow) and another chromosome 2 band B having a yellow signal (solid arrow) confirmed targeting of the correct locus and the heterozygous genotype for clone Q-E9 (Figure 13A). Bands B of both chromosomes 2, showing a yellow signal (solid arrows, Figure 13B), confirmed targeting of the correct locus and homozygous genotypes for the O-E3 clone.

[00089] На фигуре 14 изображена схема хромосомы, содержащей ген С5 мыши, с анализами, предназначенными для изучения событий генной конверсии или митотической рекомбинации, опосредованных двумя направляющими РНК, путем анализа потери гетерозиготности (LOH) в гибридных ЭС-клетках VGF1. Примерные положения ПЦР-зондов с полиморфизмом структурного варианта (SV) изображены горизонтальными стрелками с их расстояниями (в Мб) от локуса СБ, приведенного выше. Положения последовательностей узнавания гРНК для Е2 и А изображены диагональными стрелками над изображением гена С5.[00089] Figure 14 is a schematic of the chromosome containing the mouse C5 gene with assays designed to study gene conversion or mitotic recombination events mediated by two guide RNAs by loss of heterozygosity (LOH) analysis in VGF1 hybrid ES cells. Exemplary positions of the structural variant (SV) polymorphism PCR probes are depicted by horizontal arrows with their distances (in Mb) from the CB locus shown above. The positions of the gRNA recognition sequences for E2 and A are depicted by diagonal arrows above the image of the C5 gene.

[00090] На фигурах 15А-15Е изображены результаты анализа структурных вариаций (SV) клонов BR-В4, BP-G7, BO-G11, BO-F10, В0-А8 и ВС-Н9 с VGF1 (F1H4), 129 и ДНК В6 используется в качестве контроля. Анализы проводили на следующих расстояниях теломера до локуса Lrp5:13,7 Мб (фигура 15А), 20,0 Мб (фигура 15 В), 36,9 Мб (фигура 15С), 48,3 Мб (фигура 15D) и 56,7 Мб (фигура 15Е). Положения продуктов ПЦР для аллелей В6 и 129 изображены стрелками.[00090] Figures 15A-15E depict the results of structural variation (SV) analysis of clones BR-B4, BP-G7, BO-G11, BO-F10, B0-A8, and BC-H9 with VGF1 (F1H4), 129, and B6 DNA used as a control. Analyses were performed at the following telomere distances to the Lrp5 locus: 13.7 Mb (Figure 15A), 20.0 Mb (Figure 15B), 36.9 Mb (Figure 15C), 48.3 Mb (Figure 15D), and 56.7 Mb (Figure 15E). The positions of the PCR products for the B6 and 129 alleles are shown by arrows.

[00091] На фигурах 16А-16С изображены графики аллельной дискриминации для 0,32 Мб центромера Lrp5 (фигура 16А), 1,2 Мб теломера Lrp5 (фигура 16 В) и 57,2 Мб теломера Lrp5 (фигура 16С). Значения на каждой оси представляют собой относительную интенсивность флуоресценции. На графиках изображены четыре репликации для каждого образца, которые изображены как закрашенные точки (аллель В6), открытые точки (129 аллелей) и точки с диагональными линиями (оба аллеля В6/129).[00091] Figures 16A-16C depict allele discrimination plots for the 0.32 Mb Lrp5 centromere (Figure 16A), the 1.2 Mb Lrp5 telomere (Figure 16B), and the 57.2 Mb Lrp5 telomere (Figure 16C). The values on each axis represent the relative fluorescence intensity. The plots depict four replicates for each sample, which are depicted as filled dots (B6 allele), open dots (129 alleles), and dots with diagonal lines (both B6/129 alleles).

[00092] На фигурах 17А-17С схематично изображен возможный механизм митотической рекомбинации во время фазы G2 клеточного цикла, который может продуцировать гомозиготные события и широко распространенную генную конверсию, обнаруженную потерей гетерозиготности. На фигуре 17А изображены реплицированные гомологичные хромосомы, показывающие две хроматиды в гибридной 129/В6 ЭС-клетке, гетерозиготной для целевой гуманизации на 129 гомологе. Двусторонние стрелки указывают на потенциальные разрывы двойной цепи, генерируемые двойным гРНК-направленным расщеплением Cas9, которые способствуют взаимному обмену путем гомологичной рекомбинации между хроматидами на гомологичных хромосомах, показанных как перекрестное на центромерной стороне целевого аллеля, получающиеся в результате чего гибридные хроматиды изображены на фигуре 17В. На фигуре 17С изображено, что после митоза и деления клеток возможны четыре типа сегрегации хромосом в дочерние клетки. Два с удерживанием гетерозиготности, гетерозиготы родительского типа (Hum/+, верхний левый) и гетерозиготы равного обмена (Hum/+, верхний правый) не могут быть различимы с помощью анализа LOH. Два других показывают потерю гетерозиготности, гуманизированной гомозиготы (Hum/Hum, например, клона ВО-А8, нижний левый) с потерей теломерных Вб-аллелей и гомозиготы дикого типа (+/+, нижний правый) с потерей теломерных 129 аллелей. Этот последний тип будет потерян, потому что он не сохранит кассету резистентности к лекарственным средствам гуманизированной аллели.[00092] Figures 17A-17C schematically depict a possible mechanism of mitotic recombination during the G2 phase of the cell cycle that can produce homozygous events and widespread gene conversion indicated by loss of heterozygosity. Figure 17A depicts replicated homologous chromosomes showing two chromatids in a hybrid 129/B6 ES cell heterozygous for targeted humanization on the 129 homolog. Double-ended arrows point to potential double-strand breaks generated by dual gRNA-directed Cas9 cleavage that facilitate cross-exchange by homologous recombination between chromatids on the homologous chromosomes, shown as a crossover on the centromeric side of the targeted allele, resulting in the hybrid chromatids depicted in Figure 17B. Figure 17C shows that after mitosis and cell division, four patterns of chromosome segregation into daughter cells are possible. Two with retention of heterozygosity, the parental-type heterozygote (Hum/+, upper left) and the equal-exchange heterozygote (Hum/+, upper right) cannot be distinguished by LOH analysis. The other two show loss of heterozygosity, the humanized homozygote (Hum/Hum, e.g., clone BO-A8, lower left) with loss of the telomeric B6 alleles and the wild-type homozygote (+/+, lower right) with loss of the telomeric 129 alleles. This latter pattern will be lost because it will not retain the drug resistance cassette of the humanized allele.

[00093] На фигурах 18A-18F изображены возможные механизмы, объясняющие наблюдаемые результаты, включая потерю гетерозиготности (LOH), в экспериментах по гуманизации с помощью CRISPR/Cas9 в гибридных ЭС-клетках мышей F1 с одним гаплоидным хромосомным комплементом, полученным из линии мыши 129S6/SvEvTac и одного гаплоидного хромосомного комплемента, полученного из линии мыши C57BL/6NTac (В6). На фигуре 18А изображен реципрокный хроматидный обмен с помощью митотического кроссовера, где гетерозиготная модификация происходит на хромосоме 129 до репликации генома или после репликации генома с последующей конверсией генов между сестринскими хроматидами. На фигуре 18 В изображен реципрокный хроматидный обмен с помощью митотического кроссовера, где после репликации генома модифицируется одна хроматида 129. На фигуре 18С изображен реципрокный хроматидный обмен с помощью митотического кроссовера, где не было нацеливания LTVEC, но расщепление Cas9 происходило либо на хромосоме 129, либо на хромосоме В6 (изображено расщепление В6). На фигуре 18D изображено хроматидное копирование путем вызванной разрывом репликацией, где гетерозиготная модификация происходит на хромосоме 129 до репликации генома или после репликации генома с последующей конверсией генов между сестринскими хроматидами. На фигуре 18Е изображено хроматидное копирование путем вызванной разрывом репликацией, где после репликации генома модифицируется одна хроматида 129. На фигуре 18F изображено хроматидное копирование путем вызванной разрывом репликацией, где не было нацеливания LTVEC, но расщепление Cas9 происходило либо на хромосоме 129, либо на хромосоме В6 (изображено расщепление В6).[00093] Figures 18A-18F depict possible mechanisms to explain the observed results, including loss of heterozygosity (LOH), in CRISPR/Cas9 humanization experiments in F1 mouse ES cells with one haploid chromosomal complement derived from the 129S6/SvEvTac mouse strain and one haploid chromosomal complement derived from the C57BL/6NTac (B6) mouse strain. Figure 18A depicts reciprocal chromatid exchange via mitotic crossover, where a heterozygous modification occurs on chromosome 129 before genome replication or after genome replication followed by gene conversion between sister chromatids. Figure 18B depicts reciprocal chromatid exchange by mitotic crossover where one chromatid, 129, is modified after genome replication. Figure 18C depicts reciprocal chromatid exchange by mitotic crossover where there was no LTVEC targeting but Cas9 cleavage occurred on either chromosome 129 or chromosome B6 (B6 cleavage is depicted). Figure 18D depicts chromatid copying by break-induced replication where a heterozygous modification occurs on chromosome 129 before genome replication or after genome replication followed by gene conversion between sister chromatids. Figure 18E depicts chromatid copying by break-induced replication where one chromatid, 129, is modified after genome replication. Figure 18F depicts chromatid copying by break-induced replication where there was no LTVEC targeting but Cas9 cleavage occurred on either chromosome 129 or chromosome B6 (B6 cleavage is depicted).

[00094] На фигуре 19 изображена схема локуса Lrp5 мыши, являющегося мишенью для делеции и замены соответствующим локусом LRP5 человека с использованием LTVEC и одной или более гРНК в гибридных ЭС-клетках VGF1. Участок внутри пунктирных вертикальных линий является участком-мишенью (участок внутри 5 'и 3' последовательностей-мишеней LTVEC). Эталонной последовательностью для определения одиночных нуклеотидных вариаций была геномная последовательность линии мыши C57BL/6J от Jackson Laboratory. Эта эталонная последовательность сравнивалась с линией 129S6/SvEv от Taconic Biosciences, линией C57BL/6N от Taconic Biosciences и гибридной клеточной линией VGF1, полученной из линии 129S6/SvEv и линии C57BL/6N (представленного в трех рядах в нижней части фигуры). Вертикальные линии в каждом из трех рядов представляют собой одиночные нуклеотидные вариации по сравнению с эталонной последовательностью.[00094] Figure 19 depicts a schematic of the mouse Lrp5 locus targeted for deletion and replacement with the corresponding human LRP5 locus using LTVEC and one or more gRNAs in VGF1 hybrid ES cells. The region within the dotted vertical lines is the target region (the region within the 5' and 3' target sequences of the LTVEC). The reference sequence for determining single nucleotide variations was the genomic sequence of the C57BL/6J mouse strain from the Jackson Laboratory. This reference sequence was compared with the 129S6/SvEv strain from Taconic Biosciences, the C57BL/6N strain from Taconic Biosciences, and a VGF1 hybrid cell line derived from the 129S6/SvEv strain and the C57BL/6N strain (shown in the three rows at the bottom of the figure). The vertical lines in each of the three rows represent single nucleotide variations compared to the reference sequence.

[00095] На фигуре 20 изображена схема локуса Не мыши, являющегося мишенью для делеции и замены соответствующей человеческой версией с использованием LTVEC и одной или более гРНК в гибридных ЭС-клетках VGF1. Участок внутри пунктирных вертикальных линий является участком-мишенью (участок внутри 5 'и 3' последовательностей-мишеней LTVEC). Эталонной последовательностью для определения одиночных нуклеотидных вариаций была геномная последовательность линии мыши C57BL/6J от Jackson Laboratory. Эта эталонная последовательность сравнивалась с линией 129S6/SvEv от Taconic Biosciences, линией C57BL/6N от Taconic Biosciences и гибридной клеточной линией VGF1, полученной из линии 129S6/SvEv и линии C57BL/6N (представленного в трех рядах в нижней части фигуры). Вертикальные линии в каждом из трех рядов представляют собой одиночные нуклеотидные вариации по сравнению с эталонной последовательностью.[00095] Figure 20 depicts a schematic of the mouse He locus targeted for deletion and replacement with the corresponding human version using LTVEC and one or more gRNAs in VGF1 hybrid ES cells. The region within the dotted vertical lines is the target region (the region within the 5' and 3' target sequences of the LTVEC). The reference sequence for determining single nucleotide variations was the genomic sequence of the C57BL/6J mouse strain from the Jackson Laboratory. This reference sequence was compared to the 129S6/SvEv strain from Taconic Biosciences, the C57BL/6N strain from Taconic Biosciences, and a VGF1 hybrid cell line derived from the 129S6/SvEv strain and the C57BL/6N strain (shown in the three rows at the bottom of the figure). The vertical lines in each of the three rows represent single nucleotide variations compared to the reference sequence.

[00096] На фигуре 21 изображена схема локуса Trpa1 мыши, являющегося мишенью для делеции и замены соответствующей человеческой версией с использованием LTVEC и одной или более гРНК в гибридных ЭС-клетках VGF1. Участок внутри пунктирных вертикальных линий является участком-мишенью (участок внутри 5 'и 3' последовательностей-мишеней LTVEC). Эталонной последовательностью для определения одиночных нуклеотидных вариаций была геномная последовательность линии мыши C57BL/6J от Jackson Laboratory. Эта эталонная последовательность сравнивалась с линией 129S6/SvEv от Taconic Biosciences, линией C57BL/6N от Taconic Biosciences и гибридной клеточной линией VGF1, полученной из линии 129S6/SvEv и линии C57BL/6N (представленного в трех рядах в нижней части фигуры). Вертикальные линии в каждом из трех рядов представляют собой одиночные нуклеотидные вариации по сравнению с эталонной последовательностью.[00096] Figure 21 depicts a schematic of the mouse Trpa1 locus targeted for deletion and replacement with the corresponding human version using LTVEC and one or more gRNAs in VGF1 hybrid ES cells. The region within the dotted vertical lines is the target region (the region within the 5' and 3' target sequences of the LTVEC). The reference sequence for determining single nucleotide variations was the genomic sequence of the C57BL/6J mouse strain from the Jackson Laboratory. This reference sequence was compared to the 129S6/SvEv strain from Taconic Biosciences, the C57BL/6N strain from Taconic Biosciences, and a VGF1 hybrid cell line derived from the 129S6/SvEv strain and the C57BL/6N strain (shown in the three rows at the bottom of the figure). The vertical lines in each of the three rows represent single nucleotide variations compared to the reference sequence.

[00097] На фигуре 22 изображена схема локуса Adamts5 мыши, являющегося мишенью для делеции и замены соответствующей человеческой версией с использованием LTVEC и одной или более гРНК в гибридных ЭС-клетках VGF1. Участок внутри пунктирных вертикальных линий является участком-мишенью (участок внутри 5 'и 3' последовательностей-мишеней LTVEC). Эталонной последовательностью для определения одиночных нуклеотидных вариаций была геномная последовательность линии мыши C57BL/6J от Jackson Laboratory. Эта эталонная последовательность сравнивалась с линией 129S6/SvEv от Taconic Biosciences, линией C57BL/6N от Taconic Biosciences и гибридной клеточной линией VGF1, полученной из линии 129S6/SvEv и линии C57BL/6N (представленного в трех рядах в нижней части фигуры). Вертикальные линии в каждом из трех рядов представляют собой одиночные нуклеотидные вариации по сравнению с эталонной последовательностью.[00097] Figure 22 depicts a schematic of the mouse Adamts5 locus targeted for deletion and replacement with the corresponding human version using LTVEC and one or more gRNAs in VGF1 hybrid ES cells. The region within the dotted vertical lines is the target region (the region within the 5' and 3' target sequences of the LTVEC). The reference sequence for determining single nucleotide variations was the genomic sequence of the C57BL/6J mouse strain from the Jackson Laboratory. This reference sequence was compared to the 129S6/SvEv strain from Taconic Biosciences, the C57BL/6N strain from Taconic Biosciences, and a VGF1 hybrid cell line derived from the 129S6/SvEv strain and the C57BL/6N strain (shown in the three rows at the bottom of the figure). The vertical lines in each of the three rows represent single nucleotide variations compared to the reference sequence.

[00098] На фигуре 23 изображена схема локуса Folhl мыши, являющегося мишенью для делеции и замены соответствующей человеческой версией с использованием LTVEC и одной или более гРНК в гибридных ЭС-клетках VGF1. Участок внутри пунктирных вертикальных линий является участком-мишенью (участок внутри 5 'и 3' последовательностей-мишеней LTVEC). Эталонной последовательностью для определения одиночных нуклеотидных вариаций была геномная последовательность линии мыши C57BL/6J от Jackson Laboratory. Эта эталонная последовательность сравнивалась с линией 129S6/SvEv от Taconic Biosciences, линией C57BL/6N от Taconic Biosciences и гибридной клеточной линией VGF1, полученной из линии 129S6/SvEv и линии C57BL/6N (представленного в трех рядах в нижней части фигуры). Вертикальные линии в каждом из трех рядов представляют собой одиночные нуклеотидные вариации по сравнению с эталонной последовательностью.[00098] Figure 23 depicts a schematic of the mouse Folhl locus targeted for deletion and replacement with the corresponding human version using LTVEC and one or more gRNAs in VGF1 hybrid ES cells. The region within the dotted vertical lines is the target region (the region within the 5' and 3' target sequences of the LTVEC). The reference sequence for determining single nucleotide variations was the genomic sequence of the C57BL/6J mouse strain from the Jackson Laboratory. This reference sequence was compared to the 129S6/SvEv strain from Taconic Biosciences, the C57BL/6N strain from Taconic Biosciences, and a VGF1 hybrid cell line derived from the 129S6/SvEv strain and the C57BL/6N strain (shown in the three rows at the bottom of the figure). The vertical lines in each of the three rows represent single nucleotide variations compared to the reference sequence.

[00099] На фигуре 24 изображена схема локуса Dpp4 мыши, являющегося мишенью для делеции и замены соответствующей человеческой версией с использованием LTVEC и одной или более гРНК в гибридных ЭС-клетках VGF1. Участок внутри пунктирных вертикальных линий является участком-мишенью (участок внутри 5 'и 3' последовательностей-мишеней LTVEC). Эталонной последовательностью для определения одиночных нуклеотидных вариаций была геномная последовательность линии мыши C57BL/6J от Jackson Laboratory. Эта эталонная последовательность сравнивалась с линией 129S6/SvEv от Taconic Biosciences, линией C57BL/6N от Taconic Biosciences и гибридной клеточной линией VGF1, полученной из линии 129S6/SvEv и линии C57BL/6N (представленного в трех рядах в нижней части фигуры). Вертикальные линии в каждом из трех рядов представляют собой одиночные нуклеотидные вариации по сравнению с эталонной последовательностью.[00099] Figure 24 depicts a schematic of the mouse Dpp4 locus targeted for deletion and replacement with the corresponding human version using LTVEC and one or more gRNAs in VGF1 hybrid ES cells. The region within the dotted vertical lines is the target region (the region within the 5' and 3' target sequences of the LTVEC). The reference sequence for determining single nucleotide variations was the genomic sequence of the C57BL/6J mouse strain from the Jackson Laboratory. This reference sequence was compared with the 129S6/SvEv strain from Taconic Biosciences, the C57BL/6N strain from Taconic Biosciences, and a VGF1 hybrid cell line derived from the 129S6/SvEv strain and the C57BL/6N strain (shown in the three rows at the bottom of the figure). The vertical lines in each of the three rows represent single nucleotide variations compared to the reference sequence.

[000100] На фигуре 25 изображена схема локуса Rorl мыши, являющегося мишенью для делеции и замены соответствующей человеческой версией с использованием LTVEC и одной или более гРНК в гибридных ЭС-клетках VGF1. Участок внутри пунктирных вертикальных линий является участком-мишенью (участок внутри 5 'и 3' последовательностей-ллишеней LTVEC). Эталонной последовательностью для определения одиночных нуклеотидных вариаций была геномная последовательность линии мыши C57BL/6J от Jackson Laboratory. Эта эталонная последовательность сравнивалась с линией 129S6/SvEv от Taconic Biosciences, линией C57BL/6N от Taconic Biosciences и гибридной клеточной линией VGF1, полученной из линии 129S6/SvEv и линии C57BL/6N (представленного в трех рядах в нижней части фигуры). Вертикальные линии в каждом из трех рядов представляют собой одиночные нуклеотидные вариации по сравнению с эталонной последовательностью.[000100] Figure 25 depicts a schematic of the mouse Rorl locus targeted for deletion and replacement with the corresponding human version using LTVEC and one or more gRNAs in VGF1 hybrid ES cells. The region within the dotted vertical lines is the target region (the region within the 5' and 3' target sequences of the LTVEC). The reference sequence for determining single nucleotide variations was the genomic sequence of the C57BL/6J mouse strain from the Jackson Laboratory. This reference sequence was compared with the 129S6/SvEv strain from Taconic Biosciences, the C57BL/6N strain from Taconic Biosciences, and a VGF1 hybrid cell line derived from the 129S6/SvEv strain and the C57BL/6N strain (shown in the three rows at the bottom of the figure). The vertical lines in each of the three rows represent single nucleotide variations compared to the reference sequence.

[000101] На фигуре 26 изображена схема локуса мыши, включающую ген, кодирующий[000101] Figure 26 is a diagram of a mouse locus that includes a gene encoding

трансмембранный белок; локус мыши является мишенью для делеций и замены соответствующей человеческой версией с использованием LTVEC и одной или более гРНК в гибридных ЭС-клетках VGF1. Прямоугольники представляют разные гены в геномном участке-мишени. Участок внутри пунктирных вертикальных линий является участком-мишенью (участок внутри 5' и 3' последовательностей-мишеней LTVEC). Эталонной последовательностью для определения одиночных нуклеотидных вариаций была геномная последовательность линии мыши C57BL/6J от Jackson Laboratory. Эта эталонная последовательность сравнивалась с вариантом MP линии 129S6/SvEv от Taconic Biosciences, вариантом RGC линии C57BL/6N от Taconic Biosciences и гибридной клеточной линией VGF1, полученной из линии 129S6/SvEv и линии C57BL/6N (представленного в трех рядах в нижней части фигуры). Варианты MP и RGC - это разные мыши из одной и той же линии. Вертикальные линии в каждом из трех рядов представляют собой одиночные нуклеотидные вариации по сравнению с эталонной последовательностью.transmembrane protein; the mouse locus is the target for deletion and replacement with the corresponding human version using LTVEC and one or more gRNAs in VGF1 hybrid ES cells. The boxes represent different genes in the target genomic region. The region inside the dashed vertical lines is the target region (the region within the 5' and 3' target sequences of LTVEC). The reference sequence for identifying single nucleotide variations was the genomic sequence of the C57BL/6J mouse strain from the Jackson Laboratory. This reference sequence was compared with the MP variant of the 129S6/SvEv strain from Taconic Biosciences, the RGC variant of the C57BL/6N strain from Taconic Biosciences, and a VGF1 hybrid cell line derived from the 129S6/SvEv strain and the C57BL/6N strain (shown in the three rows at the bottom of the figure). The MP and RGC variants are different mice from the same line. The vertical bars in each of the three rows represent single nucleotide variations compared to the reference sequence.

[000102] На фигурах 27А-27С схематично изображен возможный механизм митотической рекомбинации во время фазы G2 клеточного цикла, который может продуцировать гомозиготные события и генную конверсию, обнаруженную с помощью локальной потери гетерозиготности. На фигуре 27А изображены реплицированные гомологичные хромосомы, показывающие две хроматиды в гибридной 129/В6 ЭС-клетке, гетерозиготной для целевой гуманизации на 129 гомологе. Гетерозиготная модификация в 129 гомологе происходит до репликации генома, или одна 129 хроматида модифицируется после репликации генома с последующей межхроматидной конверсией генов. Двусторонние стрелки указывают на потенциальные разрывы двойной цепи, генерируемые двойным гРНК-направленным расщеплением Cas9, которые способствуют двунитевому внедрению и синтез-направленной репарации, показанным диагональными пунктирными стрелками, что приводит к гибридным хроматидам, полученным с помощью события преобразования генов, которое копирует небольшую часть одной модифицированной хроматиды, как изображено на фигуре 27 В. На фигуре 27С изображено, что после митоза и деления клеток возможны два типа сегрегации хромосом в дочерние клетки: один с сохранением гетерозиготности (гетерозиготы родительского типа (Hum/+, верхний) без потери гетерозиготности, и один с локальной потерей гетерозиготности, окружающей целевую модификацию (Hum/Hum, нижний, сохраняет 129 аллели).[000102] Figures 27A-27C are schematic representations of a possible mechanism for mitotic recombination during the G2 phase of the cell cycle that can produce homozygous events and gene conversion detected by local loss of heterozygosity. Figure 27A depicts replicated homologous chromosomes showing two chromatids in a hybrid 129/B6 ES cell heterozygous for targeted humanization at the 129 homolog. The heterozygous modification at the 129 homolog occurs before genome replication, or one 129 chromatid is modified after genome replication, followed by interchromatid gene conversion. Double-headed arrows indicate potential double-strand breaks generated by dual gRNA-directed Cas9 cleavage that facilitate double-strand insertion and synthesis-directed repair, shown by diagonal dashed arrows, resulting in hybrid chromatids generated by a gene conversion event that copies a small portion of one modified chromatid, as depicted in Figure 27B. Figure 27C depicts that following mitosis and cell division, two types of chromosome segregation into daughter cells are possible: one with retention of heterozygosity (parental-type heterozygotes (Hum/+, upper) without loss of heterozygosity, and one with localized loss of heterozygosity surrounding the targeted modification (Hum/Hum, lower, retains 129 alleles).

[000103] На фигуре 28 изображена эффективность CRISPR/Cas9-опосредуемой делеции в эмбриональных стволовых клетках (ЭС) VI-3 и ULC 1-39 для различных мишеней аутоантигена разных размеров с использованием парных направляющих РНК, нацеленных на участки старт- и стоп-кодона генов, кодирующихаутоантигены, отдельно или в сочетании с большим вектором нацеливания.[000103] Figure 28 depicts the efficiency of CRISPR/Cas9-mediated deletion in embryonic stem (ES) cells VI-3 and ULC 1-39 for various self-antigen targets of different sizes using paired guide RNAs targeting the start and stop codon regions of genes encoding self-antigens, alone or in combination with a large targeting vector.

[000104] На фигуре 29 изображено процентное содержание щенков мыши, полученных с разрушенными аллелями, после нацеливания эмбрионов на одноклеточной стадии VI-3 и ULC1-39 с помощью CRISPR/Cas9 с целью нацеливания на различные аутоантигены-мишени разных размеров для делеции с использованием парных направляющих РНК, нацеленных на участки старт- и стоп-кодона генов, кодирующих аутоантигены.[000104] Figure 29 depicts the percentage of mouse pups generated with disrupted alleles following targeting of one-cell stage VI-3 and ULC1-39 embryos with CRISPR/Cas9 to target different target autoantigens of different sizes for deletion using paired guide RNAs targeting the start and stop codon regions of genes encoding autoantigens.

[000105] На фигуре 30А и 30В изображены данные титра антител для антигена-мишени человека (Мишень 9) у мышей дикого типа VI-3-Adam6 (фигура 30В) и у мышей VI3-Adam6, которые являются гомозиготными нулевыми по эндогенному гену, кодирующему аутоантиген ортолога к Мишени 9 (аутоантиген 9) (фигура 30А) после иммунизации с ДНК полной длины мишени 9 на родительских клетках VI-3T3 и клетках VI-3T3, сконструированных для экспрессии мишени 9.[000105] Figures 30A and 30B depict antibody titer data for a human target antigen (Target 9) in wild-type VI-3-Adam6 mice (Figure 30B) and VI3-Adam6 mice that are homozygous null for the endogenous gene encoding the autoantigen ortholog to Target 9 (autoantigen 9) (Figure 30A) following immunization with full-length Target 9 DNA on parental VI-3T3 cells and VI-3T3 cells engineered to express Target 9.

[000106] Фигуры 31А и 31В показывают данные титра антител для антигена-мишени человека (мишень 4) и для соответствующего ортологичного аутоантигена мыши (аутоантиген 4). На фигуре 31А изображены данные титра антител для мишени 4 человека и аутоантигена 4 мыши у мышей VI3-Adam6, которые являются гомозиготными нулевыми по эндогенному гену, кодирующему аутоантиген 4. На фигуре 31 В изображены данные титра антител для комбинации мишени 4 человека и аутоантигена 4 мыши у мышей ULC 1-39, которые являются гомозиготными нулевыми по эндогенному гену, кодирующему аутоантиген 4.[000106] Figures 31A and 31B show antibody titer data for a human target antigen (target 4) and for the corresponding orthologous mouse autoantigen (autoantigen 4). Figure 31A depicts antibody titer data for human target 4 and mouse autoantigen 4 in VI3-Adam6 mice, which are homozygous null for the endogenous gene encoding autoantigen 4. Figure 31B depicts antibody titer data for a combination of human target 4 and mouse autoantigen 4 in ULC 1-39 mice, which are homozygous null for the endogenous gene encoding autoantigen 4.

[000107] На фигуре 32 изображена схема для локуса тяжелой цепи иммуноглобулина (вверху) и локусов легкой цепи иммуноглобулина (снизу) у мышей VI3-Adam6 и ULC 1-39, каждая из которых имеет генетический фон 50% BALB/cTac, 25% C57BL/6NTac и 25% 129S6/SvEvTac. У мышей VI3-Adam6 эндогенный вариабельный участок тяжелой и легкой цепи иммуноглобулина мыши заменен соответствующей ДНК человека вместе с повторно вставленными генами Adam6 мыши (Adam6b и Adam6a, представленными с помощью трапеций). У мышей «универсальная легкая цепь» (ULC 1-39) эндогенный вариабельный участок тяжелой и легкой цепи иммуноглобулина мыши заменен соответствующей ДНК человека вместе с повторно вставленным геном Adam6 мыши, а вариабельный участок легкой цепи иммуноглобулина содержит одну перестроенную нуклеотидную последовательность легкой цепи иммуноглобулина человека (Vк1-39/Jк5), функционально связанную с промотором hVк3-15. Человеческие сегменты изображены черным цветом, а сегменты мыши обозначены диагональными линиями.[000107] Figure 32 depicts a schematic of the immunoglobulin heavy chain locus (top) and immunoglobulin light chain loci (bottom) in VI3-Adam6 and ULC 1-39 mice, each of which has a genetic background of 50% BALB/cTac, 25% C57BL/6NTac, and 25% 129S6/SvEvTac. In VI3-Adam6 mice, the endogenous mouse immunoglobulin heavy and light chain variable region is replaced by the corresponding human DNA, along with reinserted mouse Adam6 genes (Adam6b and Adam6a, represented by trapezoids). In the universal light chain (ULC 1-39) mouse, the endogenous mouse immunoglobulin heavy and light chain variable region is replaced by the corresponding human DNA together with a reinserted mouse Adam6 gene, and the immunoglobulin light chain variable region contains a single rearranged human immunoglobulin light chain nucleotide sequence (Vk1-39/Jk5) operably linked to the hVk3-15 promoter. Human segments are shown in black, and mouse segments are indicated by diagonal lines.

ОПРЕДЕЛЕНИЯDEFINITIONS

[000108] Термины «белок», «полипептид» и «пептид», используемые в данном документе взаимозаменяемо, включают полимерные формы аминокислот любой длины, включая кодированные и не кодированные аминокислоты и химически или биохимически модифицированные, или дериватизированные аминокислоты. Термины также включают полимеры, которые были модифицированы, такие как полипептиды, имеющие модифицированные пептидные остовы.[000108] The terms "protein," "polypeptide," and "peptide," as used interchangeably herein, include polymeric forms of amino acids of any length, including coded and non-coded amino acids and chemically or biochemically modified or derivatized amino acids. The terms also include polymers that have been modified, such as polypeptides having modified peptide backbones.

[000109] Говорят, что белки имеют «N-конец» и «С-конец». Термин «N-конец» относится к началу белка или полипептида, который заканчивается аминокислотой со свободной аминогруппой (-NH2). Термин «С-конец» относится к концу аминокислотной цепи (белка или полипептида), который заканчивается свободной карбоксильной группой (-СООН).[000109] Proteins are said to have an "N-terminus" and a "C-terminus." The term "N-terminus" refers to the beginning of a protein or polypeptide that ends with an amino acid with a free amino group (-NH2). The term "C-terminus" refers to the end of an amino acid chain (protein or polypeptide) that ends with a free carboxyl group (-COOH).

[000110] Термины «нуклеиновая кислота» и «полинуклеотид», используемые в данном документе взаимозаменяемо, включают полимерные формы нуклеотидов любой длины, включая рибонуклеотиды, дезоксирибонуклеотиды или аналоги или их модифицированные варианты. Они включают одно-, двух- и многоцепочечную ДНК или РНК, геномную ДНК, кДНК, гибриды ДНК-РНК и полимеры, содержащие пуриновые основания, пиримидиновые основания или другие природные, химически модифицированные, биохимически модифицированные, неприродные или дериватизированные нуклеотидные основания.[000110] The terms "nucleic acid" and "polynucleotide" as used interchangeably herein include polymeric forms of nucleotides of any length, including ribonucleotides, deoxyribonucleotides, or analogs or modified versions thereof. They include single-, double-, and multi-stranded DNA or RNA, genomic DNA, cDNA, DNA-RNA hybrids, and polymers containing purine bases, pyrimidine bases, or other natural, chemically modified, biochemically modified, non-natural, or derivatized nucleotide bases.

[000111] Говорят, что нуклеиновые кислоты имеют «5' концы» и «3' концы», поскольку мононуклеотиды подвергают взаимодействию с образованием олигонуклеотидов таким образом, что 5'-фосфат одного мононуклеотидного пентозного кольца присоединен к 3'-кислороду его соседа в одном направлении через фосфодиэфирную связь. Конец олигонуклеотида упоминают как «5' конец», если его 5'-фосфат не связан с 3'-кислородом мононуклеотидного пентозного кольца. Конец олигонуклеотида упоминают как «3' конец», если его 3'-кислород не связан с 5'-фосфатом другого мононуклеотидного пентозного кольца. Последовательность нуклеиновой кислоты, даже если она внутренняя по отношению к более крупному олигонуклеотиду, также может быть упомянута как имеющая 5 'и 3' концы. В линейной или круговой молекуле ДНК, дискретные элементы упоминаются как находящиеся «вверх по ходу транскрипции» или 5' «вниз по ходу транскрипции» или 3'-элементы.[000111] Nucleic acids are said to have "5' ends" and "3' ends" because mononucleotides react to form oligonucleotides in such a way that the 5' phosphate of one mononucleotide pentose ring is attached to the 3' oxygen of its neighbor in one direction through a phosphodiester bond. An end of an oligonucleotide is referred to as a "5' end" if its 5' phosphate is not attached to the 3' oxygen of a mononucleotide pentose ring. An end of an oligonucleotide is referred to as a "3' end" if its 3' oxygen is not attached to the 5' phosphate of another mononucleotide pentose ring. A nucleic acid sequence, even if internal to a larger oligonucleotide, may also be referred to as having 5' and 3' ends. In a linear or circular DNA molecule, discrete elements are referred to as "upstream" or 5' "downstream" or 3' elements.

[000112] Термин «дикий тип» включает в себя объекты, имеющие структуру и/или активность, которые находятся в нормальном (в отличие от мутантного, больного, измененного или так далее) состоянии или контексте. Ген дикого типа и поли пептиды часто существуют в нескольких разных формах (например, аллелях).[000112] The term "wild type" includes entities having a structure and/or activity that are in a normal (as opposed to mutant, diseased, altered, etc.) state or context. Wild type genes and polypeptides often exist in several different forms (e.g., alleles).

[000113] Термин «изолированный» по отношению к белкам и нуклеиновой кислоте включает белки и нуклеиновые кислоты, которые относительно очищены по отношению к другим бактериальным, вирусным или клеточным компонентам, которые обычно могут присутствовать in situ, вплоть до и в том числе практически чистого препарата белка и полинуклеотида. Термин «изолированный» также включает белки и нуклеиновые кислоты, которые не имеют аналога природного происхождения, которые были химически синтезированы и, таким образом, по существу не загрязнены другими белками или нуклеиновыми кислотами, или были отделены или очищены от большинства других клеточных компонентов, которые их естественно сопровождают (например, другие клеточные белки, полинуклеотиды или клеточные компоненты).[000113] The term "isolated" with respect to proteins and nucleic acids includes proteins and nucleic acids that are relatively purified with respect to other bacterial, viral, or cellular components that may normally be present in situ, up to and including a substantially pure preparation of the protein and polynucleotide. The term "isolated" also includes proteins and nucleic acids that have no naturally occurring counterpart, that have been chemically synthesized and thus are substantially uncontaminated by other proteins or nucleic acids, or have been separated or purified from most other cellular components that naturally accompany them (e.g., other cellular proteins, polynucleotides, or cellular components).

[000114] «Экзогенные» молекулы или последовательности включают молекулы или последовательности, которые обычно не присутствуют в клетке в этой форме. Нормальное присутствие включает присутствие по отношению к конкретной стадии развития и условиям окружающей среды клетки. Экзогенная молекула или последовательность, например, может включать мутированный вариант соответствующей эндогенной последовательности в клетке, такой как гуманизированный вариант эндогенной последовательности, или может включать последовательность, соответствующую эндогенной последовательности внутри клетки, но в другой форме (т.е. не внутри хромосомы). Напротив, эндогенные молекулы или последовательности включают молекулы или последовательности, которые обычно присутствуют в этой форме в конкретной клетке на конкретной стадии развития в конкретных условиях окружающей среды.[000114] "Exogenous" molecules or sequences include molecules or sequences that are not normally present in a cell in that form. Normal presence includes presence relative to a particular developmental stage and environmental conditions of the cell. An exogenous molecule or sequence, for example, may include a mutated version of a corresponding endogenous sequence in a cell, such as a humanized version of an endogenous sequence, or may include a sequence corresponding to an endogenous sequence within a cell but in a different form (i.e., not within a chromosome). In contrast, endogenous molecules or sequences include molecules or sequences that are normally present in that form in a particular cell at a particular developmental stage under particular environmental conditions.

[000115] «Оптимизация кодонов» обычно включает в себя способ модификации последовательности нуклеиновой кислоты для улучшения экспрессии в конкретных клетках-хозяевах путем замены по меньшей мере одного кодона нативной последовательности кодоном, который чаще или чаще всего используется в генах клетки-хозяина, сохраняя при этом нативную аминокислотную последовательность. Например, полинуклеотид, кодирующий белок Cas9, может быть модифицирован для замены кодонов, имеющих более высокую частоту использования в данной прокариотической или эукариотической клетке, включая бактериальную клетку, дрожжевую клетку, клетку человека, не человеческую клетку, клетку млекопитающего, клетку грызуна, клетку мыши, клетку крысы, клетку хомяка или любую другую клетку-хозяина по сравнению с последовательностью нуклеиновой кислоты естественного происхождения. Таблицы использования кодонов легко доступны, например, в «Базе данных использования кодонов». Эти таблицы могут быть адаптированы несколькими способами. См. Nakamura et al. (2000) Nucleic Acids Research 28: 292, включенный в данный документ в качестве ссылки во всей полноте для всех целей. Также доступны компьютерные алгоритмы оптимизации кодонов конкретной последовательности для экспрессии в конкретном хозяине (см., например, Gene Forge).[000115] "Codon optimization" generally includes a method of modifying a nucleic acid sequence to improve expression in particular host cells by replacing at least one codon of the native sequence with a codon that is more frequently or most frequently used in the genes of the host cell, while maintaining the native amino acid sequence. For example, a polynucleotide encoding a Cas9 protein can be modified to replace codons that are more frequently used in a given prokaryotic or eukaryotic cell, including a bacterial cell, a yeast cell, a human cell, a non-human cell, a mammalian cell, a rodent cell, a mouse cell, a rat cell, a hamster cell, or any other host cell, compared to the naturally occurring nucleic acid sequence. Codon usage tables are readily available, such as in the "Codon Usage Database." These tables can be adapted in several ways. See Nakamura et al. (2000) Nucleic Acids Research 28: 292, incorporated herein by reference in its entirety for all purposes. Computer algorithms for optimizing the codons of a particular sequence for expression in a particular host are also available (see, e.g., Gene Forge).

[000116] Термин «локус» относится к определенному местоположению гена (или значительной последовательности), последовательности ДНК, последовательности, кодирующей полипептид, или положения на хромосоме генома организма. Например, «локус Lrp5» может относиться к конкретному местоположению гена Lrp5, последовательности ДНКLrp5, LRPS-кодирующей последовательности, или позиции Lrp5 на хромосоме генома организма, которая была идентифицирована относительно того, где такая последовательность находится. «Локус Lrp5» может содержать регуляторный элемент гена Lrp5, включая, например, энхансер, промотор, 5' и/или 3' UTR, или их комбинацию.[000116] The term "locus" refers to a particular location of a gene (or significant sequence), a DNA sequence, a polypeptide encoding sequence, or a position on a chromosome of an organism's genome. For example, an "Lrp5 locus" may refer to a particular location of an Lrp5 gene, an Lrp5 DNA sequence, an LRPS encoding sequence, or a position of Lrp5 on a chromosome of an organism's genome that has been identified relative to where such a sequence is located. An "Lrp5 locus" may comprise a regulatory element of the Lrp5 gene, including, for example, an enhancer, a promoter, a 5' and/or 3' UTR, or a combination thereof.

[000117] Термин «ген» относится к последовательности ДНК в хромосоме, которая кодирует продукт (например, РНК-продукт и/или полипептидный продукт) и включает кодирующий участок, прерванный не кодирующими интронами и последовательность, расположенную рядом с кодирующим участком на обоих концах 5' и 3', так что ген соответствует полноразмерной мРНК (включая 5' и 3' не транслируемые последовательности). Термин «ген» также включает другие не кодирующие последовательности, включая регуляторные последовательности (например, промоторы, энхансеры и сайты связывания с транскрипционным фактором), сигналы полиаденилирования, внутренние сайты входа рибосомы, сайленсеры, изоляционную последовательность и участок прикрепления матриц. Эти последовательности могут быть близки к кодирующему участку гена (например, в пределах 10 т.п.о.) или на отдаленных сайтах, и они влияют на уровень или скорость транскрипции и трансляции гена.[000117] The term "gene" refers to a DNA sequence on a chromosome that encodes a product (e.g., an RNA product and/or a polypeptide product) and includes a coding region interrupted by non-coding introns and sequence adjacent to the coding region at both the 5' and 3' ends such that the gene corresponds to a full-length mRNA (including 5' and 3' untranslated sequences). The term "gene" also includes other non-coding sequences, including regulatory sequences (e.g., promoters, enhancers, and transcription factor binding sites), polyadenylation signals, internal ribosome entry sites, silencers, an insulator sequence, and a template attachment site. These sequences may be close to the coding region of the gene (e.g., within 10 kb) or at distant sites, and they affect the level or rate of transcription and translation of the gene.

[000118] Термин «аллель» относится к вариантной форме гена. Некоторые гены имеют множество различных форм, которые расположены на одном и том же положении, или генетическом локусе, на хромосоме. Диплоидный организм имеет два аллеля в каждом генетическом локусе. Каждая пара аллелей представляет генотип определенного генетического локуса. Генотипы описываются как гомозиготные, если есть два идентичных аллеля в определенном локусе, и как гетерозиготные, если эти два аллеля отличаются друг от друга.[000118] The term "allele" refers to a variant form of a gene. Some genes have multiple different forms that are located at the same position, or genetic locus, on a chromosome. A diploid organism has two alleles at each genetic locus. Each pair of alleles represents the genotype of a particular genetic locus. Genotypes are described as homozygous if there are two identical alleles at a particular locus, and as heterozygous if the two alleles are different from each other.

[000119] «Промотор» представляет собой регуляторный участок ДНК, обычно содержащий бокс TATA, способный направлять РНК-полимеразу II для инициации синтеза РНК на соответствующем сайте инициации транскрипции для конкретной полинуклеотидной последовательности. Промотор может дополнительно содержать другие участки, которые влияют на скорость инициации транскрипции. Описанные в данном документе промоторные последовательности модулируют транскрипцию функционально связанного полинуклеотида. Промотор может быть активным в одном или более типах клеток, описанных в данном документе (например, эукариотическая клетка, клетка млекопитающего отличного от человека, клетка человека, клетка грызуна, плюрипотентная клетка, эмбрион на одноклеточной стадии, дифференцированная клетка или их комбинация). Промотором может быть, например, конститутивно активный промотор, условный промотор, индуцируемый промотор, временно ограниченный промотор (например, промотор, регулируемый развитием), или пространственно ограниченный промотор (например, клетка специфический или тканеспецифический промотор). Примеры промоторов можно найти, например, в WO 2013/176772, включенном в данный документ в качестве ссылки во всей своей полноте.[000119] A "promoter" is a regulatory region of DNA, typically containing a TATA box, capable of directing RNA polymerase II to initiate RNA synthesis at the appropriate transcription initiation site for a particular polynucleotide sequence. A promoter may further contain other regions that affect the rate of transcription initiation. The promoter sequences described herein modulate transcription of an operably linked polynucleotide. A promoter may be active in one or more of the cell types described herein (e.g., a eukaryotic cell, a non-human mammalian cell, a human cell, a rodent cell, a pluripotent cell, a single-cell stage embryo, a differentiated cell, or a combination thereof). The promoter may be, for example, a constitutively active promoter, a conditional promoter, an inducible promoter, a temporally restricted promoter (e.g., a developmentally regulated promoter), or a spatially restricted promoter (e.g., a cell-specific or tissue-specific promoter). Examples of promoters can be found, for example, in WO 2013/176772, incorporated herein by reference in its entirety.

[000120] Примеры индуцируемых промоторов включают, например, химически регулируемые промоторы и физически регулируемые промоторы. Химически регулируемые промоторы включают, например, алкоголь-регулируемые промоторы (например, промотор гена алкогольдегидрогеназы (alcA)), тетрациклин-регулируемые промоторы (например, тетрациклин-реагирующий промотор, последовательность оператора тетрациклина (tetO), tet-On промотор, или промотор tet-Off), промоторы, регулируемые стероидами (например, глюкокортикоидный рецептор крысы, промотор рецептора эстрогена или промотор рецептора экдисона) или промоторы, регулируемые металлом (например, промотор металлопротеина). Физически регулируемые промоторы включают, например, температура-регулируемые промоторы (например, промотор теплового шока) и светорегулируемые промоторы (например, светоиндуцируемый промотор или светоингибируемый промотор).[000120] Examples of inducible promoters include, for example, chemically regulated promoters and physically regulated promoters. Chemically regulated promoters include, for example, alcohol-regulated promoters (e.g., the alcohol dehydrogenase gene (alcA) promoter), tetracycline-regulated promoters (e.g., the tetracycline-responsive promoter, the tetracycline operator sequence (tetO), the tet-On promoter, or the tet-Off promoter), steroid-regulated promoters (e.g., the rat glucocorticoid receptor, the estrogen receptor promoter, or the ecdysone receptor promoter), or metal-regulated promoters (e.g., a metalloprotein promoter). Physically regulated promoters include, for example, temperature-regulated promoters (e.g., a heat shock promoter) and light-regulated promoters (e.g., a light-inducible promoter or a light-inhibitable promoter).

[000121] Тканеспецифическими промоторами могут быть, например, нейрон-специфические промоторы, глия-специфические промоторы, промоторы, специфичные для мышечных клеток, промоторы, специфичные для клеток сердца, промоторы, специфичные для клеток почек, промоторы, специфичные для костных клеток, промоторы, специфичные для эндотелиальных клеток, или промоторы, специфичные для иммунной клетки (например, промотор В-клеток или промотор Т-клеток).[000121] Tissue-specific promoters can be, for example, neuron-specific promoters, glia-specific promoters, muscle cell-specific promoters, cardiac cell-specific promoters, kidney cell-specific promoters, bone cell-specific promoters, endothelial cell-specific promoters, or immune cell-specific promoters (e.g., a B cell promoter or a T cell promoter).

[000122] Регулируемые в процессе развития промоторы включают, например, промоторы, активные только во время эмбриональной стадии развития или только во взрослой клетке.[000122] Developmentally regulated promoters include, for example, promoters that are active only during the embryonic stage of development or only in the adult cell.

[000123] «Функциональная связь» или «функционально связанный» включает в себя смежное расположение двух или более компонентов (например, промотора и другого элемента последовательности), так что оба компонента функционируют нормально и позволяют, чтобы по меньшей мере один из компонентов мог опосредовать функцию, которая влияет по меньшей мере на один из других компонентов. Например, промотор может быть функционально связан с кодирующей последовательностью, если промотор контролирует уровень транскрипции кодирующей последовательности в ответ на наличие или отсутствие одного, или более регуляторных факторов транскрипции. Функциональная связь может включать в себя такие последовательности, которые смежны друг с другом или действуют в транс (например, регуляторная последовательность может действовать на расстоянии, чтобы контролировать транскрипцию кодирующей последовательности). В качестве другого примера последовательность нуклеиновой кислоты вариабельного участка иммуноглобулина (или сегментов V(D)J) может быть функционально связана с последовательностью нуклеиновой кислоты константного участка иммуноглобулина, чтобы обеспечить надлежащую рекомбинацию между последовательностями в последовательность тяжелой или легкой цепи иммуноглобулина.[000123] "Functional linkage" or "operably linked" includes the juxtaposition of two or more components (e.g., a promoter and another sequence element) such that both components function normally and allow at least one of the components to mediate a function that affects at least one of the other components. For example, a promoter can be operably linked to a coding sequence if the promoter controls the level of transcription of the coding sequence in response to the presence or absence of one or more transcription regulatory factors. A functional link can include such sequences that are adjacent to each other or act in trans (e.g., a regulatory sequence can act at a distance to control transcription of the coding sequence). As another example, an immunoglobulin variable region nucleic acid sequence (or V(D)J segments) can be operably linked to an immunoglobulin constant region nucleic acid sequence to ensure proper recombination between the sequences into an immunoglobulin heavy or light chain sequence.

[000124] «Комплементарность» нуклеиновых кислот означает, что нуклеотидная последовательность в одной цепи нуклеиновой кислоты, обусловленная ориентацией групп ее нуклеотидных оснований, образует водородные связи с другой последовательностью на противоположной нити нуклеиновой кислоты. Комплементарные основания в ДНК, как правило, А с Т и С с G. В РНК они, как правило, С с G и U с А. Комплементарность может быть идеальной или существенной/достаточной. Идеальная комплементарность между двумя нуклеиновыми кислотами означает, что две нуклеиновые кислоты могут образовывать дуплекс, в котором каждое основание дуплекса связано с комплементарным основанием путем спаривания Ватсона-Крика. «Существенная» или «достаточная» комплементарность означает, что последовательность в одной цепи не является полностью и/или идеально комплементарной последовательности в противоположной цепи, но что между связями между двумя нитями происходит достаточное связывание с образованием стабильного гибридного комплекса в наборе условий гибридизации (например, концентрации соли и температуры). Такие условия могут быть предсказаны с использованием последовательностей и стандартных математических расчетов для прогнозирования Tm (температуры плавления) гибридизованных нитей, или путем эмпирического определения Tm с использованиемобычных способов. Tm включает температуру, при которой популяция комплексов гибридизации, образованных между двумя цепями нуклеиновой кислоты, на 50% денатурирована (т.е. популяция двухцепочечных молекул нуклеиновой кислоты становится наполовину диссоциированной в отдельные нити). При температуре ниже Tm предпочтительным является образование гибридизационного комплекса, тогда как при температуре выше Tm предпочтение отдается плавлению или разделению нитей в комплексе гибридизации. Tm может быть оценена для нуклеиновой кислоты, имеющей известное содержание G+C в водном 1 М растворе NaCI, используя, например, Tm = 81,5+0,41 (% G+C), хотя другие известные вычисления Tm учитывают структурные характеристики нуклеиновой кислоты.[000124] "Complementarity" of nucleic acids means that a nucleotide sequence on one strand of a nucleic acid, due to the orientation of its nucleotide base groups, forms hydrogen bonds with another sequence on the opposite strand of the nucleic acid. Complementary bases in DNA are typically A with T and C with G. In RNA they are typically C with G and U with A. Complementarity may be perfect or substantial/sufficient. Perfect complementarity between two nucleic acids means that the two nucleic acids can form a duplex in which each base in the duplex is bound to a complementary base by Watson-Crick pairing. "Substantial" or "sufficient" complementarity means that the sequence on one strand is not completely and/or perfectly complementary to the sequence on the opposite strand, but that sufficient binding occurs between the bonds between the two strands to form a stable hybrid complex under a set of hybridization conditions (e.g., salt concentration and temperature). Such conditions can be predicted using sequences and standard mathematical calculations to predict the Tm (melting temperature) of the hybridized strands, or by empirically determining the Tm using routine methods. Tm includes the temperature at which the population of hybridization complexes formed between the two nucleic acid strands is 50% denatured (i.e., the population of double-stranded nucleic acid molecules becomes half dissociated into separate strands). Below Tm, hybridization complex formation is favored, whereas above Tm, melting or separation of the strands in the hybridization complex is favored. Tm can be estimated for a nucleic acid having a known G+C content in an aqueous 1 M NaCl solution using, for example, Tm = 81.5+0.41 (% G+C), although other known Tm calculations take into account structural characteristics of the nucleic acid.

[000125] «Условие гибридизации» включает в себя кумулятивную окружающую среду, в которой одна цепь нуклеиновой кислоты связывается со второй цепью нуклеиновой кислоты с помощью комплементарных взаимодействий цепи и водородной связи для получения комплекса гибридизации. Такие условия включают химические компоненты и концентрации их (например, соли, хелатирующие агенты, формамид) водного или органического раствора, содержащего нуклеиновые кислоты, и температуру смеси. Другие факторы, такие как продолжительность инкубации или размеры реакционной камеры, могут вносить вклад в окружающую среду. См., например, Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd ed., Pp.1.90-1.91, 9.47-9.51, 1 1.47-11.57 (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989), включенную в данный документ в качестве ссылки во всей своей полноте для всех целей.[000125] "Hybridization conditions" include the cumulative environment in which one strand of a nucleic acid associates with a second strand of a nucleic acid by complementary strand interactions and hydrogen bonding to produce a hybridization complex. Such conditions include the chemical components and their concentrations (e.g., salts, chelating agents, formamide) of an aqueous or organic solution containing nucleic acids and the temperature of the mixture. Other factors, such as the duration of incubation or the dimensions of the reaction chamber, may contribute to the environment. See, e.g., Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd ed., pp. 1.90-1.91, 9.47-9.51, 1 1.47-11.57 (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989), incorporated herein by reference in its entirety for all purposes.

[000126] Гибридизация требует, чтобы две нуклеиновые кислоты содержали комплементарные последовательности, хотя возможны несоответствия между основаниями. Условия, подходящие для гибридизации между двумя нуклеиновыми кислотами, зависят от длины нуклеиновых кислот и степени комплементарности, которые хорошо известны в данной области техники. Чем больше степень комплементарности между двумя нуклеотидными последовательностями, тем больше значение температуры плавления (Tm) для гибридов нуклеиновых кислот, имеющих эти последовательности. Для гибридизации между нуклеиновыми кислотами с короткими участками комплементарности (например, комплементарность более 35 или менее, 30 или менее, 25 или менее, 22 или менее, 20 или менее, или 18 или менее нуклеотидов) положения несовпадений становится важным (см. Sambrook et al., выше, 11.7-11.8). Как правило, длина гибридизуеллой нуклеиновой кислоты составляет по меньшей мере около 10 нуклеотидов. Иллюстративные минимальные длины гибридизуемой нуклеиновой кислоты включают по меньшей мере около 15 нуклеотидов, по меньшей мере около 20 нуклеотидов, по меньшей мере около 22 нуклеотидов, по меньшей мере около 25 нуклеотидов и по меньшей мере около 30 нуклеотидов. Кроме того, температура и концентрация соли промывочного раствора могут быть скорректированы по мере необходимости в соответствии с такими факторами, как длина участка комплементации и степень комплементации.[000126] Hybridization requires that the two nucleic acids contain complementary sequences, although mismatches between bases are possible. Conditions suitable for hybridization between two nucleic acids depend on the length of the nucleic acids and the degree of complementarity, which are well known in the art. The greater the degree of complementarity between two nucleotide sequences, the greater the melting temperature (Tm) value for hybrids of nucleic acids having these sequences. For hybridization between nucleic acids with short regions of complementarity (e.g., complementarity of greater than 35 or less, 30 or less, 25 or less, 22 or less, 20 or less, or 18 or less nucleotides), the positions of the mismatches become important (see Sambrook et al., supra, 11.7-11.8). Typically, the length of the hybridizatile nucleic acid is at least about 10 nucleotides. Exemplary minimum lengths of the hybridizable nucleic acid include at least about 15 nucleotides, at least about 20 nucleotides, at least about 22 nucleotides, at least about 25 nucleotides, and at least about 30 nucleotides. In addition, the temperature and salt concentration of the wash solution can be adjusted as needed according to factors such as the length of the complementation region and the degree of complementation.

[000127] Последовательность полинуклеотида не должна быть на 100% комплементарной таковой нуклеиновой кислоте-мишени, которая может быть специфически гибридизуема. Более того, полинуклеотид может гибридизоваться по одному или более сегментам таким образом, что промежуточные или смежные сегменты не участвуют в событии гибридизации (например, структура петли или структура шпильки). Полинуклеотид (например, гРНК) может содержать по меньшей мере 70%, по меньшей мере 80%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 99% или 100% комплементарное™ последовательности к мишени в пределах последовательности нуклеиновой кислоты-мишени, к которой они нацелены. Например, гРНК, в которой 18 из 20 нуклеотидов являются комплементарными мишени и, следовательно, специфически гибридизуются, будет представлять собой 90% комплементарность. В этом примере оставшиеся не комплементарные нуклеотиды могут быть сгруппированы или чередоваться с комплементарными нуклеотидами и не должны быть смежными друг с другом или с комплементарными нуклеотидами.[000127] The sequence of a polynucleotide does not have to be 100% complementary to that of a target nucleic acid that can be specifically hybridized. Moreover, a polynucleotide can hybridize at one or more segments such that intervening or adjacent segments do not participate in the hybridization event (e.g., a loop structure or a hairpin structure). A polynucleotide (e.g., a gRNA) can comprise at least 70%, at least 80%, at least 90%, at least 95%, at least 99%, or 100% complementary to the target sequence within the target nucleic acid sequence to which it is targeted. For example, a gRNA in which 18 of the 20 nucleotides are complementary to the target and therefore specifically hybridize would represent 90% complementarity. In this example, the remaining non-complementary nucleotides may be grouped or interleaved with complementary nucleotides and do not have to be adjacent to each other or to complementary nucleotides.

[000128] Процентную комплементарность между отдельными участками последовательностей нуклеиновых кислот в нуклеиновых кислотах можно определить с помощью программ BLAST (базовых инструментов поиска локального выравнивания) и программ PowerBLAST, известных в данной области техники (Altschul et al. (1990) J. Mol. Biol. 215:403-410; Zhang and Madden (1997) Genome Res. 7: 649-656) или с помощью программы Gap (пакет анализа последовательностей Висконсина, версия 8 для Unix, Genetics Computer Group, University Research Park, Madison Wis.), используя настройки по умолчанию, в которых используется алгоритм Smith and Waterman (Adv. Appl. Math., 1981, 2, 482-489).[000128] Percent complementarity between individual regions of nucleic acid sequences in nucleic acids can be determined using the BLAST (Basic Local Alignment Search Tool) and PowerBLAST programs known in the art (Altschul et al. (1990) J. Mol. Biol. 215:403-410; Zhang and Madden (1997) Genome Res. 7: 649-656) or using the Gap program (Wisconsin Sequence Analysis Package, version 8 for Unix, Genetics Computer Group, University Research Park, Madison Wis.) using default settings, which uses the Smith and Waterman algorithm (Adv. Appl. Math., 1981, 2, 482-489).

[000129] Способы и композиции, представленные в данном документе, используют множество различных компонентов. В описании повсеместно признается, что некоторые компоненты могут иметь активные варианты и фрагменты. К таким компонентам относятся, например, белки Cas9, CRISPR РНК, малая некодирующая РНК и направляющие РНК. Биологическая активность для каждого из этих компонентов описана в другом месте данного документа.[000129] The methods and compositions provided herein utilize a variety of different components. It is generally recognized throughout the disclosure that some components may have active variants and fragments. Such components include, for example, Cas9 proteins, CRISPR RNA, small non-coding RNA, and guide RNA. The biological activity for each of these components is described elsewhere in this disclosure.

[000130] «Идентификация последовательности» или «идентификация» в контексте двух полинуклеотидов или полипептидных последовательностей делает ссылку на остатки в двух последовательностях, которые являются одинаковыми, если они выровнены для максимального соответствия в определенном окне сравнения. Когда процент идентичности последовательности используется в отношении белков, признано, что положения остатков, которые не идентичны, часто отличаются консервативными аминокислотными заменами, где аминокислотные остатки замещены для других аминокислотных остатков с аналогичными химическими свойствами (например, заряд или гидрофобность) и, следовательно, не меняют функциональных свойств молекулы. Когда последовательности отличаются консервативными заменами, процентная идентичность последовательности может быть скорректирована вверх, чтобы исправить консервативный характер замещения. Говорят, что последовательности, которые отличаются такими консервативными заменами, имеют «сходство последовательностей» или «сходство». Средства для осуществления этой коррекции хорошо известны специалистам в данной области техники. Как правило, это включает в себя оценку консервативной замены как частичного, а не полного несоответствия, тем самым увеличивая идентичность последовательности в процентах. Так, например, когда идентичной аминокислоте дается оценка 1, а неконсервативной замене дается оценка ноль, консервативной замене дается оценка между нулем и 1. Оценка консервативных замен рассчитывается, например, как реализовано в программе PC/GENE (Intelligenetics, Маунтин Вью, Калифорния).[000130] "Sequence identification" or "identification" in the context of two polynucleotide or polypeptide sequences refers to residues in the two sequences that are the same when aligned for maximum correspondence within a specified comparison window. When percent sequence identity is used in relation to proteins, it is recognized that residue positions that are not identical often differ by conservative amino acid substitutions, where amino acid residues are substituted for other amino acid residues with similar chemical properties (e.g., charge or hydrophobicity) and therefore do not change the functional properties of the molecule. When sequences differ by conservative substitutions, the percent sequence identity may be adjusted upward to correct for the conservative nature of the substitution. Sequences that differ by such conservative substitutions are said to have "sequence similarity" or "similarity." Means for making this adjustment are well known to those skilled in the art. Typically, this involves scoring a conservative substitution as a partial rather than a complete mismatch, thereby increasing the percent sequence identity. Thus, for example, when an identical amino acid is given a score of 1 and a non-conservative substitution is given a score of zero, the conservative substitution is given a score between zero and 1. The conservative substitution score is calculated, for example, as implemented in the program PC/GENE (Intelligenetics, Mountain View, CA).

[000131] «Процент идентичности последовательностей» включает в себя значение, определяемое путем сравнения двух последовательностей с оптимальным выравниванием по сравнению с окном сравнения, причем часть полинуклеотидной последовательности в окне сравнения может содержать добавления или делеции (т.е. промежутки) по сравнению с эталонной последовательностью (которая не содержит добавлений или делеции) для оптимального выравнивания двух последовательностей. Процент рассчитывается путем определения количества положений, в которых идентичное основание нуклеиновой кислоты или аминокислотный остаток появляется в обеих последовательностях, для получения количества совпадающих положений, деля количество совпадающих положений на общее количество положений в окне сравнения, и умножая результат на 100, чтобы получить процент идентичности последовательности.[000131] "Percentage of sequence identity" includes a value determined by comparing two sequences with an optimal alignment compared to a comparison window, wherein a portion of the polynucleotide sequence in the comparison window may contain additions or deletions (i.e., gaps) compared to a reference sequence (which does not contain additions or deletions) for an optimal alignment of the two sequences. The percentage is calculated by determining the number of positions at which an identical nucleic acid base or amino acid residue appears in both sequences to obtain the number of matching positions, dividing the number of matching positions by the total number of positions in the comparison window, and multiplying the result by 100 to obtain the percent sequence identity.

[000132] Если не указано иное, значения идентичности/сходства последовательности включают значение, полученное с использованием GAP версия 10, используя следующие параметры: % идентичности и % сходства для нуклеотидной последовательности с использованием GAP Вес 50 и Длина Вес 3, и матрицу подсчета nwsgapdna.cmp; % идентичности и % сходства для аминокислотной последовательности с использованием GAP Вес 8 и Длина Вес 2 и матрицы подсчета BLOSUM62; или любую их эквивалентную программу. «Эквивалентная программа» включает в себя любую программу сравнения последовательностей, которая для любых двух последовательностей вопроса генерирует выравнивание, имеющее идентичные нуклеотидные или аминокислотные совпадения остатков, и идентичность последовательности идентичного процента по сравнению с соответствующим выравниванием, генерируемым GAP версия 10.[000132] Unless otherwise noted, sequence identity/similarity values include those generated using GAP version 10 using the following parameters: % identity and % similarity for the nucleotide sequence using a GAP Weight of 50 and a Length Weight of 3, and the nwsgapdna.cmp scoring matrix; % identity and % similarity for the amino acid sequence using a GAP Weight of 8 and a Length Weight of 2, and the BLOSUM62 scoring matrix; or any equivalent program thereof. An "equivalent program" includes any sequence comparison program that, for any two question sequences, generates an alignment having identical nucleotide or amino acid residue matches and an identical percent sequence identity compared to the corresponding alignment generated by GAP version 10.

[000133] Термин «существенная идентичность», используемый в данном документе, для обозначения общих эпитопов, включает последовательности, которые содержат идентичные остатки в соответствующих положениях. Например, две последовательности можно считать практически идентичными, если по меньшей мере 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более их соответствующих остатков идентичны по соответствующему участку остатков. Соответствующим участком может быть, например, полная последовательность или может быть по меньшей мере 5, 10, 15 или более остатков.[000133] The term "substantial identity" as used herein to refer to common epitopes includes sequences that contain identical residues at corresponding positions. For example, two sequences may be considered substantially identical if at least 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or more of their corresponding residues are identical over a corresponding region of residues. The corresponding region may be, for example, the entire sequence, or may be at least 5, 10, 15, or more residues.

[000134] Термин «консервативная замена аминокислоты» относится к замене аминокислоты, которая обычно присутствует в этой последовательности с другой аминокислотой с аналогичным размером, зарядом или полярностью. Примеры консервативных замен включают замену неполярного (гидрофобного) остатка, такого как изолейцин, валин или лейцин, для другого неполярного остатка. Аналогично, примеры консервативных замен включают замены одного полярного (гидрофильного) остатка на другой, например, между аргинином и лизином, между глутамином и аспарагином или между глицином и сери ном. Кроме того, замена основного остатка, такого как лизин, аргинин или гистидин на другой, или замена одного кислотного остатка, такого как аспарагиновая кислота или глутаминовая кислота на другой кислотный остаток, являются дополнительными примерами консервативных замен. Примеры неконсервативных замен включают замену неполярного (гидрофобного) аминокислотного остатка, такого как изолейцин, валин, лейцин, аланин или метионин на полярный (гидрофильный) остаток, такого как цистеин, глутамин, глутаминовая кислота или лизин и/или полярный остаток на неполярный остаток. Типичные классификации аминокислот приведены ниже.[000134] The term "conservative amino acid substitution" refers to the substitution of an amino acid that is normally present in the sequence with another amino acid of similar size, charge, or polarity. Examples of conservative substitutions include the substitution of a non-polar (hydrophobic) residue, such as isoleucine, valine, or leucine, for another non-polar residue. Similarly, examples of conservative substitutions include the substitution of one polar (hydrophilic) residue for another, such as between arginine and lysine, between glutamine and asparagine, or between glycine and serine. Additionally, the substitution of a basic residue, such as lysine, arginine, or histidine for another, or the substitution of one acidic residue, such as aspartic acid or glutamic acid for another acidic residue, are additional examples of conservative substitutions. Examples of non-conservative substitutions include the replacement of a non-polar (hydrophobic) amino acid residue such as isoleucine, valine, leucine, alanine, or methionine with a polar (hydrophilic) residue such as cysteine, glutamine, glutamic acid, or lysine and/or a polar residue with a non-polar residue. Typical amino acid classifications are given below.

[000135] Термин «зародышевая линия» применительно к последовательности нуклеиновой кислоты иммуноглобулина включает последовательность нуклеиновой кислоты, которая может быть передана потомству.[000135] The term "germline" when used in reference to an immunoglobulin nucleic acid sequence includes a nucleic acid sequence that can be transmitted to offspring.

[000136] Термин «антигенсвязывающий белок» включает любой белок, который связывается с антигеном. Примеры антигенсвязывающих белков включают антитело, антигенсвязывающий фрагмент антитела, мультиспецифическое антитело (например, биспецифическое антитело), scFV, бис-scFV, диатело, триатело, тетратело, V-NAR, VHH, VL, F(ab), F(ab)2, DVD (антигенсвязывающий белок с двойным вариабельным доменом), SVD (антигенсвязывающий белок с одним вариабельным доменом), привлекающий Т-клетки биспецифический активатор (BiTE) или Davisbody (пат. США №8586713, включенный в данный документ в качестве ссылки во всей полноте для всех целей).[000136] The term "antigen-binding protein" includes any protein that binds to an antigen. Examples of antigen-binding proteins include an antibody, an antigen-binding fragment of an antibody, a multispecific antibody (e.g., a bispecific antibody), scFV, bis-scFV, diabody, triabody, tetrabody, V-NAR, VHH, VL, F(ab), F(ab) 2 , DVD (dual variable domain antigen-binding protein), SVD (single variable domain antigen-binding protein), bispecific T cell activator (BiTE), or Davisbody (U.S. Pat. No. 8,586,713, incorporated herein by reference in its entirety for all purposes).

[000137] Термин «антиген» относится к веществу, будь то целая молекула или домен внутри молекулы, которая способна вызывать продуцирование антител со связывающей специфичностью к этому веществу. Термин антиген также включает вещества, которые в организмах-хозяевах дикого типа не будут вызывать продуцирование антител в силу самораспознавания, но могут вызвать такой ответу животного-хозяина с соответствующей генной инженерией для нарушения иммунологической толерантности.[000137] The term "antigen" refers to a substance, whether an entire molecule or a domain within a molecule, that is capable of eliciting the production of antibodies with binding specificity to that substance. The term antigen also includes substances that in wild-type host organisms will not elicit the production of antibodies by virtue of self-recognition, but can elicit such a response in a host animal that has been suitably genetically engineered to break immunological tolerance.

[000138] Термин «эпитоп» относится к сайту на антигене, с которым связывается антигенсвязывающий белок (например, антитело). Эпитоп может быть образован из смежных аминокислот или несмежных аминокислот, сопоставленных с помощью третичного сгибания одного или более белков. Эпитопы, образованные из смежных аминокислот (также известных как линейные эпитопы), обычно сохраняются при воздействии денатурирующих растворителей, тогда как эпитопы, образованные путем третичного сгибания (также называемые конформационными эпитопами), обычно теряются при обработке денатурирующими растворителями. Эпитоп обычно включает по меньшей мере 3 и более обычно по меньшей мере 5 или 8-10 аминокислот в уникальной пространственной конформации. Способы определения пространственной конформации эпитопов включают, например, рентгеновскую кристаллографию и двумерный ядерный магнитный резонанс. См., например. Epitope Mapping Protocols, in Methods in Molecular Biology, Vol.66, Glenn E. Morris, Ed. (1996), включенный в данный документ в качестве ссылки во всей полноте для всех целей.[000138] The term "epitope" refers to a site on an antigen to which an antigen-binding protein (e.g., an antibody) binds. An epitope may be formed from contiguous amino acids or non-contiguous amino acids juxtaposed by tertiary folding of one or more proteins. Epitopes formed from contiguous amino acids (also known as linear epitopes) are generally retained upon exposure to denaturing solvents, whereas epitopes formed by tertiary folding (also called conformational epitopes) are generally lost upon treatment with denaturing solvents. An epitope typically includes at least 3 and more typically at least 5 or 8-10 amino acids in a unique spatial conformation. Methods for determining the spatial conformation of epitopes include, for example, x-ray crystallography and two-dimensional nuclear magnetic resonance. See, for example, Epitope Mapping Protocols, in Methods in Molecular Biology, Vol.66, Glenn E. Morris, Ed. (1996), incorporated herein by reference in its entirety for all purposes.

[000139] Термин «ауто» при использовании в сочетании с антигенами или эпитопами описывает антигены или эпитопы, которые не были бы распознаны или были бы слабо распознаны рецепторами В-клеток члена дикого типа из видов-хозяев в силу включения в состав веществ, которые, как правило, биосинтезируются видом-хозяином или которым обычно подвергаются виды-хозяева. Такие вещества вызывают толерантность иммунной системы хозяина. Термин «чужеродный» при использовании в сочетании с антигенами или эпитопами описывает антигены или эпитопы, которые не являются аутоантигенами или аутоэпитопалли. Чужеродным антигеном является любой антиген, который обычно не продуцируется видом-хозяином.[000139] The term "auto," when used in conjunction with antigens or epitopes, describes antigens or epitopes that would not be recognized or would be weakly recognized by the B cell receptors of a wild-type member of the host species due to the inclusion of substances that are normally biosynthesized by the host species or to which the host species is normally exposed. Such substances induce tolerance by the host immune system. The term "foreign," when used in conjunction with antigens or epitopes, describes antigens or epitopes that are not self-antigens or autoepitopes. A foreign antigen is any antigen that is not normally produced by the host species.

[000140] Термин «антитело» включает молекулы иммуноглобулина, включающие четыре полипептидные цепи, две тяжелые (Н) цепи и две легкие цепи (L), связанные между собой дисульфидными связями. Каждая тяжелая цепь содержит вариабельный домен тяжелой цепи и константный участок тяжелой цепи (СН). Константный участок тяжелой цепи состоит из трех доменов: CH1, CH2 и CH3. Каждая легкая цепь содержит вариабельный домен легкой цепи и константный участок легкой цепи (CL). Вариабельные домены тяжелой цепи и легкой цепи могут быть дополнительно подразделены на участки гипервариабельности, называемые участками определения комплементарности (CDR), чередующиеся с более консервативными участками, называемыми каркасными участками (FR). Каждый вариабельный домен тяжелой и легкой цепей содержит три CDR и четыре FR, расположенных от аминоконца до карбоксиконца в следующем порядке: FR1, CDR1, FR2, CDR2, FR3, CDR3, FR4 (CDR тяжелой цепи могут быть сокращены как HCDR1, HCDR2 и HCDR3; CDR легкой цепи могут быть сокращены как LCDR1, LCDR2 и LCDR3). Термин «высокоаффинное» антитело относится к антителу, которое имеет KD по отношению к его эпитопу-мишени около 10-9 М или ниже (например, около 1×10-9М, 1×10-10М, 1×10-11М, или около 1×10-12 М). В одном варианте осуществления изобретения, KD измеряется поверхностным плазмонным резонансом, например, BIACORE™; в другом варианте осуществления изобретения, KD измеряется с помощью ИФА.[000140] The term "antibody" includes immunoglobulin molecules comprising four polypeptide chains, two heavy (H) chains and two light (L) chains, linked together by disulfide bonds. Each heavy chain contains a heavy chain variable domain and a heavy chain constant region ( CH ). The heavy chain constant region is composed of three domains: CH1 , CH2 , and CH3 . Each light chain contains a light chain variable domain and a light chain constant region ( CL ). The heavy chain and light chain variable domains can be further subdivided into regions of hypervariability, termed complementarity determining regions (CDRs), alternating with more conserved regions, termed framework regions (FRs). Each variable domain of the heavy and light chains contains three CDRs and four FRs, arranged from amino terminus to carboxy terminus in the following order: FR1, CDR1, FR2, CDR2, FR3, CDR3, FR4 (the heavy chain CDRs may be abbreviated as HCDR1, HCDR2, and HCDR3; the light chain CDRs may be abbreviated as LCDR1, LCDR2, and LCDR3). The term "high affinity" antibody refers to an antibody that has a K D relative to its target epitope of about 10 -9 M or lower (e.g., about 1 x 10 -9 M, 1 x 10 -10 M, 1 x 10 -11 M, or about 1 x 10 -12 M). In one embodiment, the K D is measured by surface plasmon resonance, such as BIACORE™; in another embodiment of the invention, K D is measured using ELISA.

[000141] Термин «тяжелая цепь» или «тяжелая цепь иммуноглобулина» включает последовательность тяжелой цепи иммуноглобулина, включая последовательность константного участка тяжелой цепи иммуноглобулина, из любого организма. Вариабельные домены тяжелой цепи включают в себя три CDR тяжелой цепи и четыре участка FR, если не указано иное. Фрагменты тяжелых цепей включают CDR, CDR и FR и их комбинации. Типичная тяжелая цепь имеет, следуя вариабельному домену (от N-конца до С-конца), домен CH1, шарнир, домен CH2 и домен CH3. Функциональный фрагмент тяжелой цепи включает фрагмент, который способен специфически распознавать эпитоп (например, распознавать эпитоп с KD в микромолярном, наномолярном или пикомолярном диапазоне), который способен экспрессироваться и секретироваться из клетки, и который содержит по меньшей мере один CDR. Вариабельные домены тяжелой цепи кодируются нуклеотидной последовательностью вариабельного участка, которая обычно содержит сегменты VH, DH и JH, полученные из репертуара сегментов VH, DH и JH, присутствующих в зародышевой линии. Последовательности, местоположения и номенклатуры сегментов V, D и J тяжелой цепи для различных организмов можно найти в базе данных IMGT, доступной через Интернет (www) по URL-адресу «imgt.org».[000141] The term "heavy chain" or "immunoglobulin heavy chain" includes an immunoglobulin heavy chain sequence, including an immunoglobulin heavy chain constant region sequence, from any organism. The variable domains of a heavy chain include three heavy chain CDRs and four FR regions, unless otherwise specified. Fragments of heavy chains include CDRs, CDRs, and FRs, and combinations thereof. A typical heavy chain has, following the variable domain (from the N-terminus to the C-terminus), a CH1 domain, a hinge, a CH2 domain, and a CH3 domain. A functional fragment of a heavy chain includes a fragment that is capable of specifically recognizing an epitope (e.g., recognizing an epitope with a KD in the micromolar, nanomolar, or picomolar range), that is capable of being expressed and secreted from a cell, and that contains at least one CDR. The variable domains of the heavy chain are encoded by the variable region nucleotide sequence, which typically contains V H , D H , and J H segments derived from the repertoire of V H , D H , and J H segments present in the germline. The sequences, locations, and nomenclatures of the heavy chain V, D, and J segments for various organisms can be found in the IMGT database, accessible via the Internet (www) at the URL "imgt.org".

[000142] Термин «легкая цепь» включает в себя последовательность легкой цепи иммуноглобулина из любого организма, и, если не указано иное, в него входят каппа (к) и лямбда (λ) легкие цепи человека и VpreB, а также суррогатные легкие цепи. Вариабельные домены легкой цепи обычно включают три CDR легкой цепи и четыре каркасных (FR) участка, если не указано иное. Как правило, полноразмерная легкая цепь включает от аминоконца до карбоксильного конца вариабельный домен, который включает FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4, и аминокислотную последовательность константного участка легкой цепи. Вариабельные домены легкой цепи кодируются нуклеотидной последовательностью вариабельного участка легкой цепи, которая обычно содержит сегменты гена VL легкой цепи и легкой цепи, полученные из репертуара сегментов генов легкой цепи V и J, присутствующих в зародышевой линии. Последовательности, местоположения и номенклатуры генных сегментов V и J легкой цепи для различных организмов можно найти в базе данных IMGT, доступной через Интернет (www) по URL-адресу «imgt.org». Легкие цепи включают те, которые, например, не селективно связываются либо с первым, либо со вторым эпитопом, селективно связанным эпитоп-связывающим белком, в котором они появляются. Легкие цепи также включают те, которые связывают и распознают, или помогают тяжелой цепи связывать и распознавать один или более эпитопов, селективно связанных эпитоп-связывающим белком, в котором они появляются.[000142] The term "light chain" includes the sequence of an immunoglobulin light chain from any organism and, unless otherwise specified, includes the human kappa (k) and lambda (λ) light chains and VpreB, as well as surrogate light chains. The variable domains of a light chain typically include three light chain CDRs and four framework (FR) regions, unless otherwise specified. Typically, a full-length light chain includes, from the amino terminus to the carboxyl terminus, a variable domain that includes FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4, and the amino acid sequence of the light chain constant region. The variable domains of a light chain are encoded by the nucleotide sequence of the light chain variable region, which typically contains light chain VL and light chain gene segments derived from a repertoire of light chain V and J gene segments present in the germline. The sequences, locations, and nomenclatures of the V and J light chain gene segments for various organisms can be found in the IMGT database, accessible via the Internet (www) at the URL "imgt.org". Light chains include those that, for example, do not selectively bind to either the first or second epitope selectively bound by the epitope-binding protein in which they appear. Light chains also include those that bind and recognize, or assist the heavy chain in binding and recognizing, one or more epitopes selectively bound by the epitope-binding protein in which they appear.

[000143] Термин «комплементарный определяющий участок» или «CDR», как используется в данном документе, включает аминокислотную последовательность, кодируемую нуклеотидной последовательностью генов иммуноглобулина организма, которая обычно (т.е. у животного дикого типа) появляется между двумя каркасными участками в вариабельном участке легкой или тяжелой цепи молекулы иммуноглобулина (например, антитела или рецептора Т-клетки). CDR может кодироваться, например, последовательностью зародышевой линии или перестроенной последовательностью и, например, наивной или зрелой В-клеткой, или Т-клеткой. CDR может быть соматически мутирована (например, варьироваться от последовательности, кодируемой в зародышевой линии животного), гуманизироваться, и/или модифицироваться аминокислотными заменами, добавлениями или делециями. В некоторых случаях (например, для CDR3), CDR могут кодироваться двумя или более последовательностями (например, последовательностями зародышевой линии), которые не являются смежными (например, в неперестроенной последовательности нуклеиновой кислоты), но являются смежными в последовательности нуклеиновой кислоты В-клеток, например, в результате сплайсинга или соединения последовательностей (например, рекомбинации V-D-J с образованием CDR3 тяжелой цепи).[000143] The term "complementary determining region" or "CDR," as used herein, includes an amino acid sequence encoded by the nucleotide sequence of the immunoglobulin genes of an organism that normally (i.e., in a wild-type animal) appears between two framework regions in the variable region of a light or heavy chain of an immunoglobulin molecule (e.g., an antibody or a T-cell receptor). A CDR may be encoded by, for example, a germline sequence or a rearranged sequence and, for example, a naive or mature B cell or T cell. A CDR may be somatically mutated (e.g., varied from a sequence encoded in the animal's germline), humanized, and/or modified by amino acid substitutions, additions, or deletions. In some cases (e.g., for CDR3), CDRs may be encoded by two or more sequences (e.g., germline sequences) that are not contiguous (e.g., in a non-rearranged nucleic acid sequence) but are contiguous in a B cell nucleic acid sequence, e.g., as a result of splicing or joining of sequences (e.g., V-D-J recombination to form heavy chain CDR3).

[000144] Термин «неперестроенный» включает состояние локуса иммуноглобулина, в котором генные сегменты V и генные сегменты J (для тяжелых цепей, сегменты D гена) также поддерживаются отдельно, но могут быть соединены с образованием перестроенного гена V(D)J который содержит один V, (D), J репертуара V(D)J.[000144] The term "non-rearranged" includes a state of the immunoglobulin locus in which the V gene segments and J gene segments (for heavy chains, D gene segments) are also maintained separately, but can be joined to form a rearranged V(D)J gene that contains a single V, (D), J V(D)J repertoire.

[000145] Термин локус вариабельного участка тяжелой цепи включает в себя местоположение на хромосоме, например, хромосоме мыши, где найдены последовательности ДНК вариабельного участка тяжелой цепи (VH), тяжелой цепи (DH) и тяжелой цепи (JH).[000145] The term heavy chain variable region locus includes the location on a chromosome, such as a mouse chromosome, where the heavy chain variable region (V H ), heavy chain (D H ), and heavy chain (J H ) DNA sequences are found.

[000146] Термин «вариабельный участок легкой цепи каппа» включает в себя местоположение на хромосоме, например, хромосоме мыши, где найдены последовательности ДНК дикого типа к вариабельного (Vk) и к-соединенного (Jk) участка.[000146] The term "kappa light chain variable region" includes the location on a chromosome, such as a mouse chromosome, where the wild-type k variable (Vk) and k-linked (Jk) region DNA sequences are found.

[000147] Термин «вариабельный участок легкой цепи лямбда» включает в себя местоположение на хромосоме, например, хромосоме мыши, где найдены последовательности ДНК дикого типа λ вариабельного (Vλ) и λ-соединенного (Jλ) участка.[000147] The term "lambda light chain variable region" includes the location on a chromosome, such as a mouse chromosome, where the wild-type λ variable (Vλ) and λ-joint (Jλ) region DNA sequences are found.

[000148] «Гомологичная» последовательность (например, последовательность нуклеиновой кислоты) включает последовательность, которая либо идентична, либо практически аналогична известной эталонной последовательности, так что она на, например, по меньшей мере 50%, по меньшей мере 55%, по меньшей мере 60%, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100% идентична известной эталонной последовательности. Гомологичные последовательности могут включать, например, ортологическую последовательность и паралогичные последовательности. Гомологичные гены, например, обычно происходят от общей последовательности предковых ДНК, либо через событие видообразования (ортологичные гены), либо событие генетического дублирования (паралогичные гены). «Ортологичные» гены включают гены у разных видов, которые эволюционировали из общего предкового гена с помощью видообразования. Ортологи обычно сохраняют ту же функцию в процессе эволюции. «Паралогичные» гены включают гены, связанные с дублированием в геноме. Паралоги могут развивать новые функции в процессе эволюции.[000148] A "homologous" sequence (e.g., a nucleic acid sequence) includes a sequence that is either identical to or substantially similar to a known reference sequence, such that it is, for example, at least 50%, at least 55%, at least 60%, at least 65%, at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or 100% identical to a known reference sequence. Homologous sequences can include, for example, an orthologous sequence and paralogous sequences. Homologous genes, for example, are usually descended from a common ancestral DNA sequence, either through a speciation event (orthologous genes) or a genetic duplication event (paralogous genes). "Orthologous" genes include genes in different species that have evolved from a common ancestral gene through speciation. Orthologs typically retain the same function during evolution. "Paralogous" genes include genes that are associated with duplication in the genome. Paralogs may develop new functions during evolution.

[000149] Термин «in vitro» включает искусственные окружающие среды и процессы или реакции, которые происходят в искусственной окружающей среде (например, тестовой пробирке). Термин «in vivo» включает природные окружающие среды (например, клетку или организм, или тело), а также процессы или реакции, которые происходят в естественной окружающей среде. Термин «ех vivo» включает клетки, которые были удалены из тела индивидуума, и процессы или реакции, которые происходят в таких клетках.[000149] The term "in vitro" includes artificial environments and processes or reactions that occur in an artificial environment (e.g., a test tube). The term "in vivo" includes natural environments (e.g., a cell or organism, or a body), as well as processes or reactions that occur in a natural environment. The term "ex vivo" includes cells that have been removed from the body of an individual and processes or reactions that occur in such cells.

[000150] Термин «гибрид» включает клетки или линии, которые имеют одну или более изменений последовательности (например, имеют аллельную вариацию) в одном или более геномных локусах-мишенях между первой и второй хромосомами в гомологичной паре хромосом. Например, гибридные клетки могут быть получены из потомства спаривания между двумя генетически несхожими родителями (т.е. скрещивание между родителями, которые отличаются одним или более генами). Например, гибрид может быть сгенерирован путем скрещивания двух отдельных инбредных линий (т.е. линий, выведенных для генетической гомогенности). Все люди считаются гибридами.[000150] The term "hybrid" includes cells or lines that have one or more sequence changes (e.g., have an allelic variation) at one or more target genomic loci between the first and second chromosomes in a homologous pair of chromosomes. For example, hybrid cells can be produced from the offspring of a mating between two genetically dissimilar parents (i.e., a cross between parents that differ in one or more genes). For example, a hybrid can be generated by crossing two separate inbred lines (i.e., lines bred for genetic homogeneity). All humans are considered hybrids.

[000151] Композиции или способы, «содержащие» или «включающие» один или более перечисленных элементов, могут включать в себя другие элементы, которые конкретно не перечислены. Например, композиция, которая включает «содержит» или «включает» белок, может содержать белок отдельно или в комбинации с другими ингредиентами.[000151] Compositions or methods that "comprise" or "include" one or more listed elements may include other elements that are not specifically listed. For example, a composition that "comprises" or "includes" a protein may include the protein alone or in combination with other ingredients.

[000152] Обозначение диапазона значений включает все целые числа внутри или определяющие диапазон и все поддиапазоны, определенные целыми числами в пределах диапазона.[000152] A range designation includes all integers within or defining the range and all subranges defined by integers within the range.

[000153] Если иное не понимается из контекста, термин «около» охватывает значения в пределах стандартной погрешности измерения (например, SEM) указанного значения.[000153] Unless otherwise clear from the context, the term "about" includes values within the standard error of measurement (e.g., SEM) of the stated value.

[000154] Единственные формы статей включают многие ссылки, если контекст явно не диктует иное. Например, термин «белок Cas9» или «по меньшей мере один белок Cas9» может включать в себя множество белков Cas9, включая их смеси.[000154] Single article forms include multiple references unless the context clearly dictates otherwise. For example, the term "a Cas9 protein" or "at least one Cas9 protein" may include multiple Cas9 proteins, including mixtures thereof.

[000155] Статистически значимые средние р≤0,05.[000155] Statistically significant means p≤0.05.

ПОДРОБНОЕ ОПИСАНИЕDETAILED DESCRIPTION

I. ОбзорI. Overview

[000156] В данном документе представлены композиции и улучшенные способы получения антигенсвязывающих белков (например, антител), которые связывают эпитоп с представляющим интерес чужеродным антигеном-мишенью (например, представляющим интерес антигеном-мишенью человека), который обладает общим эпитопом с аутоантигеном или является гомологичным аутоантигеном. Такие способы включают снижение толерантности чужеродного антигена у не относящихся к человеку животных, таких как грызуны (например, мыши или крысы) (необязательно содержащие в их зародышевой линии гуманизированные локусы тяжелой и/или легкой цепи иммуноглобулина) с использованием двух или более направляющих РНК (гРНК) для создания парных двунитевых разрывов на разных сайтах в пределах одного геномного локуса-мишени. Необязательно, клетка, содержащая геномный локус-мишень, представляет собой гибридную клетку, и способы дополнительно включают в себя выбор участка-мишени в геномном локусе-мишени для претерпевания нацеленной генетической модификации, так что участок-мишень имеет более высокую степень идентичности последовательности между соответствующими первыми и вторыми хромосомами в гомологичной хромосомной паре по отношению ко всем или части остатка геномного локуса-мишени. Такие спаренные двунитевые разрывы влияют на экспрессию аутоантигена для уменьшения или устранения экспрессии аутоантигена или для уменьшения или исключения экспрессии эпитопа из аутоантигена, который является общим с чужеродным антигеном. Такие генетически модифицированные отличные от человека животные, содержащие локусы тяжелой и легкой цепи гуманизированного иммуноглобулина, а также содержащие такую мутацию в геномном локусе-мишени, могут затем быть иммунизированы чужеродным антигеном, отличное от человека животное, может поддерживаться в условиях достаточных для того, чтобы отличное от человека животное обеспечивало иммунный ответ на чужеродный антиген, и антигенсвязывающий белок, который связывает чужеродный антиген, может быть получен от отличного от человека животного или клетки от отличного от человека животного.[000156] Disclosed herein are compositions and improved methods for producing antigen-binding proteins (e.g., antibodies) that bind an epitope to a foreign target antigen of interest (e.g., a human target antigen of interest) that shares an epitope with a self-antigen or is homologous to a self-antigen. Such methods include reducing tolerance to a foreign antigen in non-human animals, such as rodents (e.g., mice or rats) (optionally containing humanized heavy and/or light chain immunoglobulin loci in their germline) using two or more guide RNAs (gRNAs) to create paired double-strand breaks at different sites within a single genomic target locus. Optionally, the cell comprising the target genomic locus is a hybrid cell, and the methods further include selecting a target region in the target genomic locus to undergo targeted genetic modification, such that the target region has a higher degree of sequence identity between the corresponding first and second chromosomes in a homologous chromosome pair relative to all or a portion of the remainder of the target genomic locus. Such paired double-strand breaks affect the expression of the self-antigen to reduce or eliminate the expression of the self-antigen or to reduce or eliminate the expression of an epitope from the self-antigen that is common with a foreign antigen. Such genetically modified non-human animals containing the humanized immunoglobulin heavy and light chain loci and also containing such a mutation at the target genomic locus may then be immunized with a foreign antigen, the non-human animal may be maintained under conditions sufficient for the non-human animal to mount an immune response to the foreign antigen, and the antigen-binding protein that binds the foreign antigen may be obtained from the non-human animal or a cell from the non-human animal.

[000157] Мышей, используемых для получения антител против человеческих антигенов, таких как мыши, содержащие в своих зародышевых линиях локусы тяжелой и/или легкой цепи гуманизированного иммуноглобулина, обычно получают из комбинации линий, которая включает BALB/c из-за увеличения емкости линий BALB/c для производства разнообразного репертуара антител по сравнению с другими линиями мыши. Однако по сравнению с эмбриональными стволовыми клетками (ЭС), обычно используемыми для генерации направленных генетических модификаций у мышей (например, описанные в данном документе клетки F1H4 (VGF1)), ЭС-клетки, полученные из таких линий, продуцирующих антитела мышей, как правило, имеют уменьшенную способность к нацеливанию на культуру, и/или продуцирующих мышей поколения F0, имеющих нацеленную генетическую модификацию и передающих нацеленную модификацию через зародышевую линию. Следовательно, обычные способы генерации целевых нокаутных мышей для преодоления толерантности включают в себя несколько циклов размножения и/или последовательного нацеливания, при этом весь процесс доставки мышам, гомозиготным по нулевой аллели в представляющий интерес мишени, и готовым к иммунизации, занимает около 15-16 месяцев.[000157] Mice used to produce antibodies against human antigens, such as mice containing humanized immunoglobulin heavy and/or light chain loci in their germ lines, are typically derived from a combination of strains that includes BALB/c due to the increased capacity of BALB/c strains to produce a diverse antibody repertoire compared to other mouse strains. However, compared to embryonic stem (ES) cells typically used to generate targeted genetic modifications in mice (e.g., the F1H4 (VGF1) cells described herein), ES cells derived from such antibody-producing mouse strains typically have a reduced ability to be targeted in culture and/or produce F0-generation mice that have a targeted genetic modification and transmit the targeted modification through the germ line. Therefore, conventional methods for generating targeted knockout mice to overcome tolerance involve multiple rounds of breeding and/or sequential targeting, with the entire process of delivering mice homozygous for the null allele of the target of interest and ready for immunization taking approximately 15-16 months.

[000158] Описанные в данном документе способы выгодно уменьшают это время до примерно 4-5 месяцев (и щенки мышей, гомозиготных по нулевой аллели в представляющей интерес мишени, могут быть доставлены через ~ 3 месяца). В дополнение к более коротким временным рамкам, описанные в данном документе способы уменьшают количество раундов электропорации, необходимых для получения гомозиготных модификаций, уменьшают количество пассажей и время в культуре, уменьшают количество необходимых клеток, и упрощают процесс из-за того, что нацеливания векторов не требуется, а скринирование соответственно упрощается. Способы, описанные в данном документе, преимущественно приводят к увеличению разнообразия антител после иммунизации с представляющим интерес чужеродным антигеном, из-за увеличения использования тяжелой цепи и легкой цепи V-генных сегментов по сравнению с мышами, у которых экспрессия аутоантигена не отменяется. Кроме того, описанные в данном документе способы приводят к образованию антител против большего разнообразия эпитопов после иммунизации с представляющим интерес чужеродным антигеном, из-за образования антител, которые перекрестно реагируют с соответствующим аутоантигеном (т.е. антителами, которые связывают эпитопы, которые перекрываются между аутоантигеном и представляющим интерес чужеродным антигеном), тем самым обеспечивая получение большего количества антител против представляющего интерес чужеродного антигена.[000158] The methods described herein advantageously reduce this time to approximately 4-5 months (and pups of mice homozygous for the null allele in the target of interest can be delivered in ~3 months). In addition to the shorter time frame, the methods described herein reduce the number of rounds of electroporation required to obtain homozygous modifications, reduce the number of passages and time in culture, reduce the number of cells required, and simplify the process because targeting of vectors is not required and screening is correspondingly simplified. The methods described herein advantageously result in increased antibody diversity following immunization with a foreign antigen of interest, due to increased utilization of the heavy chain and light chain V gene segments compared to mice in which self-antigen expression is not abolished. In addition, the methods described herein result in the formation of antibodies against a greater variety of epitopes following immunization with a foreign antigen of interest, due to the formation of antibodies that cross-react with the corresponding self-antigen (i.e., antibodies that bind epitopes that overlap between the self-antigen and the foreign antigen of interest), thereby providing for the production of more antibodies against the foreign antigen of interest.

II. Способы модификации геномного локуса-мишени для преодоления толерантностиII. Methods of modification of the genomic target locus to overcome tolerance

[000159] Иммунизация отличных от человека животных (например, грызунов, таких как мыши или крысы), содержащих в их зародышевой линии локусы тяжелой и/или легкой цепи гуманизированного иммуноглобулина, «не своим» белком является широко используемым способом для получения специфических антигенсвязывающих белков, таких как моноклональные антитела. Подход к иммунизации является привлекательным, поскольку он имеет потенциал для обеспечения высокоаффинных антигенсвязывающих белков, которые созрели in vivo и могут быть экономически эффективными и эффективными во времени. Этот подход, однако, зависит от расхождения в последовательности между нативными белками у отличного от человека животного и иммунизированного белка, чтобы иммунная система отличного от человека животного могла распознавать иммуноген как не свой (то есть, чужеродный).[000159] Immunization of non-human animals (e.g., rodents such as mice or rats) containing humanized immunoglobulin heavy and/or light chain loci in their germline with a "non-self" protein is a widely used method for producing specific antigen-binding proteins such as monoclonal antibodies. The immunization approach is attractive because it has the potential to provide high-affinity antigen-binding proteins that have matured in vivo and can be cost-effective and time-efficient. This approach, however, depends on sequence divergence between the native proteins in the non-human animal and the immunized protein so that the immune system of the non-human animal can recognize the immunogen as non-self (i.e., foreign).

[000160] В-клеточные рецепторы собирают посредством серии событий рекомбинации из упорядоченного расположения генных сегментов (например, V, D и J), и эта сборка генных сегментов, как известно, является неточной и генерирует рецепторы, имеющие аффиность к различным антигенам, включая аутоантигены. Несмотря на эту способность генерировать В-клеточные рецепторы, которые связывают аутомолекулы, иммунная система оснащена несколькими механизмами аутотолерантности, чтобы избежать развития и расширения таких аутореактивных рецепторов В-клеток и отличить себя от не себя, тем самым предотвращая аутоиммунную реакцию. См., например, Shlomchik (2008) Immunity 28: 18-28 и Kumar and Mohan (2008) 40 (3): 208-23, каждый из которых включен в настоящее описание посредством ссылки во всей их полноте для всех целей. Таким образом, генерация человеческих антител у отличных от человека животных, имеющих локусы гуманизированного иммуноглобулина против человеческих антигенов, имеющих высокую степень гомологии (например, структурную гомологию или гомологию последовательностей) с аутоантигенам и отличного от человека животного, может быть сложной задачей для иммунологической толерантности. Поскольку функционально важные участки белков, как правило, сохраняются у разных видов, иммунологическая толерантность к аутоантигенам часто создает проблему для получения антител к этим ключевым эпитопам. Иммунизация отличных от человека животных (например, грызунов, таких как мыши или крысы) чужеродными (например, человеческими) антигенами, которые очень похожи или «гомологичны», дает слабые или несуществующие ответы на антитела и, следовательно, затрудняет получение антигенсвязывающих белков (например, антитела) со связыванием, направленным на такие человеческие антигены. В качестве примера, количество идентичности последовательности, являющейся общей с эндогенным белком (аутоантиген) и чужеродным антигеном-мишенью, может составлять по меньшей мере 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97% 98%, 99% или 100% идентичности последовательности, так что иммунная система не распознает антиген-мишень как чужеродный. Например, общие эпитопы между чужеродным антигеном и аутоантигеном у отличного от человека животного могут сделать установку эффективного иммунного ответа против чужеродного антигена у проблемного отличного от человека животного, потому что иммунологическая толерантность истощает и/или удаляет В-клетки, которые экспрессируют нейтрализующие антитела против чужеродного антигена. Чтобы преодолеть эту толерантность и получить ллоноклональные антитела, которые связываются с аутоантигенами, или их гомологи (например, человеческие гомологи) у отличных от человека животных, могут быть получены специфические генетически модифицированные или нокаутные отличные от человека животные для удаления генов (или представляющих интерес общих эпитопов), кодирующих белок отличных от человека животных, который разделяет общую значительную гомологию и/или является высококонсервативным с человеческими аналогами генов, кодирующих антиген, используемый для иммунизации. См., например, патент США №7119248, включенный в данный документ в качестве ссылки во всей своей полноте для всех целей. Однако создание таких отличных от человека животных, может быть дорогостоящим и время затратным.[000160] B cell receptors are assembled through a series of recombination events from an ordered arrangement of gene segments (e.g., V, D, and J), and this assembly of gene segments is known to be imprecise and generates receptors that have affinity for a variety of antigens, including self-antigens. Despite this ability to generate B cell receptors that bind self-molecules, the immune system is equipped with several self-tolerance mechanisms to avoid the development and expansion of such self-reactive B cell receptors and to distinguish self from non-self, thereby preventing an autoimmune reaction. See, e.g., Shlomchik (2008) Immunity 28: 18-28 and Kumar and Mohan (2008) 40(3): 208-23, each of which is incorporated herein by reference in its entirety for all purposes. Thus, generating human antibodies in non-human animals that have humanized immunoglobulin loci against human antigens that have a high degree of homology (e.g., structural or sequence homology) to self-antigens of the non-human animal may pose a challenge for immunological tolerance. Because functionally important regions of proteins are typically conserved across species, immunological tolerance to self-antigens often poses a challenge for generating antibodies to these key epitopes. Immunization of non-human animals (e.g., rodents such as mice or rats) with foreign (e.g., human) antigens that are highly similar or "homologous" yields weak or non-existent antibody responses and therefore complicates the generation of antigen-binding proteins (e.g., antibodies) with binding directed to such human antigens. As an example, the amount of sequence identity shared between an endogenous protein (self-antigen) and a foreign target antigen can be at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% sequence identity, such that the immune system does not recognize the target antigen as foreign. For example, common epitopes between a foreign antigen and a self-antigen in a non-human animal can enable the mounting of an effective immune response against the foreign antigen in a problematic non-human animal because immunological tolerance depletes and/or removes B cells that express neutralizing antibodies against the foreign antigen. To overcome this tolerance and produce polyclonal antibodies that bind to self-antigens or their homologs (e.g., human homologs) in non-human animals, specific non-human animals can be genetically modified or knocked out to remove genes (or common epitopes of interest) encoding a protein in non-human animals that share significant homology and/or are highly conserved with the human counterparts of the genes encoding the antigen used for immunization. See, for example, U.S. Patent No. 7,119,248, incorporated herein by reference in its entirety for all purposes. However, creating such non-human animals can be expensive and time-consuming.

[000161] Обычные способы для создания целевых нокаутных мышей для преодоления толерантности включают в себя несколько раундов разведения и/или последовательного нацеливания. Мышей, используемых для получения антител против человеческих антигенов, таких как мыши, содержащие в своих зародышевых линиях локусы тяжелой и/или легкой цепи гуманизированного иммуноглобулина (например, мыши VELOCIMMUNE®, которые гомозиготными гуманизированы как в локусах IgH, так и Igκ), обычно получают из комбинации линий, которая включает BALB/c из-за увеличения емкости линий BALB/c для производства разнообразного репертуара антител по сравнению с другими линиями мыши. Однако по сравнению с эмбриональными стволовыми клетками (ЭС), обычно используемыми для генерации нацеленных генетических модификаций у мышей (например, описанные в данном документе клетки F1H4 (VGF1), которые состоят из 50% линии 129SvS6 и 50% линии C57BL/6N), ЭС-клетки, полученные из таких линий продуцирующих антитела мышей, как правило, имеют уменьшенную способность к нацеливанию на культуру, и/или продуцирующих мышей поколения F0, имеющих нацеленную генетическую модификацию и передающих целевую модификацию через зародышевую линию. Таким образом, традиционный подход к нарушению иммунологической толерантности у мышей, продуцирующих антитела, таких как мыши VELOCIMMUNE®, включает в себя сначала нацеливание на ген, кодирующий аутоантиген в линии ЭС клеток (например, F1H4), который более восприимчив к нацеливанию и передаче целевой модификации через зародышевую линию. При таком подходе создаются большие направленные векторы (LTVEC), в клетках F1H4 ЭС создаются нокаутные (нулевые) аллели, и генерируются F0-мыши, несущие гетерозиготную нокаутную мутацию в интересующей мишени (типичные временные рамки 5 месяцев). Мыши VELOCIMMUNE® затем размножаются для получения F0 мышей, несущих гетерозиготную нокаутную мутацию в представляющий интерес мишени. Чтобы получать трижды гомозиготных мышей (гомозиготных нулевых по интересующей мишени и гомозиготных гуманизированных как IgH, так и Igκ), подходящих для иммунизации, требуются еще два поколения разведения. Весь процесс занимает приблизительно от 15 до 16 месяцев (см., например, фигуру 1) и более эффективен, чем описанный ниже подход последовательного нацеливания (см., например, фигуру 2).[000161] Conventional methods for generating targeted knockout mice to overcome tolerance involve multiple rounds of breeding and/or sequential targeting. Mice used to produce antibodies against human antigens, such as mice containing humanized immunoglobulin heavy and/or light chain loci in their germ lines (e.g., VELOCIMMUNE® mice that are homozygous humanized at both the IgH and Igκ loci), are typically derived from a combination of strains that includes BALB/c due to the increased capacity of BALB/c strains to produce a diverse antibody repertoire compared to other mouse strains. However, compared to embryonic stem cells (ES) typically used to generate targeted genetic modifications in mice (e.g., the F1H4 (VGF1) cells described herein, which are composed of 50% 129SvS6 and 50% C57BL/6N), ES cells derived from such antibody-producing mouse lines typically have reduced targeting capacity in culture and/or produce F0-generation mice that have a targeted genetic modification and transmit the targeted modification through the germ line. Thus, the traditional approach to breaking immunological tolerance in antibody-producing mice, such as VELOCIMMUNE ® mice, involves first targeting the gene encoding the self-antigen in an ES cell line (e.g., F1H4), which is more susceptible to targeting and transmitting the targeted modification through the germ line. In this approach, large targeting vectors (LTVECs) are created, knockout (null) alleles are generated in F1H4 ES cells, and F0 mice carrying a heterozygous knockout mutation in the target of interest are generated (typical time frame 5 months). The VELOCIMMUNE ® mice are then bred to produce F0 mice carrying a heterozygous knockout mutation in the target of interest. Two further generations of breeding are required to produce triply homozygous mice (homozygous null for the target of interest and homozygous humanized for both IgH and Igκ) suitable for immunization. The entire process takes approximately 15 to 16 months (see, e.g., Figure 1) and is more efficient than the sequential targeting approach described below (see, e.g., Figure 2).

[000162] Альтернативно, большой нацеливающий вектор (LTVEC) может быть разработан и сконструирован, а затем электропорирован в стволовые эмбриональные клетки (ЭС), полученные из мышей, продуцирующих антитела (например, мыши VELOCIMMUNE® или мыши VELOCIMMUNE®, содержащие функциональный эктопический ген мыши Adam6 («Мыши VI-3")), чтобы получить гетерозиготную модификацию в эндогенном гене, кодирующем аутоантиген, который является гомологичным или обладающий общим представляющим интерес эпитопом с антигеном-мишенью. Затем проводится второй раунд нацеливания для создания гомозиготной модификации. Несмотря на меньшую затрату времени, чем описанный выше подход к размножению, этот процесс все еще может потребовать много времени, занимая приблизительно от 9 до 10 месяцев для создания F0 мыши, готовой для иммунизации антигеном-мишенью (см., например, фигуру 2). Кроме того, такие способы требуют многих раундов электропорации и более длительных периодов культивирования с большим количеством пассажей, все из которых приводят к уменьшению плюрипотентности и уменьшенной способности генерировать F0 мышей для генерации антигенсвязывающих белков. См., например, Buehr et al. (2008) Cell 135:1287-1298; Li et al. (2008) Cell 135(7): 1299-1310; и Liu et al. (1997) Dev. Dyn. 209: 85-91, каждый из которых включен в настоящее описание посредством ссылки во всей их полноте для всех целей.[000162] Alternatively, a large targeting vector (LTVEC) can be designed and constructed and then electroporated into embryonic stem cells (ES) derived from antibody-producing mice (e.g., VELOCIMMUNE® mice or VELOCIMMUNE® mice containing a functional ectopic mouse Adam6 gene (“VI-3 mice”)) to generate a heterozygous modification in an endogenous gene encoding a self-antigen that is homologous to, or shares an epitope of interest with, the target antigen. A second round of targeting is then performed to generate the homozygous modification. Although less time-consuming than the expansion approach described above, this process can still be time-consuming, taking approximately 9 to 10 months to generate an F0 mouse ready for immunization with the target antigen (see, e.g., Figure 2). In addition, such methods require multiple rounds of electroporation and more prolonged periods of culture with high passage numbers, all of which result in decreased pluripotency and a diminished ability to generate F0 mice to generate antigen-binding proteins. See, e.g., Buehr et al. (2008) Cell 135:1287–1298; Li et al. (2008) Cell 135(7): 1299–1310; and Liu et al. (1997) Dev. Dyn. 209: 85–91, each of which is hereby incorporated by reference in its entirety for all purposes.

[000163] Описанные в данном документе способы выгодно уменьшают это время до примерно 4-5 месяцев (см., например, фигуру 3; и щенки мышей, гомозиготных по нулевой аллели в представляющей интерес мишени, могут быть доставлены через ~ 3 месяца, но затем выдерживаются в течение 4-5 недель до иммунизации). В дополнение к более коротким временным рамкам, описанные в данном документе способы уменьшают количество раундов электропорации и необходимых для получения гомозиготных модификаций, уменьшают количество пассажей и время в культуре, и уменьшают количество необходимых клеток. Скрининг более прост и упрощен, потому что, например, не требуется зондов усиления аллели, и калибровки числа копий не требуется. Способы, описанные в данном документе, также приводят к увеличению разнообразия антител после иммунизации с представляющим интерес чужеродным антигеном, из-за увеличения использования тяжелой цепи и легкой цепи V-генных сегментов по сравнению с мышами, у которых экспрессия аутоантигена не отменяется. Кроме того, описанные в данном документе способы могут приводить к образованию антител против большего разнообразия эпитопов после иммунизации с представляющим интерес чужеродным антигеном, из-за образования антител, которые перекрестно реагируют с соответствующим аутоантигеном (т.е. антителами, которые связывают эпитопы, которые перекрываются между аутоантигеном и представляющим интерес чужеродным антигеном), тем самым обеспечивая получение большего количества антител против представляющего интерес чужеродного антигена.[000163] The methods described herein advantageously reduce this time to about 4-5 months (see, for example, Figure 3; and mouse pups homozygous for the null allele in the target of interest can be delivered at ~3 months but then held for 4-5 weeks prior to immunization). In addition to the shorter time frame, the methods described herein reduce the number of rounds of electroporation and required to obtain homozygous modifications, reduce the number of passages and time in culture, and reduce the number of cells required. Screening is simpler and easier because, for example, allele amplification probes are not required, and copy number calibration is not required. The methods described herein also result in an increase in the diversity of antibodies following immunization with a foreign antigen of interest, due to an increase in the utilization of the heavy chain and light chain V gene segments compared to mice in which expression of the self-antigen is not abolished. In addition, the methods described herein can result in the formation of antibodies against a greater diversity of epitopes following immunization with a foreign antigen of interest, due to the formation of antibodies that cross-react with the corresponding self-antigen (i.e., antibodies that bind epitopes that overlap between the self-antigen and the foreign antigen of interest), thereby providing for the production of more antibodies against the foreign antigen of interest.

[000164] В данном документе представлены различные способы модификации геномного локуса-мишени для преодоления толерантности. Способы могут реализовываться ex vivo или in vivo, и они могут использовать две или более направляющие РНК (например, две гРНК, три направляющие РНК или четыре направляющие РНК), которые нацелены на разные участки в пределах одного геномного локуса-мишени, который влияет на экспрессию аутоантигена, гомологичного к или обладающего общим представляющим интерес эпитопом с представляющим интерес чужеродным антигеном, и образуют два или более комплекса с белком Cas и расщепляют нуклеиновую кислоту-мишень. Две или более направляющих РНК могут использоваться как самостоятельно, так и в сочетании с экзогенной матрицей для репарации, при условии, что, если клетка представляет собой эмбрион на одноклеточной стадии, например, экзогенная матрица для репарации может быть менее чем 5 т.п.о. в длину. Такие способы способствуют созданию биаллельных генетических модификаций в локусе-мишени и могут содержать разрушение генома или другие нацеленные модификации, такие как одновременная делеция последовательности нуклеиновой кислоты в геноме и замену экзогенной последовательностью нуклеиновой кислоты. По сравнению с нацеливанием с одной гРНК, которая продуцирует биаллельные модификации с низкой частотой, нацеливание с двумя или более гРНК приводит к созданию биаллельных модификаций (например, гомозиготно нацеленные клетки, гомозиготно удаленные клетки, и соединения гетерозиготно нацеленных клеток, включая гемизиготно нацеленные клетки) при значительно увеличенной скорости.[000164] Various methods for modifying a genomic target locus to overcome tolerance are provided herein. The methods may be performed ex vivo or in vivo and may utilize two or more guide RNAs (e.g., two gRNAs, three guide RNAs, or four guide RNAs) that target different sites within a single genomic target locus that affects the expression of a self-antigen that is homologous to or shares an epitope of interest with a foreign antigen of interest and form two or more complexes with a Cas protein and cleave the target nucleic acid. The two or more guide RNAs may be used either alone or in combination with an exogenous repair template, provided that, if the cell is a one-cell stage embryo, for example, the exogenous repair template may be less than 5 kb in length. Such methods facilitate the creation of biallelic genetic modifications at a target locus and may include genome disruption or other targeted modifications, such as simultaneous deletion of a nucleic acid sequence in the genome and replacement with an exogenous nucleic acid sequence. Compared to targeting with a single gRNA, which produces biallelic modifications at a low frequency, targeting with two or more gRNAs results in the creation of biallelic modifications (e.g., homozygous targeted cells, homozygous deleted cells, and junctions of heterozygous targeted cells, including hemizygous targeted cells) at a significantly increased rate.

[000165] Репарация в ответ на двухнитевые разрывы (DSB) происходит главным образом через два консервативных пути репарации ДНК: негомологичное соединение концов (NHEJ) и гомологичную рекомбинацию (HR). См. Kasparek & Humphrey (2011) Seminars in Celt & Dev. Biol. 22:886-897, включенный в данный документ в качестве ссылки во всей полноте для всех целей. NHEJ включает в себя репарацию двухнитевых разрывов в нуклеиновой кислоте путем прямого лигирования концов разрыва друг с другом или с экзогенной последовательностью без необходимости в гомологичной матрице. Лигирование несмежных последовательностей с помощью NHEJ может часто приводить к делециям, вставкам или транслокациям вблизи места двухнитевого разрыва.[000165] Repair of double-strand breaks (DSBs) occurs primarily through two conserved DNA repair pathways: non-homologous end joining (NHEJ) and homologous recombination (HR). See Kasparek & Humphrey (2011) Seminars in Celt & Dev. Biol. 22:886–897, incorporated herein by reference in its entirety for all purposes. NHEJ involves the repair of double-strand breaks in nucleic acid by direct ligation of the break ends to each other or to an exogenous sequence without the need for a homologous template. Ligation of non-contiguous sequences by NHEJ can often result in deletions, insertions, or translocations near the site of the double-strand break.

[000166] Репарация нуклеиновой кислоты-мишени, опосредуемая экзогенной матрицей для репарации, может включать в себя любой процесс обмена генетической информацией между двумя полинуклеотидами. Например, NHEJ также может привести к направленной интеграции экзогенной матрицы для репарации путем прямого лигирования концов разрыва с концами экзогенной матрицы для репарации (т.е. захвата на основе NHEJ). Такая опосредованная NHEJ направленная интеграция может быть предпочтительной для вставки экзогенной матрицы для репарации, когда пути репарации, направленной гомологией (HDR), не могут быть легко использованы (например, в не делящихся клетках, первичных клетках, и клетках, которые плохо выполняют репарацию ДНК на основе гомологии). Кроме того, в отличие от репарации, основанной на гомологии, знания о больших участках идентичности последовательности, фланкирующих сайт расщепления (за пределами «липких» концов, созданных с помощью Cas-опосредованного расщепления), не нужны, что может быть полезно при попытке направленной вставки в организмы, у которых есть геномы, для которых знание о геномной последовательности ограничено. Интеграция может протекать через лигирование «тупых» концов между экзогенной матрицей для репарации и расщепленной геномной последовательностью, или путем лигирования «липких» концов (т.е. имеющих 5' или 3' «липкие» концы) с использованием экзогенной матрицы для репарации, которая фланкирована с помощью «липких» концов, которые совместимы с теми, которые генерируются с помощью белка Cas в расщепленной геномной последовательности. См., например, US 2011/020722, WO 2014/033644, WO 2014/089290, и Maresca et al. (2013) Genome Res. 23(3):539-546, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Если «тупые» концы лигированы, может потребоваться резекция цели и/или донора для генерации участков микрогомологии, необходимых для присоединения фрагментов, что может создавать нежелательные изменения в последовательности-мишени.[000166] Exogenous repair template-mediated repair of a target nucleic acid may include any process of exchanging genetic information between two polynucleotides. For example, NHEJ may also result in targeted integration of an exogenous repair template by directly ligating the ends of the break to the ends of the exogenous repair template (i.e., NHEJ-based capture). Such NHEJ-mediated targeted integration may be advantageous for insertion of an exogenous repair template when homology-directed repair (HDR) pathways cannot be readily utilized (e.g., in non-dividing cells, primary cells, and cells that perform homology-based DNA repair poorly). Furthermore, unlike homology-based repair, knowledge of the large regions of sequence identity flanking the cleavage site (beyond the sticky ends generated by Cas-mediated cleavage) is not required, which may be useful when attempting targeted insertion into organisms that have genomes for which knowledge of the genomic sequence is limited. Integration can proceed via blunt-end ligation between the exogenous repair template and the cleaved genomic sequence, or via sticky-end ligation (i.e., having 5' or 3' sticky ends) using an exogenous repair template that is flanked by sticky ends that are compatible with those generated by the Cas protein in the cleaved genomic sequence. See, e.g., US 2011/020722, WO 2014/033644, WO 2014/089290, and Maresca et al. (2013) Genome Res. 23(3):539-546, each of which is hereby incorporated by reference in its entirety for all purposes. If blunt ends are ligated, resection of the target and/or donor may be required to generate regions of microhomology necessary for joining the fragments, which may create undesirable changes in the target sequence.

[000167] Репарация также может происходить посредством репарации, направляемой гомологией (HDR), или гомологичной рекомбинации (HR). HDR или HR включает в себя форму репарации нуклеиновой кислоты, которая может потребовать гомологию нуклеотидной последовательности, использует «донорскую» молекулу в качестве матрицы для репарации «целевой» молекулы (т.е. той, которая испытывала двухнитевой разрыв), и приводит к передаче генетической информации от донора к мишени. Не желая связывать себя какой-либо конкретной теорией, такая передача может включать коррекцию несовпадения гетеродуплексной ДНК, которое образуется между сломанной мишенью и донором, и/или синтез-зависимый отжиг нити, в котором донор используется для ресинтеза генетической информации, которая будет частью мишени, и/или связанных процессов. В некоторых случаях донорный полинуклеотид, часть донорного полинуклеотида, копия донорного полинуклеотида, или часть копии донорного полинуклеотида интегрируется в ДНК-мишень. См. Wang et al. (2013) Cell 153:910-918; Mandalos et at. (2012) PLOS ONE 7:e45768:1-9; и Wang et al. (2013) Nat Biotechnol. 31:530-532, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей.[000167] Repair may also occur through homology-directed repair (HDR) or homologous recombination (HR). HDR or HR involves a form of nucleic acid repair that may require nucleotide sequence homology, uses a "donor" molecule as a template for repair of a "target" molecule (i.e., the one that experienced a double-strand break), and results in the transfer of genetic information from the donor to the target. Without wishing to be bound by any particular theory, such transfer may involve correction of a heteroduplex DNA mismatch that forms between the broken target and the donor, and/or synthesis-dependent strand annealing, in which the donor is used to resynthesize genetic information that will be part of the target, and/or related processes. In some cases, a donor polynucleotide, a portion of a donor polynucleotide, a copy of a donor polynucleotide, or a portion of a copy of a donor polynucleotide is integrated into a target DNA. See Wang et al. (2013) Cell 153:910-918; Mandalos et al. (2012) PLOS ONE 7:e45768:1-9; and Wang et al. (2013) Nat Biotechnol. 31:530-532, each of which is hereby incorporated by reference in its entirety for all purposes.

[000168] Чтобы сделать отличных от человека животных с пониженной толерантностью к представляющему интерес чужеродному антигену-мишени, один или более геномных локусов-мишеней, влияющих на экспрессию аутоантигена, гомологичного или обладающего общим эпитопом с представляющим интерес чужеродным антигеном, могут быть нацелены на уменьшение экспрессии аутоантигена. Предпочтительно, устраняется экспрессия первого аутоантигена. Экспрессия аутоантигена считается устраненной, если аутоантиген больше не экспрессируется (например, если аутоантиген представляет собой белок, белок больше не экспрессируется, или если аутоантиген представляет собой определенный эпитоп на белке, белки, содержащие этот эпитоп, больше не экспрессируются).[000168] In order to produce non-human animals with reduced tolerance to a foreign target antigen of interest, one or more genomic target loci that affect the expression of an autoantigen that is homologous to or shares an epitope with the foreign antigen of interest can be targeted to reduce the expression of the autoantigen. Preferably, expression of the first autoantigen is abolished. Expression of the autoantigen is considered to be abolished if the autoantigen is no longer expressed (e.g., if the autoantigen is a protein, the protein is no longer expressed, or if the autoantigen is a particular epitope on a protein, proteins containing that epitope are no longer expressed).

[000169] В одном примере, геном плюрипотентной клетки отличного от человека животного, которая не является эмбрионом на одноклеточной стадии (например, эмбриональной стволовой клеткой (ЭС)), может приводиться в контакт с белком Cas, первой направляющей РНК, которая гибридизуется с первой последовательностью, распознаваемой направляющей РНК в геномном локусе-мишени, и второй направляющей РНК, которая гибридизуется с последовательностью, распознаваемой второй направляющей РНК в геномном локусе-мишени. В другом примере, геном эмбриона отличного от человека животного на одноклеточной стадии может приводиться в контакт с белком Cas, первой направляющей РНК, которая гибридизуется с первой последовательностью, распознаваемой направляющей РНК в геномном локусе-мишени, и второй направляющей РНК, которая гибридизуется с последовательностью, распознаваемой второй направляющей РНК в геномном локусе-мишени.[000169] In one example, the genome of a non-human animal pluripotent cell that is not a one-cell stage embryo (e.g., an embryonic stem (ES) cell) can be contacted with a Cas protein, a first guide RNA that hybridizes to a first sequence recognized by the guide RNA at a target genomic locus, and a second guide RNA that hybridizes to a sequence recognized by a second guide RNA at a target genomic locus. In another example, the genome of a one-cell stage embryo of a non-human animal can be contacted with a Cas protein, a first guide RNA that hybridizes to a first sequence recognized by the guide RNA at a target genomic locus, and a second guide RNA that hybridizes to a sequence recognized by a second guide RNA at a target genomic locus.

[000170] В некоторых способах, представленных в данном документе, клетка, являющаяся целью, представляет собой гибридную клетку, как определено в другом месте данного документа. Такие способы также могут включать в себя выбор участка-мишени в геномном локусе-мишени, как описано в другом месте данного документа. Участок-мишень может быть выбран так, чтобы он имел высокий процент идентичности последовательности между соответствующими первой и второй хромосомами в гомологичной паре хромосом относительно других сегментов геномного локуса-мишени или остальной части геномного локуса-мишени. В качестве примера, выбор участка-мишени может содержать сравниваемую последовательность соответствующих первой и второй хромосом в гомологичной паре хромосом в геномном локусе-мишени, и выбор участка-мишени, имеющего более высокий процент идентичности последовательности между соответствующими первой и второй хромосомами в гомологичной паре хромосом по отношению ко всему или части остатка геномного локуса-мишени. Способы выбора участка-мишени, как описано более подробно в другом месте данного документа.[000170] In some methods provided herein, the target cell is a hybrid cell as defined elsewhere herein. Such methods may also include selecting a target region within a target genomic locus as described elsewhere herein. The target region may be selected to have a high percentage of sequence identity between corresponding first and second chromosomes in a homologous pair of chromosomes relative to other segments of the target genomic locus or the remainder of the target genomic locus. As an example, selecting a target region may comprise comparing the sequence of corresponding first and second chromosomes in a homologous pair of chromosomes within a target genomic locus, and selecting a target region having a higher percentage of sequence identity between corresponding first and second chromosomes in a homologous pair of chromosomes relative to all or a portion of the remainder of the target genomic locus. Methods for selecting a target site as described in more detail elsewhere in this document.

[000171] Необязательно, геном может дополнительно приводиться в контакт с дополнительными направляющими РНК, которые гибридизуются с последовательностями, распознаваемыми направляющей РНК в геномном локусе-мишени (или во втором геномном локусе-мишени, который влияет на экспрессию аутоантигена или который влияет на экспрессию второго аутоантигена который является гомологичным или обладает общим представляющим интерес эпитопом с представляющим интерес чужеродным антигеном), такой как третья направляющая РНК, которая гибридизуется с последовательностью, распознаваемой третьей направляющей РНК в геномном локусе-мишени, или третьей направляющей РНК и четвертой направляющей РНК, которая гибридизуется с последовательностью, распознаваемой четвертой направляющей РНК в геномном локусе-мишени. Приведение в контакт может включать введение белка Cas и направляющих РНК в клетку в любой форме и с помощью любых средств, как описано более подробно в другом месте данного документа. Направляющие РНК образуют комплексы с белком Cas и направляют их к последовательностям, распознаваемым направляющей РНК в геномном локусе-мишени, где белок Cas расщепляет геномный локус-мишень на сайтах расщепления белка Cas в последовательностях, распознаваемых направляющей РНК. Расщепление с помощью белка Cas может создать двухнитевой разрыв или однонитевой разрыв (например, если белок Cas представляет собой никазу). Примеры и вариации белков Cas и направляющих РНК, которые могут быть использованы в способах, описанных в другом месте данного документа. Расщепление с помощью белка Cas в геномном локусе-мишени может модифицировать геномный локус-мишень в паре первой и второй хромосом для получения биаллельной модификации, которая уменьшает экспрессию аутоантигена.[000171] Optionally, the genome may be further contacted with additional guide RNAs that hybridize to sequences recognized by the guide RNA at the target genomic locus (or at a second target genomic locus that affects the expression of a self-antigen or that affects the expression of a second self-antigen that is homologous to or shares an epitope of interest with the foreign antigen of interest), such as a third guide RNA that hybridizes to a sequence recognized by a third guide RNA at the target genomic locus, or a third guide RNA and a fourth guide RNA that hybridizes to a sequence recognized by a fourth guide RNA at the target genomic locus. Contacting may involve introducing the Cas protein and the guide RNAs into the cell in any form and by any means, as described in more detail elsewhere herein. Guide RNAs form complexes with the Cas protein and direct them to sequences recognized by the guide RNA at a target genomic locus, where the Cas protein cleaves the target genomic locus at the Cas protein cleavage sites at the sequences recognized by the guide RNA. Cas protein cleavage can create a double-strand break or a single-strand break (e.g., if the Cas protein is a nickase). Examples and variations of Cas proteins and guide RNAs that can be used in the methods are described elsewhere in this document. Cas protein cleavage at a target genomic locus can modify the target genomic locus in the first and second chromosome pair to produce a biallelic modification that reduces expression of the self-antigen.

[000172] Представляющий интерес чужеродный антиген может представлять собой любой чужеродный антиген, для которого желательны антигенсвязывающие белки. Например, представляющий интерес чужеродный антиген может содержать, состоять по существу из, состоять из всего или части вирусного белка, бактериального белка, белка млекопитающих, белка обезьян, белка собачьих, белка кошачьих, белка лошадей, бычьего белка, белка грызунов (например, крысы или мыши) или белка человека. Например, представляющий интерес чужеродный антиген может содержать, состоять по существу из, состоять из белка человека с одной или более мутаций, или вариаций. Представляющий интерес чужеродный антиген и аутоантиген могут быть гомологичными. Например, представляющий интерес чужеродный антиген и аутоантиген могут быть ортологическими или паралогическими. Альтернативно или дополнительно, представляющий интерес чужеродный антиген и аутоантиген может содержать, состоять по существу из, состоять из общего эпитопа. Общие эпитопы могут существовать между гомологичными белками или могут существовать между разнородными белками, которые не являются гомологичными. Либо линейная аминокислотная последовательность и/или конформационная подгонка (например, подобные антигенные поверхности даже в отсутствие гомологии первичной последовательности) эпитопа могут быть общими. Например, общие эпитопы включают эпитопы, которые по существу идентичны. Если эпитоп являются общими между двумя антигенами, антитело против эпитопа на первом антигене будет, как правило, также связывать эпитоп со вторым антигеном.[000172] The foreign antigen of interest can be any foreign antigen for which antigen-binding proteins are desired. For example, the foreign antigen of interest can comprise, consist essentially of, consist of all or a portion of a viral protein, a bacterial protein, a mammalian protein, a simian protein, a canine protein, a feline protein, an equine protein, a bovine protein, a rodent protein (e.g., a rat or mouse), or a human protein. For example, the foreign antigen of interest can comprise, consist essentially of, consist of a human protein with one or more mutations or variations. The foreign antigen of interest and the self-antigen can be homologous. For example, the foreign antigen of interest and the self-antigen can be orthologous or paralogous. Alternatively or additionally, the foreign antigen of interest and the self-antigen can comprise, consist essentially of, consist of a common epitope. Common epitopes may exist between homologous proteins or may exist between dissimilar proteins that are not homologous. Either the linear amino acid sequence and/or the conformational fit (e.g., similar antigenic surfaces even in the absence of primary sequence homology) of the epitope may be shared. For example, common epitopes include epitopes that are essentially identical. If an epitope is shared between two antigens, an antibody directed against the epitope on the first antigen will typically also bind the epitope to the second antigen.

[000173] Приведение в контакт может происходить в отсутствие экзогенной матрицы для репарации или в присутствии экзогенной матрицы для репарации, которая рекомбинируется с геномным локусом-мишенью для получения нацеленной генетической модификации. Например, клетка может быть эмбрионом на одноклеточной стадии, а экзогенная матрица для репарации может быть менее чем 5 т.п.о. в длину. Примеры экзогенной матрицы для репарации описаны в другом месте данного документа.[000173] The contacting may occur in the absence of an exogenous repair template or in the presence of an exogenous repair template that recombines with the target genomic locus to produce the targeted genetic modification. For example, the cell may be a one-cell stage embryo and the exogenous repair template may be less than 5 kb in length. Examples of exogenous repair templates are described elsewhere in this document.

[000174] В некоторых таких способах, репарация нуклеиновой кислоты-мишени с помощью экзогенной матрицы для репарации происходит посредством репарации, направляемой гомологией (HDR). Репарация, направляемая гомологией может произойти, когда белок Cas расщепляет обе нити ДНК в геномном локусе-мишени для создания двухнитевого разрыва, когда белок Cas представляет собой никазу, которая расщепляет одну нить ДНК в геномном локусе-мишени для создания однонитевого разрыва, или, когда парные никизы Cas используются для создания двухнитевого разрыва, образованного двумя смещающими одноцепочечными разрывами. В таких способах, экзогенная матрица для репарации содержит 5' и 3' плечи гомологии, соответствующие 5'- и 3'-последовательностей-мишеней в геномном локусе-мишени. Последовательности, распознаваемые направляющей РНК, или сайты расщепления могут быть смежными с 5' последовательностью-мишенью, смежными с 3' последовательностью-мишенью, смежными как с 5' последовательностью-мишенью, так и 3' последовательностью-мишенью, или смежными ни с одной из 5' последовательностью-мишенью, ни с 3' последовательностью-мишенью. Последовательности, которые находятся рядом друг с другом, включают последовательности в пределах около 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов друг от друга. Необязательно, экзогенная матрица для репарации может дополнительно содержать вставку нуклеиновой кислоты, фланкированную с помощью 5'- и 3'-плечей гомологии, и вставку нуклеиновой кислоты, вставленную между 5' и 3' последовательностями-мишенями. Если вставка нуклеиновой кислоты отсутствует, экзогенная матрица для репарации может функционировать для удаления геномной последовательности между 5' и 3' последовательностями-мишенями.[000174] In some such methods, repair of a target nucleic acid by an exogenous repair template occurs via homology-directed repair (HDR). Homology-directed repair can occur when a Cas protein cleaves both strands of DNA at a target genomic locus to create a double-strand break, when the Cas protein is a nickase that cleaves one strand of DNA at a target genomic locus to create a single-strand break, or when paired Cas nickeses are used to create a double-strand break formed by two displacing single-strand breaks. In such methods, the exogenous repair template comprises 5' and 3' homology arms corresponding to 5' and 3' target sequences at the target genomic locus. The sequences recognized by the guide RNA, or cleavage sites, may be adjacent to the 5' target sequence, adjacent to the 3' target sequence, adjacent to both the 5' target sequence and the 3' target sequence, or adjacent to neither the 5' target sequence nor the 3' target sequence. Sequences that are adjacent to each other include sequences within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of each other. Optionally, the exogenous repair template may further comprise a nucleic acid insert flanked by 5' and 3' arms of homology and a nucleic acid insert inserted between the 5' and 3' target sequences. If the nucleic acid insert is absent, the exogenous repair template may function to remove the genomic sequence between the 5' and 3' target sequences.

[000175] Альтернативно, репарация нуклеиновой кислоты-мишени с помощью экзогенной матрицы для репарации может происходить посредством связанного с негомологичным соединением концов (NHEJ) лигирования. В таких способах, по меньшей мере один конец экзогенной матрицы для репарации содержит короткий одноцепочечный участок, который комплементарен по меньшей мере одному «липкому» концу, созданному с помощью Cas-опосредованного расщепления в геномном локусе-мишени. Комплементарный конец в экзогенной матрице для репарации может фланкировать вставку нуклеиновой кислоты. Например, каждый конец экзогенной матрицы для репарации может содержать короткий одноцепочечный участок, который комплементарен к «липкому» концу, созданному с помощью Cas-опосредованного расщепления в геномном локусе-мишени, и эти комплементарные участки в экзогенной матрице для репарации могут фланкировать вставку нуклеиновой кислоты. «Липкие» концы (т.е. ступенчатые концы) могут быть созданы путем резекции «тупых» концов двухнитевого разрыва, созданного с помощью Cas-опосредованного расщепления. Такая резекция может генерировать участки микрогомологии, необходимые для соединения фрагментов, но это может создавать нежелательные или неконтролируемые изменения в нуклеиновой кислоте-мишени. Альтернативно, такие «липкие» концы могут быть созданы с использованием парных Cas никаз. Например, если белок Cas является никазой, геномный локус-мишень может контактировать с первой и второй направляющими РНК, которые нацелены на противоположные нити ДНК, в результате чего геном модифицируют путем двойного никирования. Это может быть достигнуто путем приведения в контакт геномного локуса-мишени с двумя направляющими РНК, которые гибридизуются с другой последовательностью, распознаваемой РНК в геномном локусе-мишени. Две направляющие РНК образуют два комплекса с Cas никазой, и Cas никазой одноцепочечных разрывов первой нити геномного локуса-мишени в пределах одной из последовательностей, распознаваемых направляющей РНК, и одноцепочечных разрывов второй цепи геномного локуса-мишени в пределах другой последовательности, распознаваемой направляющей РНК. Экзогенную матрицу для репарации затем рекомбинируют с геномным локусом-мишенью для получения нацеленной генетической модификации.[000175] Alternatively, repair of a target nucleic acid by an exogenous repair template can occur via non-homologous end joining (NHEJ)-associated ligation. In such methods, at least one end of the exogenous repair template comprises a short single-stranded region that is complementary to at least one overhang created by Cas-mediated cleavage at a target genomic locus. The complementary end in the exogenous repair template can flank the nucleic acid insert. For example, each end of the exogenous repair template may contain a short single-stranded region that is complementary to a sticky end created by Cas-mediated cleavage at the target genomic locus, and these complementary regions in the exogenous repair template may flank the nucleic acid insert. Sticky ends (i.e., staggered ends) may be created by resection of the blunt ends of the double-strand break created by Cas-mediated cleavage. Such resection may generate regions of microhomology needed to join the fragments, but it may create unwanted or uncontrolled changes in the target nucleic acid. Alternatively, such sticky ends may be created using paired Cas nickases. For example, if the Cas protein is a nickase, the target genomic locus can be contacted with first and second guide RNAs that target opposite strands of DNA, resulting in the genome being modified by double nicking. This can be achieved by contacting the target genomic locus with two guide RNAs that hybridize to another sequence recognized by the RNA in the target genomic locus. The two guide RNAs form two complexes with the Cas nickase, and the Cas nickase makes single-strand breaks in the first strand of the target genomic locus within one of the sequences recognized by the guide RNA and single-strand breaks in the second strand of the target genomic locus within the other sequence recognized by the guide RNA. The exogenous repair template is then recombined with the target genomic locus to produce the targeted genetic modification.

[000176] В некоторых способах, вставка нуклеиновой кислоты содержит последовательность, которая является гомологичной или ортологичной для всего или части гена, кодирующего аутоантиген. Это может быть полезно, например, когда нокаут аутоантигена может привести к эмбриональной летальности. Вставка нуклеиновой кислоты может быть в экзогенной матрице для репарации в любой форме, описанной в данном документе (например, нацеливающий вектор, LTVEC, ssODN и т.д.), и вставка нуклеиновой кислоты может дополнительно содержать селекционную кассету (например, самоудаляющаяся селекционная кассета) или может отсутствовать селекционная кассета. В таких способах, например, весь или часть гена, кодирующего аутоантиген, можно удалить и заменить соответствующей гомологичной или ортологичной последовательностью. Например, весь ген, кодирующий аутоантиген, можно удалить и заменить с соответствующей гомологичной или ортологичной последовательностью, или часть гена, кодирующего конкретный мотив или участок аутоантигена, может быть удалена и заменена с соответствующей гомологичной или ортологичной последовательностью. Необязательно, соответствующая гомологичная или ортологическая последовательность может быть от другого вида. Например, если аутоантиген является мышиным антигеном, соответствующая гомологичная или ортологичная последовательность может быть, например, гомологичной или ортологичной последовательностью крысы, хомяка, кошки, собаки, черепахи, лемура или человека. Альтернативно или дополнительно гомологичная, или ортологичная последовательность может содержать одну или более точечных мутаций (например, 1, 2, 3, 4, 5 и более) по сравнению с замененной последовательностью. Такие точечные мутации могут служить, например, для устранения экспрессии одного или более эпитопов в аутоантигене. Такие эпитопы могут быть эпитопами, которые являются общими с представляющим интерес чужеродным антигеном. Необязательно, такие точечные мутации могут приводить к консервативной аминокислотной замене (например, замене аспарагиновой кислоты [Asp, D] глутаминовой кислотой [Glu, Е]) в кодированном полипептиде. Такие замены аминокислот могут приводить к экспрессии аутоантигена, который сохраняет функцию аутоантигена дикого типа, но испытывает недостаток в эпитопе, который присутствует в представляющем интерес чужеродном антигене, и является общим с аутоантигеном дикого типа. Аналогичным образом делеция всего или части гена, кодирующего аутоантиген, и замещение соответствующей гомологичной или ортологичной последовательностью, которая не содержит эпитоп, который является общим между представляющим интерес чужеродным антигеном и аутоантигеном, может приводить к экспрессии гомолога или ортолога аутоантигена, который сохраняет функцию аутоантигена дикого типа, но не содержит эпитоп, который присутствует в представляющем интерес чужеродном антигене, и является общим с аутоантигеном дикого типа. Затем могут быть получены антигенсвязывающие белки против этих эпитопов.[000176] In some methods, the nucleic acid insert comprises a sequence that is homologous or orthologous to all or a portion of a gene encoding an autoantigen. This may be useful, for example, when knockout of an autoantigen may result in embryonic lethality. The nucleic acid insert may be in an exogenous repair matrix in any form described herein (e.g., a targeting vector, LTVEC, ssODN, etc.), and the nucleic acid insert may further comprise a selection cassette (e.g., a self-erasing selection cassette) or may be absent of a selection cassette. In such methods, for example, all or a portion of a gene encoding an autoantigen may be deleted and replaced with a corresponding homologous or orthologous sequence. For example, the entire gene encoding the self-antigen can be deleted and replaced with a corresponding homologous or orthologous sequence, or a portion of the gene encoding a particular motif or region of the self-antigen can be deleted and replaced with a corresponding homologous or orthologous sequence. Optionally, the corresponding homologous or orthologous sequence can be from another species. For example, if the self-antigen is a mouse antigen, the corresponding homologous or orthologous sequence can be, for example, a rat, hamster, cat, dog, turtle, lemur or human homologous or orthologous sequence. Alternatively or additionally, the homologous or orthologous sequence can contain one or more point mutations (e.g., 1, 2, 3, 4, 5 or more) compared to the replaced sequence. Such point mutations can serve, for example, to eliminate the expression of one or more epitopes in the self-antigen. Such epitopes may be epitopes that are shared with the foreign antigen of interest. Optionally, such point mutations may result in a conservative amino acid substitution (e.g., substitution of aspartic acid [Asp, D] for glutamic acid [Glu, E]) in the encoded polypeptide. Such amino acid substitutions may result in the expression of a self-antigen that retains the function of the wild-type self-antigen but lacks an epitope that is present in the foreign antigen of interest and is shared with the wild-type self-antigen. Similarly, deletion of all or part of a gene encoding an autoantigen and replacement with a corresponding homologous or orthologous sequence that does not contain an epitope that is common between the foreign antigen of interest and the autoantigen can result in expression of a homolog or ortholog of the autoantigen that retains the function of the wild-type autoantigen but does not contain an epitope that is present in the foreign antigen of interest and is common with the wild-type autoantigen. Antigen-binding proteins can then be produced against these epitopes.

[000177] Модифицированную плюрипотентную клетку отличного от человека животного можно затем использовать для генерации генетически модифицированного отличного от человека животного с использованием способов, описанных в другом месте данного документа. Например, модифицированная плюрипотентная клетка отличного от человека животного может быть введена в эмбрион-хозяин, а эмбрион-хозяин может быть имплантирован суррогатной матери, чтобы произвести генетически модифицированное F0 поколение отличного от человека животного, у которого геномный локус-мишень модифицирован в паре первой и второй хромосом, чтобы иметь биаллельную модификацию, так что экспрессия аутоантигена уменьшается или устраняется. В случае эмбриона на одноклеточной стадии можно выбрать генетически модифицированный эмбрион, а затем имплантировать его суррогатной матери, чтобы произвести генетически модифицированное F0 поколение отличного от человека животного, у которого геномный локус-мишень модифицирован в паре первой и второй хромосом, чтобы иметь биаллельную модификацию, так что экспрессия аутоантигена уменьшается или устраняется. Затем F0 поколение отличного от человека животного может быть использовано для генерации антигенсвязывающих белков против представляющего интерес чужеродного антигена с использованием способов, описанных в другом месте данного документа.[000177] The modified pluripotent cell of a non-human animal can then be used to generate a genetically modified non-human animal using the methods described elsewhere herein. For example, the modified pluripotent cell of a non-human animal can be introduced into a host embryo and the host embryo can be implanted into a surrogate mother to produce a genetically modified F0 generation of a non-human animal in which the target genomic locus is modified in the first and second chromosome pair to have a biallelic modification such that expression of the self-antigen is reduced or eliminated. In the case of a one-cell stage embryo, the genetically modified embryo can be selected and then implanted into a surrogate mother to produce a genetically modified F0 generation of a non-human animal in which the target genomic locus is modified in the first and second chromosome pair to have a biallelic modification such that expression of the self-antigen is reduced or eliminated. The F0 generation of the non-human animal can then be used to generate antigen-binding proteins against the foreign antigen of interest using methods described elsewhere in this document.

А. Выбор участка-мишениA. Selecting a target site

[000178] Нацеленная модификация гена путем гомологичной рекомбинации между экзогенной матрицей для репарации (например, вектором нацеливания) и геномным локусом-мишенью может быть очень неэффективной, особенно в отношении типов клеток, отличных от эмбриональных стволовых клеток грызунов. Индукция одного или более двухнитевых разрывов ДНК путем CRISPR/Cas9-направленного расщепления может способствовать нацеливанию гомологичного гена с помощью гомологичной рекомбинации (HR) между экзогенной матрицей для репарации (например, вектором нацеливания) и геномным локусом-мишенью. CRISPR/Cas9 также может способствовать гомозиготным мутациям вставки или делеции (т.е. биаллельным изменениям, которые являются идентичными) с помощью механизмов репарации негомологичного соединения концов (NHEJ). Для модификаций генов, которые включают в себя очень большие гуманизации, объединение вектора нацеливания с системой нуклеазы CRISPR/Cas9, направленной на две направляющие РНК, которые нацелены на один геномный локус-мишень, может дополнительно повысить эффективность нацеливания, превышающую эффективность, достигаемую с помощью одной направляющей РНК. По сравнению с нацеливанием с одной направляющей РНК, которая продуцирует биаллельные модификации с низкой частотой или вообще отсутствует, нацеливание с двумя направляющими РНК приводит к созданию гомозиготных клеток, гомозиготно удаленных клеток, и соединений гетерозиготно нацеленными клетками (включая гемизиготно нацеленные клетки) при значительно увеличенной скорости. Однако в некоторых геномных локусах получение гомозиготно нацеленных клеток или гомозиготно удаленных клеток может быть затруднено.[000178] Targeted gene modification by homologous recombination between an exogenous repair template (e.g., a targeting vector) and a target genomic locus can be very inefficient, particularly for cell types other than rodent embryonic stem cells. Induction of one or more DNA double-strand breaks by CRISPR/Cas9-directed cleavage can facilitate targeting of a homologous gene by homologous recombination (HR) between an exogenous repair template (e.g., a targeting vector) and a target genomic locus. CRISPR/Cas9 can also facilitate homozygous insertion or deletion mutations (i.e., biallelic changes that are identical) via non-homologous end joining (NHEJ) repair mechanisms. For gene modifications that involve very large humanizations, combining the targeting vector with a CRISPR/Cas9 nuclease system targeting two guide RNAs that target a single genomic target locus can further enhance targeting efficiency beyond that achieved with a single guide RNA. Compared to targeting with a single guide RNA, which produces biallelic modifications at low or no frequency, targeting with two guide RNAs results in the generation of homozygous cells, homozygous deleted cells, and heterozygous target cell junctions (including hemizygous targeted cells) at a significantly increased rate. However, at some genomic loci, generating homozygous targeted cells or homozygous deleted cells may be difficult.

[000179] В отличие от инбредных линий мышей и крыс, обычно используемых в лабораторных условиях, которые гомозиготны практически во всех их геномных локусах, последовательность двух аллелей в геномном локусе-мишени в гибридных клетках (например, у всех людей) обычно не будет на 100% идентична. Однако, как показано в приведенных в данном документе примерах, частота гомозиготного геномного изменения, независимо от того, была ли начальная CRISPR/Cas9-индуцированная модификация продуцирована с помощью HR или NHEJ, зависит от степени сходства последовательностей между двумя аллелями геномного локуса-мишени. Это наблюдение подразумевает, что CRISPR/Cas9-индуцированная модификация гомозиготного гена, является гомологически зависимым явлением. В подтверждение этого, CRISPR/Cas9-индуцированные гомозиготные модификации, часто сопровождаются потерей гетерозиготности (LOH) аллельной последовательности и структурных вариантов (варианты с одним нуклеотидом, SNV, или структурные варианты, SV), связанные с геномным локусом-мишенью на той же хромосоме, как показано в приведенных в данном документе примерах. LOH может либо включать локальный механизм конверсии генов для вариантов с обеих сторон геномного локуса-мишени, либо конверсию генов длинного диапазона (полярного конверсия гена), включающую все варианты на теломерной стороне геномного локуса-мишени. Такие события конверсии генов должны быть результатом управляемых гомологией механизмов митотической рекомбинации.[000179] Unlike inbred strains of mice and rats commonly used in the laboratory, which are homozygous at virtually all of their genomic loci, the sequence of the two alleles at a target genomic locus in hybrid cells (e.g., all humans) will typically not be 100% identical. However, as shown in the examples provided herein, the frequency of homozygous genomic alteration, regardless of whether the initial CRISPR/Cas9-induced modification was produced by HR or NHEJ, depends on the degree of sequence similarity between the two alleles of the target genomic locus. This observation implies that CRISPR/Cas9-induced modification of a homozygous gene is a homology-dependent phenomenon. In support of this, CRISPR/Cas9-induced homozygous modifications are often accompanied by loss of heterozygosity (LOH) of allelic sequence and structural variants (single nucleotide variants, SNVs, or structural variants, SVs) associated with the target genomic locus on the same chromosome, as shown in the examples provided herein. LOH may either involve a local gene conversion mechanism for variants on both sides of the target genomic locus, or a long-range gene conversion (polar gene conversion) involving all variants on the telomeric side of the target genomic locus. Such gene conversion events must result from homology-driven mitotic recombination mechanisms.

[000180] Эти знания служат руководством для разработки экспериментов гомозиготного нацеливания с помощью CRISPR/Cas9. Выбор участков-мишеней, в которых эти два аллеля разделяют высокую степень идентичности последовательности, дает наивысшие шансы на успех. Гомозиготное нацеливание с помощью CRISPR/Cas9 в участках-мишенях с высокой степенью вариации последовательности между двумя аллелями менее вероятно будет успешным. Даже при локусах с высокой плотностью SNV и SV, показатели успеха могут быть улучшены за счет использования направляющих РНК или нуклеазных агентов, которые узнают последовательности в пределах максимально возможного длинного участка непрерывной идентичности аллельной последовательности в геномном локусе-мишени или в пределах участков геномного локуса-мишени, в котором аллельная идентичность последовательности максимизируется.[000180] This knowledge provides guidance for the design of homozygous targeting experiments using CRISPR/Cas9. Selecting target sites where the two alleles share a high degree of sequence identity provides the highest chance of success. Homozygous targeting using CRISPR/Cas9 at target sites with a high degree of sequence variation between the two alleles is less likely to be successful. Even at loci with high SNV and SV density, success rates can be improved by using guide RNAs or nuclease agents that recognize sequences within the longest possible stretch of contiguous allelic sequence identity at the target genomic locus or within regions of the target genomic locus at which allelic sequence identity is maximized.

[000181] Способы, описанные в данном документе, могут включать в себя выбор участка-мишени, так что идентичность последовательности может быть максимизирована для всей или части участка-мишени между соответствующими первой и второй хромосомами в гомологичной паре хромосом. В гибридных клетках последовательность на одной копии гомологичной пары хромосом обычно будет иметь некоторые отличия по сравнению с другой копией пары хромосом (например, однонуклеотидные вариации). Таким образом, такие способы могут включать в себя сравнение последовательности соответствующих первой и второй хромосом в гомологичной паре хромосом (например, клетка человека имеет 23 гомологичных пары хромосом) в геномном локусе-мишени и затем выбор участка-мишени в геномном локусе-мишени, таком как что идентичность последовательности максимизируется для всех или части участка-мишени между соответствующей первой и второй хромосомами в гомологичной паре хромосом. Если последовательности не доступны, такие способы могут дополнительно содержать сиквенирование геномного локуса-мишени на каждой отдельной хромосоме в паре гомологичных хромосом перед сравнением последовательности.[000181] The methods described herein may include selecting a target region such that sequence identity can be maximized for all or a portion of the target region between the corresponding first and second chromosomes in a homologous pair of chromosomes. In hybrid cells, the sequence on one copy of a homologous pair of chromosomes will typically have some differences compared to the other copy of the pair of chromosomes (e.g., single nucleotide variations). Thus, such methods may include comparing the sequence of the corresponding first and second chromosomes in a homologous pair of chromosomes (e.g., a human cell has 23 homologous pairs of chromosomes) at a target genomic locus and then selecting a target region at the target genomic locus such that sequence identity is maximized for all or a portion of the target region between the corresponding first and second chromosomes in the homologous pair of chromosomes. If sequences are not available, such methods may additionally involve sequencing the target genomic locus on each individual chromosome in a pair of homologous chromosomes prior to sequence comparison.

[000182] Участок-мишень может содержать, состоять по существу из, состоять из, например, любого сегмента или участка, нацеленных с помощью одной из двух или более направляющих РНК или одной или более экзогенной матрицы для репарации в описанных в данном документе способах, или любого сегмента или участка, фланкирующих сегмент или участок, нацеленного с помощью одной из двух или более направляющих РНК или один или более экзогенной матрицы для репарации в описанных в данном документе способах. Участок-мишень может быть смежной геномной последовательностью или несмежной геномной последовательностью. Например, участок-мишень может содержать, состоять по существу из, или состоять из геномного сегмента или участка, нацеленных на делецию, геномного сегмента или участка, нацеленных на замену, или геномного сегмента или участка, нацеленных на вставку с помощью способов, описанных в данном документе, и/или могут содержать, состоять по существу из, или состоять из 5'- и/или 3'-последовательности, фланкирующей геномный сегмент или геномный участок, нацеленный на делецию, замену или вставку с помощью способов, описанных в данном документе. Предпочтительно, участок-мишень содержит, состоит по существу из, или состоит из последовательности непосредственно вверх по ходу транскрипции и/или последовательности непосредственно вниз по ходу транскрипции от участка, нацеленного на делецию, замену или вставку с помощью способов, описанных в данном документе (например, последовательность вверх по ходу транскрипции и/или вниз по ходу транскрипции от участка между двумя последовательностями, распознаваемыми направляющей РНК, или сайтами расщепления, или последовательность вверх по ходу транскрипции и/или вниз по ходу транскрипции участка между 5 'и 3' последовательностями-мишенями экзогенной матрицы для репарации). В качестве примера, если используются две направляющие РНК, участок-мишень может содержать, состоять по существу из, состоять из 5' (т.е., вверх по ходу транскрипции) и 3' (т.е., вниз по ходу транскрипции) последовательности, фланкирующей участок между последовательностями, распознаваемыми направляющей РНК, или сайтами расщепления Cas. Примеры длин фланкирующих последовательностей описаны в другом месте данного документа.[000182] The target region may comprise, consist essentially of, consist of, for example, any segment or region targeted by one of two or more guide RNAs or one or more exogenous repair templates in the methods described herein, or any segment or region flanking a segment or region targeted by one of two or more guide RNAs or one or more exogenous repair templates in the methods described herein. The target region may be a contiguous genomic sequence or a non-contiguous genomic sequence. For example, a target region may comprise, consist essentially of, or consist of a genomic segment or region targeted for deletion, a genomic segment or region targeted for substitution, or a genomic segment or region targeted for insertion using the methods described herein, and/or may comprise, consist essentially of, or consist of 5' and/or 3' sequence flanking a genomic segment or genomic region targeted for deletion, substitution, or insertion using the methods described herein. Preferably, the target region comprises, consists essentially of, or consists of a sequence immediately upstream and/or a sequence immediately downstream of a region targeted for deletion, substitution, or insertion using the methods described herein (e.g., a sequence upstream and/or downstream of a region between two sequences recognized by a guide RNA or cleavage sites, or a sequence upstream and/or downstream of a region between the 5' and 3' target sequences of an exogenous repair template). As an example, if two guide RNAs are used, the target region may comprise, consist essentially of, consist of a 5' (i.e., upstream) and 3' (i.e., downstream) sequence flanking the region between the sequences recognized by the guide RNA or the Cas cleavage sites. Examples of flanking sequence lengths are described elsewhere in this document.

[000183] В некоторых способах, например, сначала может быть создана экзогенная матрица для репарации, и затем могут быть созданы направляющей РНК в участке, фланкированном с помощью 5'- и 3'-последовательностей-мишеней экзогенной матрицы для репарации, чтобы максимизировать идентичность последовательности в участках внутри, и/или фланкирующие (5' сторона, 3' сторона, или с каждой стороны) последовательности, распознаваемые направляющей РНК (например, фланкирующие участок между двумя последовательностями, распознаваемыми направляющей РНК, наиболее удаленных друг от друга, если используются две или более направляющие РНК). Альтернативно, в некоторых способах, например, сначала могут быть созданы две или более направляющих РНК, и затем может быть создана экзогенная матрица для репарации, так что 5' и 3' последовательности-мишени фланкируют две или более последовательности, распознаваемые направляющей РНК, и так что идентичность последовательности максимизируется в участках внутри и/или фланкированных (5' сторона, 3' сторона или каждая сторона) 5'- и 3'-последовательностей-мишеней (например, фланкирующих участок между 5'- и 3'- последовательностей-мишеней).[000183] In some methods, for example, an exogenous repair template may first be generated, and then guide RNAs may be generated in a region flanked by 5' and 3' target sequences of the exogenous repair template to maximize sequence identity in regions within, and/or flanking (5' side, 3' side, or on either side) the sequences recognized by the guide RNA (e.g., flanking the region between the two sequences recognized by the guide RNA that are most distant from each other if two or more guide RNAs are used). Alternatively, in some methods, for example, two or more guide RNAs may be first generated and then an exogenous repair template may be generated such that the 5' and 3' target sequences flank two or more sequences recognized by the guide RNA and such that sequence identity is maximized in regions within and/or flanked (5' side, 3' side, or each side) by the 5' and 3' target sequences (e.g., flanking the region between the 5' and 3' target sequences).

[000184] В качестве примера, участок-мишень может содержать, состоять по существу из, или состоять из последовательности, распознаваемой направляющей РНК, для одной из двух или более направляющих РНК. Альтернативно или, кроме того, участок-мишень может содержать, состоять по существу из, состоять из 5'- и/или 3'-последовательности, фланкирующей последовательность, распознаваемую направляющей РНК. 5'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности. Аналогично, 3'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности.[000184] As an example, the target region can comprise, consist essentially of, or consist of a sequence recognized by a guide RNA for one of two or more guide RNAs. Alternatively or in addition, the target region can comprise, consist essentially of, or consist of a 5' and/or 3' sequence flanking the sequence recognized by the guide RNA. The 5' flanking sequence can be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, or 1000 bp. flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence. Similarly, the 3' flanking sequence can be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 bp. flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence.

[000185] В качестве другого примера, участок-мишень может содержать, состоять по существу из, или состоять из двух или более последовательностей, распознаваемых направляющей РНК. Альтернативно или, кроме того, участок-мишень может содержать, состоять по существу из, или состоять из 5'- и/или 3'-последовательности, фланкирующей последовательности, распознаваемые направляющей РНК. В способах, в которых используются две направляющие РНК, например, участок-мишень может содержать, состоять по существу из, или состоять из геномного участка, фланкированного с помощью двух последовательностей, распознаваемых направляющей РНК, или сайтов расщепления или геномного участка, фланкированного с помощью и включающей две последовательности, распознаваемые направляющей РНК, или сайты расщепления. Альтернативно или, кроме того, участок-мишень может содержать, состоять по существу из, или состоять из 5'- и/или 3'-последовательности, фланкирующей участок между двумя последовательностями, распознаваемыми направляющей РНК, или сайтами расщепления, или фланкирующей участки между и включающей две последовательности, распознаваемые направляющей РНК, или сайты расщепления. Подобные участки-мишени могут быть выбраны способами, в которых используют более двух направляющих РНК, за исключением того, что вместо геномного участка, фланкированного с помощью двух последовательностей, распознаваемых направляющей РНК, или сайтами расщепления, как указано выше, будет геномный участок, фланкированный с помощью последовательностей, распознаваемых направляющей РНК, сайтов расщепления, наиболее удаленных друг от друга. 5'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности. Аналогично, 3'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности.[000185] As another example, a target region can comprise, consist essentially of, or consist of two or more sequences recognized by a guide RNA. Alternatively or in addition, a target region can comprise, consist essentially of, or consist of a 5' and/or 3' sequence flanking the sequences recognized by the guide RNA. In methods that use two guide RNAs, for example, a target region can comprise, consist essentially of, or consist of a genomic region flanked by two sequences recognized by the guide RNA or cleavage sites, or a genomic region flanked by and including two sequences recognized by the guide RNA or cleavage sites. Alternatively or in addition, the target region may comprise, consist essentially of, or consist of a 5' and/or 3' sequence flanking the region between two guide RNA recognition sequences or cleavage sites, or flanking regions between and including two guide RNA recognition sequences or cleavage sites. Such target regions may be selected by methods that use more than two guide RNAs, except that instead of a genomic region flanked by two guide RNA recognition sequences or cleavage sites as described above, there will be a genomic region flanked by the guide RNA recognition sequences of the cleavage sites that are furthest apart. The 5' flanking sequence may be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 bp of flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence. Similarly, the 3' flanking sequence can be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 bp of flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence.

[000186] В способах, в которых используется экзогенная матрица для репарации, например, участок-мишень может содержать, состоять по существу из, или состоять из участка, фланкированного с помощью 5'- и 3'-последовательностей-мишеней, или участка, фланкированного с помощью и включающей 5' и 3' последовательности-мишени. Альтернативно или дополнительно, участок-мишень может содержать, состоять по существу из, или состоять из 5'- и/или 3'-последовательности, фланкирующей геномный участок между 5'- и 3'-последовательностями-мишенями, или 5'- и/или 3'-последовательности, фланкирующей геномный участок между 5'- и 3'-последовательностями-мишенями. 5'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности. Аналогично, 3'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности.[000186] In methods that utilize an exogenous repair template, for example, the target region can comprise, consist essentially of, or consist of a region flanked by 5' and 3' target sequences, or a region flanked by and including 5' and 3' target sequences. Alternatively or additionally, the target region can comprise, consist essentially of, or consist of 5' and/or 3' sequence flanking a genomic region between the 5' and 3' target sequences, or 5' and/or 3' sequence flanking a genomic region between the 5' and 3' target sequences. The 5' flanking sequence may be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 bp of flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence. Similarly, the 3' flanking sequence can be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 bp of flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence.

[000187] Аллельная идентичность последовательности может быть максимизирована для всего участка-мишени или части участка-мишени. В качестве примера, аллельная идентичность последовательности может быть максимизирована для геномного участка, соответствующего по меньшей мере одной или каждой последовательности, узнаваемой направляющей РНК, или для участков, содержащих по меньшей мере одну или каждую последовательность, узнаваемую направляющей РНК. Например, аллельная идентичность последовательности может быть максимизирована для по меньшей мере одной или каждой последовательности, узнаваемой направляющей РНК. Альтернативно, аллельная идентичность последовательности может быть максимизирована по меньшей мере для одной или каждой последовательности, узнаваемой направляющей РНК, и 5' и/или 3' последовательности, фланкирующей по меньшей мере одну или каждую последовательность, узнаваемую направляющей РНК. Альтернативно, аллельная идентичность последовательности может быть максимизирована для 5'- и/или 3'-последовательности, фланкирующей по меньшей мере одну или каждую последовательность, узнаваемую направляющей РНК. 5'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности. Аналогично, 3'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности.[000187] The allelic sequence identity may be maximized for the entire target region or a portion of the target region. As an example, the allelic sequence identity may be maximized for a genomic region corresponding to at least one or each sequence recognized by a guide RNA, or for regions containing at least one or each sequence recognized by a guide RNA. For example, the allelic sequence identity may be maximized for at least one or each sequence recognized by a guide RNA. Alternatively, the allelic sequence identity may be maximized for at least one or each sequence recognized by a guide RNA and the 5' and/or 3' sequence flanking the at least one or each sequence recognized by a guide RNA. Alternatively, the allelic sequence identity may be maximized for the 5' and/or 3' sequence flanking at least one or each sequence recognized by the guide RNA. The 5' flanking sequence may be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, or 1000 bp. flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence. Similarly, the 3' flanking sequence can be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 bp. flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence.

[000188] Альтернативно или дополнительно аллельная идентичность последовательности может быть максимизирована для геномных участков, соответствующих 5'- и/или 3'-последовательностей-мишеней, для экзогенной матрицы для репарации или для участков, содержащих по меньшей мере одну или каждую из 5'- и 3'-последовательностей-мишеней. Например, аллельная идентичность последовательности может быть максимизирована для по меньшей мере одной или каждой из 5' и 3'-последовательностей-мишеней. Альтернативно, аллельная идентичность последовательности может быть максимизирована по меньшей мере для одной или каждой из 5'- и 3'-последовательностей-мишеней и 5' и/или 3' последовательности, фланкирующей по меньшей мере одну или каждую из 5' и 3'-последовательностей-мишеней. Альтернативно, аллельная идентичность последовательности может быть максимизирована для 5' и/или 3' последовательности, фланкирующей по меньшей мере одну или каждую из 5' и 3'-последовательностей-мишеней. 5'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3,4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности. Аналогично, 3'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности.[000188] Alternatively or additionally, allelic sequence identity may be maximized for genomic regions corresponding to 5' and/or 3' target sequences, to an exogenous repair template, or to regions containing at least one or each of the 5' and 3' target sequences. For example, allelic sequence identity may be maximized for at least one or each of the 5' and 3' target sequences. Alternatively, allelic sequence identity may be maximized for at least one or each of the 5' and 3' target sequences and 5' and/or 3' sequence flanking at least one or each of the 5' and 3' target sequences. Alternatively, the allelic sequence identity may be maximized for 5' and/or 3' sequence flanking at least one or each of the 5' and 3' target sequences. The 5' flanking sequence may be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, or 1000 bp. flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence. Similarly, the 3' flanking sequence can be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 bp. flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence.

[000189] Альтернативно или дополнительно аллельная идентичность последовательности может быть максимизирована для последовательности, фланкирующей участок, являющийся мишенью для делеции, замены или вставки. Например, в способах, использующих две направляющие РНК, аллельная идентичность последовательности может быть максимизирована для 5'- и/или 3'-последовательности, фланкирующей участок между двумя сайтами расщепления или двумя последовательностями, распознаваемыми направляющей РНК. В способах, использующих три или более направляющие РНК, аллельная идентичность последовательности может быть максимизирована для 5' и/или 3' последовательности, фланкирующей участок между двумя сайтами расщепления или двумя последовательностями, распознаваемыми направляющей РНК, которые наиболее удалены друг от друга. В качестве другого примера, в способах, использующих экзогенную матрицу для репарации, аллельная идентичность последовательности может быть максимизирована для 5'- и/или 3'-последовательности, фланкирующей участок между 5'- и 3'-последовательностей-мишеней для экзогенной матрицы для репарации (то есть, геномный участок, являющийся мишенью для удаления с помощью экзогенной матрицы для репарации). 5'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности. Аналогично, 3'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности.[000189] Alternatively or additionally, the allelic sequence identity may be maximized for a sequence flanking the region targeted for deletion, substitution, or insertion. For example, in methods using two guide RNAs, the allelic sequence identity may be maximized for the 5' and/or 3' sequence flanking the region between two cleavage sites or two sequences recognized by the guide RNA. In methods using three or more guide RNAs, the allelic sequence identity may be maximized for the 5' and/or 3' sequence flanking the region between the two cleavage sites or two sequences recognized by the guide RNA that are farthest apart. As another example, in methods using an exogenous repair template, the allelic sequence identity can be maximized for the 5' and/or 3' sequence flanking the region between the 5' and 3' target sequences of the exogenous repair template (i.e., the genomic region targeted for deletion by the exogenous repair template). The 5' flanking sequence can be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, or 1000 bp. flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb or 150 kb of flanking sequence. Similarly, the 3' flanking sequence can be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 bp. flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb or 150 kb of flanking sequence.

[000190] Выбор участка-мишени, так что идентичность последовательности максимизируется для всего или части участка-мишени между соответствующими первой и второй хромосомами в гомологичной паре хромосом, не обязательно означает поиск геномного локуса-мишени на первой и второй хромосомах в гомологичной хромосомной паре и отбор участка с наивысшей аллельной идентичностью последовательности относительно остальной части геномного локуса-мишени, но вместо этого могут приниматься во внимание другие факторы. Например, если участок-мишень содержит, состоит по существу из, или состоит из одной или более последовательностей, распознаваемых направляющей РНК, и/или последовательности, фланкирующей одну или более последовательностей, распознаваемых направляющей РНК, другие факторы, которые могут быть приняты во внимание, включают, например, такие предполагаемые последовательности, распознаваемые направляющей РНК, расположены в участке, независимо оттого, являются ли предполагаемые последовательности, распознаваемые направляющей РНК, уникальными, где внутри участка расположена предполагаемая последовательность, распознаваемая направляющей РНК, насколько успешные или конкретные предполагаемые последовательности, распознаваемые направляющей РНК в участке будут предсказаны, близость предполагаемых последовательностей, распознаваемых направляющей РНК, в пределах участка к подходящим 5'- и 3'-последовательностям мишеням для экзогенной матрицы для репарации, близость предполагаемых последовательностей, распознаваемых направляющей РНК в пределах участка к другим предполагаемым последовательностям, распознаваемым направляющей РНК, близость предполагаемых последовательностей, распознаваемых направляющей РНК, в пределах участка к мутации, являющейся мишенью для коррекции, и так далее. Например, предпочтительно последовательность, узнаваемая направляющей РНК, является уникальным сайтом-мишенью, отсутствующим в другом месте генома. См., например, US 2014/0186843, включенную в данном документе в качестве ссылки в полном объеме для всех целей. Аналогично, специфичность направляющей РНК может относиться к и может быть оптимизирована путем изменения содержания GC и длины последовательности нацеливания, и доступны алгоритмы для создания или оценки последовательности нацеливания направляющей РНК, которая минимизирует нецелевое связывание или взаимодействие направляющей РНК. См., например, WO 2016/094872, включенную в данном документе в качестве ссылки в полном объеме для всех целей. В некоторых способах, можно рассматривать или использовать белки Cas9 из разных видов (например, S. pyogenes Cas9 и S. aureus Cas9) для увеличения количества потенциальных последовательностей, распознаваемых направляющей РНК, связанных с увеличением количества доступных последовательностей РАМ.[000190] Selecting a target region such that sequence identity is maximized for all or part of the target region between the corresponding first and second chromosomes in a homologous chromosome pair does not necessarily mean searching for the target genomic locus on the first and second chromosomes in the homologous chromosome pair and selecting the region with the highest allelic sequence identity relative to the rest of the target genomic locus, but other factors may be taken into account instead. For example, if a target region comprises, consists essentially of, or consists of one or more sequences recognized by a guide RNA and/or a sequence flanking one or more sequences recognized by a guide RNA, other factors that may be taken into account include, for example, whether such putative guide RNA sequences are located within the region, whether the putative guide RNA sequences are unique, where within the region the putative guide RNA sequence is located, how successful or specific putative guide RNA sequences within the region are predicted to be, the proximity of the putative guide RNA sequences within the region to suitable 5' and 3' target sequences for the exogenous repair template, the proximity of the putative guide RNA sequences within the region to other putative guide RNA sequences ... the putative guide RNA sequences within the region, the proximity of the putative guide RNA sequences within the region to the put putative sequences recognized by the guide RNA within the region of the mutation targeted for correction, and so on. For example, preferably the sequence recognized by the guide RNA is a unique target site not found elsewhere in the genome. See, for example, US 2014/0186843, incorporated herein by reference in its entirety for all purposes. Similarly, the specificity of the guide RNA can relate to and can be optimized by altering the GC content and length of the targeting sequence, and algorithms are available for designing or evaluating a guide RNA targeting sequence that minimizes off-target binding or interaction of the guide RNA. See, for example, WO 2016/094872, incorporated herein by reference in its entirety for all purposes. In some methods, Cas9 proteins from different species (e.g., S. pyogenes Cas9 and S. aureus Cas9) can be considered or used to increase the number of potential sequences recognized by the guide RNA, associated with an increase in the number of available PAM sequences.

[000191] В одном примере, участок-мишень может быть выбран так, чтобы весь или часть участка-мишени обладал высоким процентом идентичности последовательности между соответствующими первой и второй хромосомами в гомологичной паре хромосом. Например, участок-мишень может быть выбран так, чтобы весь или часть участка-мишени обладал минимальным процентом идентичности последовательности между соответствующими первой и второй хромосомами в гомологичной паре хромосом, такой как по меньшей мере 95%, 95,5%, 96%, 96,5%, 97%, 97,5%, 98%, 98,5%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,55%, 99,6%, 99,65%, 99,7%, 99,75%, 99,8%, 99,85%, 99,9%, 99,95% или 100% идентичности последовательности.[000191] In one example, the target region may be selected such that all or a portion of the target region has a high percentage of sequence identity between the corresponding first and second chromosomes in a homologous pair of chromosomes. For example, the target region can be selected such that all or a portion of the target region has a minimum percentage of sequence identity between the corresponding first and second chromosomes in a homologous pair of chromosomes, such as at least 95%, 95.5%, 96%, 96.5%, 97%, 97.5%, 98%, 98.5%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.55%, 99.6%, 99.65%, 99.7%, 99.75%, 99.8%, 99.85%, 99.9%, 99.95% or 100% sequence identity.

[000192] В другом примере, участок-мишень может быть выбран так, чтобы весь или часть участка-мишени имел низкое количество или низкую плотность одиночных нуклеотидных вариаций между соответствующими первой и второй хромосомами в гомологичной паре хромосом. Например, участок-мишень может быть выбран так, чтобы весь или часть участка-мишени обладал максимальной плотностью одиночных нуклеотидных вариаций между соответствующими первой и второй хромосомами в гомологичной паре хромосом, такой как не более чем 5, 4,9, 4,8, 4,7, 4,6, 4,5, 4,4, 4,3, 4,2, 4,1, 4, 3,9, 3,8, 3,7, 3,6, 3,5, 3,4, 3,3, 3,2, 3,1, 3, 2,9, 2,8, 2,7, 2,6, 2,5, 2,4, 2,3, 2,2, 2,1, 2, 1,9, 1,8, 1,7, 1,6, 1,5, 1,4, 1,3, 1,2, 1,1, 1, 0,9, 0,8, 0,7, 0,6, 0,5, 0,4, 0,3, 0,2, 0,1 или ноль одиночных нуклеотидов на т.п.о. последовательности.[000192] In another example, the target region may be selected such that all or a portion of the target region has a low number or low density of single nucleotide variations between the corresponding first and second chromosomes in the homologous pair of chromosomes. For example, the target region may be selected such that all or a portion of the target region has the maximum density of single nucleotide variations between the corresponding first and second chromosomes in a homologous pair of chromosomes, such as no more than 5, 4.9, 4.8, 4.7, 4.6, 4.5, 4.4, 4.3, 4.2, 4.1, 4, 3.9, 3.8, 3.7, 3.6, 3.5, 3.4, 3.3, 3.2, 3.1, 3, 2.9, 2.8, 2.7, 2.6, 2.5, 2.4, 2.3, 2.2, 2.1, 2, 1.9, 1.8, 1.7, 1.6, 1.5, 1.4, 1.3, 1.2, 1.1, 1, 0.9, 0.8, 0.7, 0.6, 0.5, 0.4, 0.3, 0.2, 0.1 or zero single nucleotides per kb of sequence.

[000193] Необязательно, участок-мишень может быть идентичен в соответствующей первой и второй хромосомах в гомологичной паре хромосом. Необязательно, участок-мишень может находится в пределах максимально возможного участка непрерывной идентичности последовательности в геномном локусе-мишени.[000193] Optionally, the target region may be identical in the corresponding first and second chromosomes in a homologous pair of chromosomes. Optionally, the target region may be within the maximum possible region of contiguous sequence identity in the target genomic locus.

[000194] Альтернативно или дополнительно участок-мишень в геномном локусе-мишени может быть выбран таким образом, что весь или часть участка-мишени имеет высокий процент идентичности последовательности или низкое количество, или низкую плотность одиночных нуклеотидных вариаций между соответствующими первой и второй хромосомами в гомологичной паре хромосом по отношению к другим участкам в пределах геномного локуса-мишени.[000194] Alternatively or additionally, the target region within the target genomic locus may be selected such that all or a portion of the target region has a high percentage of sequence identity or a low number or low density of single nucleotide variations between the corresponding first and second chromosomes in the homologous chromosome pair relative to other regions within the target genomic locus.

[000195] Например, участок-мишень может иметь более высокий процент идентичности последовательности или более низкую плотность одиночных нуклеотидных вариаций относительно всей или части остальной части геномного локуса-мишени. Например, участок-мишень может иметь по меньшей мере 99,9% идентичности последовательностей между соответствующими первой и второй гомологичными хромосомами, а остальная часть геномного локуса-мишени имеет не более чем 99,8% идентичности последовательности между соответствующими первой и второй хромосомами.[000195] For example, a target region may have a higher percentage of sequence identity or a lower density of single nucleotide variations relative to all or a portion of the remainder of the target genomic locus. For example, a target region may have at least 99.9% sequence identity between the corresponding first and second homologous chromosomes, and the remainder of the target genomic locus has no more than 99.8% sequence identity between the corresponding first and second chromosomes.

[000196] Например, участок-мишень может содержать, состоять по существу из, или состоять из одной или более геномных участков-мишеней, соответствующих одной или более последовательностям, распознаваемых направляющей РНК, и участок-мишень может иметь высокий процент идентичности последовательности или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени, таких как геномные участки, соответствующие одной или более другим потенциальным последовательностям, распознаваемых направляющей РНК в геномном локусе-мишени. В качестве одного примера, участок-мишень может содержать, состоять по существу из, или состоять из по меньшей мере одной или каждой из одной или более последовательностей, распознаваемых направляющей РНК, а участок-мишень может иметь высокий процент идентичности последовательности или низкую плотность одиночных нуклеотидных вариаций по отношению к другим сегментам геномного локуса-мишени, таким как одна или более других потенциальных последовательностей, распознаваемых направляющей РНК в геномном локусе-мишени. В качестве еще одного примера, участок-мишень может содержать, состоять по существу из, или состоять из по меньшей мере одной или каждой из одной или более последовательности, распознаваемой направляющей РНК, и 5' и/или 3' последовательности, фланкирующей по меньшей мере одну или каждую из одной или более последовательностей, распознаваемых направляющей РНК, а участок-мишень может иметь высокий процент идентичности последовательности или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени, такую как одна или более других потенциальных последовательностей, распознаваемых направляющей РНК, и их 5' и/или 3' фланкирующей последовательности в геномном локусе-мишени. В еще одном примере участок-мишень может содержать, состоять по существу из, или состоять из 5'- и/или 3'-последовательности, фланкирующей по меньшей мере одну или каждую из одной или более последовательностей, распознаваемых направляющей РНК, и участок-мишень может иметь высокий процент идентичности последовательностей или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени, таких как 5' и/или 3' фланкирующей последовательности одной или более других потенциальных последовательностей, распознаваемых направляющей РНК в геномном локусе-мишени. 5'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности. Аналогично, 3'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности.[000196] For example, a target region can comprise, consist essentially of, or consist of one or more genomic target regions corresponding to one or more sequences recognized by a guide RNA, and the target region can have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus, such as genomic regions corresponding to one or more other potential sequences recognized by a guide RNA in the target genomic locus. As one example, a target region can comprise, consist essentially of, or consist of at least one or each of the one or more sequences recognized by a guide RNA, and the target region can have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus, such as one or more other potential sequences recognized by a guide RNA in the target genomic locus. As another example, the target region can comprise, consist essentially of, or consist of at least one or each of one or more sequences recognized by a guide RNA and a 5' and/or 3' sequence flanking the at least one or each of the one or more sequences recognized by the guide RNA, and the target region can have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus, such as one or more other potential sequences recognized by a guide RNA and their 5' and/or 3' flanking sequence in the target genomic locus. In another example, the target region can comprise, consist essentially of, or consist of 5' and/or 3' sequence flanking at least one or each of the one or more sequences recognized by the guide RNA, and the target region can have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus, such as 5' and/or 3' flanking sequence of one or more other potential sequences recognized by the guide RNA in the target genomic locus. The 5' flanking sequence can be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, or 1000 bp. flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence. Similarly, the 3' flanking sequence can be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 bp. flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence.

[000197] В способах, в которых используются две направляющие РНК, участок-мишень может содержать, состоять по существу из, или состоять из первого геномного участка-мишени, соответствующего последовательности, распознаваемой первой направляющей РНК, и/или второго геномного участка-мишени, соответствующего последовательности, распознаваемой второй направляющей РНК, а участок-мишень может иметь высокий процент идентичности последовательности или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени, таких как геномные участки, соответствующие одной или более другим потенциальным последовательностям, распознаваемым направляющей РНК, в пределах геномного локуса-мишени. Например, участок-мишень может содержать, состоять по существу из, или состоять из последовательности, распознаваемой первой направляющей РНК, и/или последовательности, распознаваемой второй направляющей РНК, а участок-мишень может иметь высокий процент идентичности последовательности или низкую плотность одиночных нуклеотидных вариаций по отношению к другим сегментам геномного локуса-мишени, таким как одна или более других потенциальных последовательностей, распознаваемых направляющей РНК в геномном локусе-мишени. В качестве другого примера участок-мишень может содержать, состоять по существу из, или состоять из большого процента последовательности, распознаваемой первой направляющей РНК, и 5' и/или 3' последовательности, фланкирующей последовательность, распознаваемую первой направляющей РНК, и/или последовательность, распознаваемую второй направляющей РНК, и 5' и/или 3' последовательности, фланкирующей последовательность, распознаваемую второй направляющей РНК, и участок-мишень может иметь высокий процент идентичности последовательности или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени, таких как геномные участки, соответствующие одной или более другим потенциальным последовательностям, распознаваемым направляющей РНК, и их 5' и/или 3' фланкирующей последовательности в геномном локусе-мишени. В еще одном примере, участок-мишень может содержать, состоять по существу из, или состоять из 5'- и/или 3'-последовательности, фланкирующей последовательность, распознаваемую первой направляющей РНК, и/или 5'-и/или 3'-последовательности, фланкирующей последовательность, распознаваемую второй направляющей РНК, а участок-мишень может иметь высокий процент идентичности последовательностей или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени, таких как 5' и/или 3'-последовательности, фланкирующей одну или более других потенциальных последовательностей, распознаваемых направляющей РНК в геномном локусе-мишени. 5'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности. Аналогично, 3'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности.[000197] In methods that utilize two guide RNAs, the target region may comprise, consist essentially of, or consist of a first target genomic region corresponding to a sequence recognized by a first guide RNA and/or a second target genomic region corresponding to a sequence recognized by a second guide RNA, and the target region may have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus, such as genomic regions corresponding to one or more other potential guide RNA recognition sequences within the target genomic locus. For example, a target region may comprise, consist essentially of, or consist of a sequence recognized by a first guide RNA and/or a sequence recognized by a second guide RNA, and the target region may have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus, such as one or more other potential sequences recognized by a guide RNA in the target genomic locus. As another example, the target region may comprise, consist essentially of, or consist of a high percentage of a sequence recognized by a first guide RNA and 5' and/or 3' sequence flanking the sequence recognized by the first guide RNA and/or a sequence recognized by a second guide RNA and 5' and/or 3' sequence flanking the sequence recognized by the second guide RNA, and the target region may have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus, such as genomic regions corresponding to one or more other potential sequences recognized by the guide RNA and their 5' and/or 3' flanking sequence in the target genomic locus. In another example, the target region may comprise, consist essentially of, or consist of 5' and/or 3' sequence flanking a sequence recognized by a first guide RNA and/or 5' and/or 3' sequence flanking a sequence recognized by a second guide RNA, and the target region may have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus, such as 5' and/or 3' sequences flanking one or more other potential sequences recognized by a guide RNA in the target genomic locus. The 5' flanking sequence may be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 bp of flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence. Similarly, the 3' flanking sequence can be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 bp of flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence.

[000198] Таким образом, в способах, в которых рассматривается одна направляющая РНК при выборе участка-мишени, например, выбор участка-мишени может включать в себя сравнение двух или более сегментов геномного локуса-мишени, причем каждый сегмент содержит, по существу состоит из, состоит из последовательности узнавания другой направляющей РНК, не присутствующей в другом месте в геноме, и по меньшей мере 10 п.о., 20 п.о., 30 п.о., 40 п.о., 50 п.о., 100 п.о., 200 п.о., 300 п.о., 400 п.о., 500 п.о., 600 п.о., 700 п.о., 800 п.о., 900 п.о., 1000 п.о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5' стороне, 3' стороне или на каждой стороне последовательности узнавания другой направляющей РНК, и выбирается как участок-мишень сегмента, имеющего самый высокий процент идентичности последовательности по отношению к другим сегментам. Если используются две или более направляющих РНК, способ может включать в себя выбор в качестве участка-мишени двух или более сегментов, имеющих самый высокий процент идентичности последовательности по сравнению с другими сегментами. Необязательно, один или более сегментов могут содержать, состоят по существу из, или состоят из сегментов, соответствующих каждой последовательности, узнаваемой направляющей РНК, в геномном локусе-мишени, но не присутствуют в другом месте в геноме.[000198] Thus, in methods that consider a single guide RNA in selecting a target region, for example, selecting a target region may include comparing two or more segments of a target genomic locus, each segment comprising, consisting essentially of, consisting of a recognition sequence of a different guide RNA not present elsewhere in the genome, and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 t.p.o., 3 t.p.o., 4 t.p.o., 5 t.p.o., 6 t.p.o., 7 t.p.o., 8 t.p.o., 9 t.p.o., 10 t.p.o., 20 t.p.o., 30 t.p.o., 40 t.p.o., 50 t.p.o., 60 t.p.o., 70 t.p.o., 80 t.p.o., 90 t.p.o., 100 t.p.o., 110 t.p.o., 120 t.p.o., 130 t.p.o., 140 t.p.o. or 150 t.p.o. flanking sequence on the 5' side, the 3' side, or on each side of the recognition sequence of another guide RNA, and the segment having the highest percentage of sequence identity to the other segments is selected as the target region. If two or more guide RNAs are used, the method may include selecting as the target region two or more segments having the highest percentage of sequence identity to the other segments. Optionally, one or more segments may comprise, consist essentially of, or consist of segments corresponding to each guide RNA recognition sequence at the target genomic locus but not present elsewhere in the genome.

[000199] Альтернативно или дополнительно, в способах, в которых используются две направляющие РНК, участок-мишень может содержать, состоять по существу из, или состоять из участка между последовательностями, распознаваемыми первой и второй направляющими РНК, или первым и вторым сайтами расщепления, а участок-мишень может иметь высокий процент идентичности последовательностей или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени, таких как участок между одной или более другими потенциальными последовательностями, распознаваемыми направляющей РНК, или сайтами расщепления в геномном локусе-мишени. Если используются три или более направляющие РНК, то соответствующий участок будет участком между двумя последовательностями, распознаваемыми направляющей РНК, или двумя сайтами расщепления, которые наиболее удалены друг от друга.[000199] Alternatively or additionally, in methods that use two guide RNAs, the target region may comprise, consist essentially of, or consist of a region between sequences recognized by the first and second guide RNAs, or the first and second cleavage sites, and the target region may have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus, such as a region between one or more other potential guide RNA sequences or cleavage sites in the target genomic locus. If three or more guide RNAs are used, the relevant region will be a region between the two guide RNA sequences or two cleavage sites that are most distant from each other.

[000200] Таким образом, в способах, в которых используются две направляющие РНК, например, выбор участка-мишени может включать в себя сравнение двух или более сегментов геномного локуса-мишени, причем каждый сегмент содержит, по существу состоит из, или состоит из участка между парой разных последовательностей, распознаваемых направляющей РНК, причем последовательности, распознаваемые направляющей РНК, не присутствуют в другом месте генома, и выбираются в качестве участка-мишени сегмента, имеющего самый высокий процент идентичности последовательности по сравнению с другими сегментами. Необязательно, один или более сегментов содержат, состоят по существу из, или состоят из сегментов, соответствующих каждой паре разных последовательностей, распознаваемых направляющей РНК, в геномном локусе-мишени, причем последовательности, распознаваемые направляющей РНК, отсутствуют в другом месте генома.[000200] Thus, in methods that use two guide RNAs, for example, selecting a target region may include comparing two or more segments of a target genomic locus, wherein each segment comprises, consists essentially of, or consists of a region between a pair of different sequences recognized by the guide RNA, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome, and the segment having the highest percentage of sequence identity compared to the other segments is selected as the target region. Optionally, one or more segments comprise, consist essentially of, or consist of segments corresponding to each pair of different sequences recognized by the guide RNA in the target genomic locus, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome.

[000201] Альтернативно или дополнительно, в способах, в которых используются две направляющие РНК, участок-мишень может содержать, состоять по существу из, или состоять из участка между последовательностями, распознаваемыми первой и второй направляющими РНК, или первым и вторым сайтами расщепления, и 5' и/или 3'-последовательности, фланкирующей геномный участок между последовательностями, распознаваемыми первой и второй направляющими РНК, или первым и вторым сайтами расщепления, и участок-мишень может иметь высокий процент идентичности последовательности или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени, таких как участок между одной или более парами разных потенциальных последовательностей, распознаваемых направляющей РНК, или сайтами расщепления в пределах геномного локуса-мишени, и 5'-и/или 3'-последовательности, фланкирующей геномный участок между одной или более парами разных потенциальных последовательностей, распознаваемых направляющей РНК, или сайтами расщепления. Предпочтительно участок-мишень может содержать, состоять по существу из, или состоять из геномного участка между последовательностями, распознаваемыми первой и второй направляющими РНК, или первым и вторым сайтами расщепления, и 5'- и 3'-последовательности, фланкирующей геномный участок между последовательностями, распознаваемыми первой и второй направляющими РНК, или первым и вторым сайтами расщепления, и участок-мишень может иметь высокий процент идентичности последовательностей или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени, таких как участок между одной или более парами разных потенциальных последовательностей, распознаваемых направляющей РНК, или сайтами расщепления в пределах геномного локуса-мишени, и 5'- и 3'-последовательности, фланкирующей геномные участки между одной или более парами разных потенциальных последовательностей, распознаваемых направляющей РНК, или сайтами расщепления. Если используются три или более направляющие РНК, то соответствующим участком будет 5' и/или 3' последовательность, фланкирующая геномный участок между двумя последовательностями, распознаваемыми направляющей РНК, или двумя сайтами расщепления, которые наиболее удалены друг от друга. 5'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности. Аналогично, 3'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности.[000201] Alternatively or additionally, in methods that utilize two guide RNAs, the target region may comprise, consist essentially of, or consist of a region between the sequences recognized by the first and second guide RNAs or the first and second cleavage sites and 5' and/or 3' sequence flanking the genomic region between the sequences recognized by the first and second guide RNAs or the first and second cleavage sites, and the target region may have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus, such as a region between one or more pairs of different potential guide RNA recognition sequences or cleavage sites within the target genomic locus and 5' and/or 3' sequence flanking the genomic region between one or more pairs of different potential guide RNA, or cleavage sites. Preferably, the target region may comprise, consist essentially of, or consist of a genomic region between sequences recognized by the first and second guide RNAs, or the first and second cleavage sites, and 5' and 3' sequence flanking the genomic region between the sequences recognized by the first and second guide RNAs, or the first and second cleavage sites, and the target region may have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus, such as a region between one or more pairs of different potential guide RNA recognition sequences or cleavage sites within the target genomic locus, and 5' and 3' sequence flanking the genomic regions between one or more pairs of different potential guide RNA recognition sequences or cleavage sites. If three or more guide RNAs are used, the relevant region will be the 5' and/or 3' sequence flanking the genomic region between the two sequences recognized by the guide RNA or the two cleavage sites that are furthest apart. The 5' flanking sequence may be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 bp. flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence. Similarly, the 3' flanking sequence can be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 bp. flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence.

[000202] Таким образом, в способах, в которых используются две направляющие РНК, например, выбирается участок-мишень которая может включать в себя сравнение двух или более сегментов геномного локуса-мишени, причем каждый сегмент содержит, по существу состоит из, или состоит из участка между парой разных последовательностей, распознаваемых направляющей РНК, и по меньшей мере 10 п.о., 20 п.о., 30 п.о., 40 п.о., 50 п.о., 100 п.о., 200 п.о., 300 п.о., 400 п.о., 500 п.о., 600 п.о., 700 п.о., 800 п.о., 900 п.о., 1000 п.о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5'-стороне, 3'-стороне или на каждой стороне геномного участка между парой разных последовательностей, распознаваемых направляющей РНК, причем последовательности, распознаваемые направляющей РНК, не присутствуют в другом месте генома, и выбираются в качестве участка-мишени сегмента, имеющего самый высокий процент идентичности последовательности относительно других сегментов. Необязательно, один или более сегментов содержат, состоят по существу из, или состоят из сегментов, соответствующих каждой паре разных последовательностей, распознаваемых направляющей РНК, в геномном локусе-мишени, причем последовательности, распознаваемые направляющей РНК, отсутствуют в другом месте генома.[000202] Thus, in methods that use two guide RNAs, for example, a target region is selected which may include comparing two or more segments of a target genomic locus, wherein each segment comprises, consists essentially of, or consists of a region between a pair of different sequences recognized by the guide RNA, and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 t.p.o., 4 t.p.o., 5 t.p.o., 6 t.p.o., 7 t.p.o., 8 t.p.o., 9 t.p.o., 10 t.p.o., 20 t.p.o., 30 t.p.o., 40 t.p.o., 50 t.p.o., 60 t.p.o., 70 t.p.o., 80 t.p.o., 90 t.p.o., 100 t.p.o., 110 t.p.o., 120 t.p.o., 130 t.p.o., 140 t.p.o. or 150 t.p.o. flanking sequences on the 5' side, 3' side, or on each side of the genomic region between a pair of different sequences recognized by the guide RNA, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome, and the segment having the highest percentage of sequence identity relative to the other segments is selected as the target region. Optionally, the one or more segments comprise, consist essentially of, or consist of segments corresponding to each pair of different sequences recognized by the guide RNA at the target genomic locus, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome.

[000203] Альтернативно или дополнительно, в способах, в которых используются две направляющие РНК, участок-мишень может содержать, состоять по существу из, или состоять из 5'- и/или 3'-последовательности, фланкирующей геномный участок между последовательностями, распознаваемыми первой и второй направляющими РНК, или первым и вторым сайтами расщепления, а участок-мишень может иметь высокий процент идентичности последовательности или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени, таких как 5' и/или 3'-последовательность, фланкирующую геномные участки между одной или более других пар потенциальных последовательностей, распознаваемых направляющей РНК, или сайтов расщепления в пределах геномного локуса-мишени. Предпочтительно, участок-мишень может содержать, состоять по существу из, или состоять из 5'- и 3'-последовательности, фланкирующей геномный участок между последовательностями, распознаваемыми первой и второй направляющими РНК, или первым и вторым сайтами расщепления, и участок-мишень может иметь высокий процент идентичности последовательностей или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени, таких как 5'- и 3'-последовательности, фланкирующей геномный участок между одной или более парами разных потенциальных последовательностей, распознаваемых направляющей РНК, или сайтов расщепления в пределах геномного локуса-мишени. Если используются три или более направляющие РНК, то соответствующим участком будет 5' и/или 3' последовательность, фланкирующая геномный участок между двумя последовательностями, распознаваемыми направляющей РНК, или двумя сайтами расщепления, которые наиболее удалены друг от друга. 5'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности. Аналогично, 3'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности.[000203] Alternatively or additionally, in methods that utilize two guide RNAs, the target region can comprise, consist essentially of, or consist of 5' and/or 3' sequence flanking the genomic region between the sequences recognized by the first and second guide RNAs or the first and second cleavage sites, and the target region can have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus, such as 5' and/or 3' sequence flanking the genomic regions between one or more other pairs of potential guide RNA recognition sequences or cleavage sites within the target genomic locus. Preferably, the target region may comprise, consist essentially of, or consist of 5' and 3' sequence flanking the genomic region between the sequences recognized by the first and second guide RNAs or the first and second cleavage sites, and the target region may have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus, such as 5' and 3' sequence flanking the genomic region between one or more pairs of different potential guide RNA recognition sequences or cleavage sites within the target genomic locus. If three or more guide RNAs are used, the corresponding region will be the 5' and/or 3' sequence flanking the genomic region between the two guide RNA recognition sequences or two cleavage sites that are most distant from each other. The 5' flanking sequence may be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 bp of flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence. Similarly, the 3' flanking sequence can be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 bp of flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence.

[000204] Таким образом, в способах, в которых используются две направляющие РНК, например, выбирается участок-мишень который может включать в себя сравнение двух или более несмежных сегментов геномного локуса-мишени, причем каждый несмежный сегмент содержит, по существу состоит из, или состоит из по меньшей мере 10 п.о., 20 п.о., 30 п.о., 40 п.о., 50 п.о., 100 п.о., 200 п.о., 300 п.о., 400 п.о., 500 п.о., 600 п.о., 700 п.о., 800 п.о., 900 п.о., 1000 п.о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о. или 150 т.п.о. фланкирующей последовательности на 5'-стороне, 3'-стороне или на каждой стороне геномного участка между парой разных последовательностей, распознаваемых направляющей РНК, причем последовательности, распознаваемые направляющей РНК, не присутствуют в другом месте генома, и выбираются в качестве участка-мишени несмежного сегмента, имеющего самый высокий процент идентичности последовательности относительно других несмежных сегментов. Необязательно, один или более несмежных сегментов содержат, состоят по существу из, или состоят из несмежных сегментов, соответствующих каждой паре разных последовательностей, распознаваемых направляющей РНК в геномном локусе-мишени, причем последовательности, распознаваемые направляющей РНК, отсутствуют в другом месте генома.[000204] Thus, in methods that use two guide RNAs, for example, a target region is selected which may include comparing two or more non-contiguous segments of a target genomic locus, wherein each non-contiguous segment comprises, consists essentially of, or consists of at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1 kb, 2 kb, 3 kb, 4 t.p.o., 5 t.p.o., 6 t.p.o., 7 t.p.o., 8 t.p.o., 9 t.p.o., 10 t.p.o., 20 t.p.o., 30 t.p.o., 40 t.p.o., 50 t.p.o., 60 t.p.o., 70 t.p.o., 80 t.p.o., 90 t.p.o., 100 t.p.o., 110 t.p.o., 120 t.p.o., 130 t.p.o., 140 t.p.o. or 150 t.p.o. a flanking sequence on the 5' side, the 3' side, or on each side of the genomic region between a pair of different sequences recognized by the guide RNA, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome, and the non-contiguous segment having the highest percentage of sequence identity relative to the other non-contiguous segments is selected as the target region. Optionally, the one or more non-contiguous segments comprise, consist essentially of, or consist of non-contiguous segments corresponding to each pair of different sequences recognized by the guide RNA at the target genomic locus, wherein the sequences recognized by the guide RNA are not present elsewhere in the genome.

[000205] В способах, в которых используются экзогенные матрицы для репарации, участок-мишень может содержать, состоять по существу из, или состоять из участка между 5'- и 3'-последовательностями-мишенями, а участок-мишень может иметь высокий процент идентичности последовательности или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени. Альтернативно или дополнительно участок-мишень может содержать, состоять по существу из, или состоять из 5'- и/или 3'-последовательностей-мишеней, и участок-мишень может иметь высокий процент идентичности последовательности или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени. Предпочтительно, участок-мишень может содержать, состоять по существу из, или состоять из 5'- и 3'-последовательностей-мишеней, и участок-мишень может иметь высокий процент идентичности последовательности или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени. Например, участок-мишень может содержать, состоять по существу из, или состоять из участка, фланкированного и включающего 5' и 3' последовательности-мишени, и участок-мишень может иметь высокий процент идентичности последовательности или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени.[000205] In methods that utilize exogenous repair templates, the target region can comprise, consist essentially of, or consist of a region between 5' and 3' target sequences, and the target region can have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus. Alternatively or additionally, the target region can comprise, consist essentially of, or consist of 5' and/or 3' target sequences, and the target region can have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus. Preferably, the target region may comprise, consist essentially of, or consist of 5' and 3' target sequences, and the target region may have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus. For example, the target region may comprise, consist essentially of, or consist of a region flanked by and including 5' and 3' target sequences, and the target region may have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the target genomic locus.

[000206] Аналогично, в способах, в которых используется экзогенная матрица для репарации, участок-мишень может содержать, состоять по существу из, или состоять из 5'- и/или 3'-последовательности, фланкирующей геномный участок между 5' и 3' последовательностями-мишенями экзогенной матрицы для репарации, или 5' и/или 3' последовательности, фланкирующей геномный участок между и включающий 5' и 3' последовательности-мишени экзогенной матрицы для репарации, и участок-мишень может иметь высокий процент идентичности последовательности или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени. Предпочтительно, участок-мишень может содержать, состоять по существу из, или состоять из 5'- и 3'-последовательности, фланкирующей геномный участок между 5' и 3' последовательностями-мишенями экзогенной матрицы для репарации, или в пределах 5' и 3' последовательности, фланкирующей геномный участок между и включающий 5' и 3'-последовательности-мишени экзогенной матрицы для репарации, и участок-мишень может иметь высокий процент идентичности последовательности или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса мишени. Альтернативно, участок-мишень может содержать, состоять по существу из, или состоять из участка между 5'- и 3'-последовательностями-мишенями экзогенной матрицы для репарации, и 5'- и/или 3'-последовательности, фланкирующей геномный участок между 5' и 3'-последовательностями-мишенями, и участок-мишень может иметь высокий процент идентичности последовательности или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени. Предпочтительно, участок-мишень может содержать, состоять по существу из, или состоять из участка между 5'- и 3'-последовательностями-мишенями экзогенной матрицы для репарации, и 5'- и 3'-последовательности, фланкирующей геномный участок между 5' и 3'-последовательностями-мишенями, и участок-мишень может иметь высокий процент идентичности последовательности или низкую плотность одиночных нуклеотидных вариаций относительно других сегментов геномного локуса-мишени. 5'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности. Аналогично, 3'-фланкирующая последовательность может быть, например, по меньшей мере 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 или 1000 п.о. фланкирующей последовательности или по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 или 150 т.п.о. фланкирующей последовательности.[000206] Similarly, in methods that utilize an exogenous repair template, the target region may comprise, consist essentially of, or consist of 5' and/or 3' sequence flanking the genomic region between the 5' and 3' target sequences of the exogenous repair template, or 5' and/or 3' sequence flanking the genomic region between and including the 5' and 3' target sequences of the exogenous repair template, and the target region may have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the genomic locus of the target. Preferably, the target region may comprise, consist essentially of, or consist of 5' and 3' sequence flanking the genomic region between the 5' and 3' target sequences of the exogenous repair template, or within 5' and 3' sequence flanking the genomic region between and including the 5' and 3' target sequences of the exogenous repair template, and the target region may have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the genomic locus of the target. Alternatively, the target region may comprise, consist essentially of, or consist of a region between the 5' and 3' target sequences of the exogenous repair template, and 5' and/or 3' sequence flanking the genomic region between the 5' and 3' target sequences, and the target region may have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the genomic target locus. Preferably, the target region may comprise, consist essentially of, or consist of a region between the 5' and 3' target sequences of the exogenous repair template, and 5' and 3' sequence flanking the genomic region between the 5' and 3' target sequences, and the target region may have a high percentage of sequence identity or a low density of single nucleotide variations relative to other segments of the genomic target locus. The 5' flanking sequence may be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, or 1000 bp. flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence. Similarly, the 3' flanking sequence can be, for example, at least 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 bp. flanking sequence or at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140 or 150 kb of flanking sequence.

[000207] Участок-мишень, модифицированный описанными в данном документе способами, может включать в себя любой сегмент или участок (смежный или несмежный) ДНК внутри клетки. Участок-мишень может быть родным для клетки, может представлять собой гетерологичный или экзогенный сегмент ДНК, который был интегрирован в геном клетки или может быть их комбинацией. Такие гетерологичные или экзогенные сегменты ДНК могут включать трансгены, экспрессионные кассеты, полинуклеотидные кодирующие селективные маркеры, или гетерологичные или экзогенные участки геномной ДНК.[000207] The target region modified by the methods described herein may include any segment or region (contiguous or non-contiguous) of DNA within a cell. The target region may be native to the cell, may be a heterologous or exogenous segment of DNA that has been integrated into the genome of the cell, or may be a combination thereof. Such heterologous or exogenous segments of DNA may include transgenes, expression cassettes, polynucleotides encoding selectable markers, or heterologous or exogenous regions of genomic DNA.

В. CRISPR/Cas системыB. CRISPR/Cas systems

[000208] Способы, описанные в настоящем документе, используют короткие палиндромные повторы, регулярно расположенные группами (CRISPR)/CRISPR (Cas)-ассоциированные системы или компоненты таких систем для модификации генома в клетке. Системы CRISPR/Cas включают транскрипты и другие элементы, участвующие в экспрессии или управлении активностью генов Cas. Система CRISPR/Cas может быть системой типа I, типа II или типа III. Альтернативно, система CRISPR/Cas может быть, например, системой типа V (например, подтипом V-A или подтипом V-B). Способы и композиции, описанные в данном документе, используют системы CRISPR/Cas, используя комплексы CRISPR (содержащие направляющую РНК (гРНК), образованную комплексом с белком Cas) для сайт-направленного расщепления нуклеиновых кислот.[000208] The methods described herein utilize clustered regularly interspaced short palindromic repeats (CRISPR)/CRISPR (Cas)-associated systems or components of such systems to modify the genome in a cell. CRISPR/Cas systems include transcripts and other elements involved in the expression or control of the activity of Cas genes. A CRISPR/Cas system can be a Type I, Type II, or Type III system. Alternatively, a CRISPR/Cas system can be, for example, a Type V system (e.g., subtype V-A or subtype V-B). The methods and compositions described herein utilize CRISPR/Cas systems using CRISPR complexes (containing guide RNA (gRNA) complexed with a Cas protein) to site-directedly cleave nucleic acids.

[000209] Системы CRISPR/Cas, используемые в описанных в данном документе способах, являются не встречающимися в природе. Система «не встречающаяся в природе» включает в себя что-либо, указывающее на вмешательство человека, такое как один или более компонентов системы, которые изменяются или мутируют из их природного состояния, будучи по меньшей мере по существу свободными по меньшей мере от одного другого компонента с которыми они естественным образом связаны в природе, или связаны с по меньшей мере одним другим компонентом, с которым они не связаны естественным образом. Например, в некоторых системах CRISPR/Cas используются не встречающиеся в природе комплексы CRISPR, содержащие гРНК и белок Cas, которые не встречаются в природе вместе. В других системах CRISPR/Cas используется белок Cas, который не встречается в природе, а в других системах CRISPR/Cas используется гРНК, которая не возникает естественным образом.[000209] The CRISPR/Cas systems used in the methods described herein are not naturally occurring. A "non-naturally occurring" system includes anything indicative of human intervention, such as one or more components of the system that are altered or mutated from their natural state, being at least substantially free of at least one other component with which they are naturally associated in nature, or associated with at least one other component with which they are not naturally associated. For example, some CRISPR/Cas systems use non-naturally occurring CRISPR complexes containing a gRNA and a Cas protein that are not found together in nature. Other CRISPR/Cas systems use a Cas protein that is not found in nature, and other CRISPR/Cas systems use a gRNA that does not occur naturally.

(1) Cas Белки(1) Cas Squirrels

[000210] Белки Cas обычно содержат по меньшей мере одну РНК узнавания или связывающий домен, который может взаимодействовать с направляющими РНК (гРНК, описанными более подробно ниже). Cas белки также могут содержать нуклеазные домены (например, домены ДНКазы или РНКазы), ДНК-связывающие домены, домены геликазы, домены белок-белок взаимодействия, домены димеризации и другие домены. Домен нуклеазы обладает каталитической активностью для расщепления нуклеиновой кислоты, которая включает разрывы ковалентных связей молекулы нуклеиновой кислоты. Расщепление может продуцировать тупые концы или ступенчатые концы, и оно может быть одноцепочечным или двухцепочечным. Например, белок типа Cas9 дикого типа, как правило, создает «тупой» продукт расщепления. Альтернативно, белок Cpf1 дикого типа (например, FnCpf1) может приводить к продукту разрыва с 5-нуклеотидным 5'-«липким» концом, причем расщепление происходит после 18-й пары оснований из последовательности РАМ на нецелевой цепочке и после 23-й пары оснований на целевой цепочке. Белок Cas может иметь полную активность расщепления для создания двухцепочечных разрывов в нуклеиновой кислоте-мишени (например, двухцепочечный разрыв с «тупыми» концами), или он может быть никазой, которая создает одноцепочечный разрыв в нуклеиновой кислоте-мишени.[000210] Cas proteins typically contain at least one recognition RNA or binding domain that can interact with guide RNAs (gRNAs, described in more detail below). Cas proteins may also contain nuclease domains (e.g., DNase or RNase domains), DNA-binding domains, helicase domains, protein-protein interaction domains, dimerization domains, and other domains. The nuclease domain has catalytic activity for cleavage of nucleic acid, which involves breaking covalent bonds of the nucleic acid molecule. The cleavage may produce blunt ends or staggered ends, and it may be single-stranded or double-stranded. For example, a wild-type Cas9-type protein typically produces a "blunt" cleavage product. Alternatively, a wild-type Cpf1 protein (e.g., FnCpf1) may produce a 5-nucleotide 5' overhang nick product, with cleavage occurring after the 18th base pair of the PAM sequence on the non-target strand and after the 23rd base pair on the target strand. The Cas protein may have full cleavage activity to create double-strand breaks in the target nucleic acid (e.g., a blunt-ended double-strand break), or it may be a nickase that creates a single-strand break in the target nucleic acid.

[000211] Примеры Cas белков включают Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5e (CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8a1, Cas8a2, Cas8b, Cas8c, Cas9 (Csn1 или Csx12), Cas10, CasI0d, CasF, CasG, CasH, Csy1, Csy2, Csy3, Cse1 (CasA), Cse2 (CasB), Cse3 (CasE), Cse4 (CasC), Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, и Cu1966, и гомологи или их модифицированные варианты.[000211] Examples of Cas proteins include Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5e (CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8a1, Cas8a2, Cas8b, Cas8c, Cas9 (Csn1 or Csx12), Cas10, CasI0d, CasF, CasG, CasH, Csy1, Csy2, Csy3, Cse1 (CasA), Cse2 (CasB), Cse3 (CasE), Cse4 (CasC), Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, and Cu1966, and homologues or modified variants thereof.

[000212] Иллюстративный белок Cas представляет собой белок Cas9 или белок, полученный из белка Cas9 из системы CRISPR/Cas типа II. Белки Cas9 относятся к системе CRISPR/Cas типа II и, как правило, имеют четыре ключевых мотива с сохраненной архитектурой. Мотивы 1, 2 и 4 являются RuvC-подобными мотивами, а мотив 3 представляет собой мотив HNH. Иллюстративные белки Cas9 взяты из Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Staphylococcus aureus, Nocardiopsis dassonvillei, Streptomyces pristinaespiralis, Streptomyces viridochromogenes, Streptomyces viridochromogenes, Streptosporangium roseum, Streptosporangium roseum, Aticyclobaciltus acidocaldarius, Bacillus pseudomycoides, Bacillus selenitireducens, Exiguobacterium sibiricum, Lactobacillus delbrueckii, Lactobacillus salivarius, Microscilla marina, Burkholderiales bacterium, Polaromonas naphthalenivorans, Polaromonas sp., Crocosphaera watsonii, Cyanothece sp., Microcystis aeruginosa, Synechococcus sp., Acetohalobium arabaticum, Ammonifex degensii, Caldicelulosiruptor becscii, Candidatus Desulforudis, Clostridium botulinum, Clostridium difficile, Finegoldia magna, Natranaerobius thermophilus, Pelotomacuium thermopropionicum, Acidithiobacillus caldus, Acidithiobacillus ferrooxidans, Allochromatium vinosum, Marinobacter sp., Nitrosococcus halophilus, Nitrosococcus watsoni, Pseudoaiteromonas haloplanktis, Ktedonobacter racemifer, Methanohalobium evestigatum, Anabaena variabilis, Nodularia spumigena, Nostoc sp., Arthrospira maxima, Arthrospira platensis, Arthrospira sp., Lyngbya sp., Microcoleus chthonoplastes, Oscillatoria sp., Petrotoga mobilis, Thermosipho africanus, Acaryochloris marina, Neisseria meningitidis, или Campylobacter jejuni. Дополнительные примеры членов семейства Cas9 описаны в WO 2014/131833, включенном в данном документе в качестве ссылки во всей полноте для всех целей. Cas9 из S. pyogenes (SpCas9) (присвоен номер доступа SwissProt Q99ZW2) является иллюстративным белком Cas9. Cas9 от S. aureus (Sa Cas9) (присвоен номер доступа UniProt J7RUA5) является еще одним иллюстративным белком Cas9. Cas9 от Campylobacter jejuni (CjCas9) (присвоен номер доступа Q0P897) является еще одним иллюстративным белком Cas9. См., например, Kim et at. (2017) Nat. Comm. 8:14500, включенный в данный документ в качестве ссылки во всей полноте для всех целей. SaCas9 меньше, чем SpCas9, a CjCas9 меньше, чем и SaCas9, и SpCas9.[000212] An exemplary Cas protein is a Cas9 protein or a protein derived from a Cas9 protein from the type II CRISPR/Cas system. Cas9 proteins belong to the type II CRISPR/Cas system and typically have four key motifs with conserved architecture. Motifs 1, 2, and 4 are RuvC-like motifs, and motif 3 is an HNH motif. Exemplary Cas9 proteins are from Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Staphylococcus aureus, Nocardiopsis dassonvillei, Streptomyces pristinaespiralis, Streptomyces viridochromogenes, Streptomyces viridochromogenes, Streptosporangium roseum, Streptosporangium roseum, Aticyclobaciltus acidocaldarius, Bacillus pseudomycoides, Bacillus selenitireducens, Exiguobacterium sibiricum, Lactobacillus delbrueckii, Lactobacillus salivarius, Microscilla marina, Burkholderiales bacterium, Polaromonas naphthalenivorans, Polaromonas sp., Crocosphaera watsonii, Cyanothece sp., Microcystis aeruginosa, Synechococcus sp., Acetohalobium arabaticum, Ammonifex degensii, Caldicelulosiruptor becscii, Candidatus Desulforudis, Clostridium botulinum, Clostridium difficile, Finegoldia magna, Natranaerobius thermophilus, Pelotomacuium thermopropionicum, Acidithiobacillus caldus, Acidithiobacillus ferrooxidans, Allochromatium vinosum, Marinobacter sp., Nitrosococcus halophilus, Nitrosococcus watsoni, Pseudoaiteromonas haloplanktis, Ktedonobacter racemifer, Methanohalobium evestigatum, Anabaena variabilis, Nodularia spumigena, Nostoc sp., Arthrospira maxima, Arthrospira platensis, Arthrospira sp., Lyngbya sp., Microcoleus chthonoplastes, Oscillatoria sp., Petrotoga mobilis, Thermosipho africanus, Acaryochloris marina, Neisseria meningitidis, or Campylobacter jejuni. Additional examples of Cas9 family members are described in WO 2014/131833, which is herein incorporated by reference in its entirety for all purposes. Cas9 from S. pyogenes (SpCas9) (assigned SwissProt accession number Q99ZW2) is an illustrative Cas9 protein. Cas9 from S. aureus (Sa Cas9) (assigned UniProt accession number J7RUA5) is another illustrative Cas9 protein. Cas9 from Campylobacter jejuni (CjCas9) (assigned accession number Q0P897) is another illustrative Cas9 protein. See, e.g., Kim et al. (2017) Nat. Comm. 8:14500, incorporated herein by reference in its entirety for all purposes. SaCas9 is smaller than SpCas9, and CjCas9 is smaller than both SaCas9 and SpCas9.

[000213] Другим примером белка Cas является белок Cpf1 (CRISPR из Prevotella и Francisella 1). Cpf1 представляет собой большой белок (около 1300 аминокислот), который содержит RuvC-подобный нуклеазный домен, гомологичный соответствующему домену Cas9 аналога с сопоставлением с характерным богатым аргинином кластера Cas9. Однако, в Cpf1 отсутствует нуклеазный домен HNH, который присутствует в белках Cas9, и RuvC-подобный домен является непрерывным в последовательности Cpf1, в отличие от Cas9, где он содержит длинные вставки, включая домен HNH. См., например, Zetsche et al. (2015) Cell 163(3):759-771, включенный в данный документ в качестве ссылки во всей полноте для всех целей. Иллюстративные Cpf1 белки взяты от Francisella tularensis 1, Francisella tularensis subsp.novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp.SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens, и Porphyromonas macacae. Cpf1 от Francisella novicida U112 (FnCpf1, присвоен номер доступа UniProt A0Q7Q2) является иллюстративным белком Cpf1.[000213] Another example of a Cas protein is the Cpf1 protein (CRISPR from Prevotella and Francisella 1). Cpf1 is a large protein (approximately 1300 amino acids) that contains a RuvC-like nuclease domain homologous to that of the Cas9 analogue, matching the characteristic arginine-rich cluster of Cas9. However, Cpf1 lacks the HNH nuclease domain present in Cas9 proteins, and the RuvC-like domain is continuous in the Cpf1 sequence, unlike Cas9, where it contains long insertions including the HNH domain. See, e.g., Zetsche et al. (2015) Cell 163(3):759–771, incorporated herein by reference in its entirety for all purposes. Exemplary Cpf1 proteins are from Francisella tularensis 1, Francisella tularensis subsp.novicida, Prevotella albensis, Lachnospiraceae bacterium MC2017 1, Butyrivibrio proteoclasticus, Peregrinibacteria bacterium GW2011_GWA2_33_10, Parcubacteria bacterium GW2011_GWC2_44_17, Smithella sp.SCADC, Acidaminococcus sp. BV3L6, Lachnospiraceae bacterium MA2020, Candidatus Methanoplasma termitum, Eubacterium eligens, Moraxella bovoculi 237, Leptospira inadai, Lachnospiraceae bacterium ND2006, Porphyromonas crevioricanis 3, Prevotella disiens, and Porphyromonas macacae. Cpf1 from Francisella novicida U112 (FnCpf1, assigned UniProt accession number A0Q7Q2) is an exemplary Cpf1 protein.

[000214] Белки Cas могут представлять собой белки дикого типа (т.е., те, которые встречаются в природе), модифицированные белки Cas (например, варианты белка Cas) или фрагменты дикого типа или модифицированные белки Cas. Белки Cas могут также быть активными вариантами или фрагментами в отношении каталитической активности дикого типа или модифицированных белков Cas. Активные варианты или фрагменты в отношении каталитической активности могут содержать по меньшей мере 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% и более идентичности последовательности с диким типом или модифицированным белком Cas или его частью, причем активные варианты сохраняют способность разрезаться на желаемом сайте расщепления и, следовательно, удерживать индуцирующую одноцепочечные разрывы или индуцирующую двухцепочечные разрывы активность. Известны анализы индуцирующей одноцепочечные разрывы или индуцирующей двухцепочечные разрывы активности, и, как правило, измеряют общую активность и специфичность белка Cas на ДНК-субстратах, содержащих сайт расщепления.[000214] Cas proteins may be wild-type proteins (i.e., those that occur in nature), modified Cas proteins (e.g., variants of the Cas protein), or fragments of wild-type or modified Cas proteins. Cas proteins may also be active variants or fragments with respect to the catalytic activity of wild-type or modified Cas proteins. Active variants or fragments with respect to catalytic activity may comprise at least 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more sequence identity to a wild-type or modified Cas protein or portion thereof, wherein the active variants retain the ability to cleave at the desired cleavage site and, therefore, retain single-strand break-inducing or double-strand break-inducing activity. Assays for single-strand break-inducing activity or double-strand break-inducing activity are known and typically measure the overall activity and specificity of the Cas protein on DNA substrates containing the cleavage site.

[000215] Одним из примеров модифицированного белка Cas является модифицированный белок SpCas9-HF1, который представляет собой вариант высокой точности Streptococcus pyogenes Cas9, несущий изменения (N497A/R661A/Q695A/Q926A), предназначенные для уменьшения неспецифических контактов ДНК. См., например, Kleinstiver et al. (2016) Nature 529(7587):490-495, включенный в данный документ в качестве ссылки во всей полноте для всех целей. Другим примером модифицированного белка Cas является модифицированный вариант eSpCas9 (K848A/K1003A/R1060A), предназначенный для уменьшения эффектов вне цели. См., например, Slaymaker et al. (2016) Science 351(6268):84-88, включенный в данный документ в качестве ссылки во всей полноте для всех целей. Другие варианты SpCas9 включают K855A и K810A/K1003A/R1060A.[000215] One example of a modified Cas protein is a modified SpCas9-HF1 protein, which is a high-fidelity variant of Streptococcus pyogenes Cas9 that carries alterations (N497A/R661A/Q695A/Q926A) designed to reduce non-specific DNA contacts. See, e.g., Kleinstiver et al. (2016) Nature 529(7587):490-495, incorporated herein by reference in its entirety for all purposes. Another example of a modified Cas protein is a modified variant of eSpCas9 (K848A/K1003A/R1060A) designed to reduce off-target effects. See, e.g., Slaymaker et al. (2016) Science 351(6268):84-88, incorporated herein by reference in its entirety for all purposes. Other SpCas9 variants include K855A and K810A/K1003A/R1060A.

[000216] Белки Cas могут быть модифицированы для увеличения или уменьшения одной, или более аффинности связывания нуклеиновой кислоты, специфичности связывания нуклеиновой кислоты и ферментативной активности. Белки Cas также могут быть модифицированы для изменения любой другой активности или свойства белка, таких как стабильность. Например, один или более нуклеазных доменов белка Cas могут быть модифицированы, удалены или инактивированы, или белок Cas может быть усечен для удаления доменов, которые не являются существенными для функции белка или для оптимизации (например, усиливают или уменьшают) активность белка Cas.[000216] Cas proteins can be modified to increase or decrease one or more of nucleic acid binding affinity, nucleic acid binding specificity, and enzymatic activity. Cas proteins can also be modified to alter any other activity or property of the protein, such as stability. For example, one or more nuclease domains of a Cas protein can be modified, deleted, or inactivated, or a Cas protein can be truncated to remove domains that are not essential to protein function or to optimize (e.g., enhance or decrease) the activity of the Cas protein.

[000217] Белки Cas могут содержать по меньшей мере один нуклеазный домен, такой как домен ДНКазы. Например, белок Cpf1 дикого типа обычно содержит RuvC-подобный домен, который расщепляет обе цепи ДНК-мишени, возможно, в димерной конфигурации. Белки Cas могут также содержать по меньшей мере два домена нуклеазы, такие как домены ДНКазы. Например, белок Cas9 дикого типа обычно содержит RuvC-подобный нуклеазный домен и HNH-подобный нуклеазный домен. Домены RuvC и HNH могут каждый вырезать другую нить двухцепочечной ДНК, чтобы сделать двухцепочечный разрыв в ДНК. См., например, Jinek et al. (2012) Science 337:816-821, включенный в данный документ в качестве ссылки во всей полноте для всех целей.[000217] Cas proteins may contain at least one nuclease domain, such as a DNase domain. For example, the wild-type Cpf1 protein typically contains a RuvC-like domain that cleaves both strands of target DNA, possibly in a dimeric configuration. Cas proteins may also contain at least two nuclease domains, such as DNase domains. For example, the wild-type Cas9 protein typically contains a RuvC-like nuclease domain and an HNH-like nuclease domain. The RuvC and HNH domains can each cut a different strand of double-stranded DNA to create a double-strand break in DNA. See, for example, Jinek et al. (2012) Science 337:816-821, incorporated herein by reference in its entirety for all purposes.

[000218] Один или оба домена нуклеазы могут быть удалены или мутированы, так что они перестали функционировать или имели уменьшенную активность нуклеазы. Если один из нуклеазных доменов удален или мутирован, полученный белок Cas (например, Cas9) может быть упомянут как никаза и может генерировать одноцепочечный разрыв в последовательности, узнаваемой направляющей РНК в двухцепочечной ДНК, но не двухцепочечный разрыв (т.е. он может расщеплять комплементарную нить или не комплементарную нить, но не то и другое). Если оба нуклеазных домена удалены или мутированы, полученный белок Cas (например, Cas9) будет иметь уменьшенную способность расщеплять обе нити двухцепочечной ДНК (например, нуклеаза-ноль белка Cas). Примером мутации, которая превращает Cas9 в никазу, является мутация D10A (аспартат к аланину в положении 10 из Cas9) в RuvC-домене Cas9 H3S. pyogenes. Аналогично, Н939А (гистидин на аланин в положении 839 аминокислоты) или Н840А (гистидин на аланин в положении 840 аминокислоты) или N863A (аспарагин на аланин в положении N863 аминокислоты) в HNH-домене Cas9 из S. pyogenes может преобразовывать Cas9 в никазу. Другие примеры мутаций, которые превращают Cas9 в никазу, включают соответствующие мутации в Cas9 из S. thermophilus. См., например, Sapranauskas et al. (2011) Nucleic Acids Research 39:9275-9282 и WO 2013/141680, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Такие мутации могут быть получены с использованием таких способов, как сайт-направленный мутагенез, ПЦР-опосредованный мутагенез или общий синтез генов. Примеры других мутаций, создающих никазы, можно найти, например, в WO 2013/176772 и WO 2013/142578, каждый из которых включен в настоящий документ посредством ссылки во всей их полноте для всех целей. Если все нуклеазные домены удалены или мутированы в белке Cas (например, оба нуклеазных домена удалены или мутированы в белке Cas9), полученный белок Cas (например, Cas9) будет иметь уменьшенную способность расщеплять обе цепи двухцепочечной ДНК (например, нуклеаза-ноль или нуклеаза-неактивный белок Cas). Один конкретный пример представляет собой двойной мутант D10A/H840A S. pyogenes Cas9 или соответствующий двойной мутант в Cas9 от другого вида, когда он оптимально совпадает с 5. pyogenes Cas9. Другой конкретный пример представляет собой двойной мутант D10A/N863AS. pyogenes Cas9 или соответствующий двойной мутант в Cas9 от другого вида, когда он оптимально совпадает с S. pyogenes Cas9.[000218] One or both nuclease domains may be deleted or mutated such that they are nonfunctional or have reduced nuclease activity. If one of the nuclease domains is deleted or mutated, the resulting Cas protein (e.g., Cas9) may be referred to as a nickase and can generate a single-strand break at the sequence recognized by the guide RNA in double-stranded DNA, but not a double-strand break (i.e., it can cleave the complementary strand or the non-complementary strand, but not both). If both nuclease domains are deleted or mutated, the resulting Cas protein (e.g., Cas9) will have a reduced ability to cleave both strands of double-stranded DNA (e.g., a nuclease-zero Cas protein). An example of a mutation that converts Cas9 to a nickase is the D10A (aspartate to alanine at position 10 of Cas9) mutation in the RuvC domain of H3S. pyogenes Cas9. Similarly, H939A (histidine to alanine at amino acid position 839) or H840A (histidine to alanine at amino acid position 840) or N863A (asparagine to alanine at amino acid position N863) in the HNH domain of S. pyogenes Cas9 can convert Cas9 to a nickase. Other examples of mutations that convert Cas9 to a nickase include the corresponding mutations in S. thermophilus Cas9. See, e.g., Sapranauskas et al. (2011) Nucleic Acids Research 39:9275-9282 and WO 2013/141680, each of which is incorporated herein by reference in its entirety for all purposes. Such mutations can be generated using methods such as site-directed mutagenesis, PCR-mediated mutagenesis, or total gene synthesis. Examples of other mutations that create nickases can be found, for example, in WO 2013/176772 and WO 2013/142578, each of which is incorporated herein by reference in its entirety for all purposes. If all nuclease domains are deleted or mutated in a Cas protein (e.g., both nuclease domains are deleted or mutated in the Cas9 protein), the resulting Cas protein (e.g., Cas9) will have a reduced ability to cleave both strands of double-stranded DNA (e.g., a nuclease-null or nuclease-inactive Cas protein). One specific example is the D10A/H840A double mutant of S. pyogenes Cas9 or the corresponding double mutant in Cas9 from another species, when it is an optimal match for 5. pyogenes Cas9. Another specific example is the D10A/N863AS double mutant of S. pyogenes Cas9 or the corresponding double mutant in Cas9 from another species, when it is an optimal match for S. pyogenes Cas9.

[000219] Также известны примеры инактивирующих мутаций в каталитических доменах белков Cas9 Staphylococcus aureus. Например, фермент Cas9 Staphyloccocus aureus (SaCas9) может содержать замещение в положении N580 (например, замещение N580A) и замещение в положении D10 (например, замещение D10A) с образованием нуклеаза-неактивного белка Cas. См., например, WO 2016/106236, включенную в данном документе в качестве ссылки в полном объеме для всех целей.[000219] Examples of inactivating mutations in the catalytic domains of Staphylococcus aureus Cas9 proteins are also known. For example, the Staphylococcus aureus Cas9 (SaCas9) enzyme may contain a substitution at position N580 (e.g., an N580A substitution) and a substitution at position D10 (e.g., a D10A substitution) to produce a nuclease-inactive Cas protein. See, for example, WO 2016/106236, incorporated herein by reference in its entirety for all purposes.

[000220] Также известны примеры инактивирующих мутаций в каталитических доменах белков Cpf1. Что касается белков Cpf1 от Francisella novicida U112 (FnCpf1), Acidaminococcus sp. BV3L6 (AsCpf1), бактерии Lachnospiraceae ND2006 (LbCpf1) и Moraxella bovoculi 237 (MbCpf1 Cpf1), такие мутации могут включать мутации в положениях 908, 993 или 1263 AsCpf1 или соответствующие положения в ортологах Cpf1, или в положениях 832, 925, 947, или 1180 из LbCpf1 или соответствующих положениях в ортологах Cpf1. Такие мутации могут включать, например, одну или более мутаций D908A, Е993А и D1263A AsCpf1 или соответствующих мутаций в ортологах Cpf1 или D832A, Е925А, D947A и D1180A LbCpf1 или соответствующих мутаций в ортологах Cpf1. См., например, US 2016/0208243, включенную в данном документе в качестве ссылки в полном объеме для всех целей.[000220] Examples of inactivating mutations in the catalytic domains of Cpf1 proteins are also known. With respect to the Cpf1 proteins from Francisella novicida U112 (FnCpf1), Acidaminococcus sp. BV3L6 (AsCpf1), Lachnospiraceae bacteria ND2006 (LbCpf1), and Moraxella bovoculi 237 (MbCpf1 Cpf1), such mutations may include mutations at positions 908, 993, or 1263 of AsCpf1 or corresponding positions in Cpf1 orthologs, or at positions 832, 925, 947, or 1180 of LbCpf1 or corresponding positions in Cpf1 orthologs. Such mutations may include, for example, one or more of the D908A, E993A, and D1263A mutations of AsCpf1 or corresponding mutations in Cpf1 orthologs, or D832A, E925A, D947A, and D1180A of LbCpf1 or corresponding mutations in Cpf1 orthologs. See, for example, US 2016/0208243, incorporated herein by reference in its entirety for all purposes.

[000221] Белки Cas также могут быть функционально связаны с гетерологичными полипептидами в виде слитых белков. Например, белок Cas может быть слит с доменом расщепления, доменом эпигенетической модификации, доменом активации транскрипции или доменом репрессора транскрипции. См., WO 2014/089290, включенную в данном документе в качестве ссылки в полном объеме для всех целей. Белки Cas также могут быть слиты с гетерологичным полипептидом, обеспечивая повышенную или пониженную стабильность. Слитый домен или гетерологичный полипептид может быть расположен на N-конце, С-конце или внутри в белке Cas.[000221] Cas proteins can also be operably linked to heterologous polypeptides as fusion proteins. For example, a Cas protein can be fused to a cleavage domain, an epigenetic modification domain, a transcriptional activation domain, or a transcriptional repressor domain. See, WO 2014/089290, incorporated herein by reference in its entirety for all purposes. Cas proteins can also be fused to a heterologous polypeptide, providing increased or decreased stability. The fusion domain or heterologous polypeptide can be located at the N-terminus, C-terminus, or internally in the Cas protein.

[000222] Примером слитого белка Cas является белок Cas, слитый с гетерологичным полипептидом, который обеспечивает субклеточную локализацию. Такие гетерологичные полипептиды могут включать, например, один или более сигналов ядерной локализации (NLS), таких как SV40 NLS для нацеливания на ядро, сигнал локализации митохондрий для нацеливания на митохондрии, сигнал удерживания ER и тому подобное. См., например, Lange et al. (2007) J. Biol. Chem. 282:5101-5105, включенный в данный документ в качестве ссылки во всей полноте для всех целей. Другие подходящие NLS включают альфа-импортин NLS. Такие сигналы субклеточной локализации могут быть расположены на N-конце, С-конце или в любом месте в белке Cas. NLS может содержать участок основных аминокислот и может быть однокомпонентной последовательностью или двухкомпонентной последовательностью. Необязательно, белок Cas содержит два или более NLS, включая NLS (например, альфа-импортин NLS) на N-конце и/или NLS (например, SV40 NLS) на С-конце.[000222] An example of a Cas fusion protein is a Cas protein fused to a heterologous polypeptide that provides subcellular localization. Such heterologous polypeptides can include, for example, one or more nuclear localization signals (NLS), such as the SV40 NLS for nuclear targeting, a mitochondrial localization signal for mitochondria targeting, an ER retention signal, and the like. See, for example, Lange et al. (2007) J. Biol. Chem. 282:5101-5105, incorporated herein by reference in its entirety for all purposes. Other suitable NLSs include the alpha-importin NLS. Such subcellular localization signals can be located at the N-terminus, the C-terminus, or anywhere in the Cas protein. The NLS can comprise a stretch of basic amino acids and can be a single-component sequence or a two-component sequence. Optionally, the Cas protein comprises two or more NLSs, including an NLS (e.g., an alpha-importin NLS) at the N-terminus and/or an NLS (e.g., an SV40 NLS) at the C-terminus.

[000223] Белки Cas также могут быть функционально связаны с доменом проникновения в клетку. Например, домен проникновения в клетку, может быть получен из белка ТАТ ВИЧ-1, проницаемого TLM мотивом, проникающим через клетку из вируса гепатита В человека, MPG, Рер-1, VP22, пептида, проникающего в клетку, из вируса Herpes simplex, или полиаргининовой пептидной последовательности. См., например, WO 2014/089290, включенную в данном документе в качестве ссылки в полном объеме для всех целей. Домен проникновения в клетку может быть расположен на N-конце, С-конце или где-либо в белке Cas.[000223] Cas proteins can also be operably linked to a cell entry domain. For example, the cell entry domain can be derived from the HIV-1 TAT protein, the human hepatitis B virus cell entry TLM motif, MPG, Pep-1, VP22, a cell entry peptide from herpes simplex virus, or a polyarginine peptide sequence. See, for example, WO 2014/089290, incorporated herein by reference in its entirety for all purposes. The cell entry domain can be located at the N-terminus, the C-terminus, or elsewhere in the Cas protein.

[000224] Белки Cas также могут быть функционально связаны с гетерологичным полипептидом для удобства отслеживания или очистки, такого как флуоресцентный белок, метка очистки или метка эпитопа. Примеры флуоресцентных белков включают зеленые флуоресцентные белки (например, GFP, GFP-2, tagGFP, turboGFP, eGFP, Emerald, Azami Green, Monomeric Azami Green, CopGFP, AceGFP, ZsGreenl), желтые флуоресцентные белки (например, YFP, eYFP, цитрин, Venus, YPet, PhiYFP, ZsYellowl), синие флуоресцентные белки (например, eBFP, eBFP2, Azurite, mKalamal, GFPuv, Sapphire, Т-сапфир), голубые флуоресцентные белки (например, eCFP, Cerulean, CyPet, AmCyanl, Midoriishi-Cyan), красные флуоресцентные белки (mKate, mKate2, mPlum, DsRed мономер, mCherry, mRFPl, DsRed-Express, DsRed2, DsRed-мономер, HcRed-Tandem, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred), оранжевые флуоресцентные белки (mOrange, mKO, Kusabira-Orange, Monomeric Kusabira-Orange, mTangerine, tdTomato) и любой другой подходящий флуоресцентный белок. Примеры меток включают глутатион-S-трансферазу (GST), белок, связывающий хитин (СВР), белок, связывающий мальтозу, тиоредоксин (TRX), поли(ИАМР), метку тандемной аффинной очистки (ТАР), myc, AcV5, AU1, AU5, Е, ECS, Е2, FLAG, гемагглютинин (НА), nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, гистидин (His), белок-носитель биотина-карбоксила (BCCP) и калмодулин.[000224] Cas proteins can also be operably linked to a heterologous polypeptide for ease of tracking or purification, such as a fluorescent protein, a purification tag, or an epitope tag. Examples of fluorescent proteins include green fluorescent proteins (e.g., GFP, GFP-2, tagGFP, turboGFP, eGFP, Emerald, Azami Green, Monomeric Azami Green, CopGFP, AceGFP, ZsGreenl), yellow fluorescent proteins (e.g., YFP, eYFP, Citrine, Venus, YPet, PhiYFP, ZsYellowl), blue fluorescent proteins (eBFP, eBFP2, Azurite, mKalamal, GFPuv, Sapphire, T-sapphire), cyan fluorescent proteins (eCFP, Cerulean, CyPet, AmCyanl, Midoriishi-Cyan), red fluorescent proteins (mKate, mKate2, mPlum, DsRed monomer, mCherry, mRFPl, DsRed-Express, DsRed2, DsRed-monomer, HcRed-Tandem, HcRedl, AsRed2, eqFP611, mRaspberry, mStrawberry, Jred), orange fluorescent proteins (mOrange, mKO, Kusabira-Orange, Monomeric Kusabira-Orange, mTangerine, tdTomato) and any other suitable fluorescent protein. Examples of tags include glutathione-S-transferase (GST), chitin binding protein (CBP), maltose binding protein, thioredoxin (TRX), poly(IAMP), tandem affinity purification (TAP) tag, myc, AcV5, AU1, AU5, E, ECS, E2, FLAG, hemagglutinin (HA), nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, histidine (His), biotin carboxyl carrier protein (BCCP), and calmodulin.

[000225] Белки Cas9 также могут быть привязаны к экзогенным матрицам для репарации или меченым нуклеиновым кислотам. Такую привязку (т.е. физическое связывание) может быть достигнуто посредством ковалентных взаимодействий или нековалентных взаимодействий, и привязка может быть прямой (например, путем прямого слияния или химической конъюгации, что может быть достигнуто путем модификации цистеиновых или лизиновых остатков на белке или интеиновой модификации) или может быть достигнуто посредством одного или более промежуточных линкеров или адаптационных молекул, таких как стрептавидин или аптамеры. См., например, Pierce et al. (2005) Mini Rev. Med. Chem. 5(1): 41-55; Duckworth et al. (2007) Angew. Chem. Int. Ed. Engl. 46(46):8819-8822; Schaeffer and Dixon (2009) Australian J. Chem. 62(10):1328-1332; Goodman et al. (2009) Chembiochem. 10(9):1551-1557; и Khatwani et al. (2012) Bioorg. Med. Chem. 20(14):4532-4539, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Нековалентные стратегии для конъюгатов синтеза белково-нуклеиновых кислот включают способы биотин-стрептавидина и никель-гистидина. Ковалентные конъюгаты белок-нуклеиновая кислота могут быть синтезированы путем соединения соответствующих функционализированных нуклеиновых кислот и белков с использованием широкого спектра химических веществ. Некоторые из этих химических веществ включают прямое присоединение олигонуклеотида к аминокислотному остатку на поверхности белка (например, лизин-амин или цистеин тиол), тогда как другие более сложные схемы требуют пост-трансляционной модификации белка или участия каталитического, или реактивного белкового домена. Способы ковалентного присоединения белков к нуклеиновым кислотам могут включать, например, химическое перекрестное сшивание олигонуклеотидов с белковыми остатками лизина или цистеина, экспрессию белок-лигирования, химиоферментные способы и использование фотоаптамеров. Экзогенную матрицу для репарации или меченую нуклеиновую кислоту можно связать с С-концом, N-концом или с внутренним участком внутри белка Cas9. Предпочтительно, экзогенная матрица для репарации или меченая нуклеиновая кислота привязана к С-концу или N-концу белка Cas9. Аналогично, белок Cas9 может быть привязан к 5'-концу, 3'-концу или к внутреннему участку в экзогенной матрице для репарации или меченной нуклеиновой кислоте. То есть, экзогенная матрица для репарации или меченая нуклеиновая кислота может быть привязана в любой ориентации и полярности. Предпочтительно, белок Cas9 привязан к 3'-концу или 3'-концу экзогенной матрицы для репарации или меченой нуклеиновой кислоты.[000225] Cas9 proteins can also be tethered to exogenous repair matrices or labeled nucleic acids. Such tethering (i.e., physical linkage) can be achieved through covalent interactions or non-covalent interactions, and the tethering can be direct (e.g., by direct fusion or chemical conjugation, which can be achieved by modification of cysteine or lysine residues on the protein or intein modification) or can be achieved through one or more intermediate linkers or adaptor molecules such as streptavidin or aptamers. See, e.g., Pierce et al. (2005) Mini Rev. Med. Chem. 5(1): 41–55; Duckworth et al. (2007) Angew. Chem. Int. Ed. Engl. 46(46):8819–8822; Schaeffer and Dixon (2009) Australian J. Chem. 62(10):1328–1332; Goodman et al. (2009) Chembiochem. 10(9):1551–1557; and Khatwani et al. (2012) Bioorg. Med. Chem. 20(14):4532–4539, each of which is hereby incorporated by reference in its entirety for all purposes. Non-covalent strategies for protein-nucleic acid conjugate synthesis include the biotin-streptavidin and nickel-histidine methods. Covalent protein-nucleic acid conjugates can be synthesized by coupling appropriately functionalized nucleic acids and proteins using a wide variety of chemistries. Some of these chemistries involve direct attachment of an oligonucleotide to an amino acid residue on the surface of a protein (e.g., a lysine amine or a cysteine thiol), while other more complex schemes require post-translational modification of the protein or the involvement of a catalytic or reactive protein domain. Methods for covalently attaching proteins to nucleic acids may include, for example, chemical cross-linking of oligonucleotides to protein lysine or cysteine residues, protein ligation expression, chemoenzymatic methods, and the use of photoaptamers. The exogenous repair template or labeled nucleic acid can be linked to the C-terminus, N-terminus, or an internal site within the Cas9 protein. Preferably, the exogenous repair template or labeled nucleic acid is linked to the C-terminus or N-terminus of the Cas9 protein. Similarly, the Cas9 protein can be tethered to the 5' end, the 3' end, or an internal site in the exogenous repair template or labeled nucleic acid. That is, the exogenous repair template or labeled nucleic acid can be tethered in any orientation and polarity. Preferably, the Cas9 protein is tethered to the 3' end or the 3' end of the exogenous repair template or labeled nucleic acid.

[000226] Белки Cas могут быть представлены в любой форме. Например, белок Cas может быть представлен в форме белка, такого как белок Cas образующий комплекс с гРНК. Альтернативно, белок Cas может быть представлен в форме нуклеиновой кислоты, кодирующей белок Cas, такой как РНК (например, матричная РНК (мРНК)) или ДНК. Необязательно, нуклеиновая кислота, кодирующая белок Cas, может быть кодон оптимизирована для эффективной трансляции в белке в конкретной клетке или организме. Например, нуклеиновая кислота, кодирующая белок Cas, может быть модифицирована для замены кодонов, имеющих более высокую частоту использования в бактериальной клетке, дрожжевой клетке, клетке человека, клетке не человека, клетке млекопитающего, клетке грызунов, клетке мыши, клетке крысы или любой другой представляющей интерес клетки-хозяина по сравнению с полинуклеотидной последовательностью природного происхождения. Когда нуклеиновая кислота, кодирующая белок Cas, вводится в клетку, белок Cas может быть временно, условно или конститутивно экспрессирован в клетке.[000226] Cas proteins can be presented in any form. For example, a Cas protein can be presented in the form of a protein, such as a Cas protein complexed with a gRNA. Alternatively, a Cas protein can be presented in the form of a nucleic acid encoding a Cas protein, such as RNA (e.g., messenger RNA (mRNA)) or DNA. Optionally, a nucleic acid encoding a Cas protein can be codon optimized for efficient translation into a protein in a particular cell or organism. For example, a nucleic acid encoding a Cas protein can be modified to substitute codons that have a higher frequency of usage in a bacterial cell, a yeast cell, a human cell, a non-human cell, a mammalian cell, a rodent cell, a mouse cell, a rat cell, or any other host cell of interest compared to a naturally occurring polynucleotide sequence. When a nucleic acid encoding a Cas protein is introduced into a cell, the Cas protein can be transiently, conditionally, or constitutively expressed in the cell.

[000227] Нуклеиновые кислоты, кодирующие белки Cas, могут быть стабильно интегрированы в геном клетки и функционально связаны с промотором, активным в клетке. Альтернативно, нуклеиновые кислоты, кодирующие белки Cas, могут быть функционально связаны с промотором в экспрессирующей конструкции. Экспрессионные конструкты включают любые конструкты нуклеиновых кислот, способные направлять экспрессию представляющего интерес гена или другой нуклеиновой кислоты (например, ген Cas), и которые могут передавать такую представляющую интерес последовательность нуклеиновой кислоты в клетку-мишень. Например, нуклеиновая кислота, кодирующая белок Cas, может находиться в векторе нацеливания, содержащем вставку нуклеиновой кислоты, и/или векторе, содержащем ДНК, кодирующую гРНК. Альтернативно, он может быть в векторе или плазмиде, который отделен от вектора нацеливания, содержащего вставку нуклеиновой кислоты и/или отдельно от вектора, содержащего ДНК, кодирующую гРНК. Промоторы, которые могут быть использованы в экспрессионном конструкте, включают промоторы, активные, например, в одной или более эукариотической клетке, клетке человека, клетке не человека, клетке млекопитающего, клетке млекопитающего отличного от человека, клетке грызунов, клетке мыши, клетке крысы, клетке хомяка, клетке кролика, плюрипотентной клетке, эмбриональной стволовой клетке (ЭС) или зиготе. Такими промоторами могут быть, например, условные промоторы, индуцируемые промоторы, конститутивные промоторы или тканеспецифические промоторы. Необязательно, промотор может быть двунаправленным промотором, стимулирующим экспрессию как белка Cas в одном направлении, так и направляющей РНК в другом направлении. Такие двунаправленные промоторы могут состоять из (1) полного, обычного, однонаправленного промотора Pol III, который содержит 3 внешних элемента управления: дистальный элемент последовательности (DSE), проксимальный элемент последовательности (PSE) и блок TATA; и (2) второй базовый промотор Pol III, который включает в себя PSE и блок TATA, слитый с 5'-концом DSE в обратной ориентации. Например, в промоторе HI DSE смежна с PSE и блоком TATA, и промотор может быть визуализирован двунаправленным путем создания гибридного промотора, в котором транскрипция в обратном направлении контролируется добавлением PSE и блока TATA, полученного из промотора U6. См., например, US 2016/0074535, включенную в данном документе в качестве ссылок в полном объеме для всех целей. Использование двунаправленного промотора для экспрессии генов, кодирующих белок Cas и направляющую РНК, одновременно позволяет генерировать компактные экспрессионные кассеты для облегчения доставки.[000227] Nucleic acids encoding Cas proteins can be stably integrated into the genome of a cell and operably linked to a promoter active in the cell. Alternatively, nucleic acids encoding Cas proteins can be operably linked to a promoter in an expression construct. Expression constructs include any nucleic acid constructs capable of directing the expression of a gene of interest or another nucleic acid (e.g., a Cas gene) and that can deliver such a nucleic acid sequence of interest to a target cell. For example, a nucleic acid encoding a Cas protein can be in a targeting vector containing a nucleic acid insert and/or a vector containing DNA encoding a gRNA. Alternatively, it can be in a vector or plasmid that is separate from the targeting vector containing the nucleic acid insert and/or separate from the vector containing DNA encoding a gRNA. Promoters that can be used in the expression construct include promoters that are active in, for example, one or more of a eukaryotic cell, a human cell, a non-human cell, a mammalian cell, a non-human mammalian cell, a rodent cell, a mouse cell, a rat cell, a hamster cell, a rabbit cell, a pluripotent cell, an embryonic stem (ES) cell, or a zygote. Such promoters can be, for example, conditional promoters, inducible promoters, constitutive promoters, or tissue-specific promoters. Optionally, the promoter can be a bidirectional promoter driving expression of both the Cas protein in one direction and the guide RNA in the other direction. Such bidirectional promoters can consist of (1) a complete, conventional, unidirectional Pol III promoter that contains 3 external control elements: a distal sequence element (DSE), a proximal sequence element (PSE), and a TATA box; and (2) a second Pol III basic promoter that includes a PSE and a TATA box fused to the 5' end of the DSE in a reverse orientation. For example, in the HI promoter, the DSE is adjacent to a PSE and a TATA box, and the promoter can be rendered bidirectional by creating a hybrid promoter in which reverse transcription is controlled by the addition of a PSE and a TATA box derived from the U6 promoter. See, for example, US 2016/0074535, incorporated herein by reference in its entirety for all purposes. The use of a bidirectional promoter to express genes encoding a Cas protein and a guide RNA simultaneously allows for the generation of compact expression cassettes for ease of delivery.

(2) Направляющие РНК(2) Guide RNAs

[000228] «Направляющая РНК» или «гРНК» представляет собой молекулу РНК, которая связывается с белком Cas (например, белком Cas9) и нацеливает белок Cas в конкретное место в ДНК-мишени. Направляющая РНК могут содержать два сегмента: «сегмент нацеливания ДНК» и «сегмент, связывающий белок». «Сегмент» включает в себя участок или область молекулы, такую как смежный участок нуклеотидов в РНК. Некоторые гРНК, например, для Cas9, могут содержать две отдельные молекулы РНК: «активатор-РНК» (например, малая некодирующая РНК) и «нацеливатель-РНК» (например, CRISPR-PHK или крРНК). Другие гРНК представляют собой одну молекулу РНК (один РНК-полинуклеотид), который также можно назвать «одномолекулярной гРНК», «одну направляющую РНК» или «огРНК». См., например, WO 2013/176772, WO 2014/065596, WO 2014/089290, WO 2014/093622, WO 2014/099750, WO 2013/142578 и WO 2014/131833, каждый из которых включен в данный документ посредством ссылки во всей их полноте для всех целей. Например, для Cas9 одна направляющая РНК может содержать крРНК, слитую с малой некодирующей РНК (например, через линкер). Для Cpf1, например, требуется только крРНК для достижения связывания с последовательностью-мишенью или расщепления. Термины «направляющая РНК» и «гРНК» включают как двухмолекулярные гРНК (т.е. модульные гРНК), так и одномолекулярные гРНК.[000228] A "guide RNA" or "gRNA" is an RNA molecule that binds to a Cas protein (e.g., Cas9 protein) and targets the Cas protein to a specific location on target DNA. Guide RNAs may contain two segments: a "DNA targeting segment" and a "protein binding segment." A "segment" includes a section or region of a molecule, such as a contiguous stretch of nucleotides in RNA. Some gRNAs, such as for Cas9, may contain two separate RNA molecules: an "activator RNA" (e.g., small non-coding RNA) and a "targeter RNA" (e.g., CRISPR RNA or crRNA). Other gRNAs are a single RNA molecule (a single RNA polynucleotide), which may also be referred to as a "single-molecule gRNA," "single guide RNA," or "ogRNA." See, for example, WO 2013/176772, WO 2014/065596, WO 2014/089290, WO 2014/093622, WO 2014/099750, WO 2013/142578, and WO 2014/131833, each of which is incorporated herein by reference in its entirety for all purposes. For example, for Cas9, a single guide RNA may comprise a crRNA fused to a small non-coding RNA (e.g., via a linker). For Cpf1, for example, only a crRNA is required to achieve binding to a target sequence or cleavage. The terms "guide RNA" and "gRNA" include both dual-molecule gRNAs (i.e., modular gRNAs) and single-molecule gRNAs.

[000229] Иллюстративная двухмолекулярная гРНК содержит молекулу, крРНК-подобную («CRISPR РНК» или «направленность-РНК» или «крРНК» или «крРНК повтор»), и соответствующую малую некодирующую РНК-подобную молекулу («транс-действующую CRISPR-РНК» или «активатор-РНК» или "малую некодирующую РНК"). КрРНК включает как сегмент нацеливания ДНК (одноцепочечный) гРНК, так и участок нуклеотидов, который образует одну половину дуплекса дцРНК белка, связывающего сегмент гРНК.[000229] An exemplary dual-molecule gRNA comprises a crRNA-like molecule ("CRISPR RNA" or "targeting RNA" or "crRNA" or "crRNA repeat") and a corresponding small non-coding RNA-like molecule ("trans-acting CRISPR RNA" or "activator RNA" or "small non-coding RNA"). The crRNA includes both a DNA targeting segment (single-stranded) of the gRNA and a stretch of nucleotides that forms one half of the dsRNA duplex of the protein binding the gRNA segment.

[000230] Соответствующая малая некодирующая РНК (активатор-РНК) содержит участок нуклеотидов, который образует другую половину дуплекса дцРНК белка, связывающего сегмент гРНК. Участок нуклеотидов крРНК комплементарен и гибридизуется с участком нуклеотидов малой некодирующей РНК дцРНК с образованием дуплекса белок-связывающего домена гРНК. Таким образом, каждая крРНК, как можно сказать, имеет соответствующую малую некодирующую РНК.[000230] The corresponding small noncoding RNA (activator RNA) contains a stretch of nucleotides that forms the other half of the dsRNA duplex of the protein binding segment of the gRNA. The nucleotide stretch of the crRNA is complementary to and hybridizes with the nucleotide stretch of the small noncoding RNA of the dsRNA to form the protein binding domain duplex of the gRNA. Thus, each crRNA can be said to have a corresponding small noncoding RNA.

[000231] В системах, в которых необходимы как крРНК, так и малая некодирующая РНК, крРНК и соответствующая малая некодирующая РНК гибридизуются с образованием гРНК. В системах, в которых требуется только крРНК, крРНК может быть гРНК. КрРНК дополнительно обеспечивает одноцепочечный сегмент ДНК-нацеливания, который гибридизуется с последовательностью, узнаваемой направляющей РНК. Если использовать для модификации внутри клетки, точная последовательность данной молекулы крРНК или малой некодирующей РНК может быть сконструирована так, чтобы быть специфичной к видам, в которых будут использоваться молекулы РНК. См., например, Mali et al. (2013) Science 339:823-826; Jinek et al. (2012) Science 337:816-821; Hwang et al. (2013) Nat. Biotechnol. 31:227-229; Jiang et al. (2013) War. Biotechnol. 31:233-239; и Cong et al. (2013) Science 339:819-823, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей.[000231] In systems in which both a crRNA and a small noncoding RNA are required, the crRNA and the corresponding small noncoding RNA hybridize to form a gRNA. In systems in which only a crRNA is required, the crRNA can be a gRNA. The crRNA additionally provides a single-stranded targeting DNA segment that hybridizes to a sequence recognized by the guide RNA. When used for intracellular modification, the precise sequence of a given crRNA or small noncoding RNA molecule can be engineered to be specific to the species in which the RNA molecules will be used. See, e.g., Mali et al. (2013) Science 339:823–826; Jinek et al. (2012) Science 337:816–821; Hwang et al. (2013) Nat. Biotechnol. 31:227–229; Jiang et al. (2013) War. Biotechnol. 31:233-239; and Cong et al. (2013) Science 339:819-823, each of which is hereby incorporated by reference in its entirety for all purposes.

[000232] Сегмент ДНК-нацеливания (крРНК) данной гРНК содержит нуклеотидную последовательность, которая комплементарна последовательности (то есть, последовательности, узнаваемой направляющей РНК) в ДНК-мишени. Сегмент ДНК-нацеливания гРНК взаимодействует с ДНК-мишенью последовательность-специфичным образом посредством гибридизации (т.е. спаривания оснований). Таким образом, нуклеотидная последовательность сегмента ДНК-нацеливания может изменяться и определяет местоположение в пределах ДНК-мишени, с которой будут взаимодействовать гРНК и ДНК-мишень. Сегмент ДНК-нацеливания исследуемой гРНК может быть модифицирован для гибридизации с любой желаемой последовательностью в ДНК-мишени. Встречающиеся в природе крРНК различаются в зависимости от системы CRISPR/Cas и организма, но часто содержат сегмент-мишень длиной между 21 до 72 нуклеотидов, фланкированный двумя прямыми повторами (DR) длиной между 21 до 46 нуклеотидов (см., например, WO 2014/131833, включенную в данный документ в качестве ссылки в полном объеме для всех целей). В случае S. pyogenes DR является 36 нуклеотидов длиной, а сегмент-мишень является 30 нуклеотидов длиной. 3' расположенный DR является комплементарным и гибридизуется с соответствующей малой некодирующей РНК, которая, в свою очередь, связывается с белком Cas.[000232] The targeting DNA segment (crRNA) of a given gRNA comprises a nucleotide sequence that is complementary to a sequence (i.e., a sequence recognized by the guide RNA) in a target DNA. The targeting DNA segment of the gRNA interacts with the target DNA in a sequence-specific manner through hybridization (i.e., base pairing). Thus, the nucleotide sequence of the targeting DNA segment can be varied and determines the location within the target DNA with which the gRNA and the target DNA will interact. The targeting DNA segment of a gRNA of interest can be modified to hybridize to any desired sequence in the target DNA. Naturally occurring crRNAs vary depending on the CRISPR/Cas system and the organism, but often contain a target segment of between 21 and 72 nucleotides in length flanked by two direct repeats (DRs) of between 21 and 46 nucleotides in length (see, e.g., WO 2014/131833, incorporated herein by reference in its entirety for all purposes). In the case of S. pyogenes, the DR is 36 nucleotides in length and the target segment is 30 nucleotides in length. The 3' located DR is complementary to and hybridizes with the corresponding small non-coding RNA, which in turn binds to the Cas protein.

[000233] Сегмент ДНК-нацеливания может иметь длину по меньшей мере около 12 нуклеотидов, по меньшей мере около 15 нуклеотидов, по меньшей мере около 17 нуклеотидов, по меньшей мере около 18 нуклеотидов, по меньшей мере около 19 нуклеотидов, по меньшей мере около 20 нуклеотидов, по меньшей мере около 25 нуклеотидов, по меньшей мере около 30 нуклеотидов, по меньшей мере около 35 нуклеотидов или по меньшей мере около 40 нуклеотидов. Такие сегменты ДНК-нацеливания могут иметь длину от около 12 нуклеотидов до около 100 нуклеотидов, от около 12 нуклеотидов до около 80 нуклеотидов, от около 12 нуклеотидов до около 50 нуклеотидов, от около 12 нуклеотидов до около 40 нуклеотидов, от около 12 нуклеотидов до около 30 нуклеотидов, от около 12 нуклеотидов до около 25 нуклеотидов или от около 12 нуклеотидов до около 20 нуклеотидов. Например, сегмент ДНК-нацеливания может составлять от около 15 нуклеотидов до около 25 нуклеотидов (например, от около 17 нуклеотидов до около 20 нуклеотидов, или около 17 нуклеотидов, около 18 нуклеотидов, около 19 нуклеотидов или около 20 нуклеотидов). См., например, US 2016/0024523, включенную в данном документе в качестве ссылки в полном объеме для всех целей. Для Cas9 из S. pyogenes типичный сегмент ДНК-нацеливания составляет между 16 и 20 нуклеотидов в длину или между 17 и 20 нуклеотидов в длину. Для Cas9 H3S. aureus типичный сегмент ДНК-нацеливания составляет между 21 и 23 нуклеотидов в длину. Для Cpf1 типичный сегмент ДНК-нацеливания составляет по меньшей мере 16 нуклеотидов в длину или по меньшей мере 18 нуклеотидов в длину.[000233] The DNA targeting segment can be at least about 12 nucleotides long, at least about 15 nucleotides long, at least about 17 nucleotides long, at least about 18 nucleotides long, at least about 19 nucleotides long, at least about 20 nucleotides long, at least about 25 nucleotides long, at least about 30 nucleotides long, at least about 35 nucleotides long, or at least about 40 nucleotides long. Such DNA targeting segments may be from about 12 nucleotides to about 100 nucleotides in length, from about 12 nucleotides to about 80 nucleotides, from about 12 nucleotides to about 50 nucleotides, from about 12 nucleotides to about 40 nucleotides, from about 12 nucleotides to about 30 nucleotides, from about 12 nucleotides to about 25 nucleotides, or from about 12 nucleotides to about 20 nucleotides. For example, a DNA targeting segment may be from about 15 nucleotides to about 25 nucleotides (e.g., from about 17 nucleotides to about 20 nucleotides, or about 17 nucleotides, about 18 nucleotides, about 19 nucleotides, or about 20 nucleotides). See, for example, US 2016/0024523, incorporated herein by reference in its entirety for all purposes. For S. pyogenes Cas9, a typical DNA targeting segment is between 16 and 20 nucleotides in length or between 17 and 20 nucleotides in length. For H3S. aureus Cas9, a typical DNA targeting segment is between 21 and 23 nucleotides in length. For Cpf1, a typical DNA targeting segment is at least 16 nucleotides in length or at least 18 nucleotides in length.

[000234] Малые некодирующие РНК могут быть в любой форме (например, полноразмерные малые некодирующие РНК или активные частичные малые некодирующие РНК) и различной длины. Они могут включать первичные транскрипты или обработанные формы. Например, малые некодирующие РНК (как часть одной направляющей РНК или как отдельная молекула как часть двухмолекулярной гРНК) могут содержать или состоять из всех или части последовательности малой некодирующей РНК дикого типа (например, около или более чем около 20, 26, 32, 45, 48, 54, 63, 67, 85 или более нуклеотидов последовательности малой некодирующей РНК дикого типа). Примеры последовательностей малой некодирующей РНК дикого типа из S. pyogenes включают 171-нуклеотидную, 89-нуклеотидную, 75-нуклеотидную и 65-нуклеотидную версии. См., например, Deltcheva et al. (2011) Nature 471:602-607; WO 2014/093661, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Примеры малых некодирующих РНК в одной направляющей РНК (огРНК) включают сегменты малой некодирующей РНК, обнаруженные в версиях огРНК +48, +54, +67 и +85, где «+n» указывает, что до +n нуклеотида малая некодирующая РНК дикого типа включен в огРНК. См. US 8697359, включенный в данный документ в качестве ссылки во всей полноте для всех целей.[000234] Small non-coding RNAs can be in any form (e.g., full-length small non-coding RNAs or active partial small non-coding RNAs) and of varying lengths. They can include primary transcripts or processed forms. For example, small non-coding RNAs (as part of a single guide RNA or as a single molecule as part of a dual-molecule gRNA) can comprise or consist of all or a portion of a wild-type small non-coding RNA sequence (e.g., about or more than about 20, 26, 32, 45, 48, 54, 63, 67, 85 or more nucleotides of a wild-type small non-coding RNA sequence). Examples of wild-type small non-coding RNA sequences from S. pyogenes include 171-nucleotide, 89-nucleotide, 75-nucleotide, and 65-nucleotide versions. See, e.g., Deltcheva et al. (2011) Nature 471:602-607; WO 2014/093661, each of which is incorporated herein by reference in its entirety for all purposes. Examples of small non-coding RNAs in a single guide RNA (ogRNA) include the small non-coding RNA segments found in the +48, +54, +67, and +85 versions of the ogRNA, where "+n" indicates that up to the +n nucleotide, wild-type small non-coding RNA is included in the ogRNA. See US 8,697,359, incorporated herein by reference in its entirety for all purposes.

[000235] Процентная комплементарность между ДНК-нацеливающей последовательностью и последовательностью, узнаваемой направляющей РНК, в ДНК-мишени может составлять по меньшей мере 60% (например, по меньшей мере 65%, по меньшей мере 70%, по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или 100%). Процентная комплементарность между последовательностью ДНК-нацеливания и последовательностью, узнаваемой направляющей РНК, в ДНК-мишени может составлять по меньшей мере 60% по сравнению с около 20 смежными нуклеотидами. В качестве примера, процентная комплементарность между ДНК-нацеливающей последовательностью и последовательностью, узнаваемой направляющей РНК, в ДНК-мишени составляет 100% по сравнению с 14 смежными нуклеотидами на 5'-конце последовательности, узнаваемой направляющей РНК, в комплементарной цепи ДНК-мишени и менее чем 0% по сравнению с оставшейся частью. В этом случае, последовательность ДНК-нацеливания можно считать 14 нуклеотидов в длину. В качестве еще одного примера, процентная комплементарность между ДНК-нацеливающей последовательностью и последовательностью, узнаваемой направляющей РНК, в ДНК-мишени составляет 100% по сравнению с семью смежными нуклеотидами на 5'-конце последовательности, узнаваемой направляющей РНК, в комплементарной цепи ДНК-мишени и менее чем 0% по сравнению с оставшейся частью. В этом случае, последовательность ДНК-нацеливания можно считать 7 нуклеотидов в длину. В некоторых направляющих РНК по меньшей мере 17 нуклеотидов в последовательности ДНК-мишени являются комплементарными ДНК-мишени. Например, последовательность ДНК нацеливания может быть длиной 20 нуклеотидов и может содержать 1, 2 или 3 несоответствия с ДНК-мишенью (последовательность, узнаваемая направляющей РНК). Предпочтительно, несоответствия не смежны с последовательностью протоспейсера с соседним мотивом (РАМ) (например, несоответствия находятся на 5'-конце последовательности ДНК-нацеливания, или несоответствия составляют по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 или 19 пар оснований вдали от последовательности РАМ).[000235] The percentage complementarity between the targeting DNA sequence and the sequence recognized by the guide RNA in the target DNA can be at least 60% (e.g., at least 65%, at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 95%, at least 97%, at least 98%, at least 99%, or 100%). The percentage complementarity between the targeting DNA sequence and the sequence recognized by the guide RNA in the target DNA can be at least 60% over about 20 contiguous nucleotides. As an example, the percent complementarity between the targeting DNA sequence and the sequence recognized by the guide RNA in the target DNA is 100% compared to 14 contiguous nucleotides at the 5' end of the sequence recognized by the guide RNA in the complementary strand of the target DNA and less than 0% compared to the remainder. In this case, the targeting DNA sequence can be considered to be 14 nucleotides in length. As another example, the percent complementarity between the targeting DNA sequence and the sequence recognized by the guide RNA in the target DNA is 100% compared to seven contiguous nucleotides at the 5' end of the sequence recognized by the guide RNA in the complementary strand of the target DNA and less than 0% compared to the remainder. In this case, the targeting DNA sequence can be considered to be 7 nucleotides in length. In some guide RNAs, at least 17 nucleotides in the target DNA sequence are complementary to the target DNA. For example, the targeting DNA sequence may be 20 nucleotides long and may contain 1, 2, or 3 mismatches with the target DNA (the sequence recognized by the guide RNA). Preferably, the mismatches are not adjacent to the protospacer adjacent motif (PAM) sequence (e.g., the mismatches are at the 5' end of the targeting DNA sequence, or the mismatches are at least 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, or 19 base pairs away from the PAM sequence).

[000236] Белок-связывающий сегмент гРНК может содержать два участка нуклеотидов, которые являются комплементарными друг другу. Комплементарные нуклеотиды белок-связывающего сегмента гибридизуются с образованием двухцепочечного дуплекса РНК (дцРНК). Белок-связывающий сегмент исследуемой гРНК, взаимодействуете белком Cas, и гРНК направляет связанный белок Cas к определенной нуклеотидной последовательности в ДНК-мишени через сегмент ДНК-нацеливания.[000236] The protein-binding segment of a gRNA may contain two nucleotide stretches that are complementary to each other. The complementary nucleotides of the protein-binding segment hybridize to form a double-stranded RNA duplex (dsRNA). The protein-binding segment of the gRNA of interest interacts with the Cas protein, and the gRNA directs the bound Cas protein to a specific nucleotide sequence in the target DNA via the targeting DNA segment.

[000237] Одиночные направляющие РНК имеют сегмент ДНК-нацеливания и «скаффолд» последовательность (т.е. белок-связывающая или Cas-связывающая последовательность направляющей РНК). Иллюстративные «скаффолд» последовательности включают: [000237] Single guide RNAs have a DNA targeting segment and a scaffold sequence (i.e., the protein-binding or Cas-binding sequence of the guide RNA). Exemplary scaffold sequences include:

[000238] Направляющие РНК могут включать модификации или последовательности, которые обеспечивают дополнительные желательные функции (например, модифицированную или регулируемую стабильность; субклеточное нацеливание; отслеживание с флуоресцентной меткой; сайт связывания для белка или белкового комплекса; и тому подобное). Примеры таких модификаций включают, например, 5'-кэп (например, 7-метилгуанилат кэп (m7G)); 3'-полиаденилированный хвост (т.е. 3' поли(А) хвост); последовательность рибопереключателя (например, для обеспечения регулируемой стабильности и/или регулируемой доступности с помощью белков и/или белковых комплексов); последовательность контроля стабильности; последовательность, которая образует дуплекс дцРНК (т.е. шпильку); модификацию или последовательность, которая нацелена на РНК в субклеточном местоположении (например, ядро, митохондрии, хлоропласты и тому подобное); модификацию или последовательность, которая обеспечивает отслеживание (например, прямую конъюгацию с флуоресцентной молекулой, конъюгацию с мотивом, которая облегчает флуоресцентное обнаружение, последовательность, которая допускает флуоресцентное обнаружение и т.д.); модификацию или последовательность, которая обеспечивает сайт связывания для белков (например, белки, которые действуют на ДНК, включая активаторы транскрипции, транскрипционные репрессоры, ДНК-метилтрансферазы, ДНК-деметилазы, гистон-ацетилтрансферазы, гистон дезацетилазы и тому подобное); и их комбинации. Другие примеры модификаций включают в себя сконструированные дуплексные структуры стебель-петля, сконструированные участки выпуклостей, сконструированные шпильки 3' дуплексной структуры стебель-петля или любую их комбинацию. См., например, US 2015/0376586, включенную в данном документе в качестве ссылки в полном объеме для всех целей. Выпуклость может быть непарным участком нуклеотидов внутри дуплекса, состоящей из крРНК-подобного участка и минимальной малой некодирующей РНК-подобного участка. Выпуклость может содержать на одной стороне дуплекса, неспаренную 5'-XXXY-3', где X представляет собой любой пурин, a Y может быть нуклеотидом, который может образовывать неоднозначную пару с нуклеотидом на противоположной нити, и неспаренный нуклеотидный участок на другой стороне дуплекса.[000238] Guide RNAs may include modifications or sequences that provide additional desirable functions (e.g., modified or regulated stability; subcellular targeting; fluorescent tag tracking; a binding site for a protein or protein complex; and the like). Examples of such modifications include, for example, a 5' cap (e.g., a 7-methylguanylate cap (m7G)); a 3' polyadenylated tail (i.e., a 3' poly(A) tail); a riboswitch sequence (e.g., to provide regulated stability and/or regulated accessibility by proteins and/or protein complexes); a stability control sequence; a sequence that forms a dsRNA duplex (i.e., a hairpin); a modification or sequence that targets the RNA to a subcellular location (e.g., the nucleus, mitochondria, chloroplasts, and the like); a modification or sequence that provides tracking (e.g., direct conjugation to a fluorescent molecule, conjugation to a motif that facilitates fluorescent detection, a sequence that allows fluorescent detection, etc.); a modification or sequence that provides a binding site for proteins (e.g., proteins that act on DNA, including transcriptional activators, transcriptional repressors, DNA methyltransferases, DNA demethylases, histone acetyltransferases, histone deacetylases, and the like); and combinations thereof. Other examples of modifications include engineered stem-loop duplex structures, engineered bulge regions, engineered 3' hairpins of a stem-loop duplex structure, or any combination thereof. See, e.g., US 2015/0376586, incorporated herein by reference in its entirety for all purposes. The bulge may be an unpaired region of nucleotides within a duplex consisting of a crRNA-like region and a minimal small noncoding RNA-like region. The bulge may contain on one side of the duplex an unpaired 5'-XXXY-3', where X is any purine and Y may be a nucleotide that can form a wobble pair with a nucleotide on the opposite strand, and an unpaired nucleotide region on the other side of the duplex.

[000239] Направляющие РНК могут предоставляться в любой форме. Например, гРНК может быть представлена в форме РНК либо в виде двух молекул (отдельная крРНК и малая некодирующая РНК), либо в виде одной молекулы (огРНК) и, необязательно, в форме комплекса с белком Cas. Например, гРНК могут быть получены путем транскрипции in vitro с использованием, например, РНК-полимеразы Т7 (см., например, WO 2014/089290 и WO 2014/065596, каждый из которых включен в настоящий документ посредством ссылки во всей их полноте для всех целей). Направляющие РНК также могут быть получены химическим синтезом.[000239] Guide RNAs may be provided in any form. For example, gRNA may be provided in the form of RNA either as two molecules (a single crRNA and a small non-coding RNA) or as a single molecule (sogRNA), and optionally in the form of a complex with a Cas protein. For example, gRNAs may be produced by in vitro transcription using, for example, T7 RNA polymerase (see, for example, WO 2014/089290 and WO 2014/065596, each of which is incorporated herein by reference in its entirety for all purposes). Guide RNAs may also be produced by chemical synthesis.

[000240] ГРНК также может быть представлена в форме ДНК, кодирующей гРНК. ДНК, кодирующая гРНК, может кодировать одну молекулу РНК (огРНК) или отдельные молекулы РНК (например, отдельную крРНК и малая некодирующая РНК). В последнем случае ДНК, кодирующая гРНК, может быть предоставлена в виде одной молекулы ДНК или в виде отдельных молекул ДНК, кодирующих крРНК и малую некодирующую РНК, соответственно.[000240] The gRNA may also be provided in the form of DNA encoding the gRNA. The DNA encoding the gRNA may encode a single RNA molecule (gRNA) or separate RNA molecules (e.g., a single crRNA and a small non-coding RNA). In the latter case, the DNA encoding the gRNA may be provided as a single DNA molecule or as separate DNA molecules encoding the crRNA and the small non-coding RNA, respectively.

[000241] Когда гРНК предоставляется в форме ДНК, гРНК может быть временно, условно или конститутивно экспрессирована в клетке. ДНК, кодирующие гРНК, могут быть стабильно интегрированы в геном клетки и функционально связаны с промотором, активным в клетке. Альтернативно, ДНК, кодирующие гРНК, могут быть функционально связаны с промотором в экспрессирующей конструкции. Например, ДНК, кодирующая гРНК, может быть в векторе, содержащем экзогенную матрицу для репарации и/или вектор, содержащий нуклеиновую кислоту, кодирующую белок Cas. Альтернативно, он может быть в векторе или плазмиде, которая отделена от вектора, содержащего экзогенную матрицу для репарации и/или вектор, содержащий нуклеиновую кислоту, кодирующую белок Cas. Промоторы, которые могут быть использованы в таких экспрессионных конструктах, включают промоторы, активные, например, в одной или более эукариотической клетке, клетке человека, клетке не человека, клетке млекопитающего, клетке млекопитающего отличного от человека, клетке грызунов, клетке мыши, клетке крысы, клетке хомяка, клетке кролика, плюрипотентной клетке, эмбриональной стволовой клетке (ЭС) или зиготе. Такими промоторами могут быть, например, условные промоторы, индуцируемые промоторы, конститутивные промоторы или тканеспецифические промоторы. Такими промоторами могут также быть, например, двунаправленные промоторы. Конкретные примеры подходящих промоторов включают промотор РНК-полимеразы III, такой как промотор U6 человека, промотор III полимеразы U6 крысы или промотор III полимеразы U6 мыши.[000241] When the gRNA is provided in the form of DNA, the gRNA can be transiently, conditionally, or constitutively expressed in a cell. DNA encoding the gRNA can be stably integrated into the genome of the cell and operably linked to a promoter active in the cell. Alternatively, DNA encoding the gRNA can be operably linked to a promoter in an expression construct. For example, DNA encoding the gRNA can be in a vector containing an exogenous repair template and/or a vector containing a nucleic acid encoding a Cas protein. Alternatively, it can be in a vector or plasmid that is separate from the vector containing the exogenous repair template and/or a vector containing a nucleic acid encoding a Cas protein. Promoters that can be used in such expression constructs include promoters that are active in, for example, one or more eukaryotic cells, a human cell, a non-human cell, a mammalian cell, a non-human mammalian cell, a rodent cell, a mouse cell, a rat cell, a hamster cell, a rabbit cell, a pluripotent cell, an embryonic stem (ES) cell, or a zygote. Such promoters can be, for example, conditional promoters, inducible promoters, constitutive promoters, or tissue-specific promoters. Such promoters can also be, for example, bidirectional promoters. Specific examples of suitable promoters include an RNA polymerase III promoter, such as the human U6 promoter, the rat U6 polymerase III promoter, or the mouse U6 polymerase III promoter.

(3) Последовательности, распознаваемые направляющей РНК(3) Sequences recognized by guide RNA

[000242] Термин «последовательность, распознаваемая направляющей РНК» включает последовательности нуклеиновых кислот, присутствующие в ДНК-мишени, с которой связывается сегмент ДНК-нацеливания гРНК, при условии наличия достаточных условий для связывания. Например, последовательности, распознаваемые направляющей РНК, включают последовательности, в которых направляющая РНК сконструирована, чтобы иметь комплементарность, где гибридизация между последовательностью, распознаваемой направляющей РНК, и последовательностью ДНК-нацеливания способствует образованию комплекса CRISPR. Полная комплементарность необязательно требуется, при условии достаточной комплементарности, чтобы вызвать гибридизацию и способствовать формированию комплекса CRISPR. Последовательности, распознаваемые направляющей РНК, также включают сайты расщепления для белков Cas, описанные более подробно ниже. Последовательность, узнаваемая направляющей РНК может содержать любой полинуклеотид, который может быть расположен, например, в ядре или цитоплазме клетки, или внутри органеллы клетки, такой как митохондрия или хлоропласт.[000242] The term "guide RNA recognition sequence" includes nucleic acid sequences present in the target DNA to which the gRNA targeting DNA segment binds, provided that sufficient conditions for binding exist. For example, guide RNA recognition sequences include sequences in which the guide RNA is designed to have complementarity, wherein hybridization between the guide RNA recognition sequence and the targeting DNA sequence facilitates formation of a CRISPR complex. Complete complementarity is not necessarily required, so long as there is sufficient complementarity to cause hybridization and facilitate formation of a CRISPR complex. Guide RNA recognition sequences also include cleavage sites for Cas proteins, described in more detail below. The sequence recognized by the guide RNA may comprise any polynucleotide that can be located, for example, in the nucleus or cytoplasm of a cell, or within a cell organelle such as a mitochondrion or chloroplast.

[000243] Последовательность, узнаваемая направляющей РНК, в ДНК-мишени может быть нацелена с помощью (то есть быть связанной с помощью, или гибридизованной с, или быть комплементарной) белка Cas или гРНК. Подходящие условия связывания ДНК/РНК включают физиологические условия, обычно присутствующие в клетке. Другие подходящие условия связывания ДНК/РНК (например, условия в бесклеточной системе) известны в данной области техники (см., например, Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook et al., Harbor Laboratory Press 2001), включенный в данный документ в качестве ссылки во всей полноте для всех целей. Цепь ДНК-мишени, которая комплементарна и гибридизуется с белком Cas или гРНК, может быть названа «комплементарной цепью», а цепь ДНК-мишени, которая комплементарна «комплементарной цепи» (и поэтому не является комплементарной белку Cas или гРНК) может быть названа «некомплементарной цепью» или «матричной цепью».[000243] A sequence recognized by a guide RNA in a target DNA may be targeted by (i.e., be bound by, or hybridized to, or be complementary to) a Cas protein or gRNA. Suitable DNA/RNA binding conditions include physiological conditions normally present in the cell. Other suitable DNA/RNA binding conditions (e.g., conditions in a cell-free system) are known in the art (see, e.g., Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook et al., Harbor Laboratory Press 2001), incorporated herein by reference in its entirety for all purposes. The strand of target DNA that is complementary to and hybridizes to the Cas protein or gRNA may be referred to as the "complementary strand," and the strand of target DNA that is complementary to the "complementary strand" (and therefore is not complementary to the Cas protein or gRNA) may be referred to as the "non-complementary strand" or "template strand."

[000244] Белок Cas может расщеплять нуклеиновую кислоту в сайте внутри или вне последовательности нуклеиновой кислоты, присутствующей в ДНК-мишени, с которой будет связываться сегмент ДНК-нацеливания гРНК. «Сайт расщепления» включает положение нуклеиновой кислоты, в котором белок Cas производит одноцепочечный разрыв или двухцепочечный разрыв. Например, образование комплекса CRISPR (содержащего гРНК, гибридизованную с последовательностью, узнаваемую направляющей РНК и образующую комплекс с белком Cas) может привести к расщеплению одной или обеих цепей в или вблизи (например, в 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 или более пар оснований из) последовательности нуклеиновой кислоты, присутствующей в ДНК-мишени, с которой будет связываться сегмент ДНК-нацеливания гРНК. Если сайт расщепления находится за пределами последовательности нуклеиновой кислоты, с которой будет связываться сегмент ДНК-нацеливания гРНК, сайт расщепления по-прежнему считается находящимся в «последовательности, узнаваемой направляющей РНК». Сайт расщепления может находиться только на одной цепи или на обеих цепях нуклеиновой кислоты. Сайты расщепления могут находиться в одном и том же положении на обеих цепях нуклеиновой кислоты (продуцирующие «тупые» концы) или могут находиться в разных сайтах на каждой цепи (образуя ступенчатые концы (т.е. «липкие» концы)). Ступенчатые концы могут быть получены, например, с использованием двух белков Cas, каждый из которых производит одноцепочечный разрыв в другом сайте расщепления на другой цепи, тем самым создавая двухцепочечный разрыв. Например, первая никаза может создать одноцепочечный разрыв на первой цепочке двухцепочечной ДНК (дцДНК), а вторая никаза может создать одноцепочечный разрыв на второй цепочке дцДНК, так что создаются «нависающие» последовательности. В некоторых случаях последовательность никазы, узнаваемая направляющей РНК, на первой нити отделена от последовательности никазы, узнаваемой направляющей РНК, на второй цепи по меньшей мере на 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 250, 500 или 1000 пар оснований.[000244] The Cas protein may cleave a nucleic acid at a site within or outside of a nucleic acid sequence present in the target DNA to which the gRNA targeting DNA segment will bind. A "cleavage site" includes a nucleic acid position at which the Cas protein produces a single-strand break or a double-strand break. For example, formation of a CRISPR complex (comprising a gRNA hybridized to a sequence recognized by a guide RNA and complexed with a Cas protein) may result in cleavage of one or both strands at or near (e.g., 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 or more base pairs from) a nucleic acid sequence present in the target DNA to which the gRNA targeting DNA segment will bind. If the cleavage site is outside the nucleic acid sequence to which the gRNA targeting DNA segment will bind, the cleavage site is still considered to be within the "guide RNA recognition sequence". The cleavage site may be on only one strand or on both strands of the nucleic acid. Cleavage sites may be at the same position on both strands of the nucleic acid (producing "blunt" ends) or may be at different sites on each strand (forming staggered ends (i.e., "sticky" ends)). Staggered ends can be produced, for example, by using two Cas proteins, each producing a single-strand break at a different cleavage site on the other strand, thereby creating a double-strand break. For example, a first nickase may create a single-strand break on the first strand of double-stranded DNA (dsDNA), and a second nickase may create a single-strand break on the second strand of dsDNA, such that "overhang" sequences are created. In some cases, the nickase sequence recognized by the guide RNA on the first strand is separated from the nickase sequence recognized by the guide RNA on the second strand by at least 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 250, 500, or 1000 base pairs.

[000245] Сайт-специфическое связывание и расщепление ДНК-мишени с помощью белков Cas может происходить в местах, определяемых как (i) комплементарность спаривания оснований между гРНК и ДНК-мишенью, так и (ii) коротким мотивом, называемым смежным мотивом протоспейсера (РАМ) в ДНК-мишени. РАМ может фланкировать последовательность, узнаваемую направляющей РНК. Необязательно, последовательность, узнаваемая направляющей РНК, может быть фланкирована на 3' конце с помощью РАМ. Альтернативно, последовательность, узнаваемая направляющей РНК, может быть фланкирована на 5' конце с помощью РАМ. Например, сайт расщепления белков Cas может составлять от около 1 до около 10 или от около 2 до около 5 пар оснований (например, 3 пары оснований) вверх или вниз по ходу транскрипции последовательности РАМ. В некоторых случаях (например, когда используется Cas9 из S. pyogenes или близкородственного Cas9), последовательность РАМ не комплементарной цепи может быть 5'-NiGG-3', где Ni представляет собой любой нуклеотид ДНК и сразу же 3' последовательности, узнаваемой направляющей РНК, не комплементарной цепи ДНК-мишени. Таким образом, последовательность РАМ комплементарной цепи будет представлять собой 5'-CCN2-3', где N2 представляет собой любой нуклеотид ДНК и сразу же 5' последовательности, узнаваемой направляющей РНК, комплементарной цепи ДНК-мишени. В некоторых таких случаях N1 и N2 могут быть комплементарными, a N1-N2 пара оснований может быть любой парой оснований (например, N1=C и N2=G; N1=G и N2=C; N1=A и N2=T; или N1=T, и N2=A). В случае Cas9 из S. aureus, РАМ, может быть NNGRRT (SEQ ID NO: 146) или NNGRR (SEQ ID NO: 147), где N может быть A, G, С или T, a R может быть G или А. В случае Cas9 из С. jejuni, РАМ может быть, например, NNNNACAC или NNNNRYAC, где N может быть A, G, С или Т, a R может быть G или А. В некоторых случаях (например, для FnCpf1), последовательность РАМ может находиться вверх по ходу транскрипции 5'-конца и иметь последовательность 5'-TTN-3'.[000245] Site-specific binding and cleavage of target DNA by Cas proteins can occur at locations determined by both (i) base-pairing complementarity between the gRNA and the target DNA and (ii) a short motif called a protospacer adjacent motif (PAM) in the target DNA. The PAM can flank a sequence recognized by the guide RNA. Optionally, the sequence recognized by the guide RNA can be flanked at the 3' end by a PAM. Alternatively, the sequence recognized by the guide RNA can be flanked at the 5' end by a PAM. For example, the cleavage site of Cas proteins can be from about 1 to about 10 or from about 2 to about 5 base pairs (e.g., 3 base pairs) upstream or downstream of the PAM sequence. In some cases (e.g. when Cas9 from S. pyogenes or a closely related Cas9 is used), the PAM sequence of the non-complementary strand may be 5'-NiGG-3', where Ni is any DNA nucleotide and is immediately 3' of a sequence recognized by a guide RNA non-complementary to the target DNA strand. Thus, the PAM sequence of the complementary strand would be 5'-CCN 2 -3', where N 2 is any DNA nucleotide and is immediately 5' of a sequence recognized by a guide RNA complementary to the target DNA strand. In some such cases, N 1 and N 2 may be complementary, and the N 1 -N 2 base pair may be any base pair (e.g., N 1 = C and N 2 = G; N 1 = G and N 2 = C; N 1 = A and N 2 = T; or N 1 = T and N 2 = A). In the case of S. aureus Cas9, the PAM may be NNGRRT (SEQ ID NO: 146) or NNGRR (SEQ ID NO: 147), where N may be A, G, C, or T and R may be G or A. In the case of C. jejuni Cas9, the PAM may be, for example, NNNNACAC or NNNNRYAC, where N may be A, G, C, or T and R may be G or A. In some cases (e.g., for FnCpf1), the PAM sequence may be upstream of the 5' end and have the sequence 5'-TTN-3'.

[000246] Примеры последовательностей, распознаваемых направляющей РНК, включают в себя последовательность ДНК, комплементарную сегменту ДНК-нацеливания гРНК, или такую последовательность ДНК в дополнение к последовательности РАМ. Например, мотив-мишень может быть 20-нуклеотидной ДНК-последовательностью, непосредственно предшествующей мотиву NGG, распознаваемой белком Cas9, таким как GN19NGG (SEQ ID NO: 1) или N20NGG (SEQ ID NO: 2) (см., например, WO 2014/165825, включенную в данный документ в качестве ссылки во всей ее полноте для всех целей). Гуанин на 5'-конце может способствовать транскрипции РНК-полимеразой в клетках. Другие примеры последовательностей, распознаваемых направляющей РНК, могут включать два гуаниновых нуклеотида на 5'-конце (например, GGN20NGG, SEQ ID NO: 3) для облегчения эффективной транскрипции с помощью полимеразы Т7 in vitro. См., например, WO 2014/065596, включенную в данном документе в качестве ссылки в полном объеме для всех целей. Другие последовательности, распознаваемые направляющей РНК, могут иметь между 4-22 нуклеотидов в длину SEQ ID NOS: 1-3, включая 5' G или GG и 3' GG или NGG. Тем не менее, другие последовательности, распознаваемые направляющей РНК, могут иметь между 14 и 20 нуклеотидов в длину SEQ ID NO: 1-3.[000246] Examples of sequences recognized by a guide RNA include a DNA sequence complementary to a gRNA targeting DNA segment, or such a DNA sequence in addition to a PAM sequence. For example, the target motif can be a 20-nucleotide DNA sequence immediately preceding the NGG motif recognized by a Cas9 protein, such as GN 19 NGG (SEQ ID NO: 1) or N 20 NGG (SEQ ID NO: 2) (see, e.g., WO 2014/165825, incorporated herein by reference in its entirety for all purposes). Guanine at the 5' end can promote transcription by RNA polymerase in cells. Other examples of sequences recognized by a guide RNA may include two guanine nucleotides at the 5' end (e.g., GGN 20 NGG, SEQ ID NO: 3) to facilitate efficient transcription by T7 polymerase in vitro. See, e.g., WO 2014/065596, incorporated herein by reference in its entirety for all purposes. Other sequences recognized by a guide RNA may be between 4-22 nucleotides in length SEQ ID NOS: 1-3, including 5' G or GG and 3' GG or NGG. However, other sequences recognized by a guide RNA may be between 14 and 20 nucleotides in length SEQ ID NOs: 1-3.

[000247] Последовательность, узнаваемая направляющей РНК, может быть любой последовательностью нуклеиновой кислоты, эндогенной или экзогенной к клетке. Последовательность, узнаваемая направляющей РНК, может быть последовательностью, кодирующей продукт гена (например, белок) или некодирующую последовательность (например, регуляторную последовательность) или может включать обе.[000247] The sequence recognized by the guide RNA may be any nucleic acid sequence, endogenous or exogenous to the cell. The sequence recognized by the guide RNA may be a sequence encoding a gene product (e.g., a protein) or a non-coding sequence (e.g., a regulatory sequence), or may include both.

С. Экзогенные матрицы для репарацииC. Exogenous matrices for reparation

[000248] Способы и композиции, раскрытые в данном документе, могут использовать экзогенные матрицы для репарации для модификации геномного локуса-мишени после расщепления геномного локуса-мишени с белком Cas. Например, клетка может быть эмбрионом на одноклеточной стадии, а экзогенная матрица для репарации может быть менее 5 т.п.о. в длину. В типах клеток, отличных от эмбрионов на одноклеточной стадии, экзогенная матрица для репарации (например, вектор нацеливания) может быть более длинной. Например, в типах клеток, отличных от эмбрионов на одноклеточной стадии, экзогенная матрица для репарации может быть большим направленным вектором (LTVEC), как описано в другом месте в данном документе (например, нацеливающий вектор, имеющий длину по меньшей мере 10 т.п.о. или имеющий 5' и 3' плечи гомологии, общая сумма которых составляет не менее 10 т.п.о.). Использование экзогенных матриц для репарации в сочетании с белками Cas может привести к более точной модификации геномного локуса-мишени путем содействия гомология-направленной репарации.[000248] The methods and compositions disclosed herein can use exogenous repair templates to modify a target genomic locus following cleavage of the target genomic locus with a Cas protein. For example, the cell can be a one-cell stage embryo, and the exogenous repair template can be less than 5 kb in length. In cell types other than one-cell stage embryos, the exogenous repair template (e.g., a targeting vector) can be longer. For example, in cell types other than one-cell stage embryos, the exogenous repair template can be a large targeting vector (LTVEC), as described elsewhere herein (e.g., a targeting vector that is at least 10 kb in length or has 5' and 3' homology arms that total at least 10 kb). The use of exogenous repair templates in combination with Cas proteins may result in more precise modification of the target genomic locus by facilitating homology-directed repair.

[000249] В таких методах белок Cas расщепляет геномный локус-мишень для создания одноцепочечного разрыва (одноцепочечный разрыв) или двухцепочечного разрыва, и его экзогенная матрица для репарации рекомбинирует нуклеиновую кислоту-мишень посредством опосредованного не гомологичным концевым соединением (NHEJ) лигирования или путем события гомология-направленной репарации. Необязательно, репарация с помощью экзогенной матрицы для репарации удаляет или нарушает последовательность, узнаваемую направляющей РНК, или сайт расщепления Cas, так что аллели, на которые были нацелены, не могут быть повторно нацелены на белок Cas.[000249] In such methods, the Cas protein cleaves a target genomic locus to create a single-strand break (ssn) or a double-strand break, and its exogenous repair template recombines the target nucleic acid via non-homologous end joining (NHEJ)-mediated ligation or via a homology-directed repair event. Optionally, repair by the exogenous repair template removes or disrupts the sequence recognized by the guide RNA or the Cas cleavage site such that the alleles that were targeted cannot be retargeted by the Cas protein.

[000250] Экзогенные матрицы для репарации могут содержать дезоксирибонуклеиновую кислоту (ДНК) или рибонуклеиновую кислоту (РНК), они могут быть одноцепочечными или двухцепочечными и могут быть в линейной или круговой форме. Например, экзогенная матрица для репарации может представлять собой одноцепочечный олигодезоксинуклеотид (ssODN). См., например, Yoshimi et al. (2016) Nat. Commun. 7:10431, включенный в данный документ в качестве ссылки во всей полноте для всех целей. Иллюстративная длина экзогенной матрицы для репарации находится в промежутке от около 50 нуклеотидов до около 5 т.п.о., в промежутке от около 50 до около 3 т.п.о., или в промежутке от около 50 до около 1000 нуклеотидов. Другие примеры экзогенных матриц для репарации составляют между около 40 до около 200 нуклеотидов в длину. Например, экзогенная матрица для репарации может составлять между около 50 до около 60, от около 60 до около 70, от около 70 до около 80, от около 80 до около 90, от около 90 до около 100, от около 100 до около 110, от около 110 до около 120, от около 120 до 130, от около 130 до около 140, от около 140 до около 150, от около 150 до около 160, от около 160 до около 170, от около 170 до около 180, от около 180 до около 190, или от около 190 до около 200 нуклеотидов в длину. Альтернативно, экзогенная матрица для репарации может составлять между около 50 до около 100, от около 100 до около 200, от около 200 до около 300, от около 300 до около 400, от около 400 до около 500, от около 500 до около 600, от около 600 до около 700, от около 700 до около 800, от около 800 до около 900, или от около 900 до около 1000 нуклеотидов в длину. Альтернативно, экзогенная матрица для репарации может составлять между около 1 до около 1,5 т.п.о., от около 1,5 до около 2 т.п.о., от около 2 до около 2,5 т.п.о., от около 2,5 до около 3 т.п.о., от около 3 до около 3,5 т.п.о., от около 3,5 до около 4 т.п.о., от около 4 до около 4,5 т.п.о. или от около 4,5 до около 5 т.п.о. в длину. Альтернативно, экзогенная матрица для репарации может быть, например, не более чем 5 т.п.о., 4,5 т.п.о., 4 т.п.о., 3,5 т.п.о., 3 т.п.о., 2,5 т.п.о., 2 т.п.о., 1,5 т.п.о., 1 т.п.о., 900 нуклеотидов, 800 нуклеотидов, 700 нуклеотидов, 600 нуклеотидов, 500 нуклеотидов, 400 нуклеотидов, 300 нуклеотидов, 200 нуклеотидов, 100 нуклеотидов или 50 нуклеотидов в длину. В типах клеток, отличных от эмбрионов на одноклеточной стадии, экзогенная матрица для репарации (например, вектор нацеливания) может быть более длинной. Например, в типах клеток, отличных от эмбрионов на одноклеточной стадии, экзогенная матрица для репарации может быть большим направленным вектором (LTVEC), как описано в другом месте данного документа.[000250] Exogenous repair templates may comprise deoxyribonucleic acid (DNA) or ribonucleic acid (RNA), they may be single-stranded or double-stranded, and may be in a linear or circular form. For example, an exogenous repair template may be a single-stranded oligodeoxynucleotide (ssODN). See, e.g., Yoshimi et al. (2016) Nat. Commun. 7:10431, incorporated herein by reference in its entirety for all purposes. An exemplary length of an exogenous repair template is in the range of about 50 nucleotides to about 5 kb, in the range of about 50 to about 3 kb, or in the range of about 50 to about 1000 nucleotides. Other examples of exogenous repair templates are between about 40 to about 200 nucleotides in length. For example, an exogenous repair template can be between about 50 to about 60, about 60 to about 70, about 70 to about 80, about 80 to about 90, about 90 to about 100, about 100 to about 110, about 110 to about 120, about 120 to 130, about 130 to about 140, about 140 to about 150, about 150 to about 160, about 160 to about 170, about 170 to about 180, about 180 to about 190, or about 190 to about 200 nucleotides in length. Alternatively, the exogenous repair template may be between about 50 to about 100, about 100 to about 200, about 200 to about 300, about 300 to about 400, about 400 to about 500, about 500 to about 600, about 600 to about 700, about 700 to about 800, about 800 to about 900, or about 900 to about 1000 nucleotides in length. Alternatively, the exogenous repair template may be between about 1 to about 1.5 kb, about 1.5 to about 2 kb, about 2 to about 2.5 kb, about 2.5 to about 3 kb, about 3 to about 3.5 kb, about 3.5 to about 4 kb, about 4 to about 4.5 kb, or about 4.5 to about 5 kb in length. Alternatively, the exogenous repair template may be, for example, no more than 5 kb, 4.5 kb, 4 kb, 3.5 kb, 3 kb, 2.5 kb, 2 kb, 1.5 kb, 1 kb, 900 nucleotides, 800 nucleotides, 700 nucleotides, 600 nucleotides, 500 nucleotides, 400 nucleotides, 300 nucleotides, 200 nucleotides, 100 nucleotides, or 50 nucleotides in length. In cell types other than one-cell stage embryos, the exogenous repair template (e.g., targeting vector) may be longer. For example, in cell types other than one-cell stage embryos, the exogenous template for repair may be a large targeting vector (LTVEC), as described elsewhere in this document.

[000251] В одном примере, экзогенная матрица для репарации представляет собой ssODN, который находится между около 80 нуклеотидов и около 200 нуклеотидов в длину. В другом примере, экзогенные матрицы для репарации представляет собой ssODN, который находится между около 80 нуклеотидов и около 3 т.п.о. в длину. Такой ssODN может иметь, например, плечи гомологии, каждое из которых составляет между около 40 нуклеотидов и около 60 нуклеотидов в длину. Такой ssODN может также иметь, например, плечи гомологии, каждое из которых составляет между около 30 нуклеотидов и 100 нуклеотидов в длину. Плечи гомологии могут быть симметричными (например, каждые 40 нуклеотидов или каждые 60 нуклеотидов в длину), или они могут быть асимметричными (например, одно плечо гомологии, которое составляет 36 нуклеотидов в длину, и одно плечо гомологии, которое составляет 91 нуклеотид в длину).[000251] In one example, the exogenous repair template is an ssODN that is between about 80 nucleotides and about 200 nucleotides in length. In another example, the exogenous repair template is an ssODN that is between about 80 nucleotides and about 3 kb in length. Such an ssODN may have, for example, homology arms that are each between about 40 nucleotides and about 60 nucleotides in length. Such an ssODN may also have, for example, homology arms that are each between about 30 nucleotides and 100 nucleotides in length. Homology arms may be symmetrical (e.g., every 40 nucleotides or every 60 nucleotides in length), or they may be asymmetrical (e.g., one homology arm that is 36 nucleotides in length and one homology arm that is 91 nucleotides in length).

[000252] Экзогенные матрицы для репарации могут включать в себя модификации или последовательности, которые обеспечивают дополнительные желательные функции (например, модифицированную или регулируемую стабильность, отслеживание или обнаружение с помощью флуоресцентной метки, сайт связывания для белка или белкового комплекса и т.д.). Экзогенные матрицы для репарации могут содержать одну или более флуоресцентных меток, меток для очистки, эпитопных меток или их комбинации. Например, экзогенная матрица для репарации может содержать одну или более флуоресцентных меток (например, флуоресцентные белки или другие флуорофоры или красители), такие как по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4 или по меньшей мере 5 флуоресцентных меток. Иллюстративные флуоресцентные метки включают флуорофоры, такие как флуоресцеин (например, 6-карбоксифлуоресцеин (6-FAM)), Texas Red, HEX, Су3, Су5, Су5.5, Pacific Blue, 5-(и-6)-карбокситетраметилродамин (TAMRA) и Су7. Широкий спектр флуоресцентных красителей доступен для коммерческого использования для маркировки олигонуклеотидов (например, от Integrated DNA Technologies). Такие флуоресцентные метки (например, внутренние флуоресцентные метки) могут использоваться, например, для обнаружения экзогенной матрицы для репарации, которая была непосредственно интегрирована в расщепленную нуклеиновую кислоту-мишень, имеющую выступающие концы, совместимые с концами экзогенной матрицы для репарации. Метка или маркировка могут быть на 5'-конце, 3'-конце или внутри в экзогенной матрице для репарации. Например, экзогенная матрица для репарации может быть конъюгирована на 5'-конце с флуорофором IR700 от Integrated DNA Technologies (5'IRDYE®700).[000252] Exogenous repair matrices may include modifications or sequences that provide additional desirable functions (e.g., modified or adjustable stability, tracking or detection using a fluorescent label, a binding site for a protein or protein complex, etc.). Exogenous repair matrices may contain one or more fluorescent labels, purification labels, epitope labels, or combinations thereof. For example, an exogenous repair matrix may contain one or more fluorescent labels (e.g., fluorescent proteins or other fluorophores or dyes), such as at least 1, at least 2, at least 3, at least 4, or at least 5 fluorescent labels. Exemplary fluorescent labels include fluorophores such as fluorescein (e.g., 6-carboxyfluorescein (6-FAM)), Texas Red, HEX, Cy3, Cy5, Cy5.5, Pacific Blue, 5-(and-6)-carboxytetramethylrhodamine (TAMRA), and Cy7. A wide range of fluorescent dyes are commercially available for labeling oligonucleotides (e.g., from Integrated DNA Technologies). Such fluorescent labels (e.g., internal fluorescent labels) can be used, for example, to detect an exogenous repair template that has been directly integrated into a cleaved target nucleic acid having overhangs compatible with the ends of the exogenous repair template. The label or marking can be at the 5' end, the 3' end, or internal to the exogenous repair template. For example, an exogenous repair template can be conjugated at the 5' end to the IR700 fluorophore from Integrated DNA Technologies (5'IRDYE ® 700).

[000253] Экзогенные матрицы для репарации могут также содержать вставки нуклеиновых кислот, включая сегменты ДНК, которые должны быть интегрированы в геномные локусы-мишени. Интеграция вставки нуклеиновой кислоты в геномный локус-мишень может приводить к добавлению представляющей интерес последовательности нуклеиновой кислоты, для геномного локуса-мишени, делеции представляющей интерес последовательности нуклеиновой кислоты в геномном локусе-мишени, или замены представляющей интерес последовательности нуклеиновой кислоты в геномном локусе-мишени (т.е. делеция и вставка). Некоторые экзогенные матрицы для репарации предназначены для введения вставки нуклеиновой кислоты в геномный локус-мишень без какой-либо соответствующей делеции в геномном локусе-мишени. Другие экзогенные матрицы для репарации предназначены для удаления представляющей интерес последовательности нуклеиновой кислоты в геномном локусе-мишени без какого-либо соответствующего введения вставки нуклеиновой кислоты. Тем не менее, другие экзогенные матрицы для репарации предназначены для удаления представляющей интерес последовательности нуклеиновой кислоты в геномном локусе-мишени и замены ее на вставку нуклеиновой кислоты.[000253] Exogenous repair matrices may also contain nucleic acid inserts, including DNA segments that are to be integrated into target genomic loci. Integration of a nucleic acid insert into a target genomic locus may result in the addition of a nucleic acid sequence of interest at the target genomic locus, a deletion of a nucleic acid sequence of interest at the target genomic locus, or a replacement of a nucleic acid sequence of interest at the target genomic locus (i.e., a deletion and an insertion). Some exogenous repair matrices are designed to introduce a nucleic acid insert into a target genomic locus without any corresponding deletion at the target genomic locus. Other exogenous repair templates are designed to remove a nucleic acid sequence of interest at a target genomic locus without any corresponding introduction of a nucleic acid insert. However, other exogenous repair templates are designed to remove a nucleic acid sequence of interest at a target genomic locus and replace it with a nucleic acid insert.

[000254] Вставка нуклеиновой кислоты или соответствующая нуклеиновая кислота в геномном локусе-мишени, который удаляется и/или заменяется, может быть различных длин. Иллюстративная вставка нуклеиновой кислоты или соответствующая нуклеиновая кислота в геномном локусе-мишени, который удаляется и/или заменяется, составляет между около 1 нуклеотида до около 5 т.п.о. в длину или составляет между около 1 нуклеотида до около 1000 нуклеотидов в длину. Например, вставка нуклеиновой кислоты или соответствующая нуклеиновая кислота в геномном локусе-мишени, который удаляется и/или заменяется, может составлять между около 1 до около 10, около 10 до около 20, около 20 до около 30, около 30 до около 40, около 40 до около 50, около 50 до около 60, от около 60 до около 70, от около 70 до около 80, от около 80 до около 90, от около 90 до около 100, от около 100 до около 110, от около 110 до около 120, от около 120 до 130, от около 130 до около 140, от около 140 до около 150, от около 150 до около 160, от около 160 до около 170, от около 170 до около 180, от около 180 до около 190, или от около 190 до около 200 нуклеотидов в длину. Аналогично, вставка нуклеиновой кислоты или соответствующая нуклеиновая кислота в геномном локусе-мишени, который удаляется и/или заменяется, может составлять между около 1 до около 100, около 100 до около 200, около 200 до около 300, около 300 до около 400, около 400 до около 500, около 500 до около 600, около 600 до около 700, около 700 до около 800, около 800 до около 900 или около 900 до около 1000 нуклеотидов в длину. Аналогично, вставка нуклеиновой кислоты или соответствующая нуклеиновая кислота в геномном локусе-мишени, который удаляется и/или заменяется, может составлять между около 1 до около 1,5 т.п.о., от около 1,5 до около 2 т.п.о., от около 2 до около 2,5 т.п.о., от около 2,5 до около 3 т.п.о., от около 3 до около 3,5 т.п.о., от около 3,5 до около 4 т.п.о., от около 4 до около 4,5 т.п.о. или от около 4,5 до около 5 т.п.о. в длину. Нуклеиновая кислота, удаляемая из геномного локуса-мишени, может также составлять между около 1 т.п.о. до около 5 т.п.о., около 5 т.п.о. до около 10 т.п.о., около 10 т.п.о. до около 20 т.п.о., около 20 т.п.о. до около 30 т.п.о., около 30 т.п.о. до около 40 т.п.о., около 40 т.п.о. до около 50 т.п.о., около 50 т.п.о. до около 60 т.п.о., около 60 т.п.о. до около 70 т.п.о., около 70 т.п.о. до около 80 т.п.о., около 80 т.п.о. до около 90 т.п.о., около 90 т.п.о. до около 100 т.п.о., около 100 т.п.о. до около 200 т.п.о., около 200 т.п.о. до около 300 т.п.о., около 300 т.п.о. до около 400 т.п.о., около 400 т.п.о. до около 500 т.п.о., около 500 т.п.о. до около 600 т.п.о., около 600 т.п.о. до около 700 т.п.о., около 700 т.п.о. до около 800 т.п.о., около 800 т.п.о. до около 900 т.п.о., или около 900 т.п.о. до около 1 Мб или длиннее. Альтернативно, нуклеиновая кислота, удаляемая из геномного локуса-мишени, может составлять между около 1 Мб до около 1,5 Мб, около 1,5 Мб до около 2 Мб, около 2 Мб до около 2,5 Мб, около 2,5 Мб до около 3 Мб, около 3 Мб до около 4 Мб, около 4 Мб до около 5 Мб, около 5 Мб до около 10 Мб, около 10 Мб до около 20 Мб, около 20 Мб до около 30 Мб, около 30 Мб до около 40 Мб, около 40 Мб до около 50 Мб, около 50 Мб до около 60 Мб, около 60 Мб до около 70 Мб, около 70 Мб до около 80 Мб, около 80 Мб до около 90 Мб, или около 90 Мб до около 100 Мб.[000254] The nucleic acid insert or corresponding nucleic acid at the target genomic locus that is removed and/or replaced can be of various lengths. An exemplary nucleic acid insert or corresponding nucleic acid at the target genomic locus that is removed and/or replaced is between about 1 nucleotide to about 5 kb in length, or is between about 1 nucleotide to about 1000 nucleotides in length. For example, the nucleic acid insert or the corresponding nucleic acid at the target genomic locus that is deleted and/or replaced can be between about 1 to about 10, about 10 to about 20, about 20 to about 30, about 30 to about 40, about 40 to about 50, about 50 to about 60, about 60 to about 70, about 70 to about 80, about 80 to about 90, about 90 to about 100, about 100 to about 110, about 110 to about 120, about 120 to 130, about 130 to about 140, about 140 to about 150, about 150 to about 160, about 160 to about 170, about 170 to about 180, from about 180 to about 190, or from about 190 to about 200 nucleotides in length. Similarly, the nucleic acid insert or the corresponding nucleic acid at the target genomic locus that is deleted and/or replaced can be between about 1 to about 100, about 100 to about 200, about 200 to about 300, about 300 to about 400, about 400 to about 500, about 500 to about 600, about 600 to about 700, about 700 to about 800, about 800 to about 900, or about 900 to about 1000 nucleotides in length. Similarly, the nucleic acid insert or the corresponding nucleic acid at the target genomic locus that is deleted and/or replaced can be between about 1 to about 1.5 kb, about 1.5 to about 2 kb, about 2 to about 2.5 kb, about 2.5 to about 3 kb, about 3 to about 3.5 kb, about 3.5 to about 4 kb, about 4 to about 4.5 kb, or about 4.5 to about 5 kb in length. The nucleic acid deleted from the target genomic locus can also be between about 1 kb to about 5 kb, about 5 kb, or about 5 kb. up to about 10 kbp, about 10 kbp to about 20 kbp, about 20 kbp to about 30 kbp, about 30 kbp to about 40 kbp, about 40 kbp to about 50 kbp, about 50 kbp to about 60 kbp, about 60 kbp to about 70 kbp, about 70 kbp to about 80 kbp, about 80 kbp to about 90 kbp, about 90 kbp to about 100 kbp, about 100 kbp to about 200 kbp, about 200 kbp to about 300 kbp, about 300 kbp to about 400 kbp, about 400 kbp to about 500 kbp, about 500 kbp to about 600 kbp, about 600 kbp to about 700 kbp, about 700 kbp to about 800 kbp, about 800 kbp to about 900 kbp, or about 900 kbp to about 1 MB or longer. Alternatively, the nucleic acid removed from the target genomic locus can be between about 1 Mb to about 1.5 Mb, about 1.5 Mb to about 2 Mb, about 2 Mb to about 2.5 Mb, about 2.5 Mb to about 3 Mb, about 3 Mb to about 4 Mb, about 4 Mb to about 5 Mb, about 5 Mb to about 10 Mb, about 10 Mb to about 20 Mb, about 20 Mb to about 30 Mb, about 30 Mb to about 40 Mb, about 40 Mb to about 50 Mb, about 50 Mb to about 60 Mb, about 60 Mb to about 70 Mb, about 70 Mb to about 80 Mb, about 80 Mb to about 90 Mb, or about 90 Mb to about 100 MB.

[000255] Вставка нуклеиновой кислоты может содержать геномную ДНК или любой другой тип ДНК. Например, вставка нуклеиновой кислоты может быть из прокариот, эукариот, дрожжей, птицы (например, курицы), млекопитающего отличного от человека, грызуна, человека, крысы, мыши, хомяка, кролика, свиньи, крупного рогатого скота, оленя, овцы, козы, кошки, собаки, хорька, примата (например, мартышка, макака-резус), одомашненного млекопитающего, сельскохозяйственного млекопитающего, черепахи или любого другого представляющего интерес организма.[000255] The nucleic acid insert may comprise genomic DNA or any other type of DNA. For example, the nucleic acid insert may be from a prokaryote, a eukaryote, a yeast, a bird (e.g., a chicken), a non-human mammal, a rodent, a human, a rat, a mouse, a hamster, a rabbit, a pig, a cattle, a deer, a sheep, a goat, a cat, a dog, a ferret, a primate (e.g., a monkey, a rhesus macaque), a domesticated mammal, a farm mammal, a turtle, or any other organism of interest.

[000256] Вставка нуклеиновой кислоты может содержать последовательность, которая является гомологичной или ортологичной для всего или части гена, кодирующего аутоантиген (например, часть гена, кодирующего конкретный мотив или участок аутоантигена). Гомологическая последовательность может быть от другого вида или одного и того же вида. Например, вставка нуклеиновой кислоты может содержать последовательность, которая содержит одну или более точечных мутаций (например, 1, 2, 3, 4, 5 и более) по сравнению с последовательностью, являющейся мишенью для замещения в геномном локусе-мишени. Необязательно, такие точечные мутации могут приводить к консервативной аминокислотной замене (например, замене аспарагиновой кислоты [Asp, D] глутаминовой кислотой [Glu, Е]) в кодированном полипептиде.[000256] The nucleic acid insert may comprise a sequence that is homologous or orthologous to all or part of a gene encoding an autoantigen (e.g., a portion of a gene encoding a particular motif or region of an autoantigen). The homologous sequence may be from another species or the same species. For example, the nucleic acid insert may comprise a sequence that comprises one or more point mutations (e.g., 1, 2, 3, 4, 5, or more) compared to a sequence that is the target for substitution at the target genomic locus. Optionally, such point mutations may result in a conservative amino acid substitution (e.g., substitution of aspartic acid [Asp, D] for glutamic acid [Glu, E]) in the encoded polypeptide.

[000257] Вставка нуклеиновой кислоты или соответствующая нуклеиновая кислота в геномном локусе-мишени, который удаляется и/или заменяется, может быть кодирующим участком, таким как экзон; некодирующим участком, таким как интрон, нетранслируемым участком или регуляторным участком (например, промотор, энхансер или транскрипционный репрессор-связывающий элемент); или любой их комбинацией.[000257] The nucleic acid insert or corresponding nucleic acid at the target genomic locus that is removed and/or replaced may be a coding region, such as an exon; a non-coding region, such as an intron, an untranslated region, or a regulatory region (e.g., a promoter, enhancer, or transcriptional repressor binding element); or any combination thereof.

[000258] Вставка нуклеиновой кислоты также может содержать условный аллель. Условный аллель может быть многофункциональным аллелем, как описано в US 2011/0104799, включенном в данный документ в качестве ссылки во всей его полноте для всех целей. Например, условный аллель может содержать: (а) исполнительную последовательность в смысловой ориентации относительно транскрипции гена-мишени; (b) кассету для отбора лекарств (DSC) в смысловой или антисмысловой ориентации; (с) представляющую интерес нуклеотидную последовательность (NSI) в антисмысловой ориентации; и (d) условный модуль инверсии (COIN, который использует экзон-расщепляющий интрон и обратимый ген-ловушка-подобный модуль) в обратной ориентации. См., например, US 2011/0104799. Условный аллель может дополнительно содержать рекомбинируемые единицы, которые рекомбинируют при воздействии первой рекомбиназы с образованием условного аллеля, который (i) не имеет исполнительной последовательности и DSC; и (ii) содержит NSI в смысловой ориентации и COIN в антисмысловой ориентации. См., например, US 2011/0104799.[000258] The nucleic acid insert may also comprise a conditional allele. The conditional allele may be a multifunctional allele as described in US 2011/0104799, incorporated herein by reference in its entirety for all purposes. For example, a conditional allele may comprise: (a) an execution sequence in a sense orientation relative to transcription of the target gene; (b) a drug selection cassette (DSC) in a sense or antisense orientation; (c) a nucleotide sequence of interest (NSI) in an antisense orientation; and (d) a conditional inversion module (COIN, which uses an exon-splitting intron and a reversible gene trap-like module) in the reverse orientation. See, for example, US 2011/0104799. The conditional allele may further comprise recombinant units that recombine upon exposure to the first recombinase to form a conditional allele that (i) lacks an executive sequence and a DSC; and (ii) comprises an NSI in the sense orientation and a COIN in the antisense orientation. See, for example, US 2011/0104799.

[000259] Вставки нуклеиновой кислоты также могут содержать полинуклеотид, кодирующий маркер для селекции. Альтернативно, вставки нуклеиновых кислот могут не иметь полинуклеотида, кодирующего маркер для селекции. Маркер для селекции может содержаться в селекционной кассете. Необязательно, селекционная кассета может быть самоудаляющейся кассетой. См., например, US 8697851 и US 2013/0312129, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. В качестве примера, самоудаляющаяся кассета может содержать ген Crei (содержит два экзона, кодирующих рекомбиназу Cre, которые разделены интроном), функционально связанные с промотором Prm1 мыши, и ген устойчивости к неомицину, функционально связанный с промотором убиквитина человека. Используя промотор Prml, самоудаляющаяся кассета может быть удалена конкретно в мужских половых клетках животных F0. Иллюстративные маркеры для селекции включают неомицин фосфотрансферазу (неоr), гигромицин В-фосфотрансферазу (гигr), пиромицин-N-ацетилтрансферазу (пироr), дезаминазу бластицидина S (bsrr), ксантин/гуанинфосфорибозилтрансферазу (gpt) или тимидинкиназу вируса простого герпеса (HSV-k) или их комбинацию. Полинуклеотид, кодирующий маркер для селекции, может быть функционально связан с промотором, активным в клетке для нацеливания. Примеры промоторов описаны в другом месте данного документа.[000259] Nucleic acid inserts may also comprise a polynucleotide encoding a selectable marker. Alternatively, nucleic acid inserts may not have a polynucleotide encoding a selectable marker. The selectable marker may be contained in a selection cassette. Optionally, the selection cassette may be a self-erasing cassette. See, for example, US 8,697,851 and US 2013/0312129, each of which is incorporated herein by reference in its entirety for all purposes. As an example, a self-erasing cassette may comprise a Crei gene (comprising two exons encoding Cre recombinase that are separated by an intron) operably linked to a mouse Prm1 promoter and a neomycin resistance gene operably linked to a human ubiquitin promoter. Using the Prml promoter, the self-erasing cassette may be deleted specifically in the male germ cells of F0 animals. Exemplary selectable markers include neomycin phosphotransferase (neo r ), hygromycin B phosphotransferase (gig r ), pyromycin N-acetyltransferase (pyro r ), blasticidin S deaminase (bsr r ), xanthine/guanine phosphoribosyltransferase (gpt), or herpes simplex virus thymidine kinase (HSV-k), or a combination thereof. A polynucleotide encoding a selectable marker may be operably linked to a promoter active in the cell to be targeted. Examples of promoters are described elsewhere in this document.

[000260] Вставка нуклеиновой кислоты также может содержать репортерный ген. Иллюстративные репортерные гены включают кодирующие люциферазы, β-галактозидазу, зеленый флуоресцентный белок (GFP), усиленный зеленый флуоресцентный белок (eGFP), голубой флуоресцентный белок (CFP), желтый флуоресцентный белок (YFP), усиленный желтый флуоресцентный белок (eYFP), синий флуоресцентный белок (BFP), усиленный синий флуоресцентный белок (eBFP), DsRed, ZsGreen, MmGFP, mPlum, mCherry, tdTomato, mStrawberry, J-Red, mOrange, mKO, mCitrine, Venus, YPet, Emerald, CyPet, Cerulean, T-Сапфир и щелочную фосфатазу. Такие репортерные гены могут быть функционально связаны с промотором, активным клетке-мишени. Примеры промоторов описаны в другом месте данного документа.[000260] The nucleic acid insert may also comprise a reporter gene. Exemplary reporter genes include those encoding luciferase, β-galactosidase, green fluorescent protein (GFP), enhanced green fluorescent protein (eGFP), cyan fluorescent protein (CFP), yellow fluorescent protein (YFP), enhanced yellow fluorescent protein (eYFP), blue fluorescent protein (BFP), enhanced blue fluorescent protein (eBFP), DsRed, ZsGreen, MmGFP, mPlum, mCherry, tdTomato, mStrawberry, J-Red, mOrange, mKO, mCitrine, Venus, YPet, Emerald, CyPet, Cerulean, T-Sapphire, and alkaline phosphatase. Such reporter genes may be operably linked to a promoter active in the target cell. Examples of promoters are described elsewhere in this document.

[000261] Вставка нуклеиновой кислоты может также содержать одну или более экспрессионных кассет или делеционных кассет. Данная кассета может содержать одну или более представляющих интерес нуклеотидных последовательностей, полинуклеотид, кодирующий маркер для селекции, и репортерный ген, а также различные регуляторные компоненты, которые влияют на экспрессию. Иллюстративные выбираемые маркеры и репортерные гены, которые могут быть включены, подробно обсуждаются в другом месте данного документа.[000261] The nucleic acid insert may also contain one or more expression cassettes or deletion cassettes. The cassette may contain one or more nucleotide sequences of interest, a polynucleotide encoding a selectable marker and a reporter gene, as well as various regulatory components that affect expression. Exemplary selectable markers and reporter genes that may be included are discussed in detail elsewhere herein.

[000262] Вставка нуклеиновой кислоты может содержать нуклеиновую кислоту, фланкированную с помощью сайтов-специфических рекомбинаций последовательностей-мишеней. Альтернативно, вставка нуклеиновой кислоты может содержать одну или более сайт-специфических рекомбинаций последовательностей-мишеней. Хотя вся вставка нуклеиновой кислоты может быть фланкирована такими сайт-специфическими рекомбинациями последовательностей-мишеней, любой участок или отдельный представляющий интерес полинуклеотид внутри вставки нуклеиновой кислоты также могут быть фланкированы такими сайтами. Сайт-специфические рекомбинации последовательностей-мишеней, которые могут фланкировать вставку нуклеиновой кислоты или какой-либо представляющий интерес полинуклеотид во вставке нуклеиновой кислоты, могут включать, например, loxP, lох511, lох2272, lох66, lох71, lохМ2, lох5171, FRT, FRT11, FRT71, attp, att, FRT, rox или их комбинацию. В одном примере сайт-специфические сайты рекомбинации фланкируют полинуклеотид, кодирующий маркер для селекции и/или репортерный ген, содержащийся внутри вставки нуклеиновой кислоты. После интеграции вставки нуклеиновой кислоты в целевой локус можно удалить последовательности между сайтами сайт-специфической рекомбинации. При желании можно использовать две экзогенные матрицы для репарации, каждая из которых содержит вставку нуклеиновой кислоты, содержащую сайт сайт-специфической рекомбинации. Экзогенные матрицы для репарации могут быть нацелены на 5' и 3' участки, фланкирующие представляющую интерес нуклеиновую кислоту. После интегрирования двух вставок нуклеиновой кислоты в геномный локус-мишень, представляющая интерес нуклеиновая кислота между двумя представляющими интерес вставленными сайтами сайт-специфической рекомбинации может быть удалена.[000262] A nucleic acid insert may comprise a nucleic acid flanked by site-specific recombinations of target sequences. Alternatively, a nucleic acid insert may comprise one or more site-specific recombinations of target sequences. Although the entire nucleic acid insert may be flanked by such site-specific recombinations of target sequences, any region or individual polynucleotide of interest within the nucleic acid insert may also be flanked by such sites. Site-specific recombinations of target sequences that may flank the nucleic acid insertion or any polynucleotide of interest within the nucleic acid insertion may include, for example, loxP, lox511, lox2272, lox66, lox71, loxM2, lox5171, FRT, FRT11, FRT71, attp, att, FRT, rox, or a combination thereof. In one example, the site-specific recombination sites flank a polynucleotide encoding a selectable marker and/or a reporter gene contained within the nucleic acid insertion. After integration of the nucleic acid insertion into the target locus, sequences between the site-specific recombination sites can be removed. If desired, two exogenous repair templates can be used, each containing a nucleic acid insertion containing a site-specific recombination site. Exogenous repair templates can be targeted to the 5' and 3' regions flanking the nucleic acid of interest. After integration of the two nucleic acid inserts into the target genomic locus, the nucleic acid of interest between the two inserted sites of interest can be removed by site-specific recombination.

[000263] Вставки нуклеиновой кислоты могут также содержать один или более сайтов рестрикции для рестрикционных эндонуклеаз (т.е. рестрикционных ферментов), которые включают эндонуклеазы типа I, типа II, типа III и типа IV. Рестрикционные эндонуклеазы типа I и типа III распознают специфические сайты узнавания, но обычно расщепляются в различном положении от сайта связывания нуклеазы, который может составлять сотни пар оснований от сайта расщепления (сайт узнавания). В системах типа II рестрикционная активность не зависит от активности любой метилазы, и расщепление обычно происходит на определенных сайтах внутри или рядом с сайтом связывания. Большинство ферментов типа II вырезают палиндромные последовательности, однако ферменты типа IIa узнают не палиндромные сайты узнавания и расщепления за пределами сайта узнавания, ферменты типа IIb вырезают последовательности дважды с обоими сайтами за пределами сайта узнавания, а ферменты типа IIs узнают асимметричный сайт узнавания и расщепляют с одной стороны и на определенном расстоянии около 1-20 нуклеотидов от сайта узнавания. Рестрикционные ферменты типа IV нацелены на метилированную ДНК. Рестрикционные ферменты далее описаны и классифицированы, например, в базе данных REBASE (вебстраница на rebase.neb.com; Roberts et al., (2003) Nucleic Acids Res. 31:418-420; Roberts er al., (2003) Nucleic Acids Res. 31:1805-1812; и Belfort et al. (2002) в Mobile DNA II, pp. 761-783, Eds. Craigie et al., (ASM Press, Вашингтон, округ Колумбия)).[000263] Nucleic acid inserts may also contain one or more restriction sites for restriction endonucleases (i.e., restriction enzymes), which include type I, type II, type III, and type IV endonucleases. Type I and type III restriction endonucleases recognize specific recognition sites, but typically cleave at a different position from the nuclease binding site, which may be hundreds of base pairs from the cleavage site (recognition site). In type II systems, restriction activity is independent of any methylase activity, and cleavage typically occurs at specific sites within or near the binding site. Most type II enzymes cut palindromic sequences, but type IIa enzymes recognize non-palindromic recognition sites and cleave beyond the recognition site, type IIb enzymes cut sequences twice with both sites beyond the recognition site, and type IIs enzymes recognize an asymmetric recognition site and cleave on one side and at a certain distance of about 1-20 nucleotides from the recognition site. Type IV restriction enzymes target methylated DNA. Restriction enzymes are further described and classified, for example, in the REBASE database (web page at rebase.neb.com; Roberts et al., (2003) Nucleic Acids Res. 31:418–420; Roberts et al., (2003) Nucleic Acids Res. 31:1805–1812; and Belfort et al. (2002) in Mobile DNA II, pp. 761–783, Eds. Craigie et al., (ASM Press, Washington, DC)).

(1) Матрицы для репарации для вставки опосредованной негомологичным соединением концов(1) Non-homologous end joining-mediated insertion repair templates

[000264] Некоторые экзогенные матрицы для репарации имеют короткие одноцепочечные участки на 5'-конце и/или 3'-конце, которые комплементарны одному или более «липких» концов, созданных опосредованным Cas-белком расщеплением в геномном локусе-мишени. Эти «липкие» концы также могут упоминаться как 5' и 3' плечи гомологии. Например, некоторые экзогенные матрицы для репарации имеют короткие одноцепочечные участки на 5'-конце и/или 3'-конце, которые комплементарны одному или более «липких» концов, созданных опосредованным Cas-белком расщеплением в 5' и/или 3' последовательности-мишени в геномном локусе-мишени. Некоторые такие экзогенные матрицы для репарации имеют комплементарные участки только на 5'-конце или только на 3'-конце. Например, некоторые такие экзогенные матрицы для репарации имеют комплементарный участок только на 5'-конце, комплементарный «липкому» концу, созданному на 5' последовательности-мишени в геномном локусе-мишени, или только на 3'-конце, комплементарную «липкому» концу, созданному на 3' последовательности-мишени в геномном локусе-мишени. Другие такие экзогенные матрицы для репарации имеют комплементарные участки как на 5', так и на 3' концах. Например, другие подобные экзогенные матрицы для репарации имеют комплементарные участки как на 5', так и на 3' концах, например, комплементарны первому и второму «липким» концам, соответственно, созданными Cas-опосредованным расщеплением в геномном локусе-мишени. Например, если экзогенная матрица для репарации является двухцепочечной, одноцепочечные комплементарные участки могут простираться от 5'-конца верхней цепи матрицы для репарации и 5'-конца нижней цепи матрицы для репарации, создавая 5' «липкие» концы на каждом конце. Альтернативно, одноцепочечный комплементарный участок может простираться от 3'-конца верхней цепи матрицы для репарации и от 3'-конца нижней цепи матрицы, создавая 3' «липкие» концы.[000264] Some exogenous repair templates have short single-stranded regions at the 5' end and/or 3' end that are complementary to one or more "sticky" ends created by Cas protein-mediated cleavage at the target genomic locus. These "sticky" ends may also be referred to as 5' and 3' homology arms. For example, some exogenous repair templates have short single-stranded regions at the 5' end and/or 3' end that are complementary to one or more "sticky" ends created by Cas protein-mediated cleavage at the 5' and/or 3' target sequence at the target genomic locus. Some such exogenous repair templates have complementary regions at only the 5' end or only the 3' end. For example, some such exogenous repair templates have a complementary region only at the 5' end that is complementary to a sticky end created at the 5' target sequence at the target genomic locus, or only at the 3' end that is complementary to a sticky end created at the 3' target sequence at the target genomic locus. Other such exogenous repair templates have complementary regions at both the 5' and 3' ends. For example, other such exogenous repair templates have complementary regions at both the 5' and 3' ends, e.g., complementary to the first and second sticky ends, respectively, created by Cas-mediated cleavage at the target genomic locus. For example, if the exogenous repair template is double-stranded, single-stranded complementary regions may extend from the 5' end of the top strand of the repair template and the 5' end of the bottom strand of the repair template, creating 5' "sticky" ends at each end. Alternatively, single-stranded complementary regions may extend from the 3' end of the top strand of the repair template and from the 3' end of the bottom strand of the template, creating 3' "sticky" ends.

[000265] Комплементарные участки могут иметь любую длину, достаточную для обеспечения лигирования между экзогенной матрицей для репарации и нуклеиновой кислотой-мишенью. Иллюстративные комплементарные участки составляют между около 1 до около 5 нуклеотидов в длину, между около 1 до около 25 нуклеотидов в длину или между около 5 до около 150 нуклеотидов в длину. Например, комплементарный участок может быть по меньшей мере около 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15,16,17,18, 19, 20, 21, 22, 23, 24 или 25 нуклеотидов в длину. Альтернативно, комплементарный участок может быть около 5 до около 10, около 10 до около 20, около 20 до около 30, около 30 до около 40, около 40 до около 50, около 50 до около 60, около 60 до около 70, около 70 до около 80, около 80 до около 90, около 90 до около 100, около 100 до около 110, около 110 до около 120, около 120 до около 130, около 130 до около 140, около 140 до около 150 нуклеотидов в длину, или длиннее.[000265] The complementary regions can be any length sufficient to provide ligation between the exogenous repair template and the target nucleic acid. Exemplary complementary regions are between about 1 to about 5 nucleotides in length, between about 1 to about 25 nucleotides in length, or between about 5 to about 150 nucleotides in length. For example, the complementary region can be at least about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides in length. Alternatively, the complementary region may be about 5 to about 10, about 10 to about 20, about 20 to about 30, about 30 to about 40, about 40 to about 50, about 50 to about 60, about 60 to about 70, about 70 to about 80, about 80 to about 90, about 90 to about 100, about 100 to about 110, about 110 to about 120, about 120 to about 130, about 130 to about 140, about 140 to about 150 nucleotides in length, or longer.

[000266] Такие комплементарные участки могут быть комплементарными «липким» концам, созданным двумя парами никаз. Два двухцепочечных разрыва со ступенчатыми концами могут быть созданы с использованием первой и второй никаз, которые расщепляют противоположные цепи ДНК, чтобы создать первый двухцепочечный разрыв, и третей и четвертой никаз, которые расщепляют противоположные цепи ДНК, чтобы создать второй двухцепочечный разрыв. Например, белок Cas может быть использован для создания одноцепочечного разрыва последовательностей, распознаваемых первой, второй, третьей и четвертой направляющей РНК, соответствующих первой, второй, третьей и четвертой направляющей РНК. Последовательности, распознаваемые первой и второй направляющими РНК, могут быть расположены для создания первого сайта расщепления таким образом, что одноцепочечные разрывы, созданные первой и второй никазами на первой и второй цепях ДНК, создают двухцепочечный разрыв (то есть первый сайт расщепления содержит одноцепочечные разрывы в первой и второй последовательностями, распознаваемыми направляющей РНК). Аналогично, последовательности, распознаваемые третьей и четвертой направляющей РНК, могут быть расположены для создания второго сайта расщепления, так что одноцепочечные разрывы, созданные третьей и четвертой никазами на первой и второй цепях ДНК, создают двухцепочечный разрыв (то есть второй сайт расщепления содержит одноцепочечные разрывы в последовательностях, распознаваемых третьей и четвертой направляющей РНК). Предпочтительно, одноцепочечные разрывы в последовательностях, распознаваемых первой и второй направляющими РНК, и/или последовательностях, распознаваемых третьей и четвертой направляющей РНК, могут быть смещенными одноцепочечными разрывами, которые создают «липкие» концы. Окно смещения может быть, например, по меньшей мере около 5 п.о., 10 п.о., 20 п.о., 30 п.о., 40 п.о., 50 п.о., 60 п.о., 70 п.о., 80 п.о., 90 п.о., 100 п.о. или более. См. Ran et at. (2013) Cell 154:1380-1389; Mali et al. (2013) Nat. Biotech.31:833-838; и Shen et al. (2014) Nat. Methods 11:399-404, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. В таких случаях двухцепочечная экзогенная матрица для репарации может быть сконструирована с одноцепочечными комплементарными участками, которые комплементарны «липким» концам, созданным одноцепочечными разрывами в последовательностях, распознаваемых первой и второй направляющими РНК, и одноцепочечными разрывами в последовательностях, распознаваемых третьей и четвертой направляющей РНК. Такая экзогенная матрица для репарации затем может быть вставлена путем лигирования, опосредованного негомологичным соединением концов.[000266] Such complementary regions may be complementary to the "sticky" ends created by two pairs of nickases. Two double-stranded breaks with staggered ends may be created using the first and second nickases, which cleave opposite strands of DNA to create the first double-stranded break, and the third and fourth nickases, which cleave opposite strands of DNA to create the second double-stranded break. For example, the Cas protein may be used to create a single-stranded break of the sequences recognized by the first, second, third, and fourth guide RNAs, corresponding to the first, second, third, and fourth guide RNAs. The sequences recognized by the first and second guide RNAs may be arranged to create the first cleavage site such that the single-strand breaks created by the first and second nicks on the first and second DNA strands create a double-strand break (i.e., the first cleavage site contains single-strand breaks in the first and second sequences recognized by the guide RNA). Similarly, the sequences recognized by the third and fourth guide RNAs may be arranged to create the second cleavage site such that the single-strand breaks created by the third and fourth nicks on the first and second DNA strands create a double-strand break (i.e., the second cleavage site contains single-strand breaks in the sequences recognized by the third and fourth guide RNAs). Preferably, the single-strand breaks in the sequences recognized by the first and second guide RNAs and/or the sequences recognized by the third and fourth guide RNAs can be biased single-strand breaks that create sticky ends. The bias window can be, for example, at least about 5 bp, 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 60 bp, 70 bp, 80 bp, 90 bp, 100 bp or more. See Ran et al. (2013) Cell 154:1380–1389; Mali et al. (2013) Nat. Biotech. 31:833–838; and Shen et al. (2014) Nat. Methods 11:399-404, each of which is incorporated herein by reference in its entirety for all purposes. In such cases, a double-stranded exogenous repair template can be constructed with single-stranded complementary regions that are complementary to the sticky ends created by single-stranded nicks in the sequences recognized by the first and second guide RNAs and single-stranded nicks in the sequences recognized by the third and fourth guide RNAs. Such an exogenous repair template can then be inserted by non-homologous end joining-mediated ligation.

(2) Матрицы для репарации для вставки с помощью репарации, направляемой гомологией(2) Repair templates for insertion using homology-directed repair

[000267] Некоторые экзогенные матрицы для репарации содержат плечи гомологии. Если экзогенная матрица для репарации также содержит вставку нуклеиновой кислоты, плечи гомологии могут фланкировать вставку нуклеиновой кислоты. Для простоты ссылок, плечи гомологии упоминаются в данном документе как 5' и 3' (то есть вверх по ходу и вниз по ходу транскрипции) плечи гомологии. Эта терминология относится к относительному положению плечей гомологии к вставке нуклеиновой кислоты в экзогенной матрице для репарации. 5'- и 3'-плечи гомологии соответствуют участкам в пределах геномного локуса-мишени, которые в данном документе называются «5' последовательностью-мишенью» и «3' последовательностью-мишенью» соответственно.[000267] Some exogenous repair templates contain homology arms. If the exogenous repair template also contains a nucleic acid insert, the homology arms may flank the nucleic acid insert. For ease of reference, the homology arms are referred to herein as the 5' and 3' (i.e., upstream and downstream) homology arms. This terminology refers to the relative position of the homology arms to the nucleic acid insert in the exogenous repair template. The 5' and 3' homology arms correspond to regions within the target genomic locus, which are referred to herein as the "5' target sequence" and the "3' target sequence," respectively.

[000268] Плечо гомологии последовательность-мишень «отвечают» или «соответствуют» друг другу, когда два участка разделяют достаточный уровень идентичности последовательности друг с другом, чтобы действовать как субстраты для реакции гомологичной рекомбинации. Термин «гомология» включает в себя последовательности ДНК, которые либо идентичны, либо разделяют идентичность последовательности с соответствующей последовательностью. Идентичность последовательности между данной последовательностью-мишенью и соответствующим плечом гомологии, найденным в экзогенной матрице для репарации, может быть любой степенью идентичности последовательности, которая допускается для происхождения гомологичной рекомбинации. Например, степень идентичности последовательности, разделенной плечом гомологии экзогенной матрицы для репарации (или ее фрагмента), и последовательности-мишени (или ее фрагмента), может быть по меньшей мере 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% идентичности последовательности, так что последовательности подвергаются гомологичной рекомбинации. Более того, соответствующий участок гомологии между плечом гомологии и соответствующей последовательностью-мишенью может быть любой длины, достаточной для обеспечения гомологичной рекомбинации. Иллюстративные плечи гомологии составляют между около 25 нуклеотидов до около 2,5 т.п.о. в длину, составляет между около 25 нуклеотидов до около 1,5 т.п.о. в длину, или составляет между около 25 до около 500 нуклеотидов в длину. Например, данное плечо гомологии (или каждое из гомологических плечей) и/или соответствующая последовательность-мишень может содержать соответствующие участки гомологии, которые составляют между около 25 до около 30, около 30 до около 40, около 40 до около 50, около 50 до около 60, около 60 до около 70, около 70 до около 80, около 80 до около 90, около 90 до около 100, около 100 до около 150, около 150 до около 200, около 200 до около 250, около 250 до около 300, около 300 до около 350, около 350 до около 400, около 400 до около 450 или около 450 до около 500 нуклеотидов, так что плечи гомологии имеют достаточную гомологию для проведения гомологичной рекомбинации с соответствующими последовательностями-мишенями в нуклеиновой кислот-мишени. Альтернативно, данное плечо гомологии (или каждое плечо гомологии) и/или соответствующая последовательность-мишень могут содержать соответствующие участки гомологии, которые находятся между около 0,5 т.п.о. до около 1 т.п.о., около 1 т.п.о. до около 1,5 т.п.о., около 1,5 т.п.о. до около 2 т.п.о., или около от 2 т.п.о. до около 2,5 т.п.о. в длину. Например, плечо гомологии каждое может содержать около 750 нуклеотидов в длину. Плечо гомологии могут быть симметричными (каждое около одинакового размера в длину), или они могут быть асимметричными (одно длиннее другого).[000268] A homology arm of a target sequence "matches" or "corresponds" to each other when two regions share a sufficient level of sequence identity with each other to act as substrates for a homologous recombination reaction. The term "homology" includes DNA sequences that are either identical to or share a sequence identity with the corresponding sequence. The sequence identity between a given target sequence and the corresponding homology arm found in the exogenous repair template may be any degree of sequence identity that is allowed for homologous recombination to occur. For example, the degree of sequence identity separated by the homology arm of the exogenous repair template (or a fragment thereof) and the target sequence (or a fragment thereof) may be at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or 100% sequence identity, such that the sequences undergo homologous recombination. Moreover, the corresponding region of homology between the homology arm and the corresponding target sequence may be of any length sufficient to ensure homologous recombination. Illustrative homology arms are between about 25 nucleotides to about 2.5 kb in length, are between about 25 nucleotides to about 1.5 kb in length, or are between about 25 to about 500 nucleotides in length. For example, a given homology arm (or each of the homology arms) and/or the corresponding target sequence may comprise respective regions of homology that are between about 25 to about 30, about 30 to about 40, about 40 to about 50, about 50 to about 60, about 60 to about 70, about 70 to about 80, about 80 to about 90, about 90 to about 100, about 100 to about 150, about 150 to about 200, about 200 to about 250, about 250 to about 300, about 300 to about 350, about 350 to about 400, about 400 to about 450, or about 450 to about 500 nucleotides in length, such that the homology arms have sufficient homology to conduct homologous recombination with corresponding target sequences in a target nucleic acid. Alternatively, a given homology arm (or each homology arm) and/or the corresponding target sequence may contain corresponding regions of homology that are between about 0.5 kb to about 1 kb, about 1 kb to about 1.5 kb, about 1.5 kb to about 2 kb, or about 2 kb to about 2.5 kb in length. For example, the homology arms may each be about 750 nucleotides in length. The homology arms may be symmetrical (each about the same size in length), or they may be asymmetrical (one longer than the other).

[000269] Плечи гомологии могут соответствовать локусу, который является родным для клетки (например, целевой локус). Альтернативно, например, они могут соответствовать участку гетерологичного или экзогенного сегмента ДНК, которая была интегрирована в геном клетки, включая, например, трансгены, экспрессионные кассеты или гетерологичные или экзогенные участки ДНК. Альтернативно, плечи гомологии вектора нацеливания могут соответствовать участку искусственной хромосомы дрожжей (YAC), бактериальной искусственной хромосомы (ВАС), человеческой искусственной хромосомы или любого другого сконструированного участка, содержащегося в соответствующей клетке-хозяине. Кроме того, плечи гомологии вектора нацеливания могут соответствовать или быть получены из участка библиотеки ВАС, библиотеки космиды или библиотеки фагов Р1 или могут быть получены из синтетической ДНК.[000269] The homology arms may correspond to a locus that is native to the cell (e.g., a target locus). Alternatively, for example, they may correspond to a region of a heterologous or exogenous segment of DNA that has been integrated into the genome of the cell, including, for example, transgenes, expression cassettes, or heterologous or exogenous regions of DNA. Alternatively, the homology arms of the targeting vector may correspond to a region of a yeast artificial chromosome (YAC), a bacterial artificial chromosome (BAC), a human artificial chromosome, or any other engineered region contained in the appropriate host cell. In addition, the homology arms of the targeting vector may correspond to or be derived from a region of a BAC library, a cosmid library, or a P1 phage library, or may be derived from synthetic DNA.

[000270] Когда система CRISPR/Cas используется в комбинации с экзогенной матрицей для репарации, 5'- и 3'-последовательности-мишени предпочтительно расположены в достаточной близости от сайта расщепления Cas (например, в пределах достаточной близости к последовательности, распознаваемой направляющей РНК), так что для содействия возникновению события гомологичной рекомбинации между последовательностями-мишенями и плечами гомологии при одноцепочечном разрыве (ник) или двухцепочечном разрыве на сайте расщепления Cas. Термин «сайт расщепления Cas» включает в себя последовательность ДНК, при котором одноцепочечный разрыв или двухцепочечный разрыв создают ферментом Cas (например, белок Cas9, комплекс образованный с направляющей РНК). Последовательности-мишени в целевом локусе, которые соответствуют 5'- и 3'-плечам гомологии экзогенной матрицы для репарации, «расположены в достаточной близости» к сайту расщепления Cas, если расстояние такое, чтобы способствовать возникновению события гомологичной рекомбинации между 5'- и 3'-последовательностями-мишенями и плечами гомологии при одноцепочечном разрыве или двухцепочечном разрыве на сайте расщепления Cas. Таким образом, последовательности-мишени, соответствующие 5'- и/или 3'-плечам гомологии экзогенной матрицы для репарации, могут быть, например, в пределах по меньшей мере 1 нуклеотида данного сайта расщепления Cas или в пределах по меньшей мере 10 нуклеотидов до около 1000 нуклеотидов данного сайта расщепления Cas. В качестве примера сайт расщепления Cas может быть непосредственно смежным с по меньшей мере одной или обеими последовательностями-мишенями.[000270] When the CRISPR/Cas system is used in combination with an exogenous repair template, the 5' and 3' target sequences are preferably located in sufficient proximity to a Cas cleavage site (e.g., within sufficient proximity to a sequence recognized by a guide RNA) so as to facilitate the occurrence of a homologous recombination event between the target sequences and the homology arms at a single-strand break (nick) or double-strand break at the Cas cleavage site. The term "Cas cleavage site" includes a DNA sequence at which a single-strand break or double-strand break is created by a Cas enzyme (e.g., a Cas9 protein complexed with a guide RNA). Target sequences at a target locus that correspond to the 5' and 3' homology arms of an exogenous repair template are "located in sufficient proximity" to a Cas cleavage site if the distance is such as to facilitate a homologous recombination event between the 5' and 3' target sequences and the homology arms at a single-strand break or a double-strand break at the Cas cleavage site. Thus, target sequences corresponding to the 5' and/or 3' homology arms of an exogenous repair template may be, for example, within at least 1 nucleotide of a given Cas cleavage site or within at least 10 nucleotides to about 1000 nucleotides of a given Cas cleavage site. As an example, a Cas cleavage site may be immediately adjacent to at least one or both target sequences.

[000271] Альтернативно, данный сайт расщепления может быть разной длины от 5'-последовательности-мишени, 3'-последовательности-мишени или обеих последовательностей-мишеней. Например, если используются две направляющие РНК, последовательности, распознаваемые первой и/или второй направляющей РНК, или первый и/или второй сайты расщепления могут быть расположены между 5' и 3' последовательностей-мишеней или могут быть смежными с или близкими к 5'-последовательности-мишени и/или 3'-последовательности-мишени, например, в пределах 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6 т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о., 10 т.п.о., 20 т.п.о., 30 т.п.о., 40 т.п.о., 50 т.п.о., 60 т.п.о., 70 т.п.о., 80 т.п.о., 90 т.п.о., 100 т.п.о., 110 т.п.о., 120 т.п.о., 130 т.п.о., 140 т.п.о., 150 т.п.о., 160 т.п.о., 170 т.п.о., 180 т.п.о., 190 т.п.о., 200 т.п.о., 250 т.п.о., 300 т.п.о., 350 т.п.о., 400 т.п.о., 450 т.п.о. или 500 т.п.о. 5'- и/или 3''-последовательностей-мишеней. Альтернативно, последовательности, распознаваемые первой и/или второй направляющей РНК, или первый и/или второй сайты расщепления могут быть расположены по меньшей мере 50 п.о., по меньшей мере 100 п.о., по меньшей мере 200 п.о., по меньшей мере 300 п.о., по меньшей мере 400 п.о., по меньшей мере 500 п.о., по меньшей мере, 600 п.о., по меньшей мере 700 п.о., по меньшей мере 800 п.о., по меньшей мере 900 п.о., по меньшей мере 1 т.п.о., по меньшей мере 2 т.п.о., по меньшей мере 3 т.п.о., по меньшей мере 4 т.п.о., по меньшей мере 5 т.п.о., по меньшей мере 6 т.п.о., по меньшей мере 7 т.п.о., по меньшей мере 8 т.п.о., по меньшей мере 9 т.п.о., по меньшей мере 10 т.п.о., по меньшей мере 20 т.п.о., по меньшей мере 30 т.п.о., по меньшей мере 40 т.п.о., по меньшей мере 50 т.п.о., по меньшей мере 60 т.п.о., по меньшей мере 70 т.п.о., по меньшей мере 80 т.п.о., по меньшей мере 90 т.п.о., по меньшей мере 100 т.п.о., по меньшей мере 110 т.п.о., по меньшей мере 120 т.п.о., по меньшей мере 130 т.п.о., по меньшей мере 140 т.п.о., по меньшей мере 150 т.п.о., по меньшей мере 160 т.п.о., по меньшей мере 170 т.п.о., по меньшей мере 180 т.п.о., по меньшей мере 190 т.п.о., по меньшей мере 200 т.п.о., по меньшей мере 250 т.п.о., по меньшей мере 300 т.п.о., по меньшей мере 350 т.п.о., по меньшей мере 400 т.п.о., по меньшей мере 450 т.п.о. или по меньшей мере 500 т.п.о. от 5' и/или 3'-последовательностей-мишеней. Например, последовательность, распознаваемая первой и/или второй направляющей РНК, или первый и/или второй сайты расщепления могут быть расположены между около 50 п.о. до около 100 п.о., около 200 п.о. до около 300 п.о., около 300 п.о. до около 400 п.о., около 400 п.о. до около 500 п.о., около 500 п.о. до около 600 п.о., около 600 п.о. до около 700 п.о., около 700 п.о. до около 800 п.о., около 800 п.о. до около 900 п.о., около 900 п.о. до около 1 т.п.о., около 1 т.п.о. до около 2 т.п.о., около 2 т.п.о. до около 3 т.п.о., около 3 т.п.о. до около 4 т.п.о., около 4 т.п.о. до около 5 т.п.о., около 5 т.п.о. до около 10 т.п.о., около 10 т.п.о. до около 20 т.п.о., около 20 т.п.о. до около 30 т.п.о., около 30 т.п.о. до около 40 т.п.о., около 40 т.п.о. до около 50 т.п.о., около 50 т.п.о. до около 100 т.п.о., около 100 т.п.о. до около 150 т.п.о., около 150 т.п.о. до около 200 т.п.о., около 200 т.п.о. до около 300 т.п.о., около 300 т.п.о. до около 400 т.п.о., или около от 400 т.п.о. до около 500 т.п.о. от 5'- и/или 3'-последовательностей-мишеней. Альтернативно, последовательности, распознаваемые первой и/или второй направляющей РНК, или первый и/или второй сайты расщепления могут быть расположены более чем 50 п.о., более чем 100 п.о., более чем 200 п.о., более чем 300 п.о., более чем 400 п.о., более чем 500 п.о., более чем 600 п.о., более чем 700 п.о., более чем 800 п.о., более чем 900 п.о., более чем 1 т.п.о., более чем 2 т.п.о., более чем 3 т.п.о., более чем 4 т.п.о., более чем 5 т.п.о., более чем 6 т.п.о., более чем 7 т.п.о., более чем 8 т.п.о., более чем 9 т.п.о., более чем 10 т.п.о., более чем 20 т.п.о., более чем 30 т.п.о., более чем 40 т.п.о., более чем 50 т.п.о., более чем 60 т.п.о., больше чем 70 т.п.о., более чем 80 т.п.о., более чем 90 т.п.о. или более чем 100 т.п.о. от 5'-и/или 3'-последовательностей-мишеней. Например, последовательность, распознаваемая первой направляющей РНК, или первый сайт расщепления могут быть расположены более чем 50 п.о., более чем 100 п.о., более чем 200 п.о., более чем 300 п.о., более чем 400 п.о., более чем 500 п.о., более чем 600 п.о., более чем 700 п.о., более чем 800 п.о., более чем 900 п.о., более чем 1 т.п.о., более чем 2 т.п.о., более чем 3 т.п.о., более чем 4 т.п.о., более чем 5 т.п.о., более чем 6 т.п.о., более чем 7 т.п.о., более чем 8 т.п.о., более чем 9 т.п.о., более чем 10 т.п.о., более чем 20 т.п.о., более чем 30 т.п.о., более чем 40 т.п.о., более чем 50 т.п.о., более чем 60 т.п.о., больше чем 70 т.п.о., более чем 80 т.п.о., более чем 90 т.п.о. или более чем 100 т.п.о. от 5'-последовательности-мишени или от обеих 5'- и 3'-последовательностей-мишеней. Аналогично, последовательность, распознаваемая второй направляющей РНК, или второй сайт расщепления могут быть расположены более чем 50 п.о., более чем 100 п.о., более чем 200 п.о., более чем 300 п.о., более чем 400 п.о., более чем 500 п.о., более чем 600 п.о., более чем 700 п.о., более чем 800 п.о., более чем 900 п.о., более чем 1 т.п.о., более чем 2 т.п.о., более чем 3 т.п.о., более чем 4 т.п.о., более чем 5 т.п.о., более чем 6 т.п.о., более чем 7 т.п.о., более чем 8 т.п.о., более чем 9 т.п.о., более чем 10 т.п.о., более чем 20 т.п.о., более чем 30 т.п.о., более чем 40 т.п.о., более чем 50 т.п.о., более чем 60 т.п.о., больше чем 70 т.п.о., более чем 80 т.п.о., более чем 90 т.п.о. или более чем 100 т.п.о. от 3'-последовательности-мишени или от обеих 5'- и 3'-последовательностей-мишеней.[000271] Alternatively, the cleavage site may be of varying length from the 5' target sequence, the 3' target sequence, or both target sequences. For example, if two guide RNAs are used, the sequences recognized by the first and/or second guide RNA or the first and/or second cleavage sites may be located between the 5' and 3' target sequences or may be adjacent to or close to the 5' target sequence and/or the 3' target sequence, such as within 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 60 kb, 70 kb, 80 kb, 90 kb, 100 kb, 110 kb, 120 kb, 130 kb, 140 kb, 150 kb, 160 kb, 170 kb, 180 kb, 190 kb, 200 kb, 250 kb, 300 kb, 350 kb, 400 kb, 450 kb or 500 kb 5' and/or 3'' target sequences. Alternatively, the sequences recognized by the first and/or second guide RNA or the first and/or second cleavage sites may be located at least 50 bp, at least 100 bp, at least 200 bp, at least 300 bp, at least 400 bp, at least 500 bp, at least 600 bp, at least 700 bp, at least 800 bp, at least 900 bp, at least 1 kb, at least 2 kb, at least 3 kb, at least 4 kb, at least 5 kb, at least 6 kb, at least 7 kb, at least 8 kb, at least 9 kb, at least 10 kb, at least 20 kb, at least 30 kb, at least 40 kb, at least 50 kb, at least 60 kb, at least 70 kb, at least 80 kb, at least 90 kb, at least 100 kb, at least 110 kb, at least 120 kb, at least 130 kb, at least 140 kb, at least 150 kb, at least 160 kb, at least 170 kb, at least 180 kb, at least 190 kb, at least 200 kb, at least 250 kb, at least 300 kb, at least 350 kb, at least 400 kb, at least 450 kb, or at least 500 kb from the 5' and/or 3' target sequences. For example, the sequence recognized by the first and/or second guide RNA or the first and/or second cleavage sites can be located between about 50 bp to about 100 bp, about 200 bp to about 300 bp, about 300 bp to about 500 bp, to about 400 bp, about 400 bp to about 500 bp, about 500 bp to about 600 bp, about 600 bp to about 700 bp, about 700 bp to about 800 bp, about 800 bp to about 900 bp, about 900 bp to about 1 kb, about 1 kb to about 2 kb, about 2 kb to about 3 kb, about 3 kb to about 4 kb, about 4 kb to about 5 kb, about 5 kb to about 10 kb, about 10 kb to about 20 kb, about 20 kb to about 30 kb, about 30 kb to about 40 kb, about 40 kb to about 50 kb, about 50 kb to about 100 kb, about 100 kb to about 150 kb, about 150 kb to about 200 kb, about 200 kb to about 300 kb, about 300 kb to about 400 kb, or about 400 kb to about 500 kb from the 5' and/or 3' target sequences. Alternatively, the sequences recognized by the first and/or second guide RNA or the first and/or second cleavage sites may be located more than 50 bp, more than 100 bp, more than 200 bp, more than 300 bp, more than 400 bp, more than 500 bp, more than 600 bp, more than 700 bp, more than 800 bp, more than 900 bp, more than 1 kb, more than 2 kb, more than 3 kb, more than 4 kb, more than 5 kb, more than 6 kb, more than 7 kb, more than 8 kb, more than 9 kb, more than 10 kb, more than 20 kb, more than 30 kb, more than 40 kb, more than 50 kb, more than 60 kb, more than 70 kb, more than 80 kb, more than 90 kb or more than 100 kb from the 5' and/or 3' target sequences. For example, the sequence recognized by the first guide RNA or the first cleavage site may be located more than 50 bp, more than 100 bp, more than 200 bp, more than 300 bp, more than 400 bp, more than 500 bp, more than 600 bp, more than 700 bp, more than 800 bp, more than 900 bp, more than 1 kb, more than 2 kb, more than 3 kb, more than 4 kb, more than 5 kb, more than 6 kb, more than 7 kb, more than 8 kb, more than 9 kb, more than 10 kb, more than 20 kb, more than 30 kb, more than 40 kb, more than 50 kb, more than 60 kb, more than 70 kb, more than 80 kb, more than 90 kb, or more than 100 kb from the 5' target sequence or from both 5' and 3' target sequences. Similarly, the sequence recognized by the second guide RNA or the second cleavage site may be located more than 50 bp, more than 100 bp, more than 200 bp, more than 300 bp, more than 400 bp, more than 500 bp, more than 600 bp, more than 700 bp, more than 800 bp, more than 900 bp, more than 1 kb, more than 2 kb, more than 3 kb, more than 4 kb, more than 5 kb, more than 6 kb, more than 7 kb, more than 8 kb, more than 9 kb, more than 10 kb, more than 20 kb, more than 30 kb, more than 40 kb, more than 50 kb, more than 60 kb, more than 70 kb, more than 80 kb, more than 90 kb, or more than 100 kb from the 3' target sequence or from both 5' and 3' target sequences.

[000272] Пространственная взаимосвязь последовательностей-мишеней, которые соответствуют плечам гомологии экзогенной матрицы для репарации и сайта расщепления Cas, может изменяться. Например, последовательности-мишени могут быть расположены 5' по отношению к сайту расщепления Cas, последовательности-мишени могут быть расположены 3' по отношению к сайту расщепления Cas, или последовательности-мишени могут фланкировать сайт расщепления Cas.[000272] The spatial relationship of the target sequences that correspond to the homology arms of the exogenous repair template and the Cas cleavage site may vary. For example, the target sequences may be located 5' to the Cas cleavage site, the target sequences may be located 3' to the Cas cleavage site, or the target sequences may flank the Cas cleavage site.

[000273] В клетках, отличных от эмбрионов на одноклеточной стадии, экзогенная матрица для репарации может быть «большим направленным вектором» или «LTVEC», который включает в себя векторы нацеливания, которые содержат плечи гомологии, которые соответствуют и получены из последовательностей нуклеиновых кислот, превышающих те, которые обычно используются другими подходами, предназначенными для выполнения гомологичной рекомбинации в клетках. LTVEC также включают направленные векторы, содержащие вставки нуклеиновых кислот, имеющие последовательности нуклеиновых кислот, более крупные, чем те, которые обычно используются другими подходами, предназначенными для выполнения гомологичной рекомбинации в клетках. Например, LTVEC делает возможной модификацию больших локусов, которая не может быть обеспечена традиционными нацеливающими векторами на основе плазмид из-за их ограничений по размеру. Например, целевой локус может быть (т.е. 5' и 3' плечи гомологии могут соответствовать) локусом клетки, который не может стать целью с использованием обычного способа или который может стать целью только неправильно или только со значительно низкой эффективностью в отсутствие одноцепочечного разрыва или двухцепочечного разрыва, вызванного нуклеазным агентом (например, белком Cas).[000273] In cells other than one-cell stage embryos, the exogenous repair template may be a "large targeting vector" or "LTVEC", which includes targeting vectors that contain homology arms that correspond to and are derived from nucleic acid sequences larger than those typically used by other approaches designed to perform homologous recombination in cells. LTVECs also include targeting vectors that contain nucleic acid inserts that have nucleic acid sequences larger than those typically used by other approaches designed to perform homologous recombination in cells. For example, LTVECs enable modification of large loci that cannot be achieved by traditional plasmid-based targeting vectors due to their size limitations. For example, the target locus may be (i.e., the 5' and 3' homology arms may match) a locus in a cell that cannot be targeted using a conventional method or that can only be targeted incorrectly or only with significantly low efficiency in the absence of a single-strand break or a double-strand break caused by a nuclease agent (e.g., a Cas protein).

[000274] Примеры LTVEC включают векторы, полученные из бактериальной искусственной хромосомы (ВАС), человеческой искусственной хромосомы или искусственной хромосомы дрожжей (YAC). Неограничивающие примеры LTVEC и способы их изготовления описаны, например, в патентах США №6586251; 6596541; и 7105348; и в WO 2002/036789, каждый из которых включен в настоящее описание посредством ссылок во всей их полноте для всех целей. LTVEC могут быть линейными или круговой формы.[000274] Examples of LTVECs include vectors derived from a bacterial artificial chromosome (BAC), a human artificial chromosome, or a yeast artificial chromosome (YAC). Non-limiting examples of LTVECs and methods for making them are described, for example, in U.S. Patent Nos. 6,586,251; 6,596,541; and 7,105,348; and WO 2002/036789, each of which is incorporated herein by reference in its entirety for all purposes. LTVECs may be linear or circular in shape.

[000275] LTVEC могут иметь любую длину и, как правило, не менее 10 т.п.о. в длину. Например, LTVEC может составлять от около 50 т.п.о. до около 300 т.п.о., от около 50 т.п.о. до около 75 т.п.о., от около 75 т.п.о. до около 100 т.п.о., от около 100 т.п.о. до 125 т.п.о., от около 125 т.п.о. до около 150 т.п.о., от около 150 т.п.о. до около 175 т.п.о., от около 175 т.п.о. до около 200 т.п.о., от около 200 т.п.о. до около 225 т.п.о., от около 225 т.п.о. до около 250 т.п.о., от около 250 т.п.о. до около 275 т.п.о., или от около 275 т.п.о. до около 300 т.п.о. LTVEC может также составлять от около 50 т.п.о. до около 500 т.п.о., от около 100 т.п.о. до около 125 т.п.о., от около 300 т.п.о. до около 325 т.п.о., от около 325 т.п.о. до 350 т.п.о., от около 350 т.п.о. до около 375 т.п.о., от около 375 т.п.о. до около 400 т.п.о., от около 400 т.п.о. до около 425 т.п.о., от около 425 т.п.о. до около 450 т.п.о., от около 450 т.п.о. до около 475 т.п.о., или от около 475 т.п.о. до около 500 т.п.о. Альтернативно, LTVEC может составлять по меньшей мере 10 т.п.о., по меньшей мере 15 т.п.о., по меньшей мере 20 т.п.о., по меньшей мере 30 т.п.о., по меньшей мере 40 т.п.о., по меньшей мере 50 т.п.о., по меньшей мере 60 т.п.о., по меньшей мере 70 т.п.о., по меньшей мере 80 т.п.о., по меньшей мере 90 т.п.о., по меньшей мере 100 т.п.о., по меньшей мере, 150 т.п.о., по меньшей мере 200 т.п.о., по меньшей мере 250 т.п.о., по меньшей мере 300 т.п.о., по меньшей мере 350 т.п.о., по меньшей мере 400 т.п.о., по меньшей мере 450 т.п.о. или по меньшей мере 500 т.п.о. или более. Размер LTVEC может быть слишком большим, чтобы обеспечить скрининг событий нацеливания с помощью обычных анализов, например, вестерн-блоттинга и ПЦР на большие расстояния (например, от 1 т.п.о. до 5 т.п.о.)[000275] LTVECs may be of any length and are typically at least 10 kb in length. For example, an LTVEC may be from about 50 kb to about 300 kb, from about 50 kb to about 75 kb, from about 75 kb to about 100 kb, from about 100 kb to 125 kb, from about 125 kb to about 150 kb, from about 150 kb to about 175 kb, from about 175 kb to about 200 kb, from about 200 kb. to about 225 kb, from about 225 kb to about 250 kb, from about 250 kb to about 275 kb, or from about 275 kb to about 300 kb. The LTVEC may also be from about 50 kb to about 500 kb, from about 100 kb to about 125 kb, from about 300 kb to about 325 kb, from about 325 kb to 350 kb, from about 350 kb to about 375 kb, from about 375 kb to about 400 kbp, from about 400 kbp to about 425 kbp, from about 425 kbp to about 450 kbp, from about 450 kbp to about 475 kbp, or from about 475 kbp to about 500 kbp. Alternatively, the LTVEC may be at least 10 kb, at least 15 kb, at least 20 kb, at least 30 kb, at least 40 kb, at least 50 kb, at least 60 kb, at least 70 kb, at least 80 kb, at least 90 kb, at least 100 kb, at least 150 kb, at least 200 kb, at least 250 kb, at least 300 kb, at least 350 kb, at least 400 kb, at least 450 kb or at least 500 kb or more. The size of LTVEC may be too large to allow screening of targeting events using conventional assays such as Western blotting and long-range PCR (e.g. 1 kb to 5 kb)

[000276] Общая сумма плеча 5'-гомологии и плеча 3'-гомологии в LTVEC обычно составляет не менее 10 т.п.о. В качестве примера, 5'-плечо гомологии может находиться в диапазоне от около 5 т.п.о. до около 100 т.п.о., и/или 3'-плечо гомологии может находиться в диапазоне от около 5 т.п.о. до около 100 т.п.о. В качестве другого примера, 5'-плечо гомологии может находиться в диапазоне от около 5 т.п.о. до около 150 т.п.о., и/или 3'-плечо гомологии может находиться в диапазоне от около 5 т.п.о. до около 150 т.п.о. Каждое плечо гомологии может составлять, например, от около 5 т.п.о. до около 10 т.п.о., от около 10 т.п.о. до около 20 т.п.о., от около 20 т.п.о. до около 30 т.п.о., от около 30 т.п.о. до около 40 т.п.о., от около 40 т.п.о. до около 50 т.п.о., от около 50 т.п.о. до около 60 т.п.о., от около 60 т.п.о. до около 70 т.п.о., от около 70 т.п.о. до около 80 т.п.о., от около 80 т.п.о. до около 90 т.п.о., от около 90 т.п.о. до около 100 т.п.о., от около 100 т.п.о. до около 110 т.п.о., от около 110 т.п.о. до около 120 т.п.о., от около 120 т.п.о. до около 130 т.п.о., от около 130 т.п.о. до около 140 т.п.о., от около 140 т.п.о. до около 150 т.п.о., от около 150 т.п.о. до около 160 т.п.о., от около 160 т.п.о. до около 170 т.п.о., от около 170 т.п.о. до около 180 т.п.о., от около 180 т.п.о. до около 190 т.п.о., или от около 190 т.п.о. до около 200 т.п.о. Общая сумма 5'- и 3'-плечей гомологии может составлять, например, от около 10 т.п.о. до около 20 т.п.о., от около 20 т.п.о. до около 30 т.п.о., от около 30 т.п.о. до около 40 т.п.о., от около 40 т.п.о. до около 50 т.п.о., от около 50 т.п.о. до около 60 т.п.о., от около 60 т.п.о. до около 70 т.п.о., от около 70 т.п.о. до около 80 т.п.о., от около 80 т.п.о. до около 90 т.п.о., от около 90 т.п.о. до около 100 т.п.о., от около 100 т.п.о. до около 110 т.п.о., от около 110 т.п.о. до около 120 т.п.о., от около 120 т.п.о. до около 130 т.п.о., от около 130 т.п.о. до около 140 т.п.о., от около 140 т.п.о. до около 150 т.п.о., от около 150 т.п.о. до около 160 т.п.о., от около 160 т.п.о. до около 170 т.п.о., от около 170 т.п.о. до около 180 т.п.о., от около 180 т.п.о. до около 190 т.п.о., или от около 190 т.п.о. до около 200 т.п.о. Общая сумма 5'- и 3'-плечей гомологии может также составлять, например, от около 200 т.п.о. до около 250 т.п.о., от около 250 т.п.о. до около 300 т.п.о., от около 300 т.п.о. до около 350 т.п.о., или от около 350 т.п.о. до около 400 т.п.о. Альтернативно, каждое плечо гомологии может составлять по меньшей мере 5 т.п.о., по меньшей мере 10 т.п.о., по меньшей мере 15 т.п.о., по меньшей мере 20 т.п.о., по меньшей мере 30 т.п.о., по меньшей мере 40 т.п.о., по меньшей мере 50 т.п.о., по меньшей мере 60 т.п.о., по меньшей мере 70 т.п.о., по меньшей мере 80 т.п.о., по меньшей мере 90 т.п.о., по меньшей мере, 100 т.п.о., по меньшей мере 110 т.п.о., по меньшей мере 120 т.п.о., по меньшей мере 130 т.п.о., по меньшей мере 140 т.п.о., по меньшей мере 150 т.п.о., по меньшей мере 160 т.п.о., по меньшей мере 170 т.п.о., по меньшей мере 180 т.п.о., по меньшей мере 190 т.п.о., или по меньшей мере 200 т.п.о. Альтернативно, общая сумма 5'- и 3'-плечей гомологии может составлять по меньшей мере 10 т.п.о., по меньшей мере 15 т.п.о., по меньшей мере 20 т.п.о., по меньшей мере 30 т.п.о., по меньшей мере 40 т.п.о., по меньшей мере 50 т.п.о., по меньшей мере 60 т.п.о., по меньшей мере 70 т.п.о., по меньшей мере 80 т.п.о., по меньшей мере 90 т.п.о., по меньшей мере, 100 т.п.о., по меньшей мере 110 т.п.о., по меньшей мере 120 т.п.о., по меньшей мере 130 т.п.о., по меньшей мере 140 т.п.о., по меньшей мере 150 т.п.о., по меньшей мере 160 т.п.о., по меньшей мере 170 т.п.о., по меньшей мере 180 т.п.о., по меньшей мере 190 т.п.о., или по меньшей мере 200 т.п.о. Каждое плечо гомологии может также составлять по меньшей мере 250 т.п.о., по меньшей мере 300 т.п.о., по меньшей мере 350 т.п.о. или по меньшей мере 400 т.п.о.[000276] The total sum of the 5' homology arm and the 3' homology arm in an LTVEC is typically at least 10 kb. As an example, the 5' homology arm can range from about 5 kb to about 100 kb, and/or the 3' homology arm can range from about 5 kb to about 100 kb. As another example, the 5' homology arm can range from about 5 kb to about 150 kb, and/or the 3' homology arm can range from about 5 kb to about 150 kb. Each homology arm can be, for example, from about 5 kb to about 150 kb. up to about 10 kbp, from about 10 kbp to about 20 kbp, from about 20 kbp to about 30 kbp, from about 30 kbp to about 40 kbp, from about 40 kbp to about 50 kbp, from about 50 kbp to about 60 kbp, from about 60 kbp to about 70 kbp, from about 70 kbp to about 80 kbp, from about 80 kbp to about 90 kbp, from about 90 kbp to about 100 kbp, from about 100 kbp to about 110 kbp, from about 110 kbp to about 120 kbp, from about 120 kbp to about 130 kbp, from about 130 kbp to about 140 kbp, from about 140 kbp to about 150 kbp, from about 150 kbp to about 160 kbp, from about 160 kbp to about 170 kbp, from about 170 kbp to about 180 kbp, from about 180 kbp to about 190 kbp, or from about 190 kbp to about 200 kbp. The total sum of the 5' and 3' arms of homology may be, for example, from about 10 kb to about 20 kb, from about 20 kb to about 30 kb, from about 30 kb to about 40 kb, from about 40 kb to about 50 kb, from about 50 kb to about 60 kb, from about 60 kb to about 70 kb, from about 70 kb to about 80 kb, from about 80 kb to about 90 kb, from about 90 kb to about 100 kb, from about 100 kb. to about 110 kbp, from about 110 kbp to about 120 kbp, from about 120 kbp to about 130 kbp, from about 130 kbp to about 140 kbp, from about 140 kbp to about 150 kbp, from about 150 kbp to about 160 kbp, from about 160 kbp to about 170 kbp, from about 170 kbp to about 180 kbp, from about 180 kbp to about 190 kbp, or from about 190 kbp to about 200 kbp. The total sum of the 5' and 3' arms of homology may also be, for example, from about 200 kb to about 250 kb, from about 250 kb to about 300 kb, from about 300 kb to about 350 kb, or from about 350 kb to about 400 kb. Alternatively, each homology arm may be at least 5 kb, at least 10 kb, at least 15 kb, at least 20 kb, at least 30 kb, at least 40 kb, at least 50 kb, at least 60 kb, at least 70 kb, at least 80 kb, at least 90 kb, at least 100 kb, at least 110 kb, at least 120 kb, at least 130 kb, at least 140 kb, at least 150 kb, at least 160 kbp, at least 170 kbp, at least 180 kbp, at least 190 kbp, or at least 200 kbp. Alternatively, the total sum of the 5' and 3' arms of homology may be at least 10 kb, at least 15 kb, at least 20 kb, at least 30 kb, at least 40 kb, at least 50 kb, at least 60 kb, at least 70 kb, at least 80 kb, at least 90 kb, at least 100 kb, at least 110 kb, at least 120 kb, at least 130 kb, at least 140 kb, at least 150 kb, at least 160 kb, at least 170 kb, at least 180 kb, at least 190 kb, or at least 200 kb. Each homology arm may also be at least 250 kb, at least 300 kb, at least 350 kb, or at least 400 kb.

[000277] LTVEC также содержать вставки нуклеиновых кислот, имеющие последовательности нуклеиновых кислот, более крупные, чем те, которые обычно используются другими подходами, предназначенными для выполнения гомологичной рекомбинации в клетках. Например, LTVEC может содержать вставку нуклеиновой кислоты в диапазоне от около 5 т.п.о. до около 10 т.п.о., от около 10 т.п.о. до около 20 т.п.о., от около 20 т.п.о. до около 40 т.п.о., от около 40 т.п.о. до около 60 т.п.о., от около 60 т.п.о. до 80 т.п.о., от около 80 т.п.о. до около 100 т.п.о., от около 100 т.п.о. до около 150 т.п.о., от около 150 т.п.о. до около 200 т.п.о., от около 200 т.п.о. до около 250 т.п.о., от около 250 т.п.о. до около 300 т.п.о., от около 300 т.п.о. до около 350 т.п.о., от около 350 т.п.о. до около 400 т.п.о., или более LTVEC может также содержать вставку нуклеиновой кислоты, например, от около 1 т.п.о. до около 5 т.п.о., от около 400 т.п.о. до около 450 т.п.о., от около 450 т.п.о. до около 500 т.п.о. или более. Альтернативно, вставка нуклеиновой кислоты может составлять по меньшей мере 1 т.п.о., по меньшей мере 5 т.п.о., по меньшей мере 10 т.п.о., по меньшей мере 20 т.п.о., по меньшей мере 30 т.п.о., по меньшей мере 40 т.п.о., по меньшей мере 60 т.п.о., по меньшей мере 80 т.п.о., по меньшей мере 100 т.п.о., по меньшей мере 150 т.п.о., по меньшей мере 200 т.п.о., по меньшей мере 250 т.п.о., по меньшей мере 300 т.п.о., по меньшей мере 350 т.п.о., по меньшей мере 400 т.п.о., по меньшей мере 450 т.п.о. или по меньшей мере 500 т.п.о.[000277] LTVECs may also contain nucleic acid inserts having nucleic acid sequences that are larger than those typically used by other approaches designed to perform homologous recombination in cells. For example, an LTVEC may contain a nucleic acid insert in the range of about 5 kb to about 10 kb, about 10 kb to about 20 kb, about 20 kb to about 40 kb, about 40 kb to about 60 kb, about 60 kb to 80 kb, about 80 kb to about 100 kb, about 100 kb to about 150 kb, from about 150 kb to about 200 kb, from about 200 kb to about 250 kb, from about 250 kb to about 300 kb, from about 300 kb to about 350 kb, from about 350 kb to about 400 kb, or more. The LTVEC may also contain a nucleic acid insert of, for example, about 1 kb to about 5 kb, about 400 kb to about 450 kb, about 450 kb to about 500 kb, or more. Alternatively, the nucleic acid insert may be at least 1 kb, at least 5 kb, at least 10 kb, at least 20 kb, at least 30 kb, at least 40 kb, at least 60 kb, at least 80 kb, at least 100 kb, at least 150 kb, at least 200 kb, at least 250 kb, at least 300 kb, at least 350 kb, at least 400 kb, at least 450 kb, or at least 500 kb.

D. Приведение в контакт с геномом клетки и введение нуклеиновых кислот или белков в клеткиD. Bringing into contact with the cell genome and introducing nucleic acids or proteins into cells

[000278] Приведение в контакте геномом клетки может включать введение одного или более белков Cas или нуклеиновых кислот, кодирующих белки Cas, одну или более направляющих РНК или нуклеиновых кислот, кодирующих направляющие РНК (то есть одну или более CRISPR РНК и одну или более малых некодирующих РНК), и одну или более экзогенных матриц для репарации в клетке, при условии, что если клетка представляет собой эмбрион на одноклеточной стадии, например, экзогенная матрица для репарации может быть менее чем 5 т.п.о. в длину. Приведение в контакт с геномом клетки (например, приведение в контакт клетки) может включать введение только одного из вышеуказанных компонентов, одного или более компонентов, или всех компонентов в клетку. «Введение» включает в себя введение в клетку нуклеиновой кислоты или белка таким образом, что последовательность получает доступ к внутренней части клетки. Введение может быть осуществлено любыми способами, и один или более компонентов (например, два компонента или все компоненты) могут быть введены в клетку одновременно или последовательно в любой комбинации. Например, экзогенная матрица для репарации может быть введена до введения белка Cas и направляющей РНК, или она может быть введена после введения белка Cas и направляющей РНК (например, экзогенную матрицу для репарации можно вводить около 1, 2, 3, 4, 8, 12, 24, 36, 48 или 72 часов до или после введения белка Cas и направляющей РНК). См., например, US 2015/0240263 и US 2015/0110762, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей.[000278] Contacting the genome of a cell may comprise introducing one or more Cas proteins or nucleic acids encoding Cas proteins, one or more guide RNAs or nucleic acids encoding guide RNAs (i.e., one or more CRISPR RNAs and one or more small non-coding RNAs), and one or more exogenous repair templates into the cell, provided that if the cell is a single-cell stage embryo, for example, the exogenous repair template may be less than 5 kb in length. Contacting the genome of a cell (e.g., contacting a cell) may comprise introducing only one of the above components, one or more components, or all of the components into the cell. "Introducing" includes introducing a nucleic acid or protein into the cell such that the sequence gains access to the interior of the cell. Introduction may be accomplished by any means, and one or more components (e.g., two components or all of the components) may be introduced into the cell simultaneously or sequentially in any combination. For example, the exogenous repair matrix may be administered prior to administration of the Cas protein and guide RNA, or it may be administered after administration of the Cas protein and guide RNA (e.g., the exogenous repair matrix may be administered about 1, 2, 3, 4, 8, 12, 24, 36, 48, or 72 hours before or after administration of the Cas protein and guide RNA). See, for example, US 2015/0240263 and US 2015/0110762, each of which is herein incorporated by reference in its entirety for all purposes.

[000279] Белок Cas может быть введен в клетку в виде белка, такого как белок Cas, образующий комплекс с гРНК, или в форме нуклеиновой кислоты, кодирующей белок Cas, такой как РНК (например, матричная РНК (мРНК)) или ДНК. При введении в форме ДНК, ДНК, кодирующая направляющую РНК, может быть функционально связана с промотором, активным в клетке. Такие ДНК могут быть в одном или более экспрессионных конструктах.[000279] The Cas protein may be introduced into the cell as a protein, such as a Cas protein complexed with a gRNA, or in the form of a nucleic acid encoding the Cas protein, such as RNA (e.g., messenger RNA (mRNA)) or DNA. When introduced in the form of DNA, the DNA encoding the guide RNA may be operably linked to a promoter active in the cell. Such DNAs may be in one or more expression constructs.

[000280] Направляющую РНК можно вводить в клетку в форме РНК или в форме ДНК, кодирующей направляющую РНК. При введении в форме ДНК, ДНК, кодирующая направляющую РНК, может быть функционально связана с промотором, активным в клетке. Такие ДНК могут быть в одном или более экспрессионных конструктах. Например, такие экспрессионные конструкты могут быть компонентами одной молекулы нуклеиновой кислоты. Альтернативно, они могут быть разделены в любой комбинации между двумя или более молекулами нуклеиновой кислоты (то есть, ДНК, кодирующие одну или более РНК CRISPR и ДНК, кодирующие одну или более малых некодирующих РНК, могут быть компонентами отдельных молекул нуклеиновой кислоты).[000280] The guide RNA may be introduced into the cell in the form of RNA or in the form of DNA encoding the guide RNA. When introduced in the form of DNA, the DNA encoding the guide RNA may be operably linked to a promoter active in the cell. Such DNAs may be in one or more expression constructs. For example, such expression constructs may be components of a single nucleic acid molecule. Alternatively, they may be divided in any combination between two or more nucleic acid molecules (i.e., DNAs encoding one or more CRISPR RNAs and DNAs encoding one or more small non-coding RNAs may be components of separate nucleic acid molecules).

[000281] В некоторых способах ДНК, кодирующая нуклеазный агент (например, белок Cas и направляющая РНК), и/или ДНК, кодирующая экзогенную матрицу для репарации, может быть введена в клетку через миникольцо ДНК. См., например, WO 2014/182700, включенную в данном документе в качестве ссылки в полном объеме для всех целей. Миникольца ДНК представляют собой молекулы суперспиральной ДНК, которые могут быть использованы для переноса генов без использования вирусов, и которые не имеют ни точки начала репликации, ни маркера для селекции с помощью антибиотиков. Таким образом, миникольцевые ДНК обычно имеют меньший размер, чем вектор плазмиды. Эти ДНК лишены бактериальной ДНК и, таким образом, лишены неметилированных мотивов CpG, обнаруженных в бактериальной ДНК.[000281] In some methods, DNA encoding a nuclease agent (e.g., a Cas protein and a guide RNA) and/or DNA encoding an exogenous repair template can be introduced into a cell via a DNA minicircle. See, e.g., WO 2014/182700, incorporated herein by reference in its entirety for all purposes. DNA minicircles are supercoiled DNA molecules that can be used for virus-free gene transfer and that lack an origin of replication or an antibiotic selection marker. Thus, minicircles are typically smaller in size than a plasmid vector. These DNAs lack bacterial DNA and thus lack the unmethylated CpG motifs found in bacterial DNA.

[000282] Способы, предлагаемые в данном документе, не зависят от конкретного способа введения нуклеиновой кислоты или белка в клетку, только то, что нуклеиновая кислота или белок получает доступ к внутренней части по меньшей мере одной клетки. Способы введения нуклеиновых кислот и белков в различные типы клеток известны в данной области и включают, например, стабильные способы трансфекции, способы временной трансфекции и опосредованные вирусом способы.[000282] The methods provided herein do not depend on the particular method of introducing the nucleic acid or protein into the cell, only that the nucleic acid or protein gains access to the interior of at least one cell. Methods of introducing nucleic acids and proteins into various types of cells are known in the art and include, for example, stable transfection methods, transient transfection methods, and virus-mediated methods.

[000283] Протоколы трансфекции, а также протоколы введения нуклеиновых кислот или белков в клетки могут варьироваться. Неограничивающие способы трансфекции включают химически-основанные способы трансфекции с использованием липосом; наночастиц; фосфата кальция (Graham et al. (1973) Virology 52 (2): 456-67, Bacchetti et al. (1977) Proc. Natl. Acad. Sci. USA 74 (4): 1590-4, и Kriegler, M (1991). Transfer and Expression: A Laboratory Manual. New York: W.H. Freeman и Company, pp. 96-97); дендримеров; или катионных полимеров, таких как DEAE-декстран или полиэтиленимин. Нехимические способы включают электропорацию, сонопоризацию и оптическую трансфекцию. Трансфекция на основе частиц включает использование генной пушки или трансфекции с помощью магнита (Bertram (2006) Current Pharmaceutical Biotechnology 7, 277-28). Вирусные способы также могут быть использованы для трансфекции.[000283] Transfection protocols, as well as protocols for introducing nucleic acids or proteins into cells, can vary. Non-limiting transfection methods include chemically based transfection methods using liposomes; nanoparticles; calcium phosphate (Graham et al. (1973) Virology 52 (2): 456-67, Bacchetti et al. (1977) Proc. Natl. Acad. Sci. USA 74 (4): 1590-4, and Kriegler, M (1991). Transfer and Expression: A Laboratory Manual. New York: W.H. Freeman and Company, pp. 96-97); dendrimers; or cationic polymers such as DEAE-dextran or polyethyleneimine. Non-chemical methods include electroporation, sonoporization, and optical transfection. Particle-based transfection involves the use of a gene gun or magnetically assisted transfection (Bertram (2006) Current Pharmaceutical Biotechnology 7, 277-28). Viral methods can also be used for transfection.

[000284] Введение нуклеиновых кислот или белков в клетку также может быть опосредовано электропорацией, интрацитоплазматической инъекцией, вирусной инфекцией, аденовирусом, лентивирусом, ретровирусом, трансфекцией, липид-опосредственной трансфекцией или нуклеофекцией. Введение нуклеиновых кислот или белков в клетку также может быть опосредовано аденоассоциированным вирусом. Нуклеофекция представляет собой усовершенствованную технологию электропорации, которая позволяет доставлять субстраты нуклеиновых кислот не только в цитоплазму, но также через ядерную мембрану и в ядро. Кроме того, использование нуклеофекции в описанных в данном документе способах обычно требует гораздо меньшего количества клеток, чем регулярная электропорация (например, только около 2 миллионов по сравнению с 7 миллионами при регулярной электропорации). В одном примере нуклеофекция выполняется с использованием системы LONZA® NUCLEOFECTOR™.[000284] Introduction of nucleic acids or proteins into a cell can also be mediated by electroporation, intracytoplasmic injection, viral infection, adenovirus, lentivirus, retrovirus, transfection, lipid-mediated transfection, or nucleofection. Introduction of nucleic acids or proteins into a cell can also be mediated by an adeno-associated virus. Nucleofection is an improved electroporation technology that allows nucleic acid substrates to be delivered not only into the cytoplasm, but also across the nuclear membrane and into the nucleus. In addition, the use of nucleofection in the methods described herein typically requires far fewer cells than regular electroporation (e.g., only about 2 million compared to 7 million with regular electroporation). In one example, nucleofection is performed using the LONZA ® NUCLEOFECTOR™ System.

[000285] Введение нуклеиновых кислот или белков в клетку (например, эмбрион на одноклеточной стадии) также может быть осуществлено путем микроинъекции. В эмбрионах на одноклеточной стадии, микроинъекция может быть в материнском и/или родительском пронуклеуме или в цитоплазме. Если микроинъекция находится только в одном пронуклеусе, родительский пронуклеус предпочтительнее из-за его большего размера. Микроинъекция мРНК предпочтительно находится в цитоплазме (например, для доставки мРНК непосредственно к механизму трансляции), тогда как микроинъекция белка Cas или нуклеиновой кислоты, кодирующей белок Cas или кодирующая РНК, является предпочтительной в ядро/пронуклеус. Альтернативно, микроинъекция может быть осуществлена путем инъекции как в ядро/пронуклеус, так и в цитоплазму: сначала можно ввести иглу в ядро/пронуклеус, и первое количество можно инъектировать, а при удалении иглы из эмбриона на одноклеточной стадии второе количество может быть инъектировано в цитоплазму. Если в цитоплазму инъектируют белок Cas, белок Cas предпочтительно содержит сигнал ядерной локализации для обеспечения доставки в ядро/пронуклеус. Способы проведения микроинъекции хорошо известны. См., например, Nagy et al. (Nagy А, Gertsenstein М, Vintersten K, Behringer R., 2003, Manipulating the Mouse Embryo. Cold Spring Harbor, New York: Cold Spring Harbor Laboratory Press); Meyer et al. (2010) Proc. Natl. Acad. Sci. USA 107:15022-15026 и Meyer et al. (2012) Proc. Natl. Acad. Sci. USA 109:9354-9359. Введение в эмбрионы на одноклеточной стадии также может быть осуществлено электропорацией.[000285] Introduction of nucleic acids or proteins into a cell (e.g., a one-cell stage embryo) can also be accomplished by microinjection. In one-cell stage embryos, microinjection can be into the maternal and/or parental pronucleus or into the cytoplasm. If the microinjection is into only one pronucleus, the parental pronucleus is preferred due to its larger size. Microinjection of mRNA is preferably in the cytoplasm (e.g., to deliver mRNA directly to the translation machinery), whereas microinjection of Cas protein or nucleic acid encoding Cas protein or encoding RNA is preferred into the nucleus/pronucleus. Alternatively, microinjection can be accomplished by injecting into both the nucleus/pronucleus and the cytoplasm: the needle can first be inserted into the nucleus/pronucleus and a first amount can be injected, and upon removal of the needle from the one-cell stage embryo, a second amount can be injected into the cytoplasm. If the Cas protein is injected into the cytoplasm, the Cas protein preferably contains a nuclear localization signal to ensure targeting into the nucleus/pronucleus. Methods for performing microinjection are well known. See, e.g., Nagy et al. (Nagy A, Gertsenstein M, Vintersten K, Behringer R, 2003, Manipulating the Mouse Embryo. Cold Spring Harbor, New York: Cold Spring Harbor Laboratory Press); Meyer et al. (2010) Proc. Natl. Acad. Sci. USA 107:15022–15026 and Meyer et al. (2012) Proc. Natl. Acad. Sci. USA 109:9354–9359. Introduction into one-cell stage embryos can also be accomplished by electroporation.

[000286] Другие способы введения нуклеиновой кислоты или белков в клетку могут включать, например, доставку вектора, доставку, опосредованную частицей, доставку, опосредованную экзосомой, доставку, опосредованную липидом и наночастицами, доставку, опосредуемую пептидом проникновения, или доставку, опосредуемую имплантируемым устройством.[000286] Other methods of introducing nucleic acid or proteins into a cell may include, for example, vector delivery, particle-mediated delivery, exosome-mediated delivery, lipid-nanoparticle-mediated delivery, penetration peptide-mediated delivery, or implantable device-mediated delivery.

[000287] Введение нуклеиновых кислот или белков в клетку может выполняться один или более раз в течение определенного периода времени. Например, введение может выполняться по меньшей мере два раза в течение периода времени, по крайней мере три раза в течение периода времени, по меньшей мере четыре раза в течение периода времени, по меньшей мере пять раз в течение периода времени, по меньшей мере шесть раз в течение периода времени, по меньшей мере семь раз в течение периода времени, по меньшей мере восемь раз в течение периода времени, по меньшей мере девять раз в течение периода времени, по меньшей мере десять раз в течение периода времени, по меньшей мере одиннадцать раз, по меньшей мере двенадцать раз в течение периода времени, по меньшей мере тринадцать раз в течение периода времени, по меньшей мере четырнадцать раз в течение периода времени, по меньшей мере пятнадцать раз в течение периода времени, по меньшей мере шестнадцать раз в течение периода времени, по меньшей мере семнадцать раз в течение периода времени, по меньшей мере восемнадцать раз в течение периода времени, по меньшей мере девятнадцать раз в течение периода времени или по меньшей мере двадцать раз в течение периода времени.[000287] The introduction of nucleic acids or proteins into a cell can be performed one or more times during a certain period of time. For example, the introduction can be performed at least twice during a period of time, at least three times during a period of time, at least four times during a period of time, at least five times during a period of time, at least six times during a period of time, at least seven times during a period of time, at least eight times during a period of time, at least nine times during a period of time, at least ten times during a period of time, at least eleven times, at least twelve times during a period of time, at least thirteen times during a period of time, at least fourteen times during a period of time, at least fifteen times during a period of time, at least sixteen times during a period of time, at least seventeen times during a period of time, at least eighteen times during a period of time, at least nineteen times during a period of time, or at least twenty times during a period of time.

[000288] В некоторых случаях клетки, используемые в способах и композициях, имеют конструкт ДНК, стабильно включенный в их геном. В таких случаях приведение в контакт может включать в себя обеспечение клетки конструктом, который уже стабильно включен в ее геном. Например, клетка, используемая в описанных в данном документе способах, может иметь ранее существовавший Cas-кодирующий ген, стабильно включенный в его геном (т.е. Cas-готовую клетку). «Стабильно введенный» или «стабильно введенный» или «стабильно интегрированный» включает введение полинуклеотида в клетку, так что нуклеотидная последовательность интегрируется в геном клетки и может быть унаследована их потомством. Любой протокол может быть использован для стабильного включения конструктов ДНК или различных компонентов целевой системы геномной интеграции.[000288] In some cases, the cells used in the methods and compositions have a DNA construct stably incorporated into their genome. In such cases, contacting may involve providing the cell with a construct that is already stably incorporated into its genome. For example, a cell used in the methods described herein may have a pre-existing Cas-encoding gene stably incorporated into its genome (i.e., a Cas-ready cell). "Stably introduced" or "stably introduced" or "stably integrated" involves introducing a polynucleotide into a cell such that the nucleotide sequence is integrated into the cell's genome and can be inherited by their progeny. Any protocol may be used to stably incorporate DNA constructs or various components of a target genomic integration system.

Е. Геномные локусы-мишени и месторасположения последовательностей, распознаваемых направляющей РНК.E. Genomic target loci and locations of sequences recognized by guide RNA.

[000289] Геномный локус-мишень может быть любым геномным локусом, который влияет на экспрессию аутоантигена, гомологичного или обладающего представляющим интерес эпитопом, с представляющим интерес чужеродным антигеном-мишенью. Предпочтительно, геномный локус-мишень содержит, по существу состоит из, или состоит из всего или части гена, кодирующего аутоантиген. В качестве примера геномный локус-мишень может содержать, по существу состоять из или состоять из участка, содержащего стартовый кодон гена, кодирующего аутоантиген, или может содержать, по существу состоять из или состоять из всего кодирующего участка гена. Альтернативно, геномный локус-ллишень может содержать, состоять по существу из или состоять из другого геномного локуса, который влияет на экспрессию гена, кодирующего аутоантиген. Примером такого геномного локуса является весь или часть гена, кодирующего регулятор транскрипции, необходимый для экспрессии гена, кодирующего аутоантиген. В некоторых способах, можно использовать многие геномные локусы-мишени. В качестве примера, если существует несколько генов, кодирующих многие аутоантигены, гомологичных или разделяющих представляющий интерес эпитоп с представляющим интерес чужеродным антигеном, нацеливание на каждый из многих генов может быть либо последовательным, либо одновременным.[000289] The target genomic locus may be any genomic locus that affects the expression of an autoantigen that is homologous to, or has an epitope of interest with, the foreign target antigen of interest. Preferably, the target genomic locus comprises, consists essentially of, or consists of all or a portion of a gene encoding an autoantigen. As an example, the target genomic locus may comprise, consist essentially of, or consist of a region containing a start codon of a gene encoding an autoantigen, or may comprise, consist essentially of, or consist of the entire coding region of a gene. Alternatively, the extra genomic locus may comprise, consist essentially of, or consist of another genomic locus that affects the expression of a gene encoding an autoantigen. An example of such a genomic locus is all or a portion of a gene encoding a transcriptional regulator necessary for the expression of a gene encoding an autoantigen. In some methods, multiple genomic target loci may be used. As an example, if there are multiple genes encoding multiple self-antigens that are homologous to or share an epitope of interest with a foreign antigen of interest, targeting each of the multiple genes may be either sequential or simultaneous.

[000290] Последовательности, распознаваемые первой и второй направляющими РНК, могут находиться в любом месте в геномном локусе-мишени. Например, последовательности, распознаваемые первой и второй направляющими РНК, могут фланкировать весь или часть гена, кодирующего аутоантиген, который является гомологичным или разделяет представляющий интерес эпитоп с представляющим интерес чужеродным антигеном-мишенью. В одном примере, последовательность, распознаваемая первой направляющей РНК, содержит старт-кодон для гена, кодирующего аутоантиген, или находится в пределах около 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от старт-кодона, и последовательность, распознаваемая второй направляющей РНК, содержит стоп-кодон для гена, кодирующего аутоантиген, или находится в пределах около 10, 20, 30, 40, 50,100, 200, 300, 400, 500, или 1000 нуклеотидов от стоп-кодона. Например, последовательность, распознаваемая первой направляющей РНК может содержать старт-кодон, а последовательность, распознаваемая второй направляющей РНК может содержать стоп-кодон. Если также используются третья и четвертая направляющие РНК, последовательности, распознаваемые третьей и четвертой направляющей РНК, могут также находиться в пределах геномного локуса-мишени. Например, две из последовательностей, распознаваемых направляющей РНК (например, первая и третья, в которых последовательности, распознаваемые первой и третей направляющей РНК, различны и необязательно перекрываются) могут содержать старт кодон для гена, кодирующего аутоантиген, или могут находиться в пределах около 10, 20, 30, 40, 50,100, 200, 300, 400, 500 или 1000 нуклеотидов от старт кодона, а также две другие последовательности, распознаваемые направляющей РНК (например, вторая и четвертая, в которых последовательности, распознаваемые второй и четвертой направляющей РНК, различны и необязательно перекрываются) может содержать стоп-кодон для гена, кодирующего аутоантиген, или может находиться в пределах около 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от стоп-кодона. Нацеливание как старт, так и стоп кодонов может привести к удалению кодирующей последовательности для гена, кодирующего аутоантиген, и тем самым исключить экспрессию аутоантигена.[000290] The sequences recognized by the first and second guide RNAs may be located anywhere in the target genomic locus. For example, the sequences recognized by the first and second guide RNAs may flank all or part of a gene encoding a self-antigen that is homologous to or shares an epitope of interest with a foreign target antigen of interest. In one example, the sequence recognized by the first guide RNA contains a start codon for a gene encoding an autoantigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the start codon, and the sequence recognized by the second guide RNA contains a stop codon for a gene encoding an autoantigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the stop codon. For example, the sequence recognized by the first guide RNA can contain a start codon, and the sequence recognized by the second guide RNA can contain a stop codon. If third and fourth guide RNAs are also used, the sequences recognized by the third and fourth guide RNAs may also be within the target genomic locus. For example, two of the sequences recognized by the guide RNA (e.g., the first and third, in which the sequences recognized by the first and third guide RNAs are different and optionally overlapping) may contain a start codon for a gene encoding an autoantigen, or may be within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the start codon, and two other sequences recognized by the guide RNA (e.g., the second and fourth, in which the sequences recognized by the second and fourth guide RNAs are different and optionally overlapping) may contain a stop codon for a gene encoding an autoantigen, or may be within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 or 1000 nucleotides from the stop codon. Targeting both start and stop codons can result in the deletion of the coding sequence for the gene encoding the self-antigen, thereby eliminating expression of the self-antigen.

[000291] В другом примере, последовательности, распознаваемые первой и второй направляющими РНК, различны, и каждая содержит старт-кодон для гена, кодирующего аутоантиген, или находится в пределах около 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от старт-кодона. Например, последовательности, распознаваемые первой и второй направляющими РНК, могут перекрываться, и каждая может содержать старт кодон. Если также используются третья и/или четвертая направляющие РНК, последовательности, распознаваемые третьей и четвертой направляющей РНК, могут находиться где угодно в пределах геномного локуса-мишени. Например, последовательности, распознаваемые третьей и четвертой направляющей РНК, могут отличаться друг от друга и отличаться от последовательностей, распознаваемых первой и второй направляющими РНК, и каждая из последовательностей, распознаваемых третьей и четвертой направляющей РНК, может также содержать старт кодон для гена, кодирующего аутоантиген или может находиться в пределах около 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от старт-кодона. Нацеливание на старт-кодон может нарушить старт- кодон и тем самым исключить экспрессию гена, кодирующего аутоантиген.[000291] In another example, the sequences recognized by the first and second guide RNAs are different and each contains a start codon for a gene encoding an autoantigen, or is within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of a start codon. For example, the sequences recognized by the first and second guide RNAs may overlap and each may contain a start codon. If a third and/or fourth guide RNA is also used, the sequences recognized by the third and fourth guide RNA may be anywhere within the target genomic locus. For example, the sequences recognized by the third and fourth guide RNAs may be different from each other and different from the sequences recognized by the first and second guide RNAs, and each of the sequences recognized by the third and fourth guide RNAs may also contain a start codon for a gene encoding an autoantigen or may be within about 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the start codon. Targeting the start codon may disrupt the start codon and thereby eliminate expression of the gene encoding the autoantigen.

[000292] Если используются третья и четвертая направляющие РНК (или дополнительные направляющие РНК), дополнительные геномные локусы-мишени, влияющие на экспрессию первого аутоантигена или влияющие на экспрессию других аутоантигенов (например, второго аутоантигена), гомологичных или разделяющих представляющий интерес эпитоп с представляющим интерес чужеродным антигеном, также могут быть нацелены на уменьшение экспрессии первого аутоантигена и/или других аутоантигенов. В качестве примера, в некоторых способах целью может быть ген, кодирующий первый аутоантиген, гомологичный или разделяющий представляющий интерес эпитоп с представляющим интерес чужеродным антигеном, и целью может быть второй ген, кодирующий второй аутоантиген, гомологичный или разделяющий представляющий интерес эпитоп с представляющим интерес чужеродным антигеном.[000292] If third and fourth guide RNAs (or additional guide RNAs) are used, additional target genomic loci that affect the expression of the first autoantigen or that affect the expression of other autoantigens (e.g., a second autoantigen) that are homologous to or share an epitope of interest with the foreign antigen of interest may also be targeted to reduce the expression of the first autoantigen and/or other autoantigens. As an example, in some methods, the target may be a gene encoding a first autoantigen that is homologous to or shares an epitope of interest with the foreign antigen of interest, and the target may be a second gene encoding a second autoantigen that is homologous to or shares an epitope of interest with the foreign antigen of interest.

F. Механизмы рекомбинации и способы для изменения распространения негомологичного соединения концов, конверсии генов или гомологичной рекомбинацииF. Mechanisms of recombination and methods for altering the spread of non-homologous end joining, gene conversion or homologous recombination

[000293] Рекомбинация включает любой процесс обмена генетической информацией между двумя полинуклеотидами и может происходить с помощью любого механизма. Рекомбинация в ответ на двухнитевые разрывы (DSB) происходит главным образом через два консервативных пути репарации ДНК: негомологичное соединение концов (NHEJ) и гомологичную рекомбинацию (HR). См. Kasparek & Humphrey (2011) Seminars in Cell & Dev. Biol. 22: 886-897, включенный в данный документ в качестве ссылки во всей полноте для всех целей. Аналогичным образом, репарация нуклеиновой кислоты-мишени, опосредуемая экзогенной матрицей для репарации, может включать в себя любой процесс обмена генетической информацией между двумя полинуклеотидами.[000293] Recombination includes any process of exchange of genetic information between two polynucleotides and can occur by any mechanism. Recombination in response to double-strand breaks (DSBs) occurs primarily through two conserved DNA repair pathways: non-homologous end joining (NHEJ) and homologous recombination (HR). See Kasparek & Humphrey (2011) Seminars in Cell & Dev. Biol. 22: 886–897, incorporated herein by reference in its entirety for all purposes. Similarly, repair of a target nucleic acid mediated by an exogenous repair template can include any process of exchange of genetic information between two polynucleotides.

[000294] NHEJ включает в себя репарацию двухнитевых разрывов в нуклеиновой кислоте путем прямого лигирования концов разрыва друг с другом или с экзогенной последовательностью без необходимости в гомологичной матрице. Лигирование несмежных последовательностей с помощью NHEJ может часто приводить к делециям, вставкам или транслокациям вблизи места двухнитевого разрыва. Например, NHEJ также может привести к направленной интеграции экзогенной матрицы для репарации путем прямого лигирования концов разрыва с концами экзогенной матрицы для репарации (т.е. захвата на основе NHEJ). Такая опосредованная NHEJ направленная интеграция может быть предпочтительной для вставки экзогенной матрицы для репарации, когда пути репарации, направленной гомологией (HDR), не могут быть легко использованы (например, в не делящихся клетках, первичных клетках, и клетках, которые плохо выполняют репарацию ДНК на основе гомологии). Кроме того, в отличие от репарации, основанной на гомологии, знания о больших участках идентичности последовательности, фланкирующих сайт расщепления (за пределами «липких» концов, созданных с помощью Cas-опосредованного расщепления), не нужны, что может быть полезно при попытке направленной вставки в организмы, у которых есть геномы, для которых знание о геномной последовательности ограничено. Интеграция может протекать через лигирование «тупых» концов между экзогенной матрицей для репарации и расщепленной геномной последовательностью, или путем лигирования «липких» концов (т.е. имеющих 5' или 3' «липкие» концы) с использованием экзогенной матрицы для репарации, которая фланкирована с помощью «липких» концов, которые совместимы с теми, которые генерируются с помощью белка Cas в расщепленной геномной последовательности. См., например, US 2011/020722, WO 2014/033644, WO 2014/089290, and Maresca er al. (2013) Genome Res. 23(3): 539-546, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Если «тупые» концы лигированы, может потребоваться резекция цели и/или донора для генерации участков микрогомологии, необходимых для присоединения фрагментов, что может создавать нежелательные изменения в последовательности-мишени.[000294] NHEJ involves the repair of double-strand breaks in nucleic acid by directly ligating the ends of the break to each other or to an exogenous sequence without the need for a homologous template. Ligation of non-contiguous sequences by NHEJ can often result in deletions, insertions, or translocations near the site of the double-strand break. For example, NHEJ can also result in the directed integration of an exogenous repair template by directly ligating the ends of the break to the ends of the exogenous repair template (i.e., NHEJ-based capture). Such NHEJ-mediated directed integration may be advantageous for insertion of an exogenous repair template when homology-directed repair (HDR) pathways cannot be readily utilized (e.g., in non-dividing cells, primary cells, and cells that perform homology-based DNA repair poorly). Furthermore, unlike homology-based repair, knowledge of the large regions of sequence identity flanking the cleavage site (beyond the sticky ends generated by Cas-mediated cleavage) is not required, which may be useful when attempting targeted insertion into organisms that have genomes for which knowledge of the genomic sequence is limited. Integration can proceed via blunt-end ligation between the exogenous repair template and the cleaved genomic sequence, or via sticky-end ligation (i.e., having 5' or 3' sticky ends) using an exogenous repair template that is flanked by sticky ends that are compatible with those generated by the Cas protein in the cleaved genomic sequence. See, e.g., US 2011/020722, WO 2014/033644, WO 2014/089290, and Maresca et al. (2013) Genome Res. 23(3): 539–546, each of which is hereby incorporated by reference in its entirety for all purposes. If blunt ends are ligated, resection of the target and/or donor may be required to generate regions of microhomology necessary for joining the fragments, which may create undesirable changes in the target sequence.

[000295] Рекомбинация также может происходить посредством репарации, направляемой гомологией (HDR), или гомологичной рекомбинации (HR). HDR или HR включает в себя форму репарации нуклеиновой кислоты, которая может потребовать гомологию нуклеотидной последовательности, использует «донорскую» молекулу в качестве матрицы для репарации «целевой» молекулы (т.е. той, которая испытывала двухнитевой разрыв), и приводит к передаче генетической информации от донора к мишени. Не желая связывать себя какой-либо конкретной теорией, такая передача может включать коррекцию несовпадения гетеродуплексной ДНК, которое образуется между сломанной мишенью и донором, и/или синтез-зависимый отжиг нити, в котором донор используется для ресинтеза генетической информации, которая будет частью мишени, и/или связанных процессов. В некоторых случаях донорный полинуклеотид, часть донорного полинуклеотида, копия донорного полинуклеотида, или часть копии донорного полинуклеотида интегрируется в ДНК-мишень. См. Wang et al. (2013) Cell 153: 910-918; Mandalos et al. (2012) PLOS ONE 7: e45768: 1-9; и Wang et al. (2013) NatBiotechnol. 31: 530-532, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей.[000295] Recombination can also occur through homology-directed repair (HDR) or homologous recombination (HR). HDR or HR involves a form of nucleic acid repair that may require nucleotide sequence homology, uses a "donor" molecule as a template for repair of a "target" molecule (i.e., the one that has experienced a double-strand break), and results in the transfer of genetic information from the donor to the target. Without wishing to be bound by any particular theory, such transfer may involve correction of a heteroduplex DNA mismatch that forms between the broken target and the donor, and/or synthesis-dependent strand annealing, in which the donor is used to resynthesize genetic information that will be part of the target, and/or related processes. In some cases, a donor polynucleotide, a portion of a donor polynucleotide, a copy of a donor polynucleotide, or a portion of a copy of a donor polynucleotide is integrated into a target DNA. See Wang et al. (2013) Cell 153: 910-918; Mandalos et al. (2012) PLOS ONE 7: e45768: 1-9; and Wang et al. (2013) NatBiotechnol. 31: 530-532, each of which is hereby incorporated by reference in its entirety for all purposes.

[000296] Рекомбинация может быть между первой и второй хромосомами в гомологичной паре хромосом. Такие средства могут включать, например, потерю гетерозиготности (LOH), конверсию генов, или перекрестные события, происходящие с помощью любого известного механизма рекомбинации. Не желая связывать себя теорией, LOH может происходить, например, посредством митотической рекомбинации, с или без конверсии гена, или посредством потери хромосом и дублирования. См., например, Lefebvre et al. (2001) Nat Genet. 27: 257-258, включенный в данный документ в качестве ссылки во всей полноте для всех целей. Конверсия генов в этом контексте может включать однонаправленную передачу генетического материала от донорной последовательности к высоко гомологичному акцептору (т.е. нереципрокный обмен генетической информацией от одной молекулы к ее гомологу). Преобразование генов включает любые средства для копирования аллеля с помощью любого известного механизма рекомбинации. Например, конверсия генов может включать в себя нереципрокную передачу генетической информации из интактной последовательности в гомологичный участок, содержащий двухцепочечный разрыв, и он может происходить между сестринскими хроматидами, гомологичными хромосомами или гомологичными последовательностями на одной и той же хроматиде или на разных хромосомах. См., например, Chen et al. (2007) Nat. Rev. Genet. 8: 762-775, включенный в данный документ в качестве ссылки во всей полноте для всех целей. В конкретных случаях, конверсия генов происходит непосредственно из гомологичной рекомбинации в результате копирования генетической информации из гомологичной хромосомы. Это может привести к локализованной потере гетерозиготности (LOH), когда гомологичные последовательности не идентичны.[000296] Recombination may be between the first and second chromosomes in a homologous pair of chromosomes. Such means may include, for example, loss of heterozygosity (LOH), gene conversion, or crossover events occurring by any known recombination mechanism. Without wishing to be bound by theory, LOH may occur, for example, through mitotic recombination, with or without gene conversion, or through chromosome loss and duplication. See, for example, Lefebvre et al. (2001) Nat Genet. 27: 257-258, incorporated herein by reference in its entirety for all purposes. Gene conversion in this context may involve the unidirectional transfer of genetic material from a donor sequence to a highly homologous acceptor (i.e., nonreciprocal exchange of genetic information from one molecule to its homolog). Gene conversion includes any means for copying an allele by any known recombination mechanism. For example, gene conversion may involve the nonreciprocal transfer of genetic information from an intact sequence to a homologous region containing a double-strand break, and it may occur between sister chromatids, homologous chromosomes, or homologous sequences on the same chromatid or on different chromosomes. See, e.g., Chen et al. (2007) Nat. Rev. Genet. 8: 762–775, incorporated herein by reference in its entirety for all purposes. In specific cases, gene conversion occurs directly from homologous recombination as a result of copying of genetic information from a homologous chromosome. This may result in localized loss of heterozygosity (LOH) when the homologous sequences are not identical.

[000297] В качестве примера, LOH может происходить посредством реципрокного обмена хроматидами путем митотического кроссовера или путем копирования хроматиды путем репликации, вызванной разрывом. В любом случае может возникнуть гетерозиготная модификация, в которой одна хромосома нацелена до репликации генома. Альтернативно, единственная хроматида может быть нацелена после репликации генома с последующей интерхроматидной конверсией генов.[000297] As an example, LOH can occur through reciprocal chromatid exchange by mitotic crossover or by chromatid copying by break-induced replication. In either case, a heterozygous modification can occur in which one chromosome is targeted prior to genome replication. Alternatively, a single chromatid can be targeted after genome replication, followed by interchromatid gene conversion.

[000298] В любом из способов, описанных в данном документе, клетка может быть клеткой, которая была модифицирована для увеличения или уменьшения активности NHEJ. Аналогично, клетка может быть клеткой, которая была модифицирована для увеличения конверсии генов или активности HDR. Такие модификации могут содержать модификации в экспрессии или активности генов, участвующих в регуляции NHEJ, конверсии генов и/или HDR. Например, снижение активности NHEJ и/или увеличение активности HDR может способствовать биаллельному разрушению геномных участков между последовательностями, распознаваемыми нуклеазой (например, последовательностями, распознаваемыми направляющей РНК), соответствующим двум нуклеазным агентам (например, белку Cas и двум направляющим РНК). Не желая быть связанными какую-либо конкретной теорией, один механизм, посредством которого может происходить биаллельное геномное разрушение, заключается в NHEJ-опосредованной репарации или HDR-опосредованной репарации в пределах первого аллеля и создании идентичного второго аллеля посредством механизмов HDR, таких как конверсия генов (см. Пример 1). Таким образом, промотирование HDR-опосредованных путей (например, путем уменьшения активности NHEJ или увеличения активности HDR) также может способствовать биаллельному разрушению геномных участков. Точно так же, не желая быть связанными какой-либо конкретной теорией, конверсия гетерозиготной клетки в гомозиготную клетку с использованием спаренных нуклеазных агентов (например, белка Cas и спаренных направляющих РНК), которые нацелены на один локус, может быть промотирована, если активность NHEJ снижается и активность HDR (например, активность конверсии генов) соответственно увеличивается.[000298] In any of the methods described herein, the cell can be a cell that has been modified to increase or decrease NHEJ activity. Similarly, the cell can be a cell that has been modified to increase gene conversion or HDR activity. Such modifications can include modifications in the expression or activity of genes involved in the regulation of NHEJ, gene conversion, and/or HDR. For example, a decrease in NHEJ activity and/or an increase in HDR activity can promote biallelic disruption of genomic regions between nuclease recognition sequences (e.g., guide RNA recognition sequences) corresponding to two nuclease agents (e.g., a Cas protein and two guide RNAs). Without wishing to be bound by any particular theory, one mechanism by which biallelic genomic disruption may occur is through NHEJ-mediated repair or HDR-mediated repair within the first allele and the creation of an identical second allele via HDR mechanisms such as gene conversion (see Example 1). Thus, promotion of HDR-mediated pathways (e.g., by decreasing NHEJ activity or increasing HDR activity) may also promote biallelic disruption of genomic regions. Similarly, without wishing to be bound by any particular theory, conversion of a heterozygous cell to a homozygous cell using paired nuclease agents (e.g., Cas protein and paired guide RNAs) that target a single locus may be promoted if NHEJ activity is decreased and HDR activity (e.g., gene conversion activity) is correspondingly increased.

[000299] Ингибиторы могут использоваться для увеличения или уменьшения активности NHEJ или для увеличения, или уменьшения активности HDR. Такими ингибиторами могут быть, например, малые молекулы или ингибирующие нуклеиновые кислоты, такие как короткие интерферирующие нуклеиновые кислоты (например, короткая интерферирующая РНК (киРНК), двухцепочечная РНК (дцРНК), микроРНК (миРНК) и короткая шпилечная РНК (кшРНК)) или антисмысловые олигонуклеотиды, специфичные для транскрипта гена. Ингибиторы могут быть направлены на ферменты, участвующие в NHEJ или HDR, или их регуляции вверх по ходу транскрипции посредством посттрансляционной модификации, например, фосфорилирования, убиквитилирования и сумоилирования.[000299] Inhibitors can be used to increase or decrease NHEJ activity or to increase or decrease HDR activity. Such inhibitors can be, for example, small molecules or inhibitory nucleic acids, such as short interfering nucleic acids (e.g., short interfering RNA (siRNA), double-stranded RNA (dsRNA), microRNA (miRNA), and short hairpin RNA (shRNA)) or antisense oligonucleotides specific for a gene transcript. Inhibitors can target enzymes involved in NHEJ or HDR or their upstream regulation through post-translational modification, such as phosphorylation, ubiquitylation, and sumoylation.

[000300] В клетках млекопитающих, NHEJ является преобладающим механизмом репарации DSB и активен во всем клеточном цикле. У позвоночных «канонический» или «классический» путь NHEJ (C-NHEJ) требует несколько основных факторов, включая DNA-PK, Ku70-80, Artemis, лигазу IV (Lig4), XRCC4, CLF и Pol μ для восстановления DSB. См. Kasparek & Humphrey (2011) Seminars in Cell & Dev. Biol. 22: 886-897, включенный в данный документ в качестве ссылки во всей полноте для всех целей. Во время NHEJ, концы ДНК связаны с помощью очень богатого защищающего конец Ки белка, который функционирует как стыковочная станция для загрузки других компонентов NHEJ.[000300] In mammalian cells, NHEJ is the predominant DSB repair mechanism and is active throughout the cell cycle. In vertebrates, the "canonical" or "classical" NHEJ (C-NHEJ) pathway requires several essential factors including DNA-PK, Ku70-80, Artemis, ligase IV (Lig4), XRCC4, CLF, and Pol μ to repair DSBs. See Kasparek & Humphrey (2011) Seminars in Cell & Dev. Biol. 22: 886–897, incorporated herein by reference in its entirety for all purposes. During NHEJ, DNA ends are tethered by the highly enriched end-protecting protein Ki, which functions as a docking station for loading other NHEJ components.

[000301] Таким образом, в некоторых способах, описанных в данном документе, клетка была модифицирована для уменьшения или устранения, или увеличения экспрессии или активности факторов, участвующих в C-NHEJ. Например, в некоторых способах, клетка была модифицирована для уменьшения или исключения экспрессии, или активности ДНК-РК, Ku70-80, Artemis, лигазы IV (Lig4), XRCC4, CLF и/или Pol μ. В конкретных способах, клетка была модифицирована для уменьшения или исключения экспрессии ДНК-РК или активности, или для увеличения экспрессии ДНК-РК или активности (например, экспрессии или активности ДНК-PKcs, иллюстративная последовательность UniProt, обозначенная Р97313). Примеры ингибиторов ДНК-PKcs включают, например, NU7026 и NU7441. См., например, патент США №6974867, включенный в данный документ в качестве ссылки во всей своей полноте для всех целей. В конкретных способах, клетка была модифицирована для уменьшения или исключения экспрессии лигазы IV или активности, или для увеличения экспрессии лигазы IV или активности. Примером ингибитора лигазы IV является SCR7.[000301] Thus, in some methods described herein, a cell has been modified to reduce or eliminate, or increase the expression or activity of factors involved in C-NHEJ. For example, in some methods, a cell has been modified to reduce or eliminate the expression or activity of DNA-PK, Ku70-80, Artemis, ligase IV (Lig4), XRCC4, CLF, and/or Pol μ. In certain methods, a cell has been modified to reduce or eliminate DNA-PK expression or activity, or to increase DNA-PK expression or activity (e.g., DNA-PKcs expression or activity, illustrative UniProt sequence designated P97313). Examples of DNA-PKcs inhibitors include, for example, NU7026 and NU7441. See, for example, U.S. Patent No. 6,974,867, incorporated herein by reference in its entirety for all purposes. In specific methods, the cell has been modified to decrease or eliminate ligase IV expression or activity, or to increase ligase IV expression or activity. An example of a ligase IV inhibitor is SCR7.

[000302] Ингибиторы, нацеленные на белки контрольной точки клеточного цикла, такие как ATM (например, KU55933), CHK1/CHK2 (например, KLD1162 или CHIR-124) и ATR (например, VE 821), также могут использоваться для синергического усиления эффектов специфических ингибиторов репарации ДНК или для предотвращения непреднамеренных побочных эффектов, таких как остановка клеточного цикла и/или апоптоз (см. Ciccia et al. (2010) Mol Cell 40: 179, включенный в данный документ в качестве ссылки во всей полноте для всех целей).[000302] Inhibitors targeting cell cycle checkpoint proteins such as ATM (e.g., KU55933), CHK1/CHK2 (e.g., KLD1162 or CHIR-124), and ATR (e.g., VE 821) can also be used to synergistically enhance the effects of specific DNA repair inhibitors or to prevent unintended side effects such as cell cycle arrest and/or apoptosis (see Ciccia et al. (2010) Mol Cell 40: 179, incorporated herein by reference in its entirety for all purposes).

[000303] Нарушение C-NHEJ может увеличить уровни аномального соединения, опосредованного «альтернативными» NHEJ (A-NHEJ) путями, а также может увеличить репарацию HR. Пути A-NHEJ проявляют смещение к опосредованным микрогомологией соединениям и происходят с более медленной кинетикой, чем C-NHEJ. Для участия было предложено несколько факторов, включая комплекс MRN (MRE11, RAD50, NBS1), QIP, XRCC1, PARP, Lig1 и Lig3. См. Kasparek & Humphrey (2011) Seminars in Cell & Dev. Biol. 22: 886-897 и Claybon er al. (2010) Nucleic Acids Res. 38(21): 7538-7545, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей.[000303] Disruption of C-NHEJ can increase levels of abnormal joining mediated by “alternative” NHEJ (A-NHEJ) pathways and can also increase HR repair. A-NHEJ pathways exhibit a bias toward microhomology-mediated joining and occur with slower kinetics than C-NHEJ. Several factors have been proposed to be involved, including the MRN complex (MRE11, RAD50, NBS1), QIP, XRCC1, PARP, Lig1, and Lig3. See Kasparek & Humphrey (2011) Seminars in Cell & Dev. Biol. 22: 886–897 and Claybon et al. (2010) Nucleic Acids Res. 38(21): 7538-7545, each of which is incorporated herein by reference in its entirety for all purposes.

[000304] Таким образом, в некоторых способах, описанных в данном документе, клетка была модифицирована для уменьшения или устранения, или увеличения экспрессии или активности факторов, участвующих в A-NHEJ. Например, в некоторых способах, клетка была модифицирована для уменьшения или исключения экспрессии, или активности MRE11, RAD50, NBS1, CtIP, XRCC1, PARP (например, PARP1), Lig1 и/или Lig3. В других способах, клетка была модифицирована для увеличения экспрессии или активности MRE11, RAD50, NBS1, CtIP, XRCC1, PARP (например, PARP1), Lig1 и/или Lig3. В конкретных способах, клетка была модифицирована для уменьшения или исключения экспрессии PARP1 или активности, или для увеличения экспрессии PARP1 или активности (иллюстративная последовательность UniProt, обозначенная Р11103). Примеры ингибиторов PARP (например, NU1025, Iniparib, Olaparib) включают никотинамиды; изохинолиноны и дигидроизохинолиноны; бензимидазолы и индолы; фталазин-1(2Н)-оны и хиназолиноны; изоиндолиноны и их аналоги и их производные; фенантридины и фенантридиноны; бензопироны и их аналоги и их производные; ненасыщенные производные гидроксимовой кислоты и их аналоги и их производные; пиридазины, включая слитые пиридазины и их аналоги и их производные; и/или другие соединения, такие как кофеин, теофиллин и тимидин, а также их аналоги и их производные. См., например, патент США №8071579, включенный в данный документ в качестве ссылки во всей своей полноте для всех целей.[000304] Thus, in some methods described herein, a cell has been modified to decrease or eliminate, or increase the expression or activity of factors involved in A-NHEJ. For example, in some methods, a cell has been modified to decrease or eliminate the expression or activity of MRE11, RAD50, NBS1, CtIP, XRCC1, PARP (e.g., PARP1), Lig1, and/or Lig3. In other methods, a cell has been modified to increase the expression or activity of MRE11, RAD50, NBS1, CtIP, XRCC1, PARP (e.g., PARP1), Lig1, and/or Lig3. In particular methods, a cell has been modified to decrease or eliminate PARP1 expression or activity, or to increase PARP1 expression or activity (an exemplary UniProt sequence designated P11103). Examples of PARP inhibitors (e.g., NU1025, Iniparib, Olaparib) include nicotinamides; isoquinolinones and dihydroisoquinolinones; benzimidazoles and indoles; phthalazin-1(2H)-ones and quinazolinones; isoindolinones and their analogs and derivatives; phenanthridines and phenanthridinones; benzopyrones and their analogs and derivatives; unsaturated hydroxymic acid derivatives and their analogs and derivatives; pyridazines, including fused pyridazines and their analogs and derivatives; and/or other compounds such as caffeine, theophylline, and thymidine and their analogs and derivatives. See, e.g., U.S. Patent No. 8,071,579, incorporated herein by reference in its entirety for all purposes.

[000305] C-NHEJ также демонстрирует конкурентные отношения с HR, так что нарушение С-NHEJ также может привести к усилению репарации HR. Такая конкуренция между NHEJ и HR может быть использована, поскольку нарушение NHEJ может привести к усилению генного нацеливания за счет уменьшения случайной интеграции и, возможно, увеличения интеграции целей путем гомологичной рекомбинации.[000305] C-NHEJ also exhibits a competitive relationship with HR, such that disruption of C-NHEJ may also result in increased HR repair. Such competition between NHEJ and HR may be exploitable, since disruption of NHEJ may result in increased gene targeting by reducing random integration and possibly increasing integration of targets via homologous recombination.

[000306] Существует несколько форм репарации гомологичной рекомбинации, включая одноцепочечный отжиг, конверсию генов, кроссоверы и репликацию, вызванную разрушением. Одноцепочечный отжиг является минорной формой репарации HR, в которой гомологичные одноцепочечные последовательности с обеих сторон резецированного отжига DSB, что приводит к восстановлению хромосом. Одноцепочечный отжиг генерирует делеции разного размера в зависимости от расстояния, разделяющего два участка гомологии последовательностей. Конверсия генов включает в себя нереципрокный обмен генетической информацией от одной молекулы к ее гомологу, в результате непосредственно от HR в результате копирования генетической информации из гомологичной хромосомы. Это может привести к локализованной LOH, когда гомологичные последовательности не идентичны. Обычно степень конверсии генов ограничена несколькими сотнями пар оснований. Тем не менее, сообщалось о конверсии генов длинного тракта в некоторых генетических фонах, включая дефицит RAD51C. См. Nagaraju et al. (2006) Mol. Cell. Biol. 26: 8075-8086, включенный в данный документ в качестве ссылки во всей полноте для всех целей. Кроссоверы могут происходить, например, между гомологичными хромосомами и иметь возможность приводить к реципрокным транслокациям, если они встречаются в G1 или нереципрокных транслокациях и LOH, простирающихся от места разрыва до дистальной теломеры, если они встречаются в G2. Репликация, индуцированная разрывом, представляет собой вариант HR, в котором после инвазии цепи, репликация ДНК продолжается до конца хромосомы. Таким образом, существует множество механизмов, с помощью которых HR может промотировать LOH.[000306] There are several forms of homologous recombination repair, including single-strand annealing, gene conversion, crossovers, and disruption-induced replication. Single-strand annealing is a minor form of HR repair in which homologous single-stranded sequences on either side of a resected DSB anneal, resulting in chromosome restoration. Single-strand annealing generates deletions of varying sizes depending on the distance separating the two regions of sequence homology. Gene conversion involves the non-reciprocal exchange of genetic information from one molecule to its homolog, resulting directly from HR by copying genetic information from the homologous chromosome. It can result in localized LOH when the homologous sequences are not identical. Typically, the extent of gene conversion is limited to a few hundred base pairs. However, long-tract gene conversion has been reported in some genetic backgrounds, including RAD51C deficiency. See Nagaraju et al. (2006) Mol. Cell. Biol. 26: 8075–8086, incorporated herein by reference in its entirety for all purposes. Crossovers can occur, for example, between homologous chromosomes and can result in reciprocal translocations if they occur in G1 or nonreciprocal translocations and LOH extending from the breakpoint to the distal telomere if they occur in G2. Break-induced replication is a variant of HR in which, after strand invasion, DNA replication continues to the end of the chromosome. Thus, there are multiple mechanisms by which HR can promote LOH.

[000307] Таким образом, в некоторых способах, описанных в данном документе, клетка была модифицирована для уменьшения или устранения, или увеличения экспрессии или активности факторов, участвующих в HR. Например, в некоторых способах, клетка была модифицирована для увеличения экспрессии или активности RAD51, RAD52, RAD54, RAD55, RAD51C, BRCA1, и/или BRCA2. В других способах, клетка была модифицирована для уменьшения или исключения экспрессии, или активности RAD51, RAD52, RAD54, RAD55, RAD51C, BRCA1, и/или BRCA2.[000307] Thus, in some methods described herein, a cell has been modified to reduce or eliminate, or increase the expression or activity of factors involved in HR. For example, in some methods, a cell has been modified to increase the expression or activity of RAD51, RAD52, RAD54, RAD55, RAD51C, BRCA1, and/or BRCA2. In other methods, a cell has been modified to reduce or eliminate the expression or activity of RAD51, RAD52, RAD54, RAD55, RAD51C, BRCA1, and/or BRCA2.

[000308] В некоторых способах, экспрессия или активность других белков, участвующих в регуляции NHEJ и/или HR, может быть изменена. Например, в некоторых способах клетка была модифицирована для уменьшения или исключения экспрессии, или активности Chk2, для уменьшения или исключения экспрессии, или активности Clspn, для уменьшения или исключения экспрессии, или активности Setd2, для увеличения экспрессии или активности Kat2a и/или для увеличения экспрессии или активность Rad51. В других способах клетка была модифицирована для увеличения экспрессии или активности Chk2, для увеличения экспрессии или активности Clspn, для увеличения экспрессии или активности Setd2, для уменьшения или исключения экспрессии, или активности Kat2a, и/или для уменьшения или исключения экспрессии, или активности Rad51.[000308] In some methods, the expression or activity of other proteins involved in regulating NHEJ and/or HR can be altered. For example, in some methods, a cell has been modified to decrease or eliminate the expression or activity of Chk2, to decrease or eliminate the expression or activity of Clspn, to decrease or eliminate the expression or activity of Setd2, to increase the expression or activity of Kat2a, and/or to increase the expression or activity of Rad51. In other methods, a cell has been modified to increase the expression or activity of Chk2, to increase the expression or activity of Clspn, to increase the expression or activity of Setd2, to decrease or eliminate the expression or activity of Kat2a, and/or to decrease or eliminate the expression or activity of Rad51.

[000309] Chk2 (также известный как Chek2 и Rad53; гомолог S. pombe представляет собой Cdsl) представляет собой серин/треониновую протеинкиназу, необходимую для остановки клеточного цикла, опосредованного контрольной точкой, активации репарации ДНК и апоптоза в ответ на наличие двухцепочечных разрывов ДНК. См. Blaikley et al. (2014) Nucleic Acids Research 42: 5644-5656, включенный в данный документ в качестве ссылки во всей полноте для всех целей. Clspn (также известный как Claspin; гомолог S. pombe представляет собой Mrcl) является белком, необходимым для остановки клеточного цикла, опосредованного контрольной точкой, в ответ на повреждение ДНК. Сообщается, что удаление гомологов Chk2 или Clspn в S. pombe приводит к гипер-рекомбинантному фенотипу, демонстрирующему значительно повышенные уровни конверсии гена, индуцированного разрывом, по сравнению с диким типом. В частности, сообщалось, что уровни конверсии генов были значительно увеличены, тогда как сообщалось, что уровни не гомологичного соединения концов (NHEJ), конверсии сестринских хроматид (SCC) и потеря гетерозиготности (LOH) снижаются. См. Blaikley et al. (2014) Nucleic Acids Research 42: 5644-5656.[000309] Chk2 (also known as Chek2 and Rad53; the S. pombe homolog is Cdsl) is a serine/threonine protein kinase required for checkpoint-mediated cell cycle arrest, activation of DNA repair, and apoptosis in response to the presence of DNA double-strand breaks. See Blaikley et al. (2014) Nucleic Acids Research 42: 5644–5656, incorporated herein by reference in its entirety for all purposes. Clspn (also known as Claspin; the S. pombe homolog is Mrcl) is a protein required for checkpoint-mediated cell cycle arrest in response to DNA damage. Deletion of Chk2 or Clspn homologs in S. pombe was reported to result in a hyper-recombinant phenotype exhibiting significantly elevated levels of break-induced gene conversion compared to wild type. Specifically, gene conversion levels were reported to be significantly increased, whereas levels of non-homologous end joining (NHEJ), sister chromatid conversion (SCC), and loss of heterozygosity (LOH) were reported to be decreased. See Blaikley et al. (2014) Nucleic Acids Research 42: 5644–5656.

[000310] Kat2a (также известный как Gcn5 и Gcn5l2) представляет собой убиквитарную гистоновую ацетилтрансферазу, которая способствует активации транскрипции и, как сообщается, связана с репарацией двухцепочечного разрыва. Kat2a-зависимое гистоновое Н3-лизин 36 (H3K36) ацетилирование увеличивает доступность хроматина, увеличивает резекцию и способствует гомологичной рекомбинации при подавлении не гомологичного соединения концов. См. Pai et al. (2014) Nat. Commun. 5: 4091, включенный в данный документ в качестве ссылки во всей полноте для всех целей. Setd2 (также известный как Kiaa1732, Kmt3a и Set2) представляет собой гистоновую метилтрансферазу, которая специфически представляет собой триметилаты лизина 36 гистона Н3 (H3K36me3) с использованием деметилированного лизина 36 (H3K36me2) в качестве субстрата. Setd2-зависимое метилирование H3K36 уменьшает доступность хроматина, уменьшает резекцию и промотирует NHEJ. См. Pai et al. (2014) Nat. Commun. 5: 4091.[000310] Kat2a (also known as Gcn5 and Gcn5l2) is a ubiquitous histone acetyltransferase that promotes transcriptional activation and has been reported to be associated with double-strand break repair. Kat2a-dependent histone H3-lysine 36 (H3K36) acetylation increases chromatin accessibility, enhances resection, and promotes homologous recombination while suppressing non-homologous end joining. See Pai et al. (2014) Nat. Commun. 5: 4091, incorporated herein by reference in its entirety for all purposes. Setd2 (also known as Kiaa1732, Kmt3a, and Set2) is a histone methyltransferase that specifically trimethylates histone H3 lysine 36 (H3K36me3) using demethylated lysine 36 (H3K36me2) as a substrate. Setd2-dependent H3K36 methylation reduces chromatin accessibility, attenuates resection, and promotes NHEJ. See Pai et al. (2014) Nat. Commun. 5: 4091.

[000311] Rad 51 (также известный как Reca, Rad51A и ДНК репарационный белок Rad51 гомолог 1) представляет собой белок, который функционирует с Rad52 и другими белками для осуществления обмена цепей во время гомологичной рекомбинации, образуя гетеродуплексную ДНК, которая разрешается путем репарации несовпадений, чтобы получить тракт конверсии гена. Сообщалось, что в клетках млекопитающих избыточная экспрессия Rad51 и Rad52 увеличивает частоту гомологичной рекомбинации и конверсии генов. См. Yanez & Porter (1999) Gene Ther. 6: 1282-1290 и Lambert & Lopez (2000) EMBO J. 19: 3090-3099, включенный в данный документ в качестве ссылки во всей полноте для всех целей.[000311] Rad 51 (also known as Reca, Rad51A, and DNA repair protein Rad51 homolog 1) is a protein that functions with Rad52 and other proteins to effect strand exchange during homologous recombination, forming heteroduplex DNA that is resolved by mismatch repair to yield the gene conversion tract. In mammalian cells, overexpression of Rad51 and Rad52 has been reported to increase the frequency of homologous recombination and gene conversion. See Yanez & Porter (1999) Gene Ther. 6: 1282-1290 and Lambert & Lopez (2000) EMBO J. 19: 3090-3099, incorporated herein by reference in its entirety for all purposes.

[000312] Модификации в экспрессии или активности генов, участвующих в регуляции NHEJ, конверсия генов, и/или репарация, связанная с гомологией, могут быть пространственно-или временно-специфичными, а также могут быть индуцибельными или временными и обратимыми. Например, могут быть созданы различные формы кассет, позволяющие проводить делецию в определенных клеточных или тканевых типах, на определенных стадиях развития или при индукции. Такие кассеты могут использовать рекомбинатную систему, в которой кассета фланкирована с обеих сторон сайтами распознавания рекомбиназы и может быть удалена с использованием рекомбиназы, экспрессированной в желаемом типе клеток, экспрессированной на желаемой стадии развития или экспрессированной или активированной при индукции. Такие кассеты могут быть дополнительно сконструированы так, чтобы включать в себя массив пар различных сайтов распознавания рекомбиназы, которые помещены таким образом, что могут быть сгенерированы нулевые, условные или комбинированные условные/нулевые аллели, как описано в US 2011/0104799, включенном в данный документ в качестве ссылки во всей его полноте для всех целей. Регулирование генов рекомбиназы можно контролировать различными способами, такими как функциональное связывание гена рекомбиназы с клетка-специфическим, ткане-специфическим, или регулируемым развитием промотором (или другим регуляторным элементом) или путем функционального связывания гена рекомбиназы с 3'-UTR, который содержит сайт распознавания для миРНК, который активен только в конкретных типах клеток, типах тканей или этапах развития. Рекомбиназу также можно регулировать, например, с использованием слитого белка, располагающего рекомбиназу под контролем эффектора или метаболита (например, CreERT2, активность которого положительно контролируется тамоксифеном) или путем размещения гена рекомбиназы под контролем индуцибельного промотора (например, тот, чья активность контролируется с помощью доксициклина и TetR или вариантов TetR). Примеры различных форм кассет и средств регулирования рекомбиназных генов приведены, например, в US 8518392; US 8354389; и US 8697851, каждый из которых включен в качестве ссылки во всей своей полноте.[000312] Modifications in the expression or activity of genes involved in the regulation of NHEJ, gene conversion, and/or homology-related repair may be spatially or temporally specific, and may be inducible or transient and reversible. For example, different forms of cassettes may be created to allow deletion in specific cell or tissue types, at specific developmental stages, or upon induction. Such cassettes may utilize a recombinant system in which the cassette is flanked on both sides by recombinase recognition sites and can be removed using a recombinase expressed in the desired cell type, expressed at a desired developmental stage, or expressed or activated upon induction. Such cassettes can further be designed to include an array of pairs of different recombinase recognition sites that are arranged such that null, conditional, or combined conditional/null alleles can be generated, as described in US 2011/0104799, incorporated herein by reference in its entirety for all purposes. Regulation of the recombinase genes can be controlled in a variety of ways, such as by operatively linking the recombinase gene to a cell-specific, tissue-specific, or developmentally regulated promoter (or other regulatory element) or by operatively linking the recombinase gene to a 3' UTR that contains a recognition site for miRNA that is active only in specific cell types, tissue types, or developmental stages. The recombinase may also be regulated, for example, by using a fusion protein placing the recombinase under the control of an effector or metabolite (e.g., CreER T2 , the activity of which is positively controlled by tamoxifen) or by placing the recombinase gene under the control of an inducible promoter (e.g., one whose activity is controlled by doxycycline and TetR or TetR variants). Examples of various forms of recombinase gene cassettes and regulatory means are provided, for example, in U.S. Patent No. 8,518,392; U.S. Patent No. 8,354,389; and U.S. Patent No. 8,697,851, each of which is incorporated by reference in its entirety.

[000313] В других способах, описанных в данном документе, клетка была модифицирована для увеличения или уменьшения активности NHEJ или для увеличения конверсии генов или активности HDR путем блокирования клетки на фазе клеточного цикла, такой как М-фаза или S-фаза клеточного цикла. См., например, WO 2016/036754, включенную в данном документе в качестве ссылок в полном объеме для всех целей. Это может быть достигнуто с помощью композиции блокировки клеточного цикла. Примеры таких композиций включают нокодазол, гидроксимочевину; колхицин; демеколцин (колцемид); ловастатин; мимозин; тимидин; афидиколин; латрункулин А; и латрункулин В. Такие модификации могут содержать модификации в экспрессии или активности генов, участвующих в регуляции NHEJ, конверсии генов и/или HDR.[000313] In other methods described herein, a cell has been modified to increase or decrease NHEJ activity, or to increase gene conversion or HDR activity, by arresting the cell in a cell cycle phase, such as the M phase or S phase of the cell cycle. See, for example, WO 2016/036754, incorporated herein by reference in its entirety for all purposes. This can be achieved using a cell cycle arrest composition. Examples of such compositions include nocodazole, hydroxyurea; colchicine; demecolcine (colcemid); lovastatin; mimosine; thymidine; aphidicolin; latrunculin A; and latrunculin B. Such modifications may comprise modifications in the expression or activity of genes involved in the regulation of NHEJ, gene conversion, and/or HDR.

G. Типы нацеленных генетических модификацийG. Types of targeted genetic modifications

[000314] Различные типы нацеленных генетических модификаций могут быть введены с использованием описанных в данном документе способов. Такие нацеленные генетические модификации могут включать в себя любую модификацию, которая уменьшает или устраняет экспрессию аутоантигена, который гомологичен или разделяет представляющий интерес эпитоп с представляющим интерес чужеродным антигеном-мишенью. Предпочтительно такие модификации разрушают геномный локус-мишень. Примеры разрушения включают в себя изменение регуляторного элемента (например, промотора или энхансера), миссенс-мутацию, нонсенс-мутацию, мутацию со сдвигом рамки, мутацию усечения, нулевую мутацию, или вставку или делецию небольшого количества нуклеотидов (например, вызывая мутацию сдвига рамки). Нарушение может привести к инактивации (т.е. потере функции) или к потере аллеля. Такие нацеленные генетические модификации могут включать, например, вставку одного или более нуклеотидов, делецию одного или более нуклеотидов, или замену (замещение) одного или более нуклеотидов. Такие вставки, делеции или замены могут приводить, например, к точечной мутации, нокауту представляющей интерес последовательности нуклеиновой кислоты или ее части, нокину представляющей интерес последовательности нуклеиновой кислоты или ее части, замену эндогенной последовательности нуклеиновой кислоты с гетерологичной или экзогенной последовательностью нуклеиновой кислоты, изменению регуляторного элемента (например, промотора или энхансера), миссенс-мутации, нонсенс-мутации, мутации со сдвигом рамки, мутации усечения, нулевой мутации, или их комбинации. Например, по меньшей мере 1, 2, 3, 4, 5, 7, 8, 9, 10 или более нуклеотидов могут быть изменены (например, удалены, вставлены или замещены), чтобы сформировать нацеленную генетическую модификацию. Делеции, вставки или замены могут быть любого размера, как описано в другом месте данного документа. См., например, Wang et al. (2013) Celt 153: 910-918; Mandalos et al. (2012) PLOSOne 7: e45768; и Wang et al. (2013) Nat Biotechnol. 31: 530-532, каждая из которых включена в настоящее описание посредством ссылки. Такие мутации могут приводить к уменьшению экспрессии или устранению экспрессии (например, мРНК и/или экспрессии белка) аутоантигена (например, делеция аллеля).[000314] Various types of targeted genetic modifications can be introduced using the methods described herein. Such targeted genetic modifications can include any modification that reduces or eliminates the expression of a self-antigen that is homologous to or shares an epitope of interest with a foreign target antigen of interest. Preferably, such modifications disrupt a target genomic locus. Examples of disruption include an alteration of a regulatory element (e.g., a promoter or enhancer), a missense mutation, a nonsense mutation, a frameshift mutation, a truncation mutation, a null mutation, or the insertion or deletion of a small number of nucleotides (e.g., causing a frameshift mutation). The disruption can result in inactivation (i.e., loss of function) or loss of an allele. Such targeted genetic modifications may include, for example, an insertion of one or more nucleotides, a deletion of one or more nucleotides, or a substitution (replacement) of one or more nucleotides. Such insertions, deletions, or substitutions may result in, for example, a point mutation, a knockout of a nucleic acid sequence of interest or a portion thereof, a knockin of a nucleic acid sequence of interest or a portion thereof, a replacement of an endogenous nucleic acid sequence with a heterologous or exogenous nucleic acid sequence, an alteration of a regulatory element (e.g., a promoter or enhancer), a missense mutation, a nonsense mutation, a frameshift mutation, a truncation mutation, a null mutation, or a combination thereof. For example, at least 1, 2, 3, 4, 5, 7, 8, 9, 10, or more nucleotides may be altered (e.g., deleted, inserted, or substituted) to form a targeted genetic modification. Deletions, insertions, or substitutions may be of any size, as described elsewhere herein. See, e.g., Wang et al. (2013) Celt 153: 910-918; Mandalos et al. (2012) PLOSOne 7: e45768; and Wang et al. (2013) Nat Biotechnol. 31: 530-532, each of which is incorporated herein by reference. Such mutations may result in decreased expression or elimination of expression (e.g., mRNA and/or protein expression) of the self-antigen (e.g., allele deletion).

[000315] Нацеленная генетическая модификация (например, вставка, делеция или замещение) может происходить в одном или более местах в геномном локусе-мишени. Например, нацеленная генетическая модификация может содержать две отдельные модификации в двух местах в геномном локусе-мишени, если используются две экзогенные матрицы для репарации.[000315] A targeted genetic modification (e.g., an insertion, deletion, or substitution) may occur at one or more locations within a target genomic locus. For example, a targeted genetic modification may comprise two separate modifications at two locations within a target genomic locus if two exogenous repair templates are used.

[000316] В способах, в которых используется экзогенная матрица для репарации, например, делеция может быть между 5'- и 3'-последовательностью-мишенью. В способах, в которых используются две или более направляющие РНК, делеция может быть между последовательностями, распознаваемыми первой и второй направляющими РНК, или первым и вторым сайтами расщепления Cas. Такие делеции могут быть любой длины. Удаленная нуклеиновая кислота может быть, например, от около 1 п.о. до около 5 п.о., от около 5 п.о. до около 10 п.о., от около 10 п.о. до около 50 п.о., от около 50 п.о. до около 100 п.о., от около 100 п.о. до около 200 п.о., от около 200 п.о. до около 300 п.о., от около 300 п.о. до около 400 п.о., от около 400 п.о. до около 500 п.о., от около 500 п.о. до около 1 т.п.о., от около 1 т.п.о. до около 5 т.п.о., от около 5 т.п.о. до около 10 т.п.о., от около 10 т.п.о. до около 20 т.п.о., от около 20 т.п.о. до около 40 т.п.о., от около 40 т.п.о. до около 60 т.п.о., от около 60 т.п.о. до около 80 т.п.о., от около 80 т.п.о. до около 100 т.п.о., от около 100 т.п.о. до около 150 т.п.о., или от около 150 т.п.о. до около 200 т.п.о., от около 200 т.п.о. до около 300 т.п.о., от около 300 т.п.о. до около 400 т.п.о., от около 400 т.п.о. до около 500 т.п.о., от около 500 т.п.о. до около 1 Мб, от около 1 Мб до около 1,5 Мб, от около 1,5 Мб до около 2 Мб, от около 2 Мб до 2,5 около Мб, или от около 2,5 Мб до около 3 Мб.[000316] In methods that use an exogenous template for repair, for example, the deletion can be between the 5' and 3' target sequence. In methods that use two or more guide RNAs, the deletion can be between the sequences recognized by the first and second guide RNAs, or the first and second Cas cleavage sites. Such deletions can be of any length. The deleted nucleic acid can be, for example, from about 1 bp to about 5 bp, from about 5 bp to about 10 bp, from about 10 bp to about 50 bp, from about 50 bp to about 100 bp, from about 100 bp to about 200 bp, from about 200 bp to about 200 bp, to about 300 bp, from about 300 bp to about 400 bp, from about 400 bp to about 500 bp, from about 500 bp to about 1 kb, from about 1 kb to about 5 kb, from about 5 kb to about 10 kb, from about 10 kb to about 20 kb, from about 20 kb to about 40 kb, from about 40 kb to about 60 kb, from about 60 kb to about 80 kb, from about 80 kb to about 100 kb, from about 100 kb to about 150 kb, or from about 150 kb to about 200 kb, from about 200 kb to about 300 kb, from about 300 kb to about 400 kb, from about 400 kb to about 500 kb, from about 500 kb to about 1 MB, from about 1 MB to about 1.5 MB, from about 1.5 MB to about 2 MB, from about 2 MB to about 2.5 MB, or from about 2.5 MB to about 3 MB.

[000317] Альтернативно, удаленная нуклеиновая кислота может составлять, например, по меньшей мере 1 п.о., по меньшей мере 5 п.о., по меньшей мере 10 п.о., по меньшей мере 50 п.о., по меньшей мере 100 п.о., по меньшей мере 200 п.о., по меньшей мере 300 п.о., по меньшей мере 400 п.о., по меньшей мере 500 п.о., по меньшей мере 1 т.п.о., по меньшей мере 5 т.п.о., по меньшей мере 10 т.п.о., по меньшей мере 20 т.п.о., по меньшей мере 30 т.п.о., по меньшей мере 40 т.п.о., по меньшей мере 50 т.п.о., по меньшей мере 60 т.п.о., по меньшей мере 70 т.п.о., по меньшей мере 80 т.п.о., по меньшей мере 90 т.п.о., по меньшей мере 100 т.п.о., по меньшей мере 110 т.п.о., по меньшей мере 120 т.п.о., по меньшей мере 130 т.п.о., по меньшей мере 140 т.п.о., по меньшей мере 150 т.п.о., по меньшей мере 160 т.п.о., по меньшей мере 170 т.п.о., по меньшей мере 180 т.п.о., по меньшей мере 190 т.п.о., по меньшей мере 200 т.п.о., по меньшей мере 250 т.п.о., по меньшей мере 300 т.п.о., по меньшей мере 350 т.п.о., по меньшей мере 400 т.п.о., по меньшей мере 450 т.п.о. или по меньшей мере 500 т.п.о. или более. В некоторых случаях удаленная нуклеиновая кислота может составлять по меньшей мере 550 т.п.о., по меньшей мере 600 т.п.о., по меньшей мере 650 т.п.о., по меньшей мере 700 т.п.о., по меньшей мере 750 т.п.о., по меньшей мере 800 т.п.о., по меньшей мере 850 т.п.о., по меньшей мере 900 т.п.о., по меньшей мере 950 т.п.о., по меньшей мере 1 Мб, по меньшей мере 1,5 Мб, по меньшей мере 2 Мб, по меньшей мере 2,5 Мб, по меньшей мере 3 Мб, по меньшей мере 4 Мб, по меньшей мере 5 Мб, по меньшей мере 10 Мб, по меньшей мере 20 Мб, по меньшей мере 30 Мб, по меньшей мере 40 Мб, по меньшей мере 50 Мб, по меньшей мере 60 Мб, по меньшей мере 70 Мб, по меньшей мере 80 Мб, по меньшей мере 90 Мб или по меньшей мере 100 Мб (например, большая часть хромосомы).[000317] Alternatively, the deleted nucleic acid can be, for example, at least 1 bp, at least 5 bp, at least 10 bp, at least 50 bp, at least 100 bp, at least 200 bp, at least 300 bp, at least 400 bp, at least 500 bp, at least 1 kb, at least 5 kb, at least 10 kb, at least 20 kb, at least 30 kb, at least 40 kb, at least 50 kb, at least 60 kb, at least 70 kb, at least at least 80 kbp, at least 90 kbp, at least 100 kbp, at least 110 kbp, at least 120 kbp, at least 130 kbp, at least 140 kbp, at least 150 kbp, at least 160 kbp, at least 170 kbp, at least 180 kbp, at least 190 kbp, at least 200 kbp, at least 250 kbp, at least 300 kbp, at least 350 kbp, at least 400 kbp, at least 450 etc. or at least 500 thousand p.p. or more. In some cases, the deleted nucleic acid may be at least 550 kb, at least 600 kb, at least 650 kb, at least 700 kb, at least 750 kb, at least 800 kb, at least 850 kb, at least 900 kb, at least 950 kb, at least 1 Mb, at least 1.5 Mb, at least 2 Mb, at least 2.5 Mb, at least 3 Mb, at least 4 Mb, at least 5 Mb, at least 10 Mb, at least 20 Mb, at least 30 Mb, at least 40 Mb, at least 50 Mb, at least 60 Mb, at least 70 Mb, at least 80 Mb, at least 90 Mb, or at least 100 Mb (e.g., most of a chromosome).

[000318] В конкретном примере, размер делеции может составлять между около 0,1 т.п.о. и около 1 Мб, между около 0,1 т.п.о. и около 900 т.п.о., между около 0,1 т.п.о. и около 400 т.п.о., между около 0,1 т.п.о. и около 200 т.п.о., между около 0,1 т.п.о. и около 100 т.п.о., или до около 1 Мб, до около 900 т.п.о., до около 400 т.п.о., до около 200 т.п.о. или до около 100 т.п.о. В конкретном примере, размер делеции может быть между около 0,1-200, 0,1-190, 0,1-180, 0,1-170, 0,1-160, 0,1-150, 0,1-140, 0,1-130, 0,1-120, 0,1- 110, 0,1-100, 0,1-90, 0,1-80, 0,1-70, 0,1-60, 0,1-50, 0,1-40, 0,1-30, 0,1-20 0,1-10, 0,1-9, 0,1-8, 0,1 -7, 0,1-6, 0,1-5, 0,1-4, 0,1-3, 0,1-2 или 0,1-1 т.п.о. Эффективность биаллельной делеции (разрушения) в целевых клеточных клонах, таких как целевые клоны эмбриональных стволовых клеток (то есть процент скринированных клонов с биаллельной делецией), может составлять между около 1-100%, 1-90%, 1-80%, 1-70%, 1-60%, 1-50%, 1-40%, 1-30%, или 1-27%, или могут составлять по меньшей мере около 1%, 2%, 3%, 4%, 5% 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20% или 25%. Например, в одном варианте осуществления размер делеции составляет около 50 т.п.о. или менее, а эффективность биаллельной делеции составляет между около 1-30% или 1-27%, или размер делеции составляет около 50 т.п.о. или выше (например, между около 50 т.п.о. до около 200 т.п.о.), а эффективность биаллельной делеции составляет около 1-5% или 1-3%. В экспериментах, в которых нацелены эмбрионы на одноклеточной стадии, эффективность биаллельной делеции (разрушение) у живых щенков, родившихся после введения CRISPR/Cas в эмбрионы на одноклеточной стадии (т.е. процент живых щенков с биаллельными делециями), может быть между около 1-100%, 1-90% или 1-85%, или по меньшей мере около 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80% или 85%. Например, в одном варианте осуществления размер делеции составляет около 50 т.п.о. или менее, а эффективность биаллельной делеции составляет между около 1-85% или 20-85%, или размер делеции составляет около 50 т.п.о. или выше (например, между около 50 т.п.о. до около 100 т.п.о.), а эффективность биаллельной делеции составляет около 1-20% или 1-15%.[000318] In a specific example, the size of the deletion may be between about 0.1 kb and about 1 Mb, between about 0.1 kb and about 900 kb, between about 0.1 kb and about 400 kb, between about 0.1 kb and about 200 kb, between about 0.1 kb and about 100 kb, or up to about 1 Mb, up to about 900 kb, up to about 400 kb, up to about 200 kb, or up to about 100 kb. In a specific example, the deletion size may be between about 0.1-200, 0.1-190, 0.1-180, 0.1-170, 0.1-160, 0.1-150, 0.1-140, 0.1-130, 0.1-120, 0.1-110, 0.1-100, 0.1-90, 0.1-80, 0.1-70, 0.1-60, 0.1-50, 0.1-40, 0.1-30, 0.1-20, 0.1-10, 0.1-9, 0.1-8, 0.1-7, 0.1-6, 0.1-5, 0.1-4, 0.1-3, 0.1-2, or 0.1-1 kb. The efficiency of biallelic deletion (disruption) in target cell clones, such as target embryonic stem cell clones (i.e., the percentage of clones screened with a biallelic deletion) may be between about 1-100%, 1-90%, 1-80%, 1-70%, 1-60%, 1-50%, 1-40%, 1-30%, or 1-27%, or may be at least about 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, or 25%. For example, in one embodiment, the deletion size is about 50 kb or less and the biallelic deletion efficiency is between about 1-30% or 1-27%, or the deletion size is about 50 kb or greater (e.g., between about 50 kb to about 200 kb) and the biallelic deletion efficiency is about 1-5% or 1-3%. In experiments that target one-cell stage embryos, the biallelic deletion (disruption) efficiency in live puppies born following CRISPR/Cas introduction into one-cell stage embryos (i.e., the percentage of live puppies with biallelic deletions) can be between about 1-100%, 1-90%, or 1-85%, or at least about 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, or 85%. For example, in one embodiment, the deletion size is about 50 kb or less and the biallelic deletion efficiency is between about 1-85% or 20-85%, or the deletion size is about 50 kb or greater (e.g., between about 50 kb to about 100 kb) and the biallelic deletion efficiency is about 1-20% or 1-15%.

[000319] В способах, в которых используется экзогенная матрица для репарации, например, вставка может быть между 5'- и 3'-последовательностью-мишенью. Такие вставки могут иметь любую длину. Например, вставленная нуклеиновая кислота может быть, например, от около 1 п.о. до около 5 п.о., от около 5 п.о. до около 10 п.о., от около 10 п.о. до около 50 п.о., от около 50 п.о. до около 100 п.о., от около 100 п.о. до около 200 п.о., от около 200 п.о. до около 300 п.о., от около 300 п.о. до около 400 п.о., от около 400 п.о. до около 500 п.о., от около 500 п.о. до около 1 т.п.о., от около 1 т.п.о. до около 5 т.п.о., от около 5 т.п.о. до около 10 т.п.о., от около 10 т.п.о. до около 20 т.п.о., от около 20 т.п.о. до около 40 т.п.о., от около 40 т.п.о. до около 60 т.п.о., от около 60 т.п.о. до около 80 т.п.о., от около 80 т.п.о. до около 100 т.п.о., от около 100 т.п.о. до около 150 т.п.о., или от около 150 т.п.о. до около 200 т.п.о., от около 200 т.п.о. до около 250 т.п.о., от около 250 т.п.о. до около 300 т.п.о., от около 300 т.п.о. до около 350 т.п.о., от около 350 т.п.о. до около 400 т.п.о., от около 400 т.п.о. до около 450 т.п.о., от около 450 т.п.о. до около 500 т.п.о. или более. Альтернативно, ставка может составлять по меньшей мере 1 п.о., по меньшей мере 5 п.о., по меньшей мере 10 п.о., по меньшей мере 50 п.о., по меньшей мере 100 п.о., по меньшей мере 200 п.о., по меньшей мере 300 п.о., по меньшей мере 400 п.о., по меньшей мере 500 п.о., по меньшей мере 1 т.п.о., по меньшей мере 5 т.п.о., по меньшей мере 10 т.п.о., по меньшей мере 20 т.п.о., по меньшей мере 30 т.п.о., по меньшей мере 40 т.п.о., по меньшей мере 60 т.п.о., по меньшей мере 80 т.п.о., по меньшей мере 100 т.п.о., по меньшей мере 150 т.п.о., по меньшей мере 200 т.п.о., по меньшей мере 250 т.п.о., по меньшей мере 300 т.п.о., по меньшей мере 350 т.п.о., по меньшей мере 400 т.п.о., по меньшей мере 450 т.п.о. или, по меньшей мере 500 т.п.о.[000319] In methods that utilize an exogenous template for repair, for example, the insertion can be between the 5' and 3' target sequence. Such insertions can be of any length. For example, the inserted nucleic acid can be, for example, from about 1 bp to about 5 bp, from about 5 bp to about 10 bp, from about 10 bp to about 50 bp, from about 50 bp to about 100 bp, from about 100 bp to about 200 bp, from about 200 bp to about 300 bp, from about 300 bp to about 400 bp, from about 400 bp to about 500 bp, from about 500 bp. up to about 1 kbp, from about 1 kbp to about 5 kbp, from about 5 kbp to about 10 kbp, from about 10 kbp to about 20 kbp, from about 20 kbp to about 40 kbp, from about 40 kbp to about 60 kbp, from about 60 kbp to about 80 kbp, from about 80 kbp to about 100 kbp, from about 100 kbp to about 150 kbp, or from about 150 kbp to about 200 kbp, from about 200 kbp up to about 250 kbp, from about 250 kbp to about 300 kbp, from about 300 kbp to about 350 kbp, from about 350 kbp to about 400 kbp, from about 400 kbp to about 450 kbp, from about 450 kbp to about 500 kbp or more. Alternatively, the rate may be at least 1 p.p., at least 5 p.p., at least 10 p.p., at least 50 p.p., at least 100 p.p., at least 200 p.p., at least 300 p.p., at least 400 p.p., at least 500 p.p., at least 1 k.p., at least 5 k.p., at least 10 k.p., at least 20 k.p., at least 30 k.p., at least 40 k.p., at least 60 k.p., at least 80 k.p., at least 100 k.p., at least 150 k.p., at least 200 kbp, at least 250 kbp, at least 300 kbp, at least 350 kbp, at least 400 kbp, at least 450 kbp, or at least 500 kbp.

[000320] Нацеленная генетическая модификация может быть точной модификацией или неточной модификацией. Например, в способах, использующих экзогенную матрицу для репарации, делеция может быть точной делецией, в которой удаленная нуклеиновая кислота состоит только из последовательности нуклеиновой кислоты между 5'- и 3'-гомологическими плечами, так что нет никаких дополнительных вставок или делеций (инделей) в модифицированном геномном локусе-мишени. Аналогично, если используются спаренные гРНК, которые фланкируют весь кодирующий участок гена, кодирующего аутоантиген, делеция между первым и вторым сайтами расщепления белка Cas может быть точной делецией, в которой удаленная нуклеиновая кислота состоит только из последовательности нуклеиновой кислоты между первым и вторым сайтами расщепления белка Cas, так что в модифицированном геномном локусе-мишени нет дополнительных вставок или делеций (инделей). В способах, в которых используются как экзогенная матрица для репарации, так и спаренные гРНК, фланкирующие представляющий интерес участок, делеция может быть либо точной делецией, упомянутой выше. Альтернативно, делеция между первым и вторым сайтами расщепления белка Cas может быть неточной делецией, выходящей за пределы первого и второго сайтов расщепления белка Cas, что согласуется с неточной репарацией путем не гомологичного соединения концов (NHEJ), что приводит к дополнительным делециям и/или вставкам в модифицированном геномном локусе. Например, делеция может распространяться около на 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 300, 400 или 500 п.о. или более за пределы первого и второго сайтов расщепления белка Cas. Аналогично, модифицированный геномный локус может содержать дополнительные вставки, согласующиеся с неточной репарацией с помощью NHEJ, такие как вставки около 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 300, 400, или 500 п.о. или более. Использование экзогенных матриц для репарации (например, одноцепочечные олигодезоксинуклеотиды (ssODN) вместе с CRISPR/Cas9 могут увеличить шансы на точные модификации с помощью промотирования гомолог-направленной репарации, а не NHEJ.[000320] The targeted genetic modification may be a precise modification or a non-precise modification. For example, in methods using an exogenous template for repair, the deletion may be a precise deletion in which the deleted nucleic acid consists only of the nucleic acid sequence between the 5' and 3' homology arms, such that there are no additional insertions or deletions (indels) in the modified target genomic locus. Similarly, if paired gRNAs are used that flank the entire coding region of a gene encoding an autoantigen, the deletion between the first and second Cas protein cleavage sites may be a precise deletion in which the deleted nucleic acid consists only of the nucleic acid sequence between the first and second Cas protein cleavage sites, such that there are no additional insertions or deletions (indels) in the modified target genomic locus. In methods that utilize both an exogenous repair template and paired gRNAs flanking the region of interest, the deletion may be either a precise deletion as described above. Alternatively, the deletion between the first and second Cas protein cleavage sites may be a non-precise deletion extending beyond the first and second Cas protein cleavage sites, consistent with non-homologous end joining (NHEJ) non-precise repair, resulting in additional deletions and/or insertions at the modified genomic locus. For example, the deletion may extend about 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 300, 400, or 500 bp or more beyond the first and second Cas protein cleavage sites. Similarly, the modified genomic locus may contain additional insertions consistent with imprecise repair by NHEJ, such as insertions of approximately 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 300, 400, or 500 bp or more. The use of exogenous repair templates (e.g., single-stranded oligodeoxynucleotides (ssODNs) in conjunction with CRISPR/Cas9 may increase the chances of accurate modifications by promoting homolog-directed repair rather than NHEJ.

[000321] Нацеленная модификация может содержать замещение последовательности в геномном локусе-мишени (например, весь или часть гена, кодирующего аутоантиген, такую как часть гена, кодирующего конкретный участок или мотив аутоантигена) с помощью соответствующей гомологичной или ортологичной последовательности. Делеция всего или части гена, кодирующего аутоантиген, и замещение соответствующей гомологичной или ортологичной последовательностью, которая не содержит эпитоп, который является общим между представляющим интерес чужеродным антигеном и аутоантигеном, может приводить к экспрессии гомолога или ортолога аутоантигена, который сохраняет функцию аутоантигена дикого типа, но не содержит эпитоп, который присутствует в представляющем интерес чужеродном антигене, и является общим с аутоантигеном дикого типа. Альтернативно или дополнительно нацеленная модификация может содержать одну или более точечных мутаций (например, 1, 2, 3, 4, 5 и более) в геномном локусе-мишени (например, весь или часть гена, кодирующего аутоантиген). Такие точечные мутации могут служить, например, для устранения экспрессии одного или более эпитопов в аутоантигене, которые разделяются с представляющим интерес чужеродным антигеном. Необязательно, такие точечные мутации могут приводить к консервативной аминокислотной замене (например, замене аспарагиновой кислоты [Asp, D] глутаминовой кислотой [Glu, Е]) в кодированном полипептиде. Такие замены аминокислот могут приводить к экспрессии аутоантигена, который сохраняет функцию аутоантигена дикого типа, но испытывает недостаток в эпитопе, который присутствует в представляющем интерес чужеродном антигене, и является общим с аутоантигеном дикого типа.[000321] A targeted modification may comprise replacing a sequence at a target genomic locus (e.g., all or part of a gene encoding an autoantigen, such as a portion of a gene encoding a particular region or motif of an autoantigen) with a corresponding homologous or orthologous sequence. Deletion of all or part of a gene encoding an autoantigen and replacement with a corresponding homologous or orthologous sequence that does not contain an epitope that is common between the foreign antigen of interest and the autoantigen may result in expression of a homolog or ortholog of the autoantigen that retains the function of the wild-type autoantigen, but does not contain an epitope that is present in the foreign antigen of interest and is common with the wild-type autoantigen. Alternatively or additionally, a targeted modification may comprise one or more point mutations (e.g., 1, 2, 3, 4, 5, or more) in a target genomic locus (e.g., all or part of a gene encoding an autoantigen). Such point mutations may serve, for example, to abolish the expression of one or more epitopes in the autoantigen that are shared with the foreign antigen of interest. Optionally, such point mutations may result in a conservative amino acid substitution (e.g., substitution of aspartic acid [Asp, D] for glutamic acid [Glu, E]) in the encoded polypeptide. Such amino acid substitutions may result in the expression of an autoantigen that retains the function of the wild-type autoantigen, but lacks an epitope that is present in the foreign antigen of interest and is shared with the wild-type autoantigen.

[000322] Способы, описанные в данном документе, способствуют и увеличивают частоту биаллельных и, в частности, гомозиготных модификаций. В частности, путем приведения в контакт клетки с первой и второй первой и второй направляющими РНК, которые нацелены на последовательности, распознаваемые первой и второй направляющими РНК в геномном локусе-мишени, эффективность продуцирования биаллельных модификаций может быть увеличена по сравнению с приведением в контакт клетки с одной только направляющей РНК. Эффективность продуцирования биаллельных модификаций также может быть увеличена путем приведения в контакт клетки с первой, второй и третьей направляющими РНК, которые нацелены на последовательности, распознаваемые направляющей РНК в геномном локусе-мишени, или первой, второй, третьей и четвертой направляющими РНК, которые нацелены на последовательности, распознаваемые направляющей РНК в геномном локусе-мишени. Кроме того, или альтернативно, эффективность продуцирования биаллельных модификаций и, в частности, гомозиготных модификаций может быть увеличена путем выбора геномного локуса-мишени, так что идентичность последовательности максимизируется между соответствующими первой и второй хромосомами в гомологичной паре хромосом во всей или части геномного локуса-мишени. Способы выбора таких геномных локусов-мишеней более подробно описаны в другом месте в данном документе.[000322] The methods described herein promote and increase the frequency of biallelic, and in particular homozygous, modifications. In particular, by contacting a cell with a first and second first and second guide RNAs that target sequences recognized by the first and second guide RNAs at a target genomic locus, the efficiency of producing biallelic modifications can be increased compared to contacting the cell with a guide RNA alone. The efficiency of producing biallelic modifications can also be increased by contacting the cell with a first, second, and third guide RNAs that target sequences recognized by the guide RNA at a target genomic locus, or a first, second, third, and fourth guide RNA that target sequences recognized by the guide RNA at a target genomic locus. In addition, or alternatively, the efficiency of producing biallelic modifications, and in particular homozygous modifications, can be increased by selecting a genomic target locus such that sequence identity is maximized between the corresponding first and second chromosomes in a homologous pair of chromosomes in all or part of the genomic target locus. Methods for selecting such genomic target loci are described in more detail elsewhere in this document.

[000323] Предпочтительно, нацеленная генетическая модификация представляет собой биаллельную модификацию. Биаллельные модификации включают события, в которых одна и та же модификация производится в одном и том же локусе на соответствующих гомологичных хромосомах (например, в диплоидной клетке), или в которых различные модификации производится в одном и том же локусе на соответствующих гомологичных хромосомах. Гомологичные хромосомы (т.е. гомологичная пара хромосом) включают хромосомы, которые имеют одни и те же гены в одних и тех же локусах, но, возможно, разные аллели (например, хромосомы, которые спарены во время мейоза). Термин аллель включает любую из одной или более альтернативных форм генетической последовательности. В диплоидной клетке или организме два аллеля данной последовательности обычно занимают соответствующие локусы на паре гомологичных хромосом.[000323] Preferably, the targeted genetic modification is a biallelic modification. Biallelic modifications include events in which the same modification is made at the same locus on corresponding homologous chromosomes (e.g., in a diploid cell), or in which different modifications are made at the same locus on corresponding homologous chromosomes. Homologous chromosomes (i.e., a homologous pair of chromosomes) include chromosomes that have the same genes at the same loci, but possibly different alleles (e.g., chromosomes that are paired during meiosis). The term allele includes any of one or more alternative forms of a genetic sequence. In a diploid cell or organism, two alleles of a given sequence typically occupy corresponding loci on a pair of homologous chromosomes.

[000324] Биаллельная модификация может приводить к гомозиготности для нацеленной генетической модификации. Гомозиготность включает ситуации, в которых оба аллеля геномного локуса-мишени (т.е. соответствующие аллели на обеих гомологичных хромосомах) имеют нацеленную генетическую модификацию. Например, биаллельная модификация может содержать, состоять по существу из, или состоять из гомозиготной делеции всего или части гена, кодирующего аутоантиген, или биаллельная модификация может содержать, состоять по существу из, или состоять из гомозиготного нарушения старт-кодона гена, кодирующего аутоантиген, так что старт-кодон больше не функционирует.[000324] A biallelic modification may result in homozygosity for a targeted genetic modification. Homozygosity includes situations in which both alleles of a target genomic locus (i.e., corresponding alleles on both homologous chromosomes) have the targeted genetic modification. For example, a biallelic modification may comprise, consist essentially of, or consist of a homozygous deletion of all or part of a gene encoding a self-antigen, or a biallelic modification may comprise, consist essentially of, or consist of a homozygous disruption of a start codon of a gene encoding a self-antigen such that the start codon no longer functions.

[000325] Альтернативно, биаллельная модификация может приводить к сложной гетерозиготности (например, гемизиготности) для целевой модификации. Сложная гетерозиготность включает ситуации, в которых оба аллеля локуса-мишени (то есть аллели на обеих гомологичных хромосомах) были модифицированы, но они были модифицированы разными путями (например, целевая модификация в одном аллеле и инактивация или нарушение другом аллеле). Например, в аллеле без нацеленной модификации, двухцепочечный разрыв, созданный белком Cas, может быть восстановлен путем репарации ДНК, опосредованной не гомологичного соединения концов (NHEJ), которая продуцирует мутантный аллель, содержащий вставку или делецию последовательности нуклеиновой кислоты и, следовательно, вызывает нарушение этого геномного локуса. Например, биаллельная модификация может приводить к сложной гетерозиготности, если клетка имеет один аллель с целевой модификацией и другой аллель, который не может быть экспрессирован. Сложная гетерозиготность включает гемизиготность. Гемизиготность включает ситуации, в которых присутствует только один аллель (то есть аллель на одной из двух гомологичных хромосом) локуса-мишени. Например, биаллельная модификация может привести к гемизиготности для целевой модификации, если целевая модификация происходит в одном аллеле с соответствующей потерей или делецией другого аллеля.[000325] Alternatively, a biallelic modification may result in compound heterozygosity (e.g., hemizygosity) for the targeted modification. Compound heterozygosity includes situations in which both alleles of a target locus (i.e., alleles on both homologous chromosomes) have been modified, but they have been modified in different ways (e.g., a targeted modification in one allele and inactivation or disruption in the other allele). For example, in an allele without a targeted modification, the double-strand break created by the Cas protein can be repaired by non-homologous end joining (NHEJ)-mediated DNA repair, which produces a mutant allele containing an insertion or deletion of nucleic acid sequence and, therefore, causes disruption of that genomic locus. For example, a biallelic modification can result in compound heterozygosity if a cell has one allele with the target modification and another allele that cannot be expressed. Compound heterozygosity includes hemizygosity. Hemizygosity includes situations in which only one allele (i.e., an allele on one of two homologous chromosomes) of the target locus is present. For example, a biallelic modification can result in hemizygosity for the target modification if the target modification occurs in one allele with a corresponding loss or deletion of the other allele.

[000326] В конкретном примере, биаллельная модификация может содержать гомозиготную делецию между последовательностями, распознаваемыми первой и второй направляющими РНК, или сайтами расщепления Cas в паре первой и второй гомологичных хромосом. Альтернативно, биаллельная модификация может содержать биаллельную делецию между последовательностями, распознаваемыми первой и второй направляющими РНК, или сайтами расщепления Cas в паре первой и второй гомологичных хромосом (т.е. делеций в обеих хромосомах, но не обязательно одинаковые делеций в каждой). Делеций могут происходить одновременно, или делеция может происходить изначально в первой гомологичной хромосоме, тогда как гомозиготность затем достигается с помощью клетки с использованием первой гомологичной хромосомы в качестве донорной последовательности для репарации одного или более двухцепочечных разрывов во второй гомологичной хромосоме через гомологичную рекомбинацию, такую как конверсия генов.[000326] In a specific example, a biallelic modification may comprise a homozygous deletion between sequences recognized by first and second guide RNAs or Cas cleavage sites in a pair of first and second homologous chromosomes. Alternatively, a biallelic modification may comprise a biallelic deletion between sequences recognized by first and second guide RNAs or Cas cleavage sites in a pair of first and second homologous chromosomes (i.e., deletions in both chromosomes, but not necessarily the same deletions in each). The deletions may occur simultaneously, or the deletion may occur initially in the first homologous chromosome, while homozygosity is then achieved by the cell using the first homologous chromosome as a donor sequence to repair one or more double-strand breaks in the second homologous chromosome through homologous recombination, such as gene conversion.

[000327] В другом конкретном примере, биаллельная модификация может содержать гомозиготное разрушение участка старт-кодона гена-мишени в паре первой и второй гомологичных хромосом. Альтернативно, биаллельное разрушение участка старт-кодона гена-мишени в паре первой и второй гомологичных хромосом (т.е. нарушения в обеих хромосомах, но не обязательно одинаковые модификации в каждой). Модификации могут происходить одновременно, или модификация может происходить изначально в первой гомологичной хромосоме, тогда как гомози готность затем достигается с помощью клетки с использован иелл первой гомологичной хромосомы в качестве донорной последовательности для репарации одного или более двухцепочечных разрывов во второй гомологичной хромосоме через гомологичную рекомбинацию, такую как конверсия генов.[000327] In another specific example, a biallelic modification may comprise a homozygous disruption of a region of the start codon of a target gene in a pair of first and second homologous chromosomes. Alternatively, a biallelic disruption of a region of the start codon of a target gene in a pair of first and second homologous chromosomes (i.e., disruptions in both chromosomes, but not necessarily the same modifications in each). The modifications may occur simultaneously, or the modification may occur initially in the first homologous chromosome, while homozygosity is then achieved by the cell using the first homologous chromosome's molecule as a donor sequence to repair one or more double-strand breaks in the second homologous chromosome via homologous recombination, such as gene conversion.

[000328] Если используется донорная последовательность (например, экзогенная матрица для репарации), биаллельная модификация может содержать делецию между последовательностями, распознаваемыми первой и второй направляющими РНК, или сайтами расщепления Cas, а также введение вставки нуклеиновой кислоты между 5' и 3'-последовательностей-мишеней в паре первой и второй гомологичных хромосом, что приводит к гомозиготному модифицированному геному. Альтернативно, биаллельная модификация может содержать делецию между 5'- и 3'-последовательностей-мишеней, а также введение вставки нуклеиновой кислоты между 5'- и 3'-последовательностей-мишеней в паре первой и второй гомологичных хромосом, что приводит к гомозиготному модифицированному геному. Делеция и вставка могут происходить одновременно в обеих хромосомах, или делеция и вставка могут первоначально происходить в первой гомологичной хромосоме, тогда как гомозиготность затем достигается с помощью клетки с использованием первой гомологичной хромосомы в качестве донорной последовательности для репарации двухцепочечного разрыва(ов) во второй гомологичной хромосоме посредством гомологичной рекомбинации, такой как конверсия генов. Например, не желая быть связанными какой-либо конкретной теорией, введение вставки нуклеиновой кислоты может происходить в первой гомологичной хромосоме (с или без расщепления белком Cas), а вторая гомологичная хромосома может быть затем модифицирована путем события конверсии гена, которое стимулируется расщеплением белком Cas на второй гомологичной хромосоме.[000328] If a donor sequence is used (e.g., an exogenous repair template), the biallelic modification may comprise a deletion between the sequences recognized by the first and second guide RNAs or Cas cleavage sites, as well as the introduction of a nucleic acid insertion between the 5' and 3' target sequences in a pair of first and second homologous chromosomes, resulting in a homozygous modified genome. Alternatively, the biallelic modification may comprise a deletion between the 5' and 3' target sequences, as well as the introduction of a nucleic acid insertion between the 5' and 3' target sequences in a pair of first and second homologous chromosomes, resulting in a homozygous modified genome. The deletion and insertion may occur simultaneously on both chromosomes, or the deletion and insertion may initially occur on the first homologous chromosome, while homozygosity is then achieved by the cell using the first homologous chromosome as a donor sequence to repair the double-strand break(s) on the second homologous chromosome through homologous recombination, such as gene conversion. For example, without wishing to be bound by any particular theory, the introduction of a nucleic acid insertion may occur on the first homologous chromosome (with or without Cas cleavage), and the second homologous chromosome may then be modified by a gene conversion event that is stimulated by Cas cleavage on the second homologous chromosome.

[000329] В альтернативном варианте, если экзогенная матрица для репарации содержит 5' и 3' плечи гомологии без вставки нуклеиновой кислоты, биаллельная модификация может содержать делецию между 5'- и 3'-последовательностей-мишеней в паре первой и второй гомологичных хромосом, что приводит к гомозиготному модифицированному геному. Делеция может происходить одновременно в обеих хромосомах, или делеция может первоначально происходить в первой гомологичной хромосоме, тогда как гомозиготность затем достигается с помощью клетки с использованием первой гомологичной хромосомы в качестве донорной последовательности для репарации двухцепочечного разрыва(ов) во второй гомологичной хромосоме посредством гомологичной рекомбинации, такой как конверсия генов. Например, не желая быть связанными какой-либо конкретной теорией, делеция может происходить в первой гомологичной хромосоме (с или без расщепления белком Cas), а вторая гомологичная хромосома может быть затем модифицирована путем события конверсии гена, которое стимулируется расщеплением белком Cas на второй гомологичной хромосоме.[000329] Alternatively, if the exogenous repair template contains 5' and 3' arms of homology without a nucleic acid insert, the biallelic modification may comprise a deletion between the 5' and 3' target sequences in a pair of first and second homologous chromosomes, resulting in a homozygous modified genome. The deletion may occur simultaneously in both chromosomes, or the deletion may initially occur in the first homologous chromosome, while homozygosity is then achieved by the cell using the first homologous chromosome as a donor sequence to repair the double-strand break(s) in the second homologous chromosome through homologous recombination, such as gene conversion. For example, without wishing to be bound by any particular theory, the deletion could occur in the first homologous chromosome (with or without Cas cleavage), and the second homologous chromosome could then be modified by a gene conversion event that is stimulated by Cas cleavage on the second homologous chromosome.

[000330] Делеция между последовательностями, распознаваемыми первой и второй направляющими РНК, или делеция между 5'- и 3'-последовательностей-мишеней может быть точной делецией, в которой удаленная нуклеиновая кислота состоит только из последовательности нуклеиновой кислоты между первым и вторым сайтами расщепления нуклеазы или только последовательности нуклеиновой кислоты между 5'- и 3'-последовательностей-мишеней, так что нет дополнительных делеций или вставок в модифицированном геномном локусе-мишени. Делеция между последовательностями, распознаваемыми первой и второй направляющими РНК, может также быть неточной делецией, выходящей за пределы первого и второго сайтов расщепления нуклеазы, что согласуется с неточной репарацией путем не гомологичного соединения концов (NHEJ), что приводит к дополнительным делециям и/или вставкам в модифицированном геномном локусе. Например, делеция может распространяться на около 1 п.о., около 2 п.о., около 3 п.о., около 4 п.о., около 5 п.о., около 10 п.о., около 20 п.о., около 30 п.о., около 40 п.о., около 50 п.о., около 100 п.о., около 200 п.о., около 300 п.о., около 400 п.о., около 500 п.о. и более за пределами первого и второго сайтов расщепления белка Cas. Аналогично, модифицированный геномный локус может содержать дополнительные вставки, совместимые с неточной репарацией NHEJ, такие как вставки около 1 п.о., около 2 п.о., около 3 п.о., около 4 п.о., около 5 п.о., около 10 п.о., около 20 п.о., около 30 п.о., около 40 п.о., около 50 п.о., около 100 п.о., около 200 п.о., около 300 п.о., около 400 п.о., около 500 п.о. или более.[000330] A deletion between the sequences recognized by the first and second guide RNAs or a deletion between the 5' and 3' target sequences may be a precise deletion in which the deleted nucleic acid consists only of the nucleic acid sequence between the first and second nuclease cleavage sites or only of the nucleic acid sequence between the 5' and 3' target sequences such that there are no additional deletions or insertions at the modified target genomic locus. A deletion between the sequences recognized by the first and second guide RNAs may also be a non-precise deletion extending beyond the first and second nuclease cleavage sites, consistent with non-precise non-homologous end joining (NHEJ) repair, resulting in additional deletions and/or insertions at the modified genomic locus. For example, the deletion may extend about 1 bp, about 2 bp, about 3 bp, about 4 bp, about 5 bp, about 10 bp, about 20 bp, about 30 bp, about 40 bp, about 50 bp, about 100 bp, about 200 bp, about 300 bp, about 400 bp, about 500 bp or more beyond the first and second cleavage sites of the Cas protein. Similarly, the modified genomic locus may contain additional insertions compatible with NHEJ misrepair, such as insertions of about 1 bp, about 2 bp, about 3 bp, about 4 bp, about 5 bp, about 10 bp, about 20 bp, about 30 bp, about 40 bp, about 50 bp, about 100 bp, about 200 bp, about 300 bp, about 400 bp, about 500 bp or more.

[000331] Целевые вставки, созданные с использованием экзогенной матрицы для репарации, могут быть любого размера. Примеры вставок нуклеиновых кислот в экзогенных матрицах для репарации и примеры размеров вставок нуклеиновых кислот описаны в другом месте данного документа.[000331] Targeted inserts created using an exogenous repair template may be of any size. Examples of nucleic acid inserts in exogenous repair templates and examples of nucleic acid insert sizes are described elsewhere in this document.

[000332] Гомозиготные нацеленные генетические модификации являются выгодными, поскольку процесс получения генетически модифицированных животных с этими модификациями (более подробно описаны ниже) может быть более эффективным и менее трудоемким. Во многих ситуациях, таких как удаление или разрушение гена для изучения эффекта его отсутствия, сама по себе гетерозиготность для нацеленной генетической модификации (т.е. модификация в одном аллеле и отсутствие изменений в другой аллеле) недостаточна. При обычных стратегиях нацеливания могут быть получены животные F0 поколения, которые являются гетерозиготными для большой целевой геномной делеций, но последующее скрещивание этих гетерозиготных животных необходимо для получения животных F1 поколения, которые гомозиготны по делеции. Эти дополнительные стадии скрещивания являются дорогостоящими и трудоемкими. Способность создавать F0 поколения генетически модифицированных животных, гомозиготных для нацеленной генетической модификации, приводит к значительному увеличению эффективности и экономии времени, поскольку требуется меньшее количество шагов разведения.[000332] Homozygous targeted genetic modifications are advantageous because the process of producing genetically modified animals with these modifications (described in more detail below) can be more efficient and less labor-intensive. In many situations, such as deleting or disrupting a gene to study the effect of its absence, heterozygosity alone for the targeted genetic modification (i.e., a modification at one allele and no change at the other allele) is not sufficient. Conventional targeting strategies can produce F0 generation animals that are heterozygous for a large targeted genomic deletion, but subsequent breeding of these heterozygous animals is required to produce F1 generation animals that are homozygous for the deletion. These additional breeding steps are expensive and labor-intensive. The ability to produce F0 generations of genetically modified animals that are homozygous for a targeted genetic modification results in significant increases in efficiency and time savings because fewer breeding steps are required.

Н. Идентификация клеток с нацеленными генетическими модификациямиN. Identification of cells with targeted genetic modifications

[000333] Способы, описанные в данном документе, могут дополнительно содержать идентификацию клетки, имеющей модифицированную нуклеиновую кислоту-мишень (например, модифицированный геном). Различные способы могут быть использованы для идентификации клеток, имеющих нацеленную генетическую модификацию, такую как делеция или вставка. Такие способы могут включать идентификацию одной клетки, имеющей нацеленную генетическую модификацию в геномном локусе-мишени. Скрининг может быть проведен для идентификации таких клеток с модифицированными геномными локусами.[000333] The methods described herein may further comprise identifying a cell having a modified target nucleic acid (e.g., a modified genome). Various methods may be used to identify cells having a targeted genetic modification, such as a deletion or insertion. Such methods may include identifying a single cell having a targeted genetic modification at a target genomic locus. Screening may be performed to identify such cells with modified genomic loci.

[000334] Стадия скрининга может содержать количественный анализ для оценки модификации аллеля (МОА) (например, анализов потери аллеля (LOA) и/или усиления аллелей (GOA)) родительской хромосомы. Например, количественный анализ может проводиться с помощью количественной ПЦР, такой как ПЦР в реальном времени (qPCR). ПЦР в реальном времени может использовать первый набор праймеров, который распознает геномный локус-мишень, и второй набор праймеров, который распознает нецелевой эталонный локус.Набор праймеров может содержать флуоресцентный зонд, который распознает амплифицированную последовательность.[000334] The screening step may comprise a quantitative assay to assess the allele modification (MOA) (e.g., loss of allele (LOA) and/or gain of allele (GOA) assays) of the parental chromosome. For example, the quantitative assay may be performed using quantitative PCR, such as real-time PCR (qPCR). Real-time PCR may use a first set of primers that recognize a target genomic locus and a second set of primers that recognize a non-target reference locus. The set of primers may comprise a fluorescent probe that recognizes the amplified sequence.

[000335] Чтобы идентифицировать гомозиготно разрушенные клоны ЭС-клеток, стратегии qPCR зонда TAQMAN® могут использоваться с большей эффективностью и точностью по сравнению с традиционными способами. Гомозиготно разрушенные аллели можно идентифицировать с помощью одной пластины qPCR из-за включения «среднего» анализа LOA (см., например, mTM-зонд на фиг. 4) и отсутствие анализа GOA. Поскольку каждый анализ, используемый для скрининга клонов ЭС-клеток, является анализом LOA, количество копий могут быть рассчитано точно для каждого тестируемого участка, без использования какого-либо не-мышиного калибратора ДНК.[000335] To identify homozygous disrupted ES cell clones, TAQMAN ® probe qPCR strategies can be used with greater efficiency and accuracy than traditional methods. Homozygous disrupted alleles can be identified with a single qPCR plate due to the inclusion of an "average" LOA assay (see, for example, the mTM probe in Fig. 4) and the absence of a GOA assay. Because each assay used to screen ES cell clones is an LOA assay, copy numbers can be calculated accurately for each region tested, without the use of any non-mouse DNA calibrator.

[000336] Стадия скрининга может также содержать анализ удерживания, который представляет собой анализ, используемый для различения правильных целевых вставок вставки нуклеиновой кислоты в геномный локус-мишень из случайных трансгенных вставок вставки нуклеиновой кислоты в геномные положения вне геномного локуса-мишени. Анализы удерживания также могут использоваться для различения правильных делеций и делеций, которые выходят за пределы участка, являющегося мишенью для делеций. Обычные анализы для скрининга целевых модификаций, такие как ПЦР на большие расстояния или вестерн-блоттинг, связывают вставленный вектор нацеливания с целевым локусом. Тем не менее, из-за больших размеров плеча гомологии, LTVEC не позволяют проводить скрининг с помощью таких обычных анализов. Для скрининга нацеливания LTVEC можно использовать анализы на модификацию аллелей (МОА), включая анализы потери аллеля (LOA) и усиления аллелей (GOA) (см., например, US 2014/0178879 и Frendewey et al. (2010) Methods Enzymol. 476: 295-307, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Анализ потери аллеля (LOA) инвертирует обычную логику скрининга и количественно определяет количество копий нативного локуса, которому была направлена мутация. В правильно нацеленном клеточном клоне, анализ LOA обнаруживает один из двух нативных аллелей (для генов, не входящих в X или Y-хромосому), а другой аллель нарушается нацеленной модификацией. Тот же принцип может применяться в обратном порядке как анализ усиления аллеля (GOA) для количественной оценки количества копий вставленного вектора нацеливания. Например, совместное использование анализов GOA и LOA выявит правильно нацеленный гетерозиготный клон как потерявший одну копию нативного гена-мишени и получивший одну копию гена устойчивости к лекарственным средствам или другого вставленного маркера.[000336] The screening step may also include a retention assay, which is an assay used to distinguish between correct targeted insertions of nucleic acid into a target genomic locus from random transgenic insertions of nucleic acid into genomic positions outside of the target genomic locus. Retention assays may also be used to distinguish between correct deletions and deletions that extend beyond the region targeted by the deletions. Conventional assays for screening targeted modifications, such as long-range PCR or Western blotting, bind the inserted targeting vector to the target locus. However, due to the large homology arm sizes, LTVECs do not allow screening with such conventional assays. Allelic modification assays (LOAs), including loss of allele (LOA) and gain of allele (GOA) assays, can be used to screen for LTVEC targeting (see, e.g., US 2014/0178879 and Frendewey et al. (2010) Methods Enzymol. 476: 295-307, each of which is incorporated herein by reference in its entirety for all purposes. Loss of allele (LOA) assays invert the conventional screening logic and quantify the copy number of the native locus to which a mutation has been targeted. In a correctly targeted cell clone, LOA assays detect one of the two native alleles (for genes not on the X or Y chromosome) and the other allele is disrupted by the targeted modification. The same principle can be applied in reverse as a gain of allele (GOA) assay to quantify the copy number of the inserted targeting vector. For example, using GOA and LOA assays together would identify a correctly targeted heterozygous clone as having lost one copy of the native target gene and gained one copy of a drug resistance gene or other inserted marker.

[000337] В качестве примера, количественная полимеразная цепная реакция (кПЦР) может быть использована в качестве способа количественной оценки аллелей, но любой способ, который может достоверно различать разницу между нулевой, одной и двумя копиями гена-мишени или между нулевой, одной и двумя копиями вставки нуклеиновой кислоты могут быть использованы для разработки анализа МОА. Например, TAQMAN® можно использовать для количественного определения количества копий ДНК-матрицы в образце геномной ДНК, особенно по сравнению с эталонным геном (см., например, US 6596541, включенную в данный документ в качестве ссылки во всей своей полноте для всех целей). Эталонный ген количественно определяют в той же геномной ДНК, что и ген-мишень(и) или локус(ы). Поэтому выполняются две амплификации TAQMAN® (каждая с соответствующим зондом). Один зонд TAQMAN® определяет «Ct» (пороговый цикл) эталонного гена, тогда как другой зонд определяет Ct участок гена-мишени(ей) или локуса(ов), который заменяется успешным нацеливанием (т.е. анализ LOA). Ct представляет собой количество, которое отражает количество исходной ДНК для каждого из зондов TAQMAN®, то есть менее многочисленная последовательность требует большего количества циклов ПЦР для достижения порогового цикла. Уменьшение наполовину количества копий последовательности матрицы для реакции TAQMAN® приведет к увеличению около одной единицы Ct. Реакции TAQMAN® в клетках, где один аллель гена-мишени (генов-мишеней) или локуса(ов) был заменен с помощью гомологичной рекомбинации, приведет к увеличению одного Ct для целевой реакции TAQMAN® без увеличения в Ct для эталонного гена по сравнению с ДНК из нецелевых клеток. Для анализа GOA можно использовать другой зонд TAQMAN® для определения Ct вставки нуклеиновой кислоты, который заменяет целевой ген(ы) или локус(ы) путем успешного нацеливания.[000337] As an example, quantitative polymerase chain reaction (qPCR) can be used as a method for quantifying alleles, but any method that can reliably distinguish the difference between zero, one, and two copies of a target gene, or between zero, one, and two copies of a nucleic acid insert, can be used to develop a MOA assay. For example, TAQMAN® can be used to quantify the number of copies of template DNA in a genomic DNA sample, especially when compared to a reference gene (see, e.g., U.S. Patent No. 6,596,541, incorporated herein by reference in its entirety for all purposes). The reference gene is quantified in the same genomic DNA as the target gene(s) or locus(es). Therefore, two TAQMAN® amplifications (each with an appropriate probe) are performed. One TAQMAN ® probe defines the “Ct” (threshold cycle) of the reference gene, while the other probe defines the Ct region of the target gene(s) or locus(es) that is replaced by successful targeting (i.e. LOA analysis). The Ct is a quantity that reflects the amount of starting DNA for each of the TAQMAN ® probes, i.e. less abundant sequence requires more PCR cycles to reach the threshold cycle. Halving the copy number of template sequence for a TAQMAN ® reaction will result in an increase of approximately one unit in Ct. TAQMAN ® reactions in cells where one allele of the target gene(s) or locus(es) has been replaced by homologous recombination will result in an increase of one Ct for the targeted TAQMAN ® reaction, with no increase in the Ct for the reference gene compared to DNA from non-target cells. For GOA analysis, another TAQMAN ® probe can be used to determine the Ct of a nucleic acid insert that replaces the target gene(s) or locus(es) by successful targeting.

[000338] Поскольку спаренные гРНК могут создавать крупные Cas-опосредуемые делеции в геномном локусе-мишени, это может быть полезно для усиления стандартных анализов LOA и GOA для проверки правильного нацеливания с помощью LTVEC (т.е. в клетках, отличных от эмбрионов на одноклеточной стадии). Например, только анализы LOA и GOA не могут отличить правильно нацеленные клеточные клоны от клонов, в которых большая Cas-индуцированная делеция геномного локуса-мишени совпадает со случайной интеграцией LTVEC в другом месте в геноме, особенно если в анализе GOA используется зонд против селекционной кассеты внутри вставки LTVEC. Поскольку давление отбора в целевой клетке основано на селекционной кассете, случайная трансгенная интеграция LTVEC в другом месте в геноме будет включать в себя селекционную кассету и смежные участки LTVEC, но исключает более дистальные участки LTVEC. Например, если часть LTVEC случайным образом интегрирована в геном, a LTVEC содержит вставку нуклеиновой кислоты длиной около 5 т.п.о. или более с селекционной кассетой, смежной с плечом 3'-гомологии, обычно плечом 3'-гомологии, но не плечом 5'-гомологии, будет трансгенно интегрирована с селекционной кассетой. В качестве альтернативы, если селекционная кассета, смежная с 5'-плечом гомологии, обычно 5'-плечом гомологии, но не 3'-плечом гомологии, будет трансгенно интегрирована с селекционной кассетой. В качестве примера, если анализы LOA и GOA используются для оценки целевой интеграции LTVEC, и в анализе GOA используются зонды против селекционной кассеты, гетерозиготная делеция в геномном локусе-мишени в сочетании со случайной трансгенной интеграцией LTVEC даст такое же считывание, как гетерозиготная целевая интеграция LTVEC в геномном локусе-мишени. Чтобы проверить правильность нацеливания с помощью LTVEC, анализы удерживания можно использовать отдельно или в сочетании с анализами LOA и/или GOA.[000338] Because paired gRNAs can create large Cas-mediated deletions at the target genomic locus, this may be useful to augment standard LOA and GOA assays to verify correct targeting by LTVEC (i.e., in cells other than one-cell stage embryos). For example, LOA and GOA assays alone cannot distinguish correctly targeted cell clones from clones in which a large Cas-induced deletion at the target genomic locus coincides with random integration of LTVEC elsewhere in the genome, particularly if the GOA assay uses a probe against a selection cassette within the LTVEC insert. Because the selection pressure in the target cell is based on the selection cassette, random transgene integration of LTVEC elsewhere in the genome will include the selection cassette and adjacent regions of LTVEC, but exclude more distal regions of LTVEC. For example, if a portion of an LTVEC is randomly integrated into the genome, and the LTVEC contains a nucleic acid insert of about 5 kb or more with a selection cassette adjacent to a 3' homology arm, typically a 3' homology arm but not a 5' homology arm, will be transgenically integrated with the selection cassette. Alternatively, if a selection cassette adjacent to a 5' homology arm, typically a 5' homology arm but not a 3' homology arm, will be transgenically integrated with the selection cassette. As an example, if LOA and GOA assays are used to assess targeted integration of LTVEC, and the GOA assay uses probes against a selection cassette, a heterozygous deletion at the target genomic locus combined with random transgenic integration of LTVEC will yield the same readout as a heterozygous targeted integration of LTVEC at the target genomic locus. To verify correct targeting by LTVEC, retention assays can be used alone or in combination with LOA and/or GOA assays.

[000339] Анализы удерживания определяют количество копий матрицы ДНК в 5'-последовательности-мишени (соответствующей 5'-плечу гомологии LTVEC) и/или 3'-последовательности-мишени (соответствующей 3'-плечу гомологии LTVEC). В частности, полезно определить число копий матрицы ДНК в последовательности-мишени, соответствующее плечу гомологии, которое находится рядом с селекционной кассетой. В диплоидных клетках, количество копий, большее чем два, обычно указывает на трансгенную интеграцию LTVEC случайным образом вне геномного локуса-мишени, а не в геномном локусе-мишени, что нежелательно. Правильно нацеленные клоны будут сохранять количество копий два. Кроме того, количество копий менее чем две втакихтестах на удерживание обычно указывает на крупные Cas-опосредованные делеций, выходящие за пределы участка, нацеленного на делецию, что также нежелательно.[000339] Retention assays determine the copy number of the template DNA in the 5' target sequence (corresponding to the 5' homology arm of LTVEC) and/or the 3' target sequence (corresponding to the 3' homology arm of LTVEC). In particular, it is useful to determine the copy number of the template DNA in the target sequence corresponding to the homology arm that is adjacent to the selection cassette. In diploid cells, a copy number greater than two usually indicates transgene integration of LTVEC at random outside the target genomic locus rather than at the target genomic locus, which is undesirable. Correctly targeted clones will retain a copy number of two. Additionally, copy numbers less than two in such retention assays usually indicate large Cas-mediated deletions that extend beyond the region targeted by the deletion, which is also undesirable.

[000340] В иллюстративном анализе удерживания для идентификации целевого введения вставки нуклеиновой кислоты в геномном локусе-мишени в диплоидной клетке, ДНК сначала получают из клетки, имеющей геном, который был приведен в контакт с большим направленным вектором (LTVEC), содержащим вставку нуклеиновый кислоты, фланкированную первым плечом гомологии, которое гибридизуется с первой последовательностью-мишенью, и вторым плечом гомологии, которое гибридизуется со второй последовательностью-мишенью, причем вставка нуклеиновой кислоты содержит селекционную кассету, смежную с первым плечом гомологичным. Необязательно, селекционная кассета может содержать ген устойчивости к лекарственным средствам. Затем ДНК подвергают воздействию зонда, который связывается в первой последовательностью-мишенью, зонда, который связывается внутри вставки нуклеиновой кислоты, и зонда, который связывается в эталонном гене, имеющем известное количество копий, причем каждый зонд генерирует детектируемый сигнал при связывании. Затем регистрируются сигналы от связывания каждого из зондов. Сигнал от эталонного зонда гена сравнивают с сигналом от первого зонда последовательности-мишени, чтобы определить количество копий для первой последовательности-мишени, а сигнал от эталонного зонда гена сравнивают с сигналом от зонда вставки нуклеиновой кислоты, чтобы определить количество копий для вставки нуклеиновой кислоты. Количество копий вставки нуклеиновой кислоты одна или две и количество копий первой последовательности-мишени две обычно указывает на целевое введение вставки нуклеиновой кислоты в геномном локусе-мишени, а количество копий вставки нуклеиновой кислоты одна или более и количество копий первой последовательности-мишени три или более обычно указывает на случайное введение вставки нуклеиновой кислоты в геномном локусе, отличном от геномного локуса-мишени.[000340] In an exemplary retention assay for identifying the targeting of a nucleic acid insert at a target genomic locus in a diploid cell, DNA is first obtained from a cell having a genome that has been contacted with a large targeting vector (LTVEC) containing a nucleic acid insert flanked by a first homology arm that hybridizes to a first target sequence and a second homology arm that hybridizes to a second target sequence, wherein the nucleic acid insert comprises a selection cassette adjacent to the first homology arm. Optionally, the selection cassette may comprise a drug resistance gene. The DNA is then exposed to a probe that binds to the first target sequence, a probe that binds within the nucleic acid insert, and a probe that binds within a reference gene having a known copy number, each probe generating a detectable signal upon binding. The signals from the binding of each of the probes are then recorded. The signal from the reference gene probe is compared with the signal from the first target sequence probe to determine the copy number for the first target sequence, and the signal from the reference gene probe is compared with the signal from the nucleic acid insert probe to determine the copy number for the nucleic acid insert. A copy number of the inserted nucleic acid of one or two and a copy number of the first target sequence of two generally indicates a targeted introduction of the inserted nucleic acid at a target genomic locus, and a copy number of the inserted nucleic acid of one or more and a copy number of the first target sequence of three or more generally indicates a random introduction of the inserted nucleic acid at a genomic locus other than the target genomic locus.

[000341] Сигнал от связывания зонда первой последовательности-мишени может использоваться для определения значения порогового цикла (Ct) для первой последовательности-мишени, сигнал от связывания эталонного зонда гена может использоваться для определения значения порогового цикла (Ct) для эталонного гена, а количество копий первой последовательности-мишени может быть определено путем сравнения значения Ct первой последовательности-мишени и значения Ct эталонного гена. Аналогично, сигнал от связывания зонда вставки нуклеиновой кислоты может быть использован для определения значения порогового цикла (Ct) для вставки нуклеиновой кислоты, а количество копий вставки нуклеиновой кислоты может быть определено путем сравнения значения Ct первой последовательности-мишени и значения Ct эталонного гена.[000341] The signal from the binding of the probe of the first target sequence can be used to determine the threshold cycle (Ct) value for the first target sequence, the signal from the binding of the reference gene probe can be used to determine the threshold cycle (Ct) value for the reference gene, and the copy number of the first target sequence can be determined by comparing the Ct value of the first target sequence and the Ct value of the reference gene. Similarly, the signal from the binding of the nucleic acid insert probe can be used to determine the threshold cycle (Ct) value for the nucleic acid insert, and the copy number of the nucleic acid insert can be determined by comparing the Ct value of the first target sequence and the Ct value of the reference gene.

[000342] Вставка нуклеиновой кислоты в LTVEC может быть, например, по меньшей мере 5, 10, 20, 30, 40, 50, 60, 70,80,90,100,150, 200,250,300,350,400,450 или 500 т.п.о. Расстояние между последовательностями, с которыми связываются зонды в первой последовательности-мишени и селекционной кассете, может быть, например, не более 100 нуклеотидов, 200 нуклеотидов, 300 нуклеотидов, 400 нуклеотидов, 500 нуклеотидов, 600 нуклеотидов, 700 нуклеотидов, 800 нуклеотидов, 900 нуклеотидов, 1 т.п.о., 1,5 т.п.о., 2 т.п.о., 2,5 т.п.о., 3 т.п.о., 3,5 т.п.о., 4 т.п.о., 4,5 т.п.о. или 5 т.п.о.[000342] The nucleic acid insertion into the LTVEC may be, for example, at least 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, or 500 kb. The distance between the sequences to which the probes bind in the first target sequence and the selection cassette may be, for example, no more than 100 nucleotides, 200 nucleotides, 300 nucleotides, 400 nucleotides, 500 nucleotides, 600 nucleotides, 700 nucleotides, 800 nucleotides, 900 nucleotides, 1 kb, 1.5 kb, 2 kb, 2.5 kb, 3 kb, 3.5 kb, 4 kb, 4.5 kb, or 5 kb.

[000343] Такие способы могут дополнительно содержать дополнительные анализы удерживания для определения количества копий второй последовательности-мишени. Например, такие способы могут дополнительно включать в себя воздействие на ДНК клетки зонда, который связывает вторую последовательность-мишень, обнаруживая сигнал от связывания зонда второй последовательности-мишени, и сравнивая сигнал от эталонного зонда гена с сигналом от зонда второй последовательности-мишени, чтобы определить количество копии для второй последовательности-мишени.[000343] Such methods may further comprise additional retention assays to determine the copy number of the second target sequence. For example, such methods may further comprise exposing the DNA of the cell to a probe that binds the second target sequence, detecting a signal from the binding of the probe to the second target sequence, and comparing the signal from the reference gene probe to the signal from the probe of the second target sequence to determine the copy number for the second target sequence.

[000344] Подобным образом, такие способы могут дополнительно включать дополнительные анализы GOA для определения количества копий одной или более дополнительных последовательностей внутри вставки нуклеиновой кислоты. Например, такие способы могут дополнительно включать в себя воздействие на ДНК клетки одного или более дополнительных зондов, которые связывают вставку нуклеиновой кислоты, обнаруживая сигнал от связывания одного или более дополнительных зондов, и сравнивают сигнал от эталонного зонда гена с сигналом от одного или более дополнительных зондов вставки нуклеиновой кислоты для определения количества копий для одной или более дополнительных последовательностей внутри вставки нуклеиновой кислоты.[000344] Similarly, such methods may further include additional GOA assays to determine the copy number of one or more additional sequences within the nucleic acid insert. For example, such methods may further include exposing the DNA of the cell to one or more additional probes that bind the nucleic acid insert, detecting a signal from the binding of the one or more additional probes, and comparing the signal from the reference gene probe to the signal from the one or more additional nucleic acid insert probes to determine the copy number for the one or more additional sequences within the nucleic acid insert.

[000345] Аналогично, когда LTVEC предназначен для удаления эндогенной последовательности из геномного локуса-мишени или при использовании парных гРНК (например, для создания парных двухцепочечных разрывов на разных сайтах в пределах одного геномного целевого локуса и удаления промежуточной эндогенной последовательности) такие способы могут дополнительно включать анализ LOA для определения количества копий эндогенных последовательностей в геномном локусе-мишени. Например, такие способы могут дополнительно включать воздействие на ДНК клетки зонда, который связывает эндогенную последовательность в геномном локусе-мишени, обнаруживая сигнал от связывания зонда эндогенной последовательности, и сравнивая сигнал от эталонного зонда гена с сигналом от зонда эндогенной последовательности, чтобы определить количество копий для эндогенной п осл едо в ател ьн ости.[000345] Similarly, when LTVEC is designed to remove an endogenous sequence from a target genomic locus or when paired gRNAs are used (e.g., to create paired double-strand breaks at different sites within a single genomic target locus and remove the intervening endogenous sequence), such methods may further include an LOA assay to determine the copy number of the endogenous sequences at the target genomic locus. For example, such methods may further include exposing the DNA of the cell to a probe that binds an endogenous sequence at the target genomic locus, detecting a signal from the binding of the endogenous sequence probe, and comparing the signal from the reference gene probe to the signal from the endogenous sequence probe to determine the copy number for the endogenous sequence.

[000346] Анализы удерживания также могут быть использованы в экспериментах, в которых используются спаренные гРНК, но не обязательно используется экзогенная матрица для репарации. Поскольку спаренные гРНК могут создавать крупные Cas-опосредуемые делеций в геномном локусе-мишени, это может быть полезно для усиления стандартных анализов LOA, для проверки правильного нацеливания делеций с помощью спаренных гРНК, в отличие от делеций, выходящих за пределы участка, нацеленного на делецию из-за инделей после репарации NHEJ.[000346] Retention assays can also be used in experiments that use paired gRNAs but do not necessarily use an exogenous repair template. Because paired gRNAs can create large Cas-mediated deletions at the target genomic locus, this can be useful to augment standard LOA assays to verify that deletions are correctly targeted by paired gRNAs, as opposed to deletions that extend beyond the deletion target site due to indels following NHEJ repair.

[000347] Анализы удерживания определяют количество копий матрицы ДНК в участке, содержащем и/или вверх по ходу транскрипции последовательности, распознаваемой первой направляющей РНК (то есть 5' последовательность, распознаваемая направляющей РНК), и/или участке, содержащем и/или вниз по ходу транскрипции и рядом с последовательностью, распознаваемой второй направляющей РНК (т.е. 3' последовательность, распознаваемая направляющей РНК). В диплоидных клетках количество копий менее чем одна указывает на большие NHEJ-опосредованные делеций, простирающиеся за участок, нацеленный на делецию, что нежелательно. Правильно нацеленные клоны будут сохранять количество копий два. Зонд для определения количества копий может быть, например, в пределах около 100 нуклеотидов, 200 нуклеотидов, 300 нуклеотидов, 400 нуклеотидов, 500 нуклеотидов, 600 нуклеотидов, 700 нуклеотидов, 800 нуклеотидов, 900 нуклеотидов, 1 т.п.о., 1,5 т.п.о., 2 т.п.о., 2,5 т.п.о., 3 т.п.о., 3,5 т.п.о., 4 т.п.о., 4,5 т.п.о. или 5 т.п.о. последовательности, распознаваемой направляющей РНК.[000347] Retention assays determine the number of copies of DNA template in the region containing and/or upstream of the sequence recognized by the first guide RNA (i.e., the 5' sequence recognized by the guide RNA) and/or the region containing and/or downstream of and adjacent to the sequence recognized by the second guide RNA (i.e., the 3' sequence recognized by the guide RNA). In diploid cells, a copy number of less than one indicates large NHEJ-mediated deletions extending beyond the region targeted by the deletion, which is undesirable. Correctly targeted clones will retain a copy number of two. The copy number probe may be, for example, within about 100 nucleotides, 200 nucleotides, 300 nucleotides, 400 nucleotides, 500 nucleotides, 600 nucleotides, 700 nucleotides, 800 nucleotides, 900 nucleotides, 1 kb, 1.5 kb, 2 kb, 2.5 kb, 3 kb, 3.5 kb, 4 kb, 4.5 kb, or 5 kb of the sequence recognized by the guide RNA.

[000348] Другие примеры подходящих количественных анализов включают в себя флуоресцентную опосредованную гибридизацию in situ (FISH), сравнительную геномную гибридизацию, изотермическую амплификацию ДНК, количественную гибридизацию с иммобилизованным зондом(ами), зондами INVADER®, зондами молекулярного маяка TAQMAN®, или зондовой технологией ECLIPSE™ (см., например, US 2005/0144655, включенный в данном документе в качестве ссылки в полном объеме для всех целей).Также можно использовать обычные анализы для скрининга целевых модификаций, такие как ПЦР на большие расстояния, вестерн-блоттинг или сиквенирование Сэнгера. Такие анализы обычно используются для получения доказательств о связи между вставленным вектором нацеливания и геномным локусом-мишенью. Например, для ПЦР-анализа длинных фрагментов один праймер может распознавать последовательность внутри вставленной ДНК, в то время как другой распознает последовательность геномного локуса-мишени за пределами концов плеча гомологии вектора нацеливания.[000348] Other examples of suitable quantitative assays include fluorescence-mediated in situ hybridization (FISH), comparative genomic hybridization, isothermal DNA amplification, quantitative hybridization with immobilized probe(s), INVADER® probes, TAQMAN® molecular beacon probes, or ECLIPSE™ probe technology (see, e.g., US 2005/0144655, incorporated herein by reference in its entirety for all purposes). Conventional assays for screening target modifications, such as long-range PCR, Western blotting, or Sanger sequencing, can also be used. Such assays are typically used to provide evidence of the association between an inserted targeting vector and a target genomic locus. For example, for long fragment PCR analysis, one primer may recognize a sequence within the inserted DNA, while another recognizes a sequence of the target genomic locus outside the homology arm ends of the targeting vector.

[000349] Сиквенирование следующего поколения (NGS) также может быть использовано для скрининга, особенно в эмбрионах на одноклеточной стадии, которые были модифицированы. Сиквенирование следующего поколения также может упоминаться как «NGS» или «массовое параллельное сиквенирование» или «высокопроизводительное сиквенирование». Такие NGS могут использоваться в качестве инструмента для скрининга в дополнение к анализу МОА и анализу удерживания для определения точной природы нацеленной генетической модификации и обнаружения мозаицизма. Мозаицизм относится к наличию двух или более популяций клеток с разными генотипами у одного индивидуума, который развился из одного оплодотворенного яйца (т.е. зиготы). В способах, описанных в данных документах, нет необходимости скринировать целевые клоны с использованием маркеров для селекции. Например, анализы МОА и NGS, описанные в данных документах, могут использоваться без использования селекционных кассет.[000349] Next generation sequencing (NGS) can also be used for screening, particularly in single-cell stage embryos that have been modified. Next generation sequencing can also be referred to as "NGS" or "massively parallel sequencing" or "high throughput sequencing." Such NGS can be used as a screening tool in addition to MOA analysis and retention analysis to determine the exact nature of the targeted genetic modification and to detect mosaicism. Mosaicism refers to the presence of two or more populations of cells with different genotypes in a single individual that developed from a single fertilized egg (i.e., zygote). The methods described in these documents do not require screening of target clones using selection markers. For example, the MOA and NGS assays described in these documents can be used without the use of selection cassettes.

[000350] Целевые клетки также могут быть скринированы на предмет уменьшения или элиминации экспрессии аутоантигена, гомологичного с или обладающего представляющий интерес эпитопом с представляющим интерес чужеродным антигеном. Например, если аутоантигеном является белок, экспрессия может быть оценена с помощью любых известных методов анализа экспрессии белка, включая, например, Вестерн-блот анализ или иммуноокрашивание белка.[000350] Target cells can also be screened for a decrease or elimination of expression of a self-antigen that is homologous to or has an epitope of interest with a foreign antigen of interest. For example, if the self-antigen is a protein, expression can be assessed using any known protein expression assay, including, for example, Western blot analysis or protein immunostaining.

III. Способы получения генетически модифицированных отличных от человека животныхIII. Methods for obtaining genetically modified non-human animals

[000351] Генетически модифицированные отличные от человека животные, могут быть получены с использованием различных способов, описанных в данном документе. Любой удобный способ или протокол для получения генетически модифицированного организма, включая способы, описанные в данном документ, подходит для получения такого генетически модифицированного отличного от человека животного. Такие способы, начинающиеся с генетической модификации плюрипотентной клетки, такой как эмбриональная стволовая клетка (ЭС), обычно включают: (1) модификация генома плюрипотентной клетки, которая не является эмбрионом на одноклеточной стадии, с использованием способов, описанных в данном документе; (2) определение или выбор генетически модифицированной плюрипотентной клетки; (3) введение генетически модифицированной плюрипотентной клетки в эмбрион-хозяин; и (4) имплантация и гестация эмбриона-хозяина, содержащего генетически модифицированную плюрипотентную клетку, у суррогатной матери. Суррогатная мать может затем производить F0 поколение отличных от человека животных, содержащих нацеленную генетическую модификацию и способную передавать нацеленную генетическую модификацию через зародышевую линию. Животные, несущие генетически модифицированный геномный локус, могут быть идентифицированы с помощью анализа модификации аллеля (МОА), как описано в данном документе. Донорную клетку можно вводить в эмбрион-хозяин на любой стадии, такой как стадия бластоцисты или стадия пред-морулы (т.е. 4-клеточная стадия или 8-клеточная стадия). Производится потомство, которое способно передавать генетическую модификацию через зародышевую линию. Плюрипотентной клеткой может быть, например, ЭС-клетка (например, ЭС-клетка грызуна, ЭС-клетка мыши или ЭС-клетка крысы), как обсуждается в другом месте данного документа. См., например, патент США №7294754, включенный в данный документ в качестве ссылки во всей своей полноте для всех целей.[000351] Genetically modified non-human animals can be produced using a variety of methods described herein. Any convenient method or protocol for producing a genetically modified organism, including the methods described herein, is suitable for producing such a genetically modified non-human animal. Such methods, starting with genetic modification of a pluripotent cell, such as an embryonic stem (ES) cell, typically include: (1) modifying the genome of a pluripotent cell that is not a single-cell stage embryo using the methods described herein; (2) identifying or selecting a genetically modified pluripotent cell; (3) introducing the genetically modified pluripotent cell into a host embryo; and (4) implanting and gestation the host embryo containing the genetically modified pluripotent cell in a surrogate mother. The surrogate mother may then produce an F0 generation of non-human animals containing the targeted genetic modification and capable of transmitting the targeted genetic modification through the germ line. Animals carrying the genetically modified genomic locus may be identified using modification allele analysis (MOA), as described herein. The donor cell may be introduced into the host embryo at any stage, such as the blastocyst stage or the pre-morula stage (i.e., 4-cell stage or 8-cell stage). Offspring are produced that are capable of transmitting the genetic modification through the germ line. The pluripotent cell may be, for example, an ES cell (e.g., a rodent ES cell, a mouse ES cell, or a rat ES cell), as discussed elsewhere herein. See, for example, U.S. Patent No. 7,294,754, incorporated herein by reference in its entirety for all purposes.

[000352] Альтернативно, такие способы, начинающиеся с генетической модификации эмбриона на одноклеточной стадии, обычно включают: (1) модификацию генома плюрипотентной клетки, которая не является эмбрионом на одноклеточной стадии, с использованием способов, описанных в данном документе; (2) определение или выбор генетически модифицированного эмбриона; и (3) имплантацию и гестацию генетически модифицированного эмбриона у суррогатной матери. Суррогатная мать может затем производить F0 поколение отличных от человека животных, содержащих нацеленную генетическую модификацию и способную передавать нацеленную генетическую модификацию через зародышевую линию. Животные, несущие генетически модифицированный геномный локус, могут быть идентифицированы с помощью анализа модификации аллеля (МОА), как описано в данном документе.[000352] Alternatively, such methods, beginning with genetic modification of a one-cell stage embryo, typically include: (1) modifying the genome of a pluripotent cell that is not a one-cell stage embryo using the methods described herein; (2) identifying or selecting a genetically modified embryo; and (3) implanting and gestation the genetically modified embryo in a surrogate mother. The surrogate mother may then produce an F0 generation of non-human animals containing the targeted genetic modification and capable of transmitting the targeted genetic modification through the germ line. Animals carrying a genetically modified genomic locus may be identified using an allele modification assay (AMA), as described herein.

[000353] Методы переноса ядра также могут быть использованы для генерации отличных от человека животных. Вкратце, способы ядерного переноса могут включать в себя следующие этапы: (1) энуклеация ооцита или обеспечение энуклеированного ооцита; (2) выделение или обеспечение донорной клетки или ядра, которые должны быть объединены с энуклеированным ооцитом; (3) вставка клетки или ядра в энуклеированный ооцит с образованием восстановленной клетки; (4) имплантация восстановленной клетки в матку отличного от человека животного с образованием эмбриона; и (5) развитие эмбриона. В таких способах ооциты обычно извлекают из умерших животных, хотя они могут быть выделены также из яйцеводов и/или яичников живых животных. Ооциты могут созревать в различных средах, известных специалистам в данной области, до энуклеации. Энуклеация ооцита может быть осуществлена с помощью нескольких способов, хорошо известных специалистам в данной области. Внесение донорной клетки или ядра в энуклеированный ооцит с образованием восстановленной клетки может быть проведено путем микроинъекции донорной клетки под внеклеточной оболочкой ооцита перед слиянием. Слияние может быть вызвано применением электрического импульса постоянного тока через плоскость контакта/слияния (электрослияние), путем воздействия на клетки химикатов, способствующих слиянию, таких как полиэтилен гликоль, или с помощью инактивированного вируса, такого как вирус Сендай. Восстановленную клетку можно активировать электрическими и/или неэлектрическими средствами до, во время и/или после слияния ядра донора и ооцита реципиента. Способы активации включают электрические импульсы, химически индуцированный шок, проникновение с помощью спермы, увеличение уровней двухвалентных катионов в ооците, и снижение фосфорилирования клеточных белков (как в виде ингибиторов киназы) в ооците. Активированные восстановленные клетки или эмбрионы можно культивировать в среде, хорошо известной специалистам в данной области техники, а затем переносить в матку животного. См., например, US 2008/0092249, WO 1999/005266, US 2004/0177390, WO 2008/017234 и патент US №7612250, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей.[000353] Nuclear transfer methods can also be used to generate non-human animals. Briefly, nuclear transfer methods can include the following steps: (1) enucleating an oocyte or providing an enucleated oocyte; (2) isolating or providing a donor cell or nucleus to be combined with the enucleated oocyte; (3) inserting the cell or nucleus into the enucleated oocyte to form a reconstituted cell; (4) implanting the reconstituted cell into the uterus of a non-human animal to form an embryo; and (5) developing the embryo. In such methods, oocytes are typically recovered from deceased animals, although they can also be isolated from the oviducts and/or ovaries of living animals. The oocytes can be matured in a variety of environments known to those skilled in the art prior to enucleation. Enucleation of the oocyte can be accomplished by a number of methods well known to those skilled in the art. The introduction of a donor cell or nucleus into an enucleated oocyte to form a reconstituted cell can be accomplished by microinjection of the donor cell under the extracellular membrane of the oocyte prior to fusion. Fusion can be induced by applying a direct current electrical pulse across the contact/fusion plane (electrofusion), by exposing the cells to fusion-promoting chemicals such as polyethylene glycol, or by an inactivated virus such as Sendai virus. The reconstituted cell can be activated by electrical and/or non-electrical means before, during, and/or after fusion of the donor nucleus and the recipient oocyte. Methods of activation include electrical pulses, chemically induced shock, penetration by sperm, increasing divalent cation levels in the oocyte, and decreasing phosphorylation of cellular proteins (as in the form of kinase inhibitors) in the oocyte. The activated reconstituted cells or embryos can be cultured in a medium well known to those skilled in the art and then transferred into the uterus of an animal. See, for example, US 2008/0092249, WO 1999/005266, US 2004/0177390, WO 2008/017234, and US Patent No. 7,612,250, each of which is incorporated herein by reference in its entirety for all purposes.

[000354] Различные способы, предлагаемые в данном документе, позволяют генерировать генетически модифицированное отличное от человека F0 животное, в котором клетки генетически модифицированного F0 животного, которые содержат нацеленную генетическую модификацию. Признано, что в зависимости от способа, используемого для генерации F0 животного, количество клеток в пределах F0 животного, которые имеют нацеленную генетическую модификацию, будет варьироваться. Введение донорных ЭС-клеток в эмбрион на стадии пред-морулы из соответствующего организма (например, эмбрион мыши на 8-клеточной стадии) с помощью, например, способа VELOCIMOUSE® позволяет получить больший процент клеточной популяции F0 животных, чтобы содержать клетки, имеющие нацеленную генетическую модификацию. Например, по меньшей мере 50%, 60%, 65%, 70%, 75%, 85%, 86%, 87%, 87%, 88%, 89%, 90%, 91%, 92%, 93% 94%, 95%, 96%, 97%, 98%, 99% или 100% клеточного вклада отличного от человека F0 животного может содержать популяцию клеток, имеющую нацеленную генетическую модификацию. Кроме того, по меньшей мере одна или более зародышевых клеток F0 животного могут иметь нацеленную генетическую модификацию.[000354] The various methods provided herein allow for the generation of a genetically modified non-human F0 animal, wherein the cells of the genetically modified F0 animal contain a targeted genetic modification. It is recognized that, depending on the method used to generate the F0 animal, the number of cells within the F0 animal that have a targeted genetic modification will vary. Introduction of donor ES cells into a pre-morula stage embryo from an appropriate organism (e.g., an 8-cell stage mouse embryo) using, for example, the VELOCIMOUSE® method allows for a higher percentage of the cell population of the F0 animal to contain cells that have a targeted genetic modification. For example, at least 50%, 60%, 65%, 70%, 75%, 85%, 86%, 87%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% of the cellular contribution of the non-human F0 animal may comprise a population of cells having a targeted genetic modification. In addition, at least one or more germ cells of the F0 animal may have a targeted genetic modification.

А. Типы отличных от человека животных и клетокA. Types of non-human animals and cells

[000355] Приведенные в данном документе способы используют отличных от человека животных и клетки, и эмбрионы от отличных от человека животных. Такие отличные от человека животные предпочтительно представляют собой млекопитающих, таких как грызуны (например, крысы, мыши и хомяки). Другие отличные отчеловека млекопитающие включают, например, людей, отличных от человека приматов, обезьян, приматов, кошек, собак, кроликов, лошадей, быков, оленей, бизонов, скот (например, виды крупного рогатого скота, таких как коровы, волы и т.д.; виды овец, такие как овцы, козы и т.д., а также виды свиней, такие как свиньи и кабаны). Термин «отличный от человека» исключает людей. В некоторых способах, представленных в данном документе, отличные от человека животные и клетки, и эмбрионы от отличных от человека животных являются гибридными.[000355] The methods provided herein utilize non-human animals and cells and embryos from non-human animals. Such non-human animals are preferably mammals such as rodents (e.g., rats, mice, and hamsters). Other non-human mammals include, for example, humans, non-human primates, monkeys, apes, cats, dogs, rabbits, horses, bovines, deer, bison, cattle (e.g., bovine species such as cows, oxen, etc.; ovine species such as sheep, goats, etc.; and porcine species such as pigs and boars). The term "non-human" excludes humans. In some methods provided herein, the non-human animals and cells and embryos from non-human animals are hybrids.

[000356] Клетка отличного от человека животного, используемая в предлагаемых в данном документе способах, может представлять собой, например, тотипотентную клетку или плюрипотентную клетку (например, эмбриональную стволовую (ЭС) клетку, такую как ЭС-клетка грызуна, ЭС-клетка мыши, или ЭС-клетка крысы)). Тотипотентные клетки включают недифференцированные клетки, которые могут приводить к возникновению любого типа клеток, а плюрипотентные клетки включают недифференцированные клетки, которые обладают способностью развиваться в более чем один дифференцированные типы клеток. Такими плюрипотентными и/или тотипотентными клетками могут быть, например, ЭС-клетки или ЭС-подобные клетки, такие как индуцированные плюрипотентные стволовые клетки (iPS). ЭС-клетки включают в себя эмбрион-полученные тотипотентные или плюрипотентные клетки, которые способны вносить вклад в любую ткань развивающегося эмбриона после введения в эмбрион. ЭС-клетки могут быть получены из внутренней клеточной массы бластоцисты и способны дифференцироваться в клетки любого из трех зародышевых слоев позвоночных (энтодерма, эктодерма и мезодерма).[000356] A non-human animal cell used in the methods provided herein can be, for example, a totipotent cell or a pluripotent cell (e.g., an embryonic stem (ES) cell, such as a rodent ES cell, a mouse ES cell, or a rat ES cell)). Totipotent cells include undifferentiated cells that can give rise to any cell type, and pluripotent cells include undifferentiated cells that have the ability to develop into more than one differentiated cell type. Such pluripotent and/or totipotent cells can be, for example, ES cells or ES-like cells, such as induced pluripotent stem (iPS) cells. ES cells include embryo-derived totipotent or pluripotent cells that are capable of contributing to any tissue of a developing embryo upon introduction into the embryo. ES cells can be derived from the inner cell mass of the blastocyst and are capable of differentiating into cells of any of the three vertebrate germ layers (endoderm, ectoderm, and mesoderm).

[000357] Клетки отличного от человека животного, используемые в предлагаемых в данном документе способах, также могут включать эмбрионы на одноклеточной стадии (т.е. оплодотворенные ооциты или зиготы). Эмбрионы на одноклеточной стадии представляют собой эукариотические клетки, образованные событием оплодотворения между двумя гаметами. Такие эмбрионы на одноклеточной стадии могут быть из любого генетического фона (например, BALB/c, C57BL/6, 129 или их комбинации), могут быть свежими или замороженными и могут быть получены из естественного скрещивания или оплодотворения in vitro.[000357] Non-human animal cells used in the methods provided herein may also include single-cell stage embryos (i.e., fertilized oocytes or zygotes). Single-cell stage embryos are eukaryotic cells formed by a fertilization event between two gametes. Such single-cell stage embryos may be from any genetic background (e.g., BALB/c, C57BL/6, 129, or combinations thereof), may be fresh or frozen, and may be obtained from natural mating or in vitro fertilization.

[000358] Мыши и мышиные клетки, используемые в способах, представленных в данном документе, могут быть, например, из линии 129, линии C57BL/6, линии BALB/c, линии Swiss Webster, смеси линий 129 и C57BL/6, смеси линий BALB/c и C57BL/6, смеси линий 129 и BALB/c, и смеси линий BALB/c, C57BL/6 и 129. Например, мышь или мышиная клетка, используемая в предлагаемых в данном документе способах, может быть по меньшей мере частично из линии BALB/c (например, по меньшей мере около 25%, по меньшей мере около 50%, по меньшей мере около 75% полученного из линии BALB/c, или около 25%, около 50%, около 75% или около 100% полученного из линии BALB/c). В одном примере мыши или мышиные клетки могут иметь линию, содержащую 50% BALB/c, 25% C57BL/6 и 25% 129. Альтернативно, мыши или мышиные клетки могут содержать линию или комбинацию линий, которая исключает BALB/c. У таких мышей фон BALB/c не требуется для получения достаточного репертуара антигенсвязывающих белков против представляющего интерес чужеродного антигена.[000358] The mice and mouse cells used in the methods provided herein can be, for example, from the 129 strain, the C57BL/6 strain, the BALB/c strain, the Swiss Webster strain, a mixture of the 129 and C57BL/6 strains, a mixture of the BALB/c and C57BL/6 strains, a mixture of the 129 and BALB/c strains, and a mixture of the BALB/c, C57BL/6, and 129 strains. For example, a mouse or mouse cell used in the methods provided herein can be at least partially from the BALB/c strain (e.g., at least about 25%, at least about 50%, at least about 75% derived from the BALB/c strain, or about 25%, about 50%, about 75%, or about 100% derived from the BALB/c strain). In one example, the mice or mouse cells may have a lineage containing 50% BALB/c, 25% C57BL/6, and 25% 129. Alternatively, the mice or mouse cells may contain a lineage or combination of lines that excludes BALB/c. In such mice, a BALB/c background is not required to obtain a sufficient repertoire of antigen-binding proteins against a foreign antigen of interest.

[000359] Примеры линий 129 включают 129Р1, 129Р2, 129РЗ, 129X1, 129S1 (например, 129S1/SV, 129S1/Svlm), 129S2,129S4, 129S5, 129S9/SvEvH, 129S6 (129/SvEvTac), 129S7, 129S8, 129Т1 и 129Т2. См., например, Festing ег at. (1999) Mammalian Genome 10(8): 836, включенный в данный документ в качестве ссылки во всей полноте для всех целей. Примеры линий C57BL включают C57BL/A, C57BL/An, C57BL/GrFa, C57BL/Kal_wN, C57BL/6, C57BL/6J, C57BL/6ByJ, C57BL/6NJ, C57BL/10, C57BL/10ScSn, C57BL/10Cr и C57BL/Ola. Мыши и мышиные клетки, используемые в предлагаемых в данном документе способах, также могут быть из смеси вышеупомянутой линии 129 и вышеупомянутой линии C57BL/6 (например, 50% 129 и 50% C57BL/6). Аналогично, мыши и мышиные клетки, используемые в предлагаемых в данном документе способах, могут быть из смеси вышеупомянутых линий 129 или смеси вышеупомянутых линий BL/6 (например, линии 129S6 (129/SvEvTac)). Конкретным примером ЭС-клеток мыши является ЭС-клеткой мыши VGF1. ЭС-клетки мыши VGF1 (также известные как F1H4) были получены из гибридных эмбрионов, полученных путем скрещивания самки мыши C57BL/6NTac с самцом мыши 129S6/SvEvTac. См., например, Auerbach ег at. (2000) Biotechniques 29, 1024-1028, включенный в данный документ в качестве ссылки во всей полноте для всех целей.[000359] Examples of 129 lineages include 129P1, 129P2, 129P3, 129X1, 129S1 (e.g., 129S1/SV, 129S1/Svlm), 129S2, 129S4, 129S5, 129S9/SvEvH, 129S6 (129/SvEvTac), 129S7, 129S8, 129T1, and 129T2. See, e.g., Festing et al. (1999) Mammalian Genome 10(8): 836, incorporated herein by reference in its entirety for all purposes. Examples of C57BL strains include C57BL/A, C57BL/An, C57BL/GrFa, C57BL/Kal_wN, C57BL/6, C57BL/6J, C57BL/6ByJ, C57BL/6NJ, C57BL/10, C57BL/10ScSn, C57BL/10Cr, and C57BL/Ola. The mice and mouse cells used in the methods provided herein can also be from a mixture of the aforementioned 129 strain and the aforementioned C57BL/6 strain (e.g., 50% 129 and 50% C57BL/6). Similarly, the mice and mouse cells used in the methods provided herein can be from a mixture of the aforementioned 129 strains or a mixture of the aforementioned BL/6 strains (e.g., the 129S6 (129/SvEvTac) strain). A specific example of a mouse ES cell is the VGF1 mouse ES cell. VGF1 mouse ES cells (also known as F1H4) were derived from hybrid embryos obtained by crossing a female C57BL/6NTac mouse with a male 129S6/SvEvTac mouse. See, e.g., Auerbach et al. (2000) Biotechniques 29, 1024-1028, incorporated herein by reference in its entirety for all purposes.

[000360] Мыши и мышиные клетки, используемые в предлагаемых в данном документе способах, могут также иметь любую комбинацию гаплотипов МНС. Функция молекул МНС заключается в связывании чужеродных пептидных фрагментов и их дисплея на клеточной поверхности для распознавания соответствующими Т-клетками. Например, мыши и мышиные клетки могут содержать гаплотип MHCb (например, C57BL/6), гаплотип MHCd (например, BALB/c) или могут содержать как MHCb, так и MHCd (например, комбинацию C57BL/6 и BALB/c). Такие комбинации МНС могут приводить к увеличению титра антител.[000360] The mice and mouse cells used in the methods provided herein may also have any combination of MHC haplotypes. The function of MHC molecules is to bind foreign peptide fragments and display them on the cell surface for recognition by appropriate T cells. For example, the mice and mouse cells may contain an MHC b haplotype (e.g., C57BL/6), an MHC d haplotype (e.g., BALB/c), or may contain both MHC b and MHC d (e.g., a combination of C57BL/6 and BALB/c). Such MHC combinations may result in increased antibody titers.

[000361] Крысы или крысиные клетки, используемые в предлагаемых в данном документе способах, могут быть от любой линии крысы, включая, например, линию крысы ACI, линию крысы Dark Agouti (DA), линию крысы Wistar, линию крысы LEA, линию крысы Sprague Dawley (SD) или линию крысы Fischer, такую как Fisher F344 или Fisher F6. Крысы или крысиные клетки также могут быть получены из линии, полученной из смеси двух или более линий, указанных выше. Например, крысы или крысиные клетки могут быть из линии DA или линии ACI. Линия крысы ACI характеризуется наличием черного агути с белым животом и ногами и гаплотипом RT1av1. Такие линии доступны из различных источников, включая Harlan Laboratories. Примером линии ЭС-клеток крысы от крысы ACI является ЭС-клетка крысы ACI.G1. Линия крысы Dark Agouti (DA) характеризуется наличием агути шерсти и гаплотипа RT1av1. Такие крысы доступны из различных источников, включая Charles River и Harlan Laboratories. Примерами линий ЭС-клеток крысы от крысы DA является линия ЭС-клеток крысы DA.2B и линия ЭС-клеток крысы DA.2C. В некоторых случаях, крысы или крысиные клетки относятся к инбредной линии крысы. См., например, US 2014/0235933 Al, включенную в данном документе в качестве ссылки в полном объеме для всех целей. В других случаях, крысы или крысиные клетки относятся к гибридной линии крысы.[000361] The rats or rat cells used in the methods provided herein may be from any rat strain, including, for example, the ACI rat strain, the Dark Agouti (DA) rat strain, the Wistar rat strain, the LEA rat strain, the Sprague Dawley (SD) rat strain, or a Fischer rat strain such as Fisher F344 or Fisher F6. The rats or rat cells may also be derived from a strain derived from a mixture of two or more of the strains noted above. For example, the rats or rat cells may be from a DA strain or an ACI strain. The ACI rat strain is characterized by having a black agouti with a white belly and legs and the RT1 av1 haplotype. Such strains are available from a variety of sources, including Harlan Laboratories. An example of a rat ES cell line from an ACI rat is the ACI.G1 rat ES cell. The Dark Agouti (DA) rat strain is characterized by having an agouti coat and the RT1 av1 haplotype. Such rats are available from a variety of sources, including Charles River and Harlan Laboratories. Examples of rat ES cell strains from the DA rat include the DA.2B rat ES cell strain and the DA.2C rat ES cell strain. In some cases, the rats or rat cells refer to an inbred rat strain. See, for example, US 2014/0235933 Al, incorporated herein by reference in its entirety for all purposes. In other cases, the rats or rat cells refer to a hybrid rat strain.

[000362] Клетки, которые были имплантированы в эмбрион-хозяин, можно назвать «донорскими клетками». Донорская клетка может быть от той же линии, что и эмбрион-хозяин, или от другой линии. Аналогично, суррогатная мать может быть от той же линии, что и донорная клетка и/или эмбрион-хозяин, или суррогатная мать может быть от другой линии в качестве донорской клетки и/или эмбриона-хозяина.[000362] The cells that have been implanted into the host embryo may be referred to as "donor cells." The donor cell may be from the same lineage as the host embryo or from a different lineage. Similarly, the surrogate mother may be from the same lineage as the donor cell and/or host embryo, or the surrogate mother may be from a different lineage as the donor cell and/or host embryo.

[000363] В описанных в данном документе способах и композициях можно использовать множество эмбрионов-хозяев. Например, донорскую клетку (например, донорскую ЭС-клетку) можно вводить в эмбрион на стадии пред-морулы (например, эмбрион на стадии 8 клеток) из соответствующего организма. См., например, US 7576259; US 7659442; US 7294754; и US 2008/0078000, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. В других способах, донорские клетки могут быть имплантированы в эмбрион-хозяин на 2-клеточной стадии, 4-клеточной стадии, 8-клеточной стадии, 16-клеточной стадии, 32-клеточной стадии или 64-клеточной стадии. Эмбрион-хозяин также может быть бластоцистой или может быть эмбрионом до бластоцисты, эмбрионом на стадии пред-морулы, эмбрионом на стадии морулы, неплотным эмбрионом на стадии морулы или плотным эмбрионом на стадии морулы. При использовании эмбриона мыши, стадией эмбриона-хозяина может быть этап Тейлера 1 (TS1), TS2, TS3, TS4, TS5 и TS6 со ссылкой на этапы Тейлера, описанные в Theiler (1989) «The House Mouse: Atlas of Mouse Development," Springer-Verlag, Нью-Йорк, включенный в данный документ в качестве ссылки во всей полноте для всех целей. Например, этап Тейлера может быть выбран из TS1, TS2, TS3 и TS4. В некоторых способах эмбрион-хозяин включают внеклеточную оболочку ооцита, а донорская клетка представляет собой ЭС-клетку, которая вводится в эмбрион-хозяин через отверстие во внеклеточной оболочке ооцита. В других способах, эмбрион-хозяин является зона-менее эмбриона. В других способах эмбрион-хозяин на стадии морулы агрегируется.[000363] A variety of host embryos can be used in the methods and compositions described herein. For example, a donor cell (e.g., a donor ES cell) can be introduced into a pre-morula stage embryo (e.g., an 8-cell stage embryo) from a suitable organism. See, for example, US 7,576,259; US 7,659,442; US 7,294,754; and US 2008/0078000, each of which is incorporated herein by reference in its entirety for all purposes. In other methods, donor cells can be implanted into a 2-cell stage, 4-cell stage, 8-cell stage, 16-cell stage, 32-cell stage, or 64-cell stage host embryo. The host embryo may also be a blastocyst or may be a pre-blastocyst embryo, a pre-morula stage embryo, a morula stage embryo, a loose morula stage embryo, or a solid morula stage embryo. When using a mouse embryo, the stage of the host embryo may be Theiler stage 1 (TS1), TS2, TS3, TS4, TS5, and TS6, with reference to the Theiler stages described in Theiler (1989) "The House Mouse: Atlas of Mouse Development," Springer-Verlag, New York, incorporated herein by reference in its entirety for all purposes. For example, the Theiler stage may be selected from TS1, TS2, TS3, and TS4. In some methods, the host embryo includes the extracellular membrane of an oocyte, and the donor cell is an ES cell that is introduced into the host embryo through an opening in the extracellular membrane of the oocyte. In other methods, the host embryo is a zone-less embryo. In other methods, the host embryo at the morula stage is aggregated.

В. Отличные от человека животные для образования антигенсвязывающих белковB. Animals other than humans for the production of antigen-binding proteins

[000364] Отличное от человека животное, используемое в предлагаемых в данном документе способах, может быть любым отличным от человека животным, способным продуцировать антигенсвязывающие белки, таким как млекопитающее, грызун, крыса или мышь. Например, можно использовать отличное от человека животное (например, грызуна, такого как крыса или мышь), генетически модифицированное для оптимизации производства антител. Такие отличные от человека животные могут быть отличными от человека животными, сконструированными для облегчения крупномасштабного производства антител, которые могут быть использованы в качестве терапевтических средств для человека, включая отличных от человека животных, которые содержат гуманизированный локус иммуноглобулина. Например, отличное от человека животное (например, грызун, такой как крыса или мышь), может содержать одну или более из следующих модификаций в своей зародышевой линии: локус вариабельного участка тяжелой цепи отличного от человека животного (например, грызуна, такого как крыса или мышь) заменен полностью или частично на вариабельный локус гена тяжелой цепи человека; вариабельный участок локуса легкой цепи каппа отличного от человека животного (например, грызуна, такого как крыса или мышь) полностью или частично заменяется локусом вариабельного участка легкой цепи каппа человека; вариабельный участок локуса легкой цепи лямбда отличного от человека животного (например, грызуна, такого как крыса или мышь) полностью или частично заменяется локусом вариабельного участка легкой цепи лямбда человека; и локусы вариабельного участка тяжелой и легкой цепей заменены полностью своими человеческими гомологами или ортологами. Отличное от человека животное (например, грызун, такой как крыса или мышь) также может содержать одну или более следующих модификаций в своей зародышевой линии: полностью человеческие локусы вариабельного участка тяжелой и легкой цепей, функционально связанные с константным участком последовательности нуклеиновой кислоты отличного от человека животного (например, грызуна, такого как крыса или мышь), так что отличное от человека животное (например, грызун, такой как крыса или мышь), продуцирует В-клетку или антитело, содержащее вариабельный домен человека, слитый с константным доменом отличного от человека животного (например, грызуна, такого как крыса или мышь); или вариабельный участок тяжелой и/или легкой цепи человека, функционально связанный с константным участком последовательности нуклеиновой кислоты отличного от человека животного (например, грызун, такой как крыса или мышь), так что отличное от человека животное (например, грызун, такой как крыса или мышь) продуцирует В-клетку или антитело, содержащее вариабельный домен человека, слитый с константным участком отличного от человека животного (например, грызуна, такого как крыса или мышь). В качестве примера можно использовать мышей VELOCIMMUNE®. См., например, US 6596541, US 8791323, US 8895802, US 8895801, US 7105348, US 2002/0106629, US 2007/0061900, US 2011/0258710, US 2011/0283376, US 2013/0210137, US 2014/0017781, US 2014/0020124, US 2014/0020125, US 2014/0017782, US 2014/0018522, US 2014/0033337, US 2014/0033336, US 2014/0041068, US 2014/0073010, US 2014/0023637, US 2014/0017238, US 2014/0013457, US 2014/0017229, US 2002/0183275, US 8 502 018, US 2012/0322108, US 2013/0254911, US 2014/0213773, US 2015/0201589, US 2015/0210776, US 2014/0017228, US 8642835, US 8697940, и Murphy et al. (2014) Proc. Natl. Acad. Sci. U.S.A. 111(14): 5153-5158, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Мыши VELOCIMMUNE® содержат точную крупномасштабную замену вариабельных участков зародышевой линии, которые кодируют тяжелую цепь иммуноглобулина мыши (IgH) и легкую цепь иммуноглобулина (например, легкую цепь к, IgK), с соответствующими вариабельными участками иммуноглобулина человека в эндогенных локусах. Эта точная замена приводит к мыши с гибридными локусами иммуноглобулина, которые образуют тяжелые и легкие цепи, которые имеют вариабельные участки человека и константный участок мыши. Точная замена сегментов VH-DH-JH и Vk-Jk мыши оставляет фланкирующие последовательностей мыши интактными и функциональными в гибридныхлокусахиммуноглобулина. Гуморальная иммунная система мыши функционирует так же, как у мыши дикого типа. Развитие В-клеток беспрепятственно в любом значительном отношении, и богатое разнообразие вариабельных участков человека генерируется у мыши на антигенную стимуляцию.[000364] The non-human animal used in the methods provided herein can be any non-human animal capable of producing antigen-binding proteins, such as a mammal, a rodent, a rat, or a mouse. For example, a non-human animal (e.g., a rodent, such as a rat or mouse) that has been genetically modified to optimize antibody production can be used. Such non-human animals can be non-human animals engineered to facilitate large-scale production of antibodies that can be used as therapeutics for humans, including non-human animals that contain a humanized immunoglobulin locus. For example, a non-human animal (e.g., a rodent, such as a rat or mouse) can contain one or more of the following modifications in its germline: a heavy chain variable region locus of a non-human animal (e.g., a rodent, such as a rat or mouse) has been replaced, in whole or in part, with a human heavy chain variable locus; the variable region of the kappa light chain locus of a non-human animal (e.g., a rodent such as a rat or mouse) is replaced, in whole or in part, by a human kappa light chain variable region locus; the variable region of the lambda light chain locus of a non-human animal (e.g., a rodent such as a rat or mouse) is replaced, in whole or in part, by a human lambda light chain variable region locus; and the heavy and light chain variable region loci are replaced, in whole or in part, by their human homologs or orthologs. A non-human animal (e.g., a rodent, such as a rat or mouse) may also contain one or more of the following modifications in its germline: fully human heavy and light chain variable region loci operably linked to a constant region of a non-human animal (e.g., a rodent, such as a rat or mouse) nucleic acid sequence, such that the non-human animal (e.g., a rodent, such as a rat or mouse) produces a B cell or antibody comprising a human variable domain fused to a constant domain of a non-human animal (e.g., a rodent, such as a rat or mouse); or a human heavy and/or light chain variable region operably linked to a constant region of a nucleic acid sequence of a non-human animal (e.g., a rodent, such as a rat or mouse), such that the non-human animal (e.g., a rodent, such as a rat or mouse) produces a B cell or antibody comprising a human variable domain fused to a constant region of a non-human animal (e.g., a rodent, such as a rat or mouse). VELOCIMMUNE® mice can be used as an example. See, for example, US 6596541, US 8791323, US 8895802, US 8895801, US 7105348, US 2002/0106629, US 2007/0061900, US 2011/0258710, US 2011/0283376, US 2013/0210137, US 2014/0017781, US 2014/0020124, US 2014/0020125, US 2014/0017782, US 2014/0018522, US 2014/0033337, US 2014/0033336, US 2014/0041068, US 2014/0073010, US 2014/0023637, US 2014/0017238, US 2014/0013457, US 2014/0017229, US 2002/0183275, US 8 502 018, US 2012/0322108, US 2013/0254911, US 2014/0213773, US 2015/0201589, US 2015/0210776, US 2014/0017228, US 8642835, US 8697940, and Murphy et al. (2014) Proc. Natl. Acad. Sci. USA 111(14): 5153-5158, each of which is incorporated herein by reference in its entirety for all purposes. VELOCIMMUNE® mice contain a precise, large-scale exchange of the germline variable regions that encode mouse immunoglobulin heavy chain (IgH) and immunoglobulin light chain (e.g., κ light chain, IgK) with the corresponding human immunoglobulin variable regions at endogenous loci. This precise exchange results in a mouse with hybrid immunoglobulin loci that form heavy and light chains that have human variable regions and a mouse constant region. The precise exchange of the mouse V H -D H -J H and Vk-Jk segments leaves the mouse flanking sequences intact and functional at the hybrid immunoglobulin loci. The mouse humoral immune system functions as well as in a wild-type mouse. B cell development is unimpeded in any significant respect, and a rich diversity of human variable regions is generated in mice upon antigenic stimulation.

[000365] Отличные от человека животные (например, грызуны, такие как крысы или мыши), описанные выше (например, мыши VELOCIMMUNE®), могут также содержать в своей зародышевой линии функциональную эктопическую последовательность нуклеиновой кислоты, которая кодирует ADAM6 ген или голлолог, или ортолог или его функциональный фрагмент у отличного от человека животного (например, грызуна, такого как крыса или мышь). Например, такое отличное от человек животное (например, грызун, такой как крыса или мышь), может не иметь функционального эндогенного гена ADAM6 и содержать функциональную эктопическую последовательность нуклеиновой кислоты, чтобы дополнить потерю функции ADAM6 отличного от человека животного (например, грызуна, такого как крыса или мышь). Например, функциональная эктопическая последовательность может содержать один или более генов Adam6, таких как ген Adam6a мыши, ген Adam6b мыши или оба гена Adam6a и Adam6b. Эктопическая последовательность нуклеиновой кислоты может присутствовать в локусе вариабельного участка тяжелой цепи человека или в другом месте. См., например, US 2012/0322108; US 2013/0254911; US 2014/0213773; US 2015/0201589; US 2015/0210776; US 2014/0017228; и US 2013/0198879, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей.[000365] The non-human animals (e.g., rodents, such as rats or mice) described above (e.g., VELOCIMMUNE® mice) may also comprise in their germline a functional ectopic nucleic acid sequence that encodes an ADAM6 gene or a holologo or ortholog or functional fragment thereof in the non-human animal (e.g., a rodent, such as a rat or mouse). For example, such a non-human animal (e.g., a rodent, such as a rat or mouse) may lack a functional endogenous ADAM6 gene and may comprise a functional ectopic nucleic acid sequence to complement the loss of ADAM6 function of the non-human animal (e.g., a rodent, such as a rat or mouse). For example, a functional ectopic sequence may comprise one or more Adam6 genes, such as a mouse Adam6a gene, a mouse Adam6b gene, or both the Adam6a and Adam6b genes. The ectopic nucleic acid sequence may be present in a human heavy chain variable region locus or elsewhere. See, for example, US2012/0322108; US2013/0254911; US2014/0213773; US2015/0201589; US2015/0210776; US2014/0017228; and US2013/0198879, each of which is hereby incorporated by reference in its entirety for all purposes.

[000366] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают отличных от человека животных (например, грызунов, таких как крысы или мыши), генетически модифицированных для экспрессии ограниченного репертуара вариабельных доменов легкой цепи человека, или одного вариабельного домена легкой цепи человека, из ограниченного репертуара генных сегментов вариабельного участка легкой цепи человека. Такие отличные от человека животные генерируют «универсальные легкие цепи» или «обычные легкие цепи» и могут быть полезны при создании биспецифических антител. См., например, US 2011/0195454; US 2012/0021409; US 2012/0192300; US 2015/0059009; US 2013/0045492; US 2013/0198880; US 2013/0185821; US 2013/0302836; US 2013/0247234; US 2014/0329711; и US 2013/0198879, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Например, отличное от человека животное (например, грызун, такой как крыса или мышь), может быть генетически модифицировано, чтобы включать в себя один неперестроенный генный сегмент вариабельного участка легкой цепи человека (или два генных сегмента вариабельного участка легкой цепи человека), который перестраивают для образования перестроенного гена вариабельного участка легкой цепи человека (или два перестроенных гена вариабельного участка легкой цепи), которые экспрессируют одну легкую цепь (или экспрессируют одну или обе из двух легких цепей). Перестроенные вариабельные домены легкой цепи человека способны спариваться с множеством аффинно-созревших тяжелых цепей человека, выбранных с помощью отличных от человека животных (например, грызунов, таких как крысы или мыши), причем вариабельные участки тяжелой цепи специфически связывают различные эпитопы.[000366] Other non-human animals (e.g., rodents such as rats or mice) that can be used include non-human animals (e.g., rodents such as rats or mice) genetically modified to express a limited repertoire of human light chain variable domains, or a single human light chain variable domain, from a limited repertoire of human light chain variable region gene segments. Such non-human animals generate "universal light chains" or "conventional light chains" and can be useful in generating bispecific antibodies. See, e.g., US 2011/0195454; US 2012/0021409; US 2012/0192300; US 2015/0059009; US 2013/0045492; US 2013/0198880; US 2013/0185821; US 2013/0302836; US 2013/0247234; US 2014/0329711; and US 2013/0198879, each of which is incorporated herein by reference in its entirety for all purposes. For example, a non-human animal (e.g., a rodent such as a rat or mouse) can be genetically modified to include one non-rearranged human light chain variable region gene segment (or two human light chain variable region gene segments) that is rearranged to form a rearranged human light chain variable region gene (or two rearranged light chain variable region genes) that express one light chain (or express one or both of two light chains). The rearranged human light chain variable domains are able to pair with a variety of affinity-matured human heavy chains selected from non-human animals (e.g., rodents such as rats or mice), with the heavy chain variable regions specifically binding different epitopes.

[000367] Для достижения ограниченного репертуара вариантов легкой цепи отличное от человека животное (например, грызун, такой как крыса или мышь), может быть сконструировано таким образом, чтобы сделать нефункциональным или по существу нефункциональным его способность производить, или перестраивать нативный вариабельный домен легкой цепи отличного от человека животного (например, грызуна, такого как крыса или мышь). Это может быть достигнуто, например, путем удаления генных сегментов вариабельного участка легкой цепи отличного от человека животного (например, грызуна, такого как крыса или мышь). Затем эндогенный локус отличного от человека животного (например, грызуна, такого как крыса или мышь) может быть модифицирован экзогенным подходящим генным сегментом вариабельного участка легкой цепи человека, функционально связанным с константным участком легкой цепи отличного от человека животного (например, грызуна, такого как крыса или мышь) таким образом, что экзогенные генные сегменты вариабельного участка человека можно перестраивать и рекомбинировать с константным участком легкой цепи эндогенного гена отличного от человека животного (например, грызуна, такого как крыса или мышь) и образуют перестроенный обратный химерный ген легкой цепи (вариабельный человека, константный отличного от человека животного (например, грызуна, такого как крыса или мышь)).[000367] To achieve a limited repertoire of light chain variants, a non-human animal (e.g., a rodent, such as a rat or mouse) can be engineered to render non-functional or substantially non-functional its ability to produce, or to rearrange, a native non-human animal (e.g., a rodent, such as a rat or mouse) light chain variable domain. This can be achieved, for example, by deleting gene segments of the non-human animal (e.g., a rodent, such as a rat or mouse) light chain variable region. The endogenous locus of a non-human animal (e.g., a rodent such as a rat or mouse) can then be modified with an exogenous suitable human light chain variable region gene segment operably linked to a non-human animal (e.g., a rodent such as a rat or mouse) light chain constant region such that the exogenous human variable region gene segments can be rearranged and recombined with the endogenous non-human animal (e.g., a rodent such as a rat or mouse) light chain constant region to form a rearranged reverse chimeric light chain gene (human variable, non-human animal (e.g., a rodent such as a rat or mouse) constant).

[000368] Отличные от человека животные (например, грызуны, такие как крысы или мыши), описанные выше (например, «универсальная легкая цепь» или «обычная легкая цепь»), могут также содержать в своей зародышевой линии функциональную эктопическую последовательность нуклеиновой кислоты, которая кодирует ADAM6 ген или гомолог, или ортолог или его функциональный фрагмент у отличного от человека животного (например, грызуна, такого как крыса или мышь). Аналогично, любые другие отличные от человека животные (например, грызуны, такие как крысы или мыши), описанные в данном документе, могут также содержать в своей зародышевой линии функциональную эктопическую последовательность нуклеиновой кислоты, которая кодирует ADAM6 ген или гомолог, или ортолог или его функциональный фрагменту отличного от человека животного (например, грызуна, такого как крыса или мышь). Например, такое отличное от человек животное (например, грызун, такой как крыса или мышь), может не иметь функционального эндогенного гена ADAM6 и содержать функциональную эктопическую последовательность нуклеиновой кислоты, чтобы дополнить потерю функции ADAM6 отличного от человека животного (например, грызуна, такого как крыса или мышь). Эктопическая последовательность нуклеиновой кислоты может присутствовать в локусе вариабельного участка тяжелой цепи человека или в другом месте. См., например, US 2012/0322108; US 2013/0254911; US 2014/0213773; US 2015/0201589; US 2015/0210776; US 2014/0017228; и US 2013/0198879, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей.[000368] The non-human animals (e.g., rodents, such as rats or mice) described above (e.g., a "universal light chain" or a "normal light chain") may also comprise in their germline a functional ectopic nucleic acid sequence that encodes an ADAM6 gene or a homolog or ortholog or functional fragment thereof in a non-human animal (e.g., a rodent, such as a rat or mouse). Similarly, any other non-human animals (e.g., rodents, such as rats or mice) described herein may also comprise in their germline a functional ectopic nucleic acid sequence that encodes an ADAM6 gene or a homolog or ortholog or functional fragment thereof in a non-human animal (e.g., a rodent, such as a rat or mouse). For example, such a non-human animal (e.g., a rodent such as a rat or mouse) may lack a functional endogenous ADAM6 gene and contain a functional ectopic nucleic acid sequence to complement the loss of ADAM6 function of the non-human animal (e.g., a rodent such as a rat or mouse). The ectopic nucleic acid sequence may be present in a human heavy chain variable region locus or elsewhere. See, for example, US2012/0322108; US2013/0254911; US2014/0213773; US2015/0201589; US2015/0210776; US2014/0017228; and US2013/0198879, each of which is hereby incorporated by reference in its entirety for all purposes.

[000369] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают в себя отличное от человека животное, содержащее в своей зародышевой линии неперестроенный V-сегмент легкой цепи, и неперестроенный J-сегмент, функционально связанный с константным участком тяжелой цепи последовательности нуклеиновой кислоты. См., например, US 2012/0096572, US 2014/0130194 и US 2014/0130193, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Одним из примеров такого отличного от человека животного является отличное от человека животное, у которого геном зародышевой линии содержит модифицированный эндогенный локус тяжелой цепи иммуноглобулина, содержащий замену всех функциональных эндогенных вариабельных генных сегментов тяжелой цепи иммуноглобулина отличного от человека животного (VH), всех функциональных эндогенных разнообразных генных сегментов тяжелой цепи иммуноглобулина отличного от человека животного (DH), и всех функциональных эндогенных соединительных генных сегментов тяжелой цепи иммуноглобулина отличного от человека животного (JH) в эндогенном локусе тяжелой цепи иммуноглобулина отличного от человека животного с нуклеотидной последовательностью, которая содержит множество неперестроенных вариабельных генных сегментов легкой цепи иммуноглобулина человека (Vk) и множество соединительных генных сегментов легкой цепи иммуноглобулина человека (Jk) и функционально связан с эндогенной константным (СН) участком тяжелой цепи иммуноглобулина отличного от человека животного, где множество неперестроенных генных V сегментов легкой цепи иммуноглобулина человека и множество неперестроенных генных J сегментов легкой цепи иммуноглобулина человека участвуют в перестраивании в В-клетке при развитии В-клеток с образованием перестроенной последовательности гена легкой цепи Vk/Jk иммуноглобулина человека, функционально связанной с эндогенным СН-участком тяжелой цепи иммуноглобулина отличного от человека животного при модифицированном эндогенном локусе тяжелой цепи. Другим примером такого отличного от человека животного является отличное от человека животное, содержащее в своей зародышевой линии первый неперестроенный вариабельный генный сегмент легкой цепи каппа человека (Vk) и неперестроенный соединительный генный сегментлегкой цепи каппа человека (Jk), функционально связанный с эндогенным константным участком тяжелой цепи отличного от человека животного в эндогенном локусе тяжелой цепи отличного от человека животного, причем первый неперестроенный генный сегмент Vk человека и неперестроенный генный сегмент Jk человека заменяют все функциональные эндогенные вариабельные генные сегменты тяжелой цепи отличного от человека животного (VH), все функциональные эндогенные разнообразные генные сегменты тяжелой цепи отличного от человека животного (DH), и все функциональные эндогенные соединительные генные сегменты тяжелой цепи отличного от человека животного (JH), отличные от человека, причем первый неперестроенный генный сегмент Vk человека и неперестроенный генный сегмент Jk человека участвуют в перестраивании с образованием перестроенной последовательности Vk/Jk, функционально связанной с эндогенным константным участком тяжелой цепи отличного от человека животного у отличного от человека животного, и причем отличное от человека животное дополнительно содержит в своей зародышевой линии второй вариабельный генный сегмент легкой цепи человека (VL) и соединительный генный сегмент легкой цепи человека (JL), функционально связанный с константным геном легкой цепи отличного от человека животного. Еще одним примером такого отличного от человека животного является отличное от человека животное, у которого геном содержит: (а) эндогенный локус тяжелой цепи иммуноглобулина, модифицированный, чтобы содержать замену всех функциональных эндогенных вариабельных генных сегментов (VH) тяжелой цепи иммуноглобулина отличного от человека животного, всех функциональных эндогенных разнообразных генных сегментов (DH) тяжелой цепи иммуноглобулина отличного от человека животного, и всех функциональных эндогенных соединительных генных сегментов (JH) тяжелой цепи иммуноглобулина отличного от человека животного в эндогенном локусе тяжелой цепи иммуноглобулина отличного от человека животного первым множеством неперестроенных вариабельных генных сегментов легкой цепи человека (Vk) и первым множеством неперестроенных соединительных генных сегментов легкой цепи человека (Jk), причем первое множество неперестроенных генных сегментов гена Vk и Jk легкой цепи иммуноглобулина человека функционально связано с эндогенным константным (СН) участком тяжелой цепи последовательности нуклеиновой кислоты в эндогенном локусе тяжелой цепи иммуноглобулина и участвует в перестраивании в В-клетке при развитии В-клеток для образования первой перестроенной последовательности гена легкой цепи Vk/Jk человека, функционально связанной с эндогенной СН последовательностью нуклеиновой кислоты отличного от человека животного; и (b) модифицированный локус легкой цепи иммуноглобулина, содержащий второе множество неперестроенных вариабельных (Vk) генных сегментов легкой цепи человека и второе множество неперестроенных соединительных (Jk) генных сегментов легкой цепи человека, функционально связанное с эндогенным константным участком (Ск) легкой цепи последовательности нуклеотидной кислоты отличного от человека животного в эндогенном локусе легкой цепи отличного от человека животного, причем второе множество неперестроенных генных сегментов Vk и Jk легкой цепи иммуноглобулина человека заменяет все функциональные эндогенные вариабельные (Vk) генные сегменты легкой цепи отличного от человека животного и все функциональные эндогенные соединительные (Jk) генные сегменты легкой цепи отличного от человека животного в эндогенном локусе цепи и участвуют в перестраивании в В-клетке при развитии В-клеток с образованием второй перестроенной последовательности участка Vk/Jk гена легкой цепи иммуноглобулина человека функционально связанный с эндогенным Ск-участком последовательности нуклеиновой кислоты отличного от человека животного.[000369] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal that comprises in its germline an unrearranged V segment of a light chain and an unrearranged J segment operably linked to a heavy chain constant region of a nucleic acid sequence. See, for example, US2012/0096572, US2014/0130194, and US2014/0130193, each of which is herein incorporated by reference in its entirety for all purposes. One example of such a non-human animal is a non-human animal in which the germline genome comprises a modified endogenous immunoglobulin heavy chain locus that comprises a replacement of all functional endogenous non-human immunoglobulin heavy chain variable gene segments (V H ), all functional endogenous non-human immunoglobulin heavy chain diverse gene segments (D H ), and all functional endogenous non-human immunoglobulin heavy chain joining gene segments (J H ) at the endogenous non-human immunoglobulin heavy chain locus with a nucleotide sequence that comprises a plurality of unrearranged human immunoglobulin light chain variable gene segments (Vk) and a plurality of human immunoglobulin light chain joining gene segments (Jk) and is operably linked to an endogenous non-human immunoglobulin heavy chain constant ( CH ) region, where the plurality of unrearranged immunoglobulin light chain V gene segments human and multiple unrearranged human immunoglobulin light chain J gene segments participate in a rearrangement in the B cell during B cell development to form a rearranged human immunoglobulin light chain Vk/Jk gene sequence functionally linked to the endogenous CH region of a non-human animal immunoglobulin heavy chain at a modified endogenous heavy chain locus. Another example of such a non-human animal is a non-human animal that contains in its germline the first unrearranged human kappa light chain variable gene segment (Vk) and the unrearranged human kappa light chain joining gene segment (Jk) operably linked to an endogenous non-human animal heavy chain constant region at an endogenous non-human animal heavy chain locus, wherein the first unrearranged human Vk gene segment and the unrearranged human Jk gene segment replace all functional endogenous non-human animal heavy chain variable gene segments (V H ), all functional endogenous non-human animal heavy chain diverse gene segments (D H ), and all functional endogenous non-human animal heavy chain joining gene segments (J H ), wherein the first unrearranged human Vk gene segment and the unrearranged human Jk gene segment participate in rearrangement to form a rearranged Vk/Jk sequence operably linked to an endogenous non-human heavy chain constant region in a non-human animal, and wherein the non-human animal further comprises in its germline a second human light chain variable gene segment (V L ) and a human light chain joining gene segment (J L ) operably linked to a non-human animal light chain constant gene. Another example of such a non-human animal is a non-human animal whose genome comprises: (a) an endogenous immunoglobulin heavy chain locus that is modified to contain a replacement of all functional endogenous non-human animal immunoglobulin heavy chain variable (V H ) gene segments, all functional endogenous non-human animal immunoglobulin heavy chain diverse (D H ) gene segments, and all functional endogenous non-human animal immunoglobulin heavy chain joining (J H ) gene segments at the endogenous non-human animal immunoglobulin heavy chain locus with a first plurality of unrearranged human light chain variable (Vk) gene segments and a first plurality of unrearranged human light chain joining (Jk) gene segments, wherein the first plurality of unrearranged human immunoglobulin light chain Vk and Jk gene segments are operably linked to an endogenous heavy chain constant ( CH ) region of a nucleic acid sequence in the endogenous the immunoglobulin heavy chain locus and participates in the rearrangement in the B cell during B cell development to form the first rearranged human Vk/Jk light chain gene sequence functionally linked to the endogenous CH nucleic acid sequence of a non-human animal; and (b) a modified immunoglobulin light chain locus comprising a second plurality of unrearranged human light chain variable (Vk) gene segments and a second plurality of unrearranged human light chain joining (Jk) gene segments operably linked to an endogenous light chain constant region (Ck) of a non-human animal nucleotide acid sequence at an endogenous light chain locus of the non-human animal, wherein the second plurality of unrearranged human immunoglobulin light chain Vk and Jk gene segments replace all functional endogenous non-human animal light chain variable (Vk) gene segments and all functional endogenous non-human animal light chain joining (Jk) gene segments at the endogenous chain locus and participate in rearrangement in a B cell during B cell development to form a second rearranged human immunoglobulin light chain Vk/Jk gene sequence operably linked to the endogenous Ck region nucleic acid sequences from a non-human animal.

[000370] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают в себя отличное от человека животное, содержащее в геноме своей зародышевой линии локус тяжелой цепи иммуноглобулина, который содержит перестроенную нуклеотидную последовательность вариабельного участка тяжелой цепи иммуноглобулина человека, функционально связанную с эндогенным константным участком последовательности гена иммуноглобулина отличного от человека животного. См., например, US 2015/0020224, US 2014/0245468, US 2016/0100561, US 9204624 и US 14/961642, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Одним примером такого отличного от человека животные является отличное от человека животные, содержащее в геноме своей зародышевой линии в эндогенном локусе тяжелой цепи иммуноглобулина перестроенную нуклеотидную последовательность вариабельного участка тяжелой цепи иммуноглобулина человека, функционально связанную с эндогенным константным участком тяжелой цепи последовательности гена, причем перестроенная нуклеотидная последовательность вариабельного участка тяжелой цепи кодирует последовательность VH3-23/X1X2/JH, где X1 представляет собой любую аминокислоту, а Х2 представляет собой любую аминокислоту. Другим примером такого отличного от человека животного является отличное от человека животное, содержащее в геноме своей зародышевой линии генетически модифицированный эндогенный локус тяжелой цепи иммуноглобулина, который содержит перестроенную нуклеотидную последовательность вариабельного участка тяжелой цепи иммуноглобулина человека, функционально связанную с эндогенным константным участком последовательности гена иммуноглобулина, не относящегося к человеку, причем отличное от человека животное проявляет гуморальную иммунную систему, по существу, сходную с отличными от человека животными в отношении популяций В-клеток. Еще одним примером такого отличного от человека животного является отличное от человека животное, содержащее генетически модифицированный эндогенный локус тяжелой цепи иммуноглобулина, который содержит перестроенную нуклеотидную последовательность вариабельного участка тяжелой цепи человеческого иммуноглобулина, содержащую последовательность V-сегмента тяжелой цепи (VH), которая является функционально связанный через спейсер с последовательностью J-сегментов тяжелой цепи (JH), причем спейсер содержит кодирует по меньшей мере два аминокислотных остатка, причем перестроенная нуклеотидная последовательность вариабельного участка тяжелой цепи иммуноглобулина человека функционально соответствует эндогенной последовательности гена константного участка иммуноглобулина отличного от человека животного. В одном примере, сегмент VH представляет собой VH3-23.[000370] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal that comprises in its germline genome an immunoglobulin heavy chain locus that comprises a rearranged human immunoglobulin heavy chain variable region nucleotide sequence operably linked to an endogenous constant region of an immunoglobulin gene sequence of the non-human animal. See, for example, US2015/0020224, US2014/0245468, US2016/0100561, US9204624, and US14/961642, each of which is herein incorporated by reference in its entirety for all purposes. One example of such a non-human animal is a non-human animal that contains in its germline genome at the endogenous immunoglobulin heavy chain locus a rearranged nucleotide sequence of a human immunoglobulin heavy chain variable region operably linked to an endogenous heavy chain constant region gene sequence, wherein the rearranged nucleotide sequence of the heavy chain variable region encodes the sequence V H 3-23/X 1 X 2 /J H , where X 1 is any amino acid and X 2 is any amino acid. Another example of such a non-human animal is a non-human animal that contains in its germline genome a genetically modified endogenous immunoglobulin heavy chain locus that contains a rearranged human immunoglobulin heavy chain variable region nucleotide sequence operably linked to an endogenous constant region of a non-human immunoglobulin gene sequence, wherein the non-human animal exhibits a humoral immune system substantially similar to non-human animals with respect to B cell populations. Another example of such a non-human animal is a non-human animal comprising a genetically modified endogenous immunoglobulin heavy chain locus that comprises a rearranged nucleotide sequence of a human immunoglobulin heavy chain variable region comprising a heavy chain V segment (V H ) sequence that is operably linked through a spacer to a heavy chain J segment (J H ) sequence, wherein the spacer comprises encoding at least two amino acid residues, wherein the rearranged nucleotide sequence of the human immunoglobulin heavy chain variable region operably corresponds to an endogenous immunoglobulin constant region gene sequence of the non-human animal. In one example, the V H segment is V H 3-23.

[000371] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают отличное от человека животное геном чьей зародышевой линии содержит: ограниченный локус тяжелой цепи иммуноглобулина, характеризующийся наличием отдельного неперестроенного генного сегмента VH человека, одного или более неперестроенного генных сегментов DH человека, и одного или более неперестроенного генных JH человека, функционально связанный с последовательностью нуклеиновой кислоты константного участка тяжелой цепи иммуноглобулина, не относящегося к человеку, причем отличное от человека животное дополнительно содержит В-клетку, содержащую перестроенную последовательность гена вариабельного участка тяжелой цепи человека, полученную из ограниченного локуса тяжелой цепи иммуноглобулина. См., например, US 2013/0323791 и US 2013/0096287, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. У некоторых таких отличных от человека животных одиночный неперестроенный генный сегмент VH человека представляет собой VH1-69. У некоторых таких отличных от человека животных одиночный неперестроенный генный сегмент VH человека представляет собой VH1-2. Другие отличные от человека животные, которые могут быть использованы, включают в себя отличное от человека животное, чей эндогенный локус тяжелой цепи иммуноглобулина ограничен тем, что он содержит один генный сегмент VH человека, один или более генный сегмент DH человека, и один или более генный сегмент JH и который не содержит функциональный эндогенный локус вариабельного участка тяжелой цепи иммуноглобулина; отличное от человека животное, дополнительно содержащее один или более генных сегментов VL иммуноглобулина человека, функционально связанные с одним или более генных сегментов JL человека, причем один генный сегмент VH человека, один или более генных сегментов DH человека, и один или более генных сегментов JH являются функционально связанным с геном константного участка тяжелой цепи иммуноглобулина, не относящегося к человеку, причем один генный сегмент VH человека представляет собой VH1-69 или его полиморфный вариант.[000371] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal whose germline genome comprises: a restricted immunoglobulin heavy chain locus characterized by having a single, unrearranged human V H gene segment, one or more unrearranged human D H gene segments, and one or more unrearranged human J H gene segments operably linked to a non-human immunoglobulin heavy chain constant region nucleic acid sequence, wherein the non-human animal further comprises a B cell comprising a rearranged human heavy chain variable region gene sequence derived from the restricted immunoglobulin heavy chain locus. See, e.g., US 2013/0323791 and US 2013/0096287, each of which is herein incorporated by reference in its entirety for all purposes. In some such non-human animals, the single unrearranged human V H gene segment is V H 1-69. In some such non-human animals, the single unrearranged human V H gene segment is V H 1-2. Other non-human animals that may be used include a non-human animal whose endogenous immunoglobulin heavy chain locus is limited in that it contains one human V H gene segment, one or more human D H gene segments, and one or more human J H gene segments and that does not contain a functional endogenous immunoglobulin heavy chain variable region locus; a non-human animal further comprising one or more human V L immunoglobulin gene segments operably linked to one or more human J L gene segments, wherein the one human V H gene segment, the one or more human D H gene segments, and the one or more J H gene segments are operably linked to a non-human immunoglobulin heavy chain constant region gene, wherein the one human V H gene segment is V H 1-69 or a polymorphic variant thereof.

[000372] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают в себя отличное от человека животное, содержащее в геноме своей зародышевой линии генетически модифицированный локус тяжелой цепи иммуноглобулина, содержащий неперестроенную нуклеотидную последовательность вариабельного участка тяжелой цепи иммуноглобулина человека, причем неперестроенная нуклеотидная последовательность вариабельного участка тяжелой цепи содержит добавление по меньшей мере одного гистидинового кодона или замещение по меньшей мере одного негистидинового кодона с гистидиновым кодоном, причем гистидиновый кодон не кодируется соответствующим генным сегментом вариабельного участка тяжелой цепи зародышевой линии человека; и причем добавленный или замещенный гистидиновый кодон присутствует в комплементарной определяющем участке 3 (CDR3), кодирующей последовательность. См., например, US 2013/0247235, US 9301510 и US 14/046501, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей.[000372] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal that comprises in its germline genome a genetically modified immunoglobulin heavy chain locus that comprises a non-rearranged nucleotide sequence of a human immunoglobulin heavy chain variable region, wherein the non-rearranged nucleotide sequence of the heavy chain variable region comprises the addition of at least one histidine codon or the substitution of at least one non-histidine codon with a histidine codon, wherein the histidine codon is not encoded by a corresponding human germline heavy chain variable region gene segment; and wherein the added or substituted histidine codon is present in complementary determining region 3 (CDR3) coding sequence. See, for example, US 2013/0247235, US 9301510, and US 14/046501, each of which is incorporated herein by reference in its entirety for all purposes.

[000373] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают отличное от человека животное, содержащее генетическую модификацию зародышевой линии, которая содержит делецию по меньшей мере части нуклеотидной последовательности, кодирующей домен СН1 эндогенного константного участка гена IgG; причем отличное от человека животное экспрессирует константный участок гена IgM, который содержит функциональный домен СН1, и отличное от человека животное экспрессирует в своей сыворотке антитело IgG, которое не содержит домен СН1 полностью или частично, и которое не содержит родственную легкую цепь. См., например, US 2011/0145937, US 2014/0289876, US 2015/0197553, US 2015/0197554, US 2015/0197555, US 2015/0196015, US 2015/0197556, US 2015/0197557 и US 8754287, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Примером такого отличного от человека животного является отличное от человека животное, содержащее модификацию зародышевой линии, причем эта модификация содержит: (а) делецию нуклеотидной последовательности, кодирующую ген СН1-домена константного участка эндогенного IgG; и (b) включение одного или более генных сегментов вариабельного участка тяжелой цепи человека, причем один или более генных сегментов вариабельного участка тяжелой цепи человека функционально связаны с константным участком эндогенного IgG (а); причем отличное от человека животное содержит ген константного участка интактного IgM, и отличное от человека животное экспрессирует тяжелую цепь антитела IgG, содержащее вариабельный домен человека, лишенный домена СН1, полностью или частично, и не обладает родственной легкой цепью и секретирует тяжелую цепь указанного антитела IgG в свою сыворотку. См., например, US 2011/0145937. Другим примером такого отличного от человека животного является отличное от человека животное, содержащее модификацию зародышевой линии, причем эта модификация содержит: (а) делецию последовательности нуклеиновой кислоты, кодирующей СН1-домен и ген константного участка шарнирного участка эндогенного IgG; и (b) включение одного или более генных сегментов вариабельного участка тяжелой цепи человека, причем один или более генных сегментов вариабельного участка тяжелой цепи человека функционально связаны с константным участком эндогенного IgG (а); причем отличное от человека животное содержит ген константного участка интактного IgM. См., например, US 2015/0197553. Еще одним примером такого отличного от человека животного является отличное от человека животное, содержащее модификацию зародышевой линии, причем эта модификация содержит: (а) делецию последовательности нуклеиновой кислоты, кодирующей СН1-домен и гена константного участка эндогенного IgG; (b) делецию гена константного участка эндогенного IgG2a; (с) делецию гена константного участка эндогенного IgG2b; и (d) включение одного или более генных сегментов вариабельного участка тяжелой цепи человека, причем один или более генных сегментов вариабельного участка тяжелой цепи человека функционально связаны с константным участком эндогенного IgG (а); причем отличное от человека животное содержит ген константного участка интактного IgM. См., например, US 2015/0197554. Еще одним примером такого отличного от человека животного является отличное от человека животное, содержащее модификацию зародышевой линии, причем эта модификация содержит: (а) делецию последовательности нуклеиновой кислоты, кодирующей СН1-домен и ген константного участка шарнирного участка эндогенного IgG; (b) делецию гена константного участка эндогенного IgG2a; (с) делецию гена константного участка эндогенного IgG2b; и (d) включение одного или более генных сегментов вариабельного участка тяжелой цепи человека, причем один или более генных сегментов вариабельного участка тяжелой цепи человека функционально связаны с константным участком эндогенного IgG (а); причем отличное от человека животное содержит ген константного участка интактного IgM. См., например, US 2015/0197555. Еще одним примером такого отличного от человека животного является отличное от человека животное, содержащее модификацию зародышевой линии, причем эта модификация содержит: (а) делецию последовательности нуклеиновой кислоты, кодирующей СН1-домен гена константного участка эндогенного IgG1; (b) делецию гена константного участка эндогенного IgD; (с) делецию гена константного участка эндогенного IgG3; (d) делецию гена константного участка эндогенного IgG2a; (е) делецию гена константного участка эндогенного IgG2b; (f) делецию гена константного участка эндогенного IgE; (g) делецию гена константного участка эндогенного IgA; и (h) включение одного или более генных сегментов вариабельного участка тяжелой цепи человека, причем один или более генных сегментов вариабельного участка тяжелой цепи человека функционально связаны с константным участком эндогенного IgG1 (а); причем отличное от человека животное содержит ген константного участка интактного IgM. См., например, US 2015/0196015. Еще одним примером такого отличного от человека животного является отличное от человека животное, содержащее модификацию зародышевой линии, причем эта модификация содержит: (а) делецию последовательности нуклеиновой кислоты, кодирующей СН1-домен гена константного участка эндогенного IgG1; (b) делецию последовательности нуклеиновой кислоты, кодирующей ген СН1 домен константного участка эндогенного IgG2a; (с) делецию гена константного участка эндогенного IgD; (d) делецию гена константного участка эндогенного IgG3; (е) делецию гена константного участка эндогенного IgG2b; (f) делецию гена константного участка эндогенного IgE; (g) делецию гена константного участка эндогенного IgA; и (h) включение одного или более генных сегментов вариабельного участка тяжелой цепи человека, причем один или более генных сегментов вариабельного участка тяжелой цепи человека функционально связаны с константным участком эндогенного IgG1 (а); причем отличное от человека животное содержит ген константного участка интактного IgM. См., например, US 2015/0197556. Еще одним примером такого отличного от человека животного является отличное от человека животное, содержащее модификацию зародышевой линии, причем эта модификация содержит: (а) делецию последовательности нуклеиновой кислоты, кодирующей СН1-домен и ген константного участка шарнирного участка эндогенного IgG1; (b) делецию гена константного участка эндогенного IgD; (с) делецию гена константного участка эндогенного IgG3; (d) делецию гена константного участка эндогенного IgG2a; (е) делецию гена константного участка эндогенного IgG2b; (f) делецию гена константного участка эндогенного IgE; (g) делецию гена константного участка эндогенного IgA; и (h) включение одного или более генных сегментов вариабельного участка тяжелой цепи человека, причем один или более генных сегментов вариабельного участка тяжелой цепи человека функционально связаны с константным участком эндогенного IgG1 (а); причем отличное от человека животное содержит ген константного участка интактного IgM. См., например, US 2015/0197557.[000373] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal that comprises a germline genetic modification that comprises a deletion of at least a portion of a nucleotide sequence encoding a CH1 domain of an endogenous constant region of an IgG gene; wherein the non-human animal expresses an IgM gene constant region that comprises a functional CH1 domain, and the non-human animal expresses in its serum an IgG antibody that lacks all or a portion of the CH1 domain and that lacks a cognate light chain. See, for example, US2011/0145937, US2014/0289876, US2015/0197553, US2015/0197554, US2015/0197555, US2015/0196015, US2015/0197556, US2015/0197557, and US8754287, each of which is incorporated herein by reference in its entirety for all purposes. An example of such a non-human animal is a non-human animal comprising a germline modification, the modification comprising: (a) a deletion of a nucleotide sequence encoding the CH1 domain gene of an endogenous IgG constant region; and (b) comprising one or more human heavy chain variable region gene segments, wherein the one or more human heavy chain variable region gene segments are operably linked to an endogenous IgG constant region (a); wherein the non-human animal comprises an intact IgM constant region gene, and the non-human animal expresses an IgG antibody heavy chain comprising a human variable domain lacking a CH1 domain, in whole or in part, and lacks a cognate light chain, and secretes the heavy chain of said IgG antibody into its serum. See, for example, US 2011/0145937. Another example of such a non-human animal is a non-human animal comprising a germline modification, wherein the modification comprises: (a) a deletion of a nucleic acid sequence encoding a CH1 domain and a hinge constant region gene of an endogenous IgG; and (b) comprising one or more human heavy chain variable region gene segments, wherein the one or more human heavy chain variable region gene segments are operably linked to an endogenous IgG constant region (a); wherein the non-human animal comprises an intact IgM constant region gene. See, for example, US 2015/0197553. Another example of such a non-human animal is a non-human animal comprising a germline modification, wherein the modification comprises: (a) a deletion of a nucleic acid sequence encoding a CH1 domain and an endogenous IgG constant region gene; (b) a deletion of an endogenous IgG2a constant region gene; (c) a deletion of an endogenous IgG2b constant region gene; and (d) comprising one or more human heavy chain variable region gene segments, wherein the one or more human heavy chain variable region gene segments are operably linked to an endogenous IgG constant region (a); wherein the non-human animal comprises an intact IgM constant region gene. See, for example, US 2015/0197554. Another example of such a non-human animal is a non-human animal comprising a germline modification, wherein the modification comprises: (a) a deletion of a nucleic acid sequence encoding the CH1 domain and the hinge constant region gene of endogenous IgG; (b) a deletion of the endogenous IgG2a constant region gene; (c) a deletion of the endogenous IgG2b constant region gene; and (d) comprising one or more human heavy chain variable region gene segments, wherein the one or more human heavy chain variable region gene segments are operably linked to an endogenous IgG constant region (a); wherein the non-human animal comprises an intact IgM constant region gene. See, for example, US 2015/0197555. Another example of such a non-human animal is a non-human animal comprising a germline modification, wherein the modification comprises: (a) a deletion of a nucleic acid sequence encoding the CH1 domain of an endogenous IgG1 constant region gene; (b) a deletion of an endogenous IgD constant region gene; (c) a deletion of an endogenous IgG3 constant region gene; (d) a deletion of an endogenous IgG2a constant region gene; (e) a deletion of an endogenous IgG2b constant region gene; (f) a deletion of an endogenous IgE constant region gene; (g) a deletion of an endogenous IgA constant region gene; and (h) the inclusion of one or more human heavy chain variable region gene segments, wherein the one or more human heavy chain variable region gene segments are operably linked to an endogenous IgG1 constant region (a); wherein the non-human animal comprises an intact IgM constant region gene. See, for example, US 2015/0196015. Another example of such a non-human animal is a non-human animal comprising a germline modification, wherein the modification comprises: (a) a deletion of a nucleic acid sequence encoding the CH1 domain of an endogenous IgG1 constant region gene; (b) a deletion of a nucleic acid sequence encoding the CH1 domain of an endogenous IgG2a constant region gene; (c) a deletion of an endogenous IgD constant region gene; (d) a deletion of an endogenous IgG3 constant region gene; (e) a deletion of an endogenous IgG2b constant region gene; (f) a deletion of an endogenous IgE constant region gene; (g) a deletion of an endogenous IgA constant region gene; and (h) the inclusion of one or more human heavy chain variable region gene segments, wherein the one or more human heavy chain variable region gene segments are operably linked to an endogenous IgG1 constant region (a); wherein the non-human animal comprises an intact IgM constant region gene. See, for example, US 2015/0197556. Another example of such a non-human animal is a non-human animal comprising a germline modification, wherein the modification comprises: (a) a deletion of a nucleic acid sequence encoding the CH1 domain and the hinge constant region gene of an endogenous IgG1; (b) a deletion of an endogenous IgD constant region gene; (c) a deletion of an endogenous IgG3 constant region gene; (d) a deletion of an endogenous IgG2a constant region gene; (e) a deletion of an endogenous IgG2b constant region gene; (f) a deletion of an endogenous IgE constant region gene; (g) a deletion of an endogenous IgA constant region gene; and (h) comprising one or more human heavy chain variable region gene segments, wherein the one or more human heavy chain variable region gene segments are operably linked to an endogenous IgG1 constant region (a); wherein the non-human animal comprises an intact IgM constant region gene. See, for example, US 2015/0197557.

[000374] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают отличное от человека животное, содержащее последовательность вариабельного участка легкой цепи λ (Vλ) и по меньшей мере одну J-последовательность (J), смежную с последовательностью константного участка легкой цепи к отличного от человека животного. См., например, US 2012/0073004, US 2014/0137275, US 2015/0246976, US 2015/0246977, US 2015/0351371, US 9035128, US 9066502, US 9163092 и US 9150662, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Одним из примеров такого отличного от человека животного является отличным от человека животным, содержащее: (а) по меньшей мере 12 до по меньшей мере 40 неперестроенных генных сегментов вариабельного участка человеческой легкой цепи λ человека и по меньшей мере один генный сегмент Jλ человека на эндогенном локусе легкой цепи отличного от человека животных; (b) межгенную последовательность Vk-Jk человека, расположенную между по меньшей мере 12 до по меньшей мере 40 генных сегментов вариабельного участка легкой цепи человека и по меньшей мере одну последовательность Jλ человека; причем отличное от человека животное экспрессирует антитело, которое содержит легкую цепь, содержащую домен Vλ человека и домен Ск отличного от человека животного. Еще одним примером такого отличного от человека животного является отличное от человека животное, содержащее в эндогенном локусе легкой цепи к в его зародышевой линии: (а) неперестроенный вариабельный участок легкой цепи, содержащий множество смежных неперестроенных функциональных V генных сегментов легкой цепи λ (hVλ) человека и множество смежных неперестроенных функциональных J генных сегментов легкой цепи λ человека (hJλ), причем множество генных сегментов hVλ и множество генных сегментов hJλ являются только функциональными генными сегментами вариабельного участка в неперестроенном вариабельном участке легкой цепи; и (b) ген константного участка легкой цепи к отличного от человека животного, причем множество смежных неперестроенных V генных сегментов легкой цепи λ человека (hVλ) и множество смежных неперестроенных J генных сегментов легкой цепи λ человека (hJλ) являются функционально связанными с геном константного участка легкой цепи к отличного от человека животного, так что неперестроенный вариабельный участок легкой цепи способна перестраиваться, чтобы сформировать перестроенный вариабельный участок легкой цепи λ человека, а отличное от человека животное экспрессирует антитела, содержащие легкую цепь, содержащую вариабельный участок, кодируемый с помощью перестроенного вариабельного участка легкой цепи λ человека и константного участка, кодируемого с помощью гена константного участка легкой цепи к отличного от человека животного. Еще одним примером такого отличного от человека животного является отличное от человека животное, содержащее в эндогенном локусе легкой цепи к в его зародышевой линии: (а) неперестроенный вариабельный участок легкой цепи, содержащую: (i) по меньшей мере 12 смежных неперестроенных функциональных V генных сегментов вариабельного участка легкой цепи λ (hVλ) человека и множество смежных неперестроенных функциональных J генных сегментов легкой цепи λ (hJλ), причем по меньшей мере 12 функциональных генных сегментов hVλ и множество функциональных генных сегментов hJλ являются только функциональными генными сегментами вариабельного участка в неперестроенном вариабельном участке легкой цепи; и (ii) межгенную последовательность Vk-Jk человека, расположенную между смежными генными сегментами hVλ и множеством смежных генных сегментов hJλ; и (b) ген константного участка легкой цепи к отличного от человека животного; причем по меньшей мере 12 смежных неперестроенных функциональных V генных сегментов легкой цепи λ человека (hVλ) и множество смежных неперестроенных функциональных J генных сегментов легкой цепи λ человека (hJλ) являются функционально связанными с геном константного участка легкой цепи к отличного от человека животного, так что неперестроенный вариабельный участок легкой цепи способна перестраиваться, чтобы сформировать перестроенный вариабельный участок легкой цепи λ человека, а отличное от человека животное экспрессирует антитела, содержащие легкую цепь, содержащую вариабельный участок, кодируемый с помощью перестроенного вариабельного участка легкой цепи λ человека и константного участка, кодируемого с помощью гена константного участка легкой цепи к отличного от человека животного. Еще одним примером такого отличного от человека животного является отличное от человека животное, содержащее в его зародышевой линии: (а) неперестроенный вариабельный участок легкой цепи, содержащую множество смежных неперестроенных функциональных V генных сегментов легкой цепи λ (hVλ) человека и множество смежных неперестроенных функциональных J генных сегментов легкой цепи λ человека (hJλ), причем множество генных сегментов hVλ и множество генных сегментов hJλ являются только функциональными генными сегментами вариабельного участка в неперестроенном вариабельном участке легкой цепи; и (b) ген константного участка легкой цепи к отличного от человека животного, причем множество смежных неперестроенных функциональных hVλ генных сегментов и множество смежных неперестроенных функциональных hJλ генных сегментов являются функционально связанными с геном константного участка легкой цепи к отличного от человека животного, так что неперестроенный вариабельный участок легкой цепи способен перестраиваться, чтобы сформировать перестроенный вариабельный участок легкой цепи λ человека, и отличное от человека животное экспрессирует антитела, содержащие легкую цепь, содержащую вариабельный домен, кодируемый с помощью перестроенного вариабельного участка легкой цепи λ человека, и константный домен, кодируемый с помощью гена константного участка легкой цепи к отличного от человека животного. Еще одним примером такого отличного от человека животного является отличное от человека животное, содержащее в его зародышевой линии: (а) неперестроенный вариабельный участок легкой цепи, содержащий: (i) по меньшей мере 12 смежных неперестроенных функциональных участков генных сегментов легкой цепи λ (hVλ) человека и множество смежных неперестроенных функциональных J генных сегментов легкой цепи λ (hJλ), причем по меньшей мере 12 функциональных генных сегментов hVλ и множество функциональных генных сегментов hJλ являются только функциональными генными сегментами вариабельного участка в неперестроенном вариабельном участке легкой цепи; и (ii) межгенную последовательность Vk-Jk человека, расположенную между смежными генными сегментами hVλ и множеством смежных генных сегментов hJλ; и (b) ген константного участка легкой цепи к отличного от человека животного; причем по меньшей мере 12 смежных неперестроенных функциональных hVλ генных сегментов и множество смежных неперестроенных функциональных hJλ генных сегментов являются функционально связанными с геном константного участка легкой цепи к отличного от человека животного, так что неперестроенный вариабельный участок легкой цепи способен перестраиваться, чтобы сформировать перестроенный вариабельный участок легкой цепи λ человека, и отличное от человека животное экспрессирует антитела, содержащие легкую цепь, содержащую вариабельный домен, кодируемый с помощью перестроенного вариабельного участка легкой цепи λ человека, и константной домен, кодируемый с помощью гена константного участка легкой цепи к отличного от человека животного. Еще одним примером такого отличного от человека животного является отличное от человека животное, геном которого содержит локус иммуноглобулина, содержащий генные сегменты Vλ и Jλ человека, функционально связанные с геном Ск отличного от человека животного, так что отличное от человека животное экспрессирует легкую цепь иммуноглобулина которая содержит последовательность вариабельного домена λ человека, слитую с константным доменом к отличного от человека животного. См., например, US 9226484[000374] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal comprising a λ light chain variable region sequence (Vλ) and at least one J sequence (J) adjacent to a λ light chain constant region sequence of a non-human animal. See, for example, US2012/0073004, US2014/0137275, US2015/0246976, US2015/0246977, US2015/0351371, US9035128, US9066502, US9163092, and US9150662, each of which is incorporated herein by reference in its entirety for all purposes. One example of such a non-human animal is a non-human animal comprising: (a) at least 12 to at least 40 unrearranged human λ light chain variable region gene segments and at least one human Jλ gene segment at an endogenous light chain locus of the non-human animal; (b) a human Vk-Jk intergenic sequence located between the at least 12 to at least 40 human light chain variable region gene segments and the at least one human Jλ sequence; wherein the non-human animal expresses an antibody that comprises a light chain comprising a human Vλ domain and a non-human Ck domain. Another example of such a non-human animal is a non-human animal that contains at the endogenous λ light chain locus in its germline: (a) an unrearranged light chain variable region comprising a plurality of contiguous unrearranged functional human λ light chain V gene segments (hVλ) and a plurality of contiguous unrearranged functional human λ light chain J gene segments (hJλ), wherein the plurality of hVλ gene segments and the plurality of hJλ gene segments are the only functional variable region gene segments in the unrearranged light chain variable region; and (b) a K light chain constant region gene of a non-human animal, wherein a plurality of contiguous unrearranged V gene segments of a human λ light chain (hVλ) and a plurality of contiguous unrearranged J gene segments of a human λ light chain (hJλ) are operably linked to the K light chain constant region gene of the non-human animal such that the unrearranged variable region of the light chain is capable of rearranging to form a rearranged variable region of the human λ light chain, and the non-human animal expresses antibodies comprising a light chain comprising a variable region encoded by the rearranged variable region of the human λ light chain and a constant region encoded by the K light chain constant region gene of the non-human animal. Another example of such a non-human animal is a non-human animal comprising at an endogenous k light chain locus in its germline: (a) a non-rearranged light chain variable region comprising: (i) at least 12 contiguous non-rearranged functional human V gene segments of the λ light chain variable region (hVλ) and a plurality of contiguous non-rearranged functional J gene segments of the λ light chain (hJλ), wherein the at least 12 functional hVλ gene segments and the plurality of functional hJλ gene segments are the only functional variable region gene segments in the non-rearranged light chain variable region; and (ii) a human Vk-Jk intergenic sequence located between the contiguous hVλ gene segments and the plurality of contiguous hJλ gene segments; and (b) a non-human animal k light chain constant region gene; wherein at least 12 contiguous, non-rearranged, functional V gene segments of a human λ light chain (hVλ) and a plurality of contiguous, non-rearranged, functional J gene segments of a human λ light chain (hJλ) are operably linked to a K light chain constant region gene of a non-human animal, such that the non-rearranged variable region of the light chain is capable of rearranging to form a rearranged variable region of a human λ light chain, and the non-human animal expresses antibodies comprising a light chain comprising a variable region encoded by the rearranged variable region of a human λ light chain and a constant region encoded by the K light chain constant region gene of the non-human animal. Another example of such a non-human animal is a non-human animal that comprises in its germline: (a) an unrearranged light chain variable region comprising a plurality of contiguous unrearranged functional human λ light chain V gene segments (hVλ) and a plurality of contiguous unrearranged functional human λ light chain J gene segments (hJλ), wherein the plurality of hVλ gene segments and the plurality of hJλ gene segments are the only functional variable region gene segments in the unrearranged light chain variable region; and (b) a K light chain constant region gene of a non-human animal, wherein the plurality of contiguous, unrearranged, functional hVλ gene segments and the plurality of contiguous, unrearranged, functional hJλ gene segments are operably linked to the K light chain constant region gene of the non-human animal such that the unrearranged light chain variable region is capable of rearranging to form a rearranged human λ light chain variable region, and the non-human animal expresses antibodies comprising a light chain comprising a variable domain encoded by the rearranged human λ light chain variable region and a constant domain encoded by the K light chain constant region gene of the non-human animal. Another example of such a non-human animal is a non-human animal comprising in its germline: (a) a non-rearranged light chain variable region comprising: (i) at least 12 contiguous non-rearranged functional human λ light chain (hVλ) gene segments and a plurality of contiguous non-rearranged functional λ light chain (hJλ) J gene segments, wherein the at least 12 functional hVλ gene segments and the plurality of functional hJλ gene segments are the only functional variable region gene segments in the non-rearranged light chain variable region; and (ii) a human Vk-Jk intergenic sequence located between the contiguous hVλ gene segments and the plurality of contiguous hJλ gene segments; and (b) a non-human animal K light chain constant region gene; wherein at least 12 contiguous, non-rearranged functional hVλ gene segments and a plurality of contiguous, non-rearranged functional hJλ gene segments are operably linked to a non-human animal K light chain constant region gene such that the non-rearranged light chain variable region is capable of rearranging to form a rearranged human λ light chain variable region, and the non-human animal expresses antibodies comprising a light chain comprising a variable domain encoded by the rearranged human λ light chain variable region and a constant domain encoded by the non-human animal K light chain constant region gene. Another example of such a non-human animal is a non-human animal whose genome comprises an immunoglobulin locus comprising human Vλ and Jλ gene segments operably linked to a non-human animal Ck gene such that the non-human animal expresses an immunoglobulin light chain that comprises a human λ variable domain sequence fused to a non-human animal K constant domain. See, e.g., US 9226484

[000375] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают отличное от человека животное, содержащее в своей зародышевой линии, в эндогенном локусе легкой цепи отличного от человека, последовательность вариабельного участка легкой цепи λ человека, причем последовательность вариабельного участка лямбда человека экспрессируется в легкой цепи, которая содержит последовательность гена константного участка иммуноглобулина отличного от человека животного. См., например, US 2013/0323790, US 2013/0326647, US 2015/0089680, US 2015/0173331, US 2015/0176002, US 2015/0173332, US 2012/0070861, US 2015/0320023, US 2016/0060359, US 2016/0057979, US 9029628, US 9006511, US 9012717, US 9206261, US 9206262, US 9206263, и US 9226484, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Примером такого отличного от человека животного является отличное от человека животное, которое экспрессирует легкую цепь иммуноглобулина, которая содержит вариабельную последовательность лямбда человека, слитую с константным участком отличного от человека животного, причем отличное от человека животное проявляет к до А коэффициент использования около 1:1. См., например, US 9029628. Еще одним примером такого отличного от человека животного является отличное от человека животное, геном которого содержит эндогенный неперестроенный локус легкой цепи к иммуноглобулина, содержащий замещение эндогенных генных сегментов Vk и Jk генными сегментами Vλ и Jλ человека, и причем генные сегменты Vλ и Jλ человека функционально связаны с геном Ск отличного от человека животного, таким образом, что отличное от человека животное экспрессирует легкую цепь иммуноглобулина, которая содержит вариабельную последовательность λ человека, слитую с константным участком отличного от человека животного. См., например, US 9006511. Еще одним примером такого отличного от человека животного является отличное от человека животное, геном которого содержит эндогенный локус легкой цепи λ иммуноглобулина, содержащий: (i) делецию первого эндогенного кластера гена Vλ-Jλ-Cλ; и (ii) замещение фрагмента эндогенных генных сегментов Vλ и Jλ во втором эндогенном кластере гена Vλ-Jλ-Cλ с генными сегментами Vλ и Jλ человека, причем генные сегменты Vλ и Jλ человека содержат по меньшей мере один генный сегмент Vλ человека и по меньшей мере один генный сегмент Jλ человека, и причем генные сегменты Vλ и Jλ человека функционально связаны с геном СА отличного от человека животного. См., например, US 9012717.[000375] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal that contains in its germline, at an endogenous non-human light chain locus, a human λ light chain variable region sequence, wherein the human lambda variable region sequence is expressed in a light chain that contains a non-human immunoglobulin constant region gene sequence. See, for example, US 2013/0323790, US 2013/0326647, US 2015/0089680, US 2015/0173331, US 2015/0176002, US 2015/0173332, US 2012/0070861, US 2015/0320023, US 2016/0060359, US 2016/0057979, US 9029628, US 9006511, US 9012717, US 9206261, US 9206262, US 9206263, and US 9226484, each of which is incorporated herein by reference in its entirety for all purposes. An example of such a non-human animal is a non-human animal that expresses an immunoglobulin light chain that comprises a human lambda variable sequence fused to a non-human constant region, wherein the non-human animal exhibits a to A utilization ratio of about 1:1. See, for example, US 9,029,628. Another example of such a non-human animal is a non-human animal the genome of which comprises an endogenous, unrearranged κ immunoglobulin light chain locus comprising a replacement of the endogenous Vk and Jk gene segments with human Vλ and Jλ gene segments, and wherein the human Vλ and Jλ gene segments are operably linked to the Ck gene of the non-human animal, such that the non-human animal expresses an immunoglobulin light chain that comprises a human λ variable sequence fused to a non-human constant region. See, for example, US 9,006,511. Another example of such a non-human animal is a non-human animal whose genome comprises an endogenous immunoglobulin λ light chain locus comprising: (i) a deletion of a first endogenous Vλ-Jλ-Cλ gene cluster; and (ii) a replacement of a fragment of the endogenous Vλ and Jλ gene segments in a second endogenous Vλ-Jλ-Cλ gene cluster with human Vλ and Jλ gene segments, wherein the human Vλ and Jλ gene segments comprise at least one human Vλ gene segment and at least one human Jλ gene segment, and wherein the human Vλ and Jλ gene segments are operably linked to the CA gene of the non-human animal. See, for example, US 9,012,717.

[000376] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают отличное от человека животное, имеющее геном, содержащий модификацию локуса тяжелой цепи иммуноглобулина, причем модификация уменьшает или устраняет функцию эндогенного ADAM6, и отличное от человека животное дополнительно содержит последовательность нуклеиновой кислоты, кодирующую белок ADAM6 отличного от человека животного, или ортолог, или его гомолог, или функциональный фрагмент соответствующего белка ADAM6. См., например, US 2012/0322108, US 2013/0254911, US 2014/0213773, US 2015/0201589, US 2015/0210776, US 2014/0017228, US 8642835 и US 8697940, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Примером такого отличного от человека животного является отличное отчеловека животное, геном которого содержит: (а) эктопическое размещение гена ADAM6; и (b) локус вариабельного участка тяжелой цепи иммуноглобулина человека, содержащий вставку одного или более генных сегментов VH человека, одного или более генных сегментов DH человека, и одного или более генных сегментов JH человека в эндогенный локус тяжелой цепи отличного от человека животного, причем генные сегменты VH, DH и JH человека функционально связаны с геном константного участка тяжелой цепи; так что отличное от человека животное характеризуется тем, что: (i) оно фертильно; и (и) когда оно иммунизировано антигеном, то продуцирует антитела, содержащие вариабельные домены тяжелой цепи, кодируемые одним или более генными сегментами VH человека, одним или более DH человека, и одним или более JH человека, функционально связанными с константными доменами тяжелой цепи, кодируемыми геном константного участка тяжелой цепи, причем антитела проявляют специфическое связывание с антигеном. См., например, US 8642835.[000376] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal having a genome comprising a modification of an immunoglobulin heavy chain locus, wherein the modification reduces or eliminates the function of endogenous ADAM6, and the non-human animal further comprises a nucleic acid sequence encoding an ADAM6 protein of the non-human animal, or an ortholog or homolog thereof, or a functional fragment of the corresponding ADAM6 protein. See, for example, US 2012/0322108, US 2013/0254911, US 2014/0213773, US 2015/0201589, US 2015/0210776, US 2014/0017228, US 8642835, and US 8697940, each of which is incorporated herein by reference in its entirety for all purposes. An example of such a non-human animal is a non-human animal whose genome comprises: (a) an ectopic location of the ADAM6 gene; and (b) a human immunoglobulin heavy chain variable region locus comprising an insertion of one or more human V H gene segments, one or more human D H gene segments, and one or more human J H gene segments into an endogenous heavy chain locus of a non-human animal, wherein the human V H , D H , and J H gene segments are operably linked to a heavy chain constant region gene; such that the non-human animal is characterized in that: (i) it is fertile; and (and) when immunized with an antigen, it produces antibodies comprising heavy chain variable domains encoded by the one or more human V H gene segments, one or more human D H , and one or more human J H , operably linked to heavy chain constant domains encoded by the heavy chain constant region gene, wherein the antibodies exhibit specific binding to the antigen. See, for example, US 8,642,835.

[000377] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают отличное от человека животное, содержащее: (а) вставку одного или более генных сегментов Vλ и Jλ человека вверх по ходу транскрипции константного участка легкой цепи иммуноглобулина, не относящегося к человеку, (b) вставку одного или более VH человека, одного или более DH человека, и одного или более генных сегментов JH человека по ходу транскрипции константного участка тяжелой цепи иммуноглобулина, не относящегося к человеку, и (с) нуклеотидную последовательность, которая кодирует белок ADAM6 или его функциональный фрагмент, причем белок ADAM6 экспрессируется из эктопической последовательности нуклеиновой кислоты ADAM6. См., например, US 2013/0160153 и US 2014/0017228, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Примером такого отличного от человека животного является отличное от человека животное, геном которого содержит: (а) вставку одного или более генных сегментов Vλ человека и одного или более генных сегментов Jλ человека по ходу транскрипции гена константного участка легкой цепи иммуноглобулина отличного от человека животного, (b) вставку одного или более генных сегментов VH человека, одного или более генных сегментов DH человека, и одного или более генных сегментов JH человека по ходу транскрипции гена константного участка тяжелой цепи иммуноглобулина отличного от человека животного, и (с) эктопическую нуклеотидную последовательность, которая кодирует белок ADAM6 отличного от человека животного, причем белок ADAM6 отличного от человека животного экспрессируется из эктопической нуклеотидной последовательности. См., например, US 2013/0160153.[000377] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal comprising: (a) an insertion of one or more human Vλ and Jλ gene segments upstream of a non-human immunoglobulin light chain constant region, (b) an insertion of one or more human VH , one or more human DH , and one or more human JH gene segments downstream of a non-human immunoglobulin heavy chain constant region, and (c) a nucleotide sequence that encodes an ADAM6 protein or a functional fragment thereof, wherein the ADAM6 protein is expressed from an ectopic ADAM6 nucleic acid sequence. See, e.g., US2013/0160153 and US2014/0017228, each of which is herein incorporated by reference in its entirety for all purposes. An example of such a non-human animal is a non-human animal whose genome comprises: (a) an insertion of one or more human Vλ gene segments and one or more human Jλ gene segments downstream of a non-human animal immunoglobulin light chain constant region gene, (b) an insertion of one or more human V H gene segments, one or more human D H gene segments, and one or more human J H gene segments downstream of a non-human animal immunoglobulin heavy chain constant region gene, and (c) an ectopic nucleotide sequence that encodes an ADAM6 protein of a non-human animal, wherein the ADAM6 protein of a non-human animal is expressed from the ectopic nucleotide sequence. See, for example, US 2013/0160153.

[000378] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают в себя отличное от человека животное, содержащее в своей зародышевой линии локус иммуноглобулина, который содержит неперестроенную вариабельную последовательность гена иммуноглобулина, содержащую в кодирующей CDR3 последовательности замену по меньшей мере одного негистидинового кодона на гистидиновый кодон или вставку по меньшей мере одного гистидинового кодона, причем отличное от человека животное дополнительно содержит in vivo разнообразный репертуар антител, каждое из которых специфично для представляющего интерес антигена и содержит CDR3 вариабельного домена в по меньшей мере одной гистидиновой аминокислоте, кодируемой по меньшей мере одной заменой или вставкой гистидинового кодона в неперестроенную вариабельную последовательность гена иммуноглобулина. См., например, US 2013/0247236 и US 2014/0082760, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. В одном примере первый локус гена вариабельного участка иммуноглобулина содержит функциональную часть неперестроенной последовательности вариабельного участка тяжелой цепи иммуноглобулина, которая содержит неперестроенные генные сегменты VH, DH и JH, и причем один или более неперестроенных генных сегментов VH, DH и JH содержат вставленный или замещенный гистидиновый кодон, который не кодируется соответствующим генным сегментом зародышевой линии дикого типа. В другом примере неперестроенными генными сегментами VH, DH и JH являются неперестроенный VH человека, неперестроенный DH человека и неперестроенный JH генные сегменты человека. В другом варианте осуществления изобретения, содержит в его зародышевой линии второй локус гена вариабельного участка иммуноглобулина, содержащий последовательность вариабельного участка легкой цепи иммуноглобулина, содержащую вставку по меньшей мере одного гистидинового кодона или замещение по меньшей мере одного не гистиди нового кодона на гистидиновый кодон, причем вставленный или замещенный гистидиновый кодон не кодируется соответствующей последовательностью вариабельного участка иммуноглобулина зародышевой линии дикого типа, причем отличное от человека животное экспрессирует вариабельный домен легкой цепи иммуноглобулина, который содержит гистидин, полученный из замены гистидина или вставки в зародышевую линию отличного от человека животного. См., например, US 2013/0247236.[000378] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal that comprises in its germline an immunoglobulin locus that comprises a non-rearranged variable sequence of an immunoglobulin gene that comprises, in a CDR3 encoding sequence, a substitution of at least one non-histidine codon to a histidine codon or an insertion of at least one histidine codon, wherein the non-human animal further comprises in vivo a diverse repertoire of antibodies, each of which is specific for an antigen of interest and comprises a CDR3 of a variable domain at least one histidine amino acid encoded by at least one histidine codon substitution or insertion in the non-rearranged variable sequence of the immunoglobulin gene. See, for example, US2013/0247236 and US2014/0082760, each of which is incorporated herein by reference in its entirety for all purposes. In one example, the first immunoglobulin variable region gene locus comprises a functional portion of an unrearranged immunoglobulin heavy chain variable region sequence that comprises unrearranged VH , DH , and JH gene segments, and wherein one or more of the unrearranged VH , DH , and JH gene segments comprises an inserted or substituted histidine codon that is not encoded by the corresponding wild-type germline gene segment. In another example, the unrearranged VH , DH , and JH gene segments are unrearranged human VH , unrearranged human DH , and unrearranged human JH gene segments. In another embodiment, the invention comprises, in its germline, a second immunoglobulin variable region gene locus comprising an immunoglobulin light chain variable region sequence comprising an insertion of at least one histidine codon or a substitution of at least one non-histidine codon with a histidine codon, wherein the inserted or substituted histidine codon is not encoded by the corresponding wild-type immunoglobulin variable region germline sequence, wherein the non-human animal expresses an immunoglobulin light chain variable domain that comprises a histidine derived from the histidine substitution or insertion in the germline of the non-human animal. See, for example, US 2013/0247236.

[000379] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают отличное от человека животное, содержащее: (а) вставку одного или более VL человека и одного или более JL генных сегментов человека вверх по ходу транскрипции константного участка легкой цепи иммуноглобулина, не относящегося к человеку; (b) вставку одного или более VL человека и одного или более генных сегментов JL человека по ходу транскрипции константного участка тяжелой цепи иммуноглобулина, не относящегося к человеку, и (с) нуклеотидную последовательность, которая кодирует белок ADAM6 или его функциональный фрагмент, причем белок ADAM6 экспрессируется из эктопической последовательности нуклеиновой кислоты ADAM6. См., например, US 2013/0212719, включенную в данном документе в качестве ссылки в полном объеме для всех целей. Примером такого отличного от человека животного является отличное от человека животное, геном которого содержит: (а) вставку одного или более генных сегментов VL человека и одного или более генных сегментов JL человека по ходу транскрипции гена константного участка легкой цепи иммуноглобулина, не относящегося к человеку, причем один или более генных сегментов VL человека и один или более генных сегментов JL человека функционально связаны с геном константного участка легкой цепи иммуноглобулина, не относящегося к человеку; (b) вставку одного или более генных сегментов VL человека и одного или более генных сегментов JL человека по ходу транскрипции гена константного участка тяжелой цепи иммуноглобулина, не относящегося к человеку, причем один или более генных сегментов VL человека и один или более генных сегментов JL человека функционально связаны с геном константного участка тяжелой цепи иммуноглобулина, не относящегося к человеку; и (с) вставленную последовательность нуклеиновой кислоты, которая кодирует белок ADAM6 отличного от человека животного (например, грызуна, такого как крыса или мышь), причем белок ADAM6 отличного от человека животного (например, грызуна, такого как крыса или мышь) экспрессируется из вставленной последовательности нуклеиновой кислоты, так что В-клетки отличного от человека животного экспрессируют антитела, каждое из которых содержит две легкие цепи иммуноглобулина спаренные с двумя тяжелыми цепями иммуноглобулина, причем каждая легкая цепь содержит вариабельный домен легкой цепи человека и константный домен легкой цепи, не относящейся к человеку, и каждая тяжелая цепь содержит вариабельный домен легкой цепи человека и константный домен тяжелой цепи, не относящейся к человеку. См., например, US 2013/0212719.[000379] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal comprising: (a) an insertion of one or more human VL and one or more human JL gene segments upstream of a non-human immunoglobulin light chain constant region; (b) an insertion of one or more human VL and one or more human JL gene segments downstream of a non-human immunoglobulin heavy chain constant region; and (c) a nucleotide sequence that encodes an ADAM6 protein or a functional fragment thereof, wherein the ADAM6 protein is expressed from an ectopic ADAM6 nucleic acid sequence. See, e.g., US 2013/0212719, incorporated herein by reference in its entirety for all purposes. An example of such a non-human animal is a non-human animal whose genome comprises: (a) an insertion of one or more human V L gene segments and one or more human J L gene segments downstream of a non-human immunoglobulin light chain constant region gene, wherein the one or more human V L gene segments and the one or more human J L gene segments are operably linked to the non-human immunoglobulin light chain constant region gene; (b) an insertion of one or more human V L gene segments and one or more human J L gene segments downstream of a non-human immunoglobulin heavy chain constant region gene, wherein the one or more human V L gene segments and the one or more human J L gene segments are operably linked to the non-human immunoglobulin heavy chain constant region gene; and (c) an inserted nucleic acid sequence that encodes an ADAM6 protein of a non-human animal (e.g., a rodent such as a rat or mouse), wherein the ADAM6 protein of the non-human animal (e.g., a rodent such as a rat or mouse) is expressed from the inserted nucleic acid sequence such that B cells of the non-human animal express antibodies, each of which comprises two immunoglobulin light chains paired with two immunoglobulin heavy chains, each light chain comprising a human light chain variable domain and a non-human light chain constant domain, and each heavy chain comprising a human light chain variable domain and a non-human heavy chain constant domain. See, for example, US 2013/0212719.

[000380] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают в себя отличное от человека животное, имеющее в своей зародышевой линии: (а) геномную последовательность человека, содержащую один генный сегмент VH человека, один или более генных сегментов DH и один или более генных сегментов JH; и (b) последовательность, которая кодирует белок ADAM6, который функционирует у самца отличного от человека животного, причем последовательность, которая кодирует ADAM6, расположена в положении, отличном от локуса ADAM6 отличного от человека животного дикого типа. См., например, US 2013/0333057, включенную в данном документе в качестве ссылки в полном объеме для всех целей. Примером такого отличного от человека животного является отличное от человека животное, имеющее в своей зародышевой линии: (а) неперестроенную геномную последовательность человека, содержащую один генный сегмент VH человека, один или более генных сегментов DH человека и один или более генных сегментов JH человека, причем один генный сегмент VH человека представляет собой VH1-2, VH1-69, VH2-26, VH2-70 или его полиморфный вариант; и (b) последовательность, которая кодирует белок ADAM6, который функционирует у самца отличного от человека животного, причем последовательность, которая кодирует белок ADAM6, расположена в положении, отличном от локуса ADAM6 отличного от человека животного дикого типа. См., например, US 2013/0333057.[000380] Other non-human animals (e.g., rodents such as rats or mice) that may be used include a non-human animal having in its germline: (a) a human genomic sequence comprising one human VH gene segment, one or more DH gene segments, and one or more JH gene segments; and (b) a sequence that encodes an ADAM6 protein that is functional in a male non-human animal, wherein the sequence that encodes ADAM6 is located at a position other than the ADAM6 locus of the wild-type non-human animal. See, for example, US 2013/0333057, incorporated herein by reference in its entirety for all purposes. An example of such a non-human animal is a non-human animal that has in its germline: (a) an unrearranged human genomic sequence comprising one human V H gene segment, one or more human D H gene segments, and one or more human J H gene segments, wherein the one human V H gene segment is V H 1-2, V H 1-69, V H 2-26, V H 2-70, or a polymorphic variant thereof; and (b) a sequence that encodes an ADAM6 protein that is functional in a male non-human animal, wherein the sequence that encodes the ADAM6 protein is located at a position other than the ADAM6 locus of the wild-type non-human animal. See, for example, US 2013/0333057.

[000381] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают в себя отличное от человека животное, содержащее: (а) один перестроенный вариабельный участок легкой цепи иммуноглобулина человека (VL/JL), которая кодирует VL домен легкой цепи иммуноглобулина человека, причем один перестроенный участок VL/JL человека выбирается из генного сегмент Vк1-39/J человека или генного сегмента Vк3-20/J человека (например, генного сегмента Vк1-39/Jк5 или генного сегмента Vк3-20/Jк1 человека); и (b) замещение генных сегментов эндогенной тяжелой цепи (VH) одним или более генными сегментами VH человека, причем генные сегменты VH человека функционально связаны с геном константного участка эндогенной тяжелой цепи (СН), а генные сегменты VH человека способны перестраивать и формировать ген химерной тяжелой цепи человека/отличного от человека животного. Такие отличные от человека животные можно назвать отличными от человека животными с «универсальной легкой цепью» (ULC) или «обычной легкой цепью». См., например, US 2011/0195454, US 2012/0021409, US 2012/0192300, US 2015/0059009, US 2013/0045492, US 2013/0198880, US 2013/0185821, US 2013/0302836, US 2015/0313193 и US 15/056713, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Аналогичным образом, другое отличное от человека животное (например, грызун, такой как крыса или мышь), которое может быть использовано, включает отличное от человека животное, которое экспрессирует популяцию антител, причем зародышевая линия отличного от человека животного включает только один ген вариабельного участка легкой цепи каппа иммуноглобулина, который представляет собой перестроенный ген вариабельного участка легкой цепи каппа зародышевой линии человека, причем отличное от человека животное является либо гетерозиготным для гена вариабельного участка легкой цепи каппа иммуноглобулина, поскольку оно содержит только одну копию, или гомозиготным для одного гена вариабельного участка легкой цепи каппа иммуноглобулина, поскольку оно содержит две копии; отличное от человека животное характеризуется активным созреванием аффинности, так что: (i) каждый легкая цепь каппа иммуноглобулина популяции содержит вариабельный домен легкой цепи, который кодируется перестроенным геном вариабельного участка легкой цепи каппа зародышевой линии человека, или его соматически мутированным вариантом; (ii) популяция содержит антитела, содержащие легкие цепи каппа иммуноглобулина, чей вариабельный домен легкой цепи кодируется перестроенным геном вариабельного участка легкой цепи каппа зародышевой линии человека, и антитела, содержащие легкие цепи каппа иммуноглобулина, чей вариабельный домен легкой цепи кодируется их соматически мутированными вариантами; и (iii) отличное от человека животное образует разнообразный набор соматически мутированных высокоаффинных тяжелых цепей, которые успешно соединяются с легкими цепями каппа иммуноглобулина с образованием антител к популяции. Примером такого отличного от человека животного является отличное от человека животное, которое является гетерозиготным или гомозиготным в своей зародышевой линии для: (а) вставки в эндогенный локус вариабельного участка легкой цепи иммуноглобулина к отличного от человека животного перестроенной последовательности Vk/Jk, содержащей: одну последовательность Vk зародышевой линии человека, при этом последовательность Vk зародышевой линии человека представлена в SEQ ID NO: 148 или SEQ ID NO: 149; и одну последовательность Jk зародышевой линии человека, причем перестроенная последовательность Vk/Jk функционально связана с эндогенной константного участка к отличного от человека животного; и (b) вставки в эндогенный локус вариабельного участка тяжелой цепи иммуноглобулина отличного от человека животного из множества генных сегментов вариабельного участка тяжелой цепи иммуноглобулина человека, причем генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека функционально связаны с константным участком эндогенной тяжелой цепи иммуноглобулина отличного от человека животного, и генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека способны перестраивать и формировать перестроенный ген тяжелой цепи химерного иммуноглобулина человека/отличного от человека животного. SEQ ID NO: 148 представляет собой последовательность сконструированного локуса Vк1-39Jк5 человека, и SEQ ID NO: 149 представляет собой последовательность сконструированного локуса Vк3-20Jк1 человека. См., например, US 2011/0195454, включенную в данном документе в качестве ссылки в полном объеме для всех целей.[000381] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal comprising: (a) one rearranged human immunoglobulin light chain variable region (V L /J L ) that encodes a V L domain of a human immunoglobulin light chain, wherein the one rearranged human V L /J L region is selected from a human Vκ1-39/J gene segment or a human Vκ3-20/J gene segment (e.g., a human Vκ1-39/Jκ5 gene segment or a human Vκ3-20/Jκ1 gene segment); and (b) replacing the endogenous heavy chain (V H ) gene segments with one or more human V H gene segments, wherein the human V H gene segments are operably linked to an endogenous heavy chain constant region ( CH ) gene, and the human V H gene segments are capable of rearranging and forming a chimeric human/non-human animal heavy chain gene. Such non-human animals may be referred to as "universal light chain" (ULC) or "normal light chain" non-human animals. See, for example, US 2011/0195454, US 2012/0021409, US 2012/0192300, US 2015/0059009, US 2013/0045492, US 2013/0198880, US 2013/0185821, US 2013/0302836, US 2015/0313193, and US 15/056713, each of which is incorporated herein by reference in its entirety for all purposes. Similarly, another non-human animal (e.g., a rodent such as a rat or a mouse) that can be used includes a non-human animal that expresses a population of antibodies, wherein the germline of the non-human animal comprises only one immunoglobulin kappa light chain variable region gene that is a rearranged human germline kappa light chain variable region gene, wherein the non-human animal is either heterozygous for the immunoglobulin kappa light chain variable region gene because it contains only one copy, or homozygous for one immunoglobulin kappa light chain variable region gene because it contains two copies; the non-human animal is characterized by active affinity maturation such that: (i) each immunoglobulin kappa light chain of the population comprises a light chain variable domain that is encoded by a rearranged human germline kappa light chain variable region gene, or a somatically mutated variant thereof; (ii) the population contains antibodies comprising immunoglobulin kappa light chains whose light chain variable domain is encoded by a rearranged human germline kappa light chain variable region gene and antibodies comprising immunoglobulin kappa light chains whose light chain variable domain is encoded by somatically mutated variants thereof; and (iii) the non-human animal produces a diverse set of somatically mutated high-affinity heavy chains that successfully combine with immunoglobulin kappa light chains to form antibodies to the population. An example of such a non-human animal is a non-human animal that is heterozygous or homozygous in its germline for: (a) insertion into an endogenous immunoglobulin κ light chain variable region locus of the non-human animal, a rearranged Vk/Jk sequence comprising: one human germline Vk sequence, wherein the human germline Vk sequence is shown in SEQ ID NO: 148 or SEQ ID NO: 149; and one human germline Jk sequence, wherein the rearranged Vk/Jk sequence is operably linked to an endogenous κ constant region of the non-human animal; and (b) inserting into an endogenous non-human immunoglobulin heavy chain variable region locus a plurality of human immunoglobulin heavy chain variable region gene segments, wherein the human immunoglobulin heavy chain variable region gene segments are operably linked to an endogenous non-human immunoglobulin heavy chain constant region, and the human immunoglobulin heavy chain variable region gene segments are capable of rearranging and forming a rearranged chimeric human/non-human immunoglobulin heavy chain gene. SEQ ID NO: 148 is the sequence of an engineered human Vκ1-39Jκ5 locus, and SEQ ID NO: 149 is the sequence of an engineered human Vκ3-20Jκ1 locus. See, for example, US 2011/0195454, incorporated herein by reference in its entirety for all purposes.

[000382] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают отличное от человека животное полезное для получения домена VL/CH х ULC человека, содержащего в геноме своей зародышевой линии: (i) гибридный локус иммуноглобулина который кодирует гибридную цепь иммуноглобулина, причем гибридный локус иммуноглобулина содержит неперестроенные генные сеглленты вариабельного участка легкой цепи иммуноглобулина человека (VL и JL), функционально связанные с последовательностью нуклеиновой кислоты константного участка тяжелой цепи иммуноглобулина, содержащей один или более генов константного участка тяжелой цепи, каждый из которых кодирует по меньшей мере функциональный домен СН1, причем генные сегменты VL и JL способны перестраиваться с образованием гибридной последовательности, содержащей перестроенную последовательность гена VL/JL человека, функционально связанную с последовательностью нуклеиновой кислоты константного участка тяжелой цепи иммуноглобулина; (ii) локус легкой цепи, который кодирует универсальную легкую цепь человека, и содержит перестроенную нуклеотидную последовательность вариабельного участка универсальной легкой цепи человека, функционально связанную с последовательностью нуклеиновой кислоты константного участка легкой цепи иммуноглобулина; причем отличное от человека животное способно продуцировать антигенсвязывающий белок, который содержит гибридную цепь иммуноглобулина человека, полученную из гибридного локуса, и родственную универсальную легкую цепь человека, полученной из локуса легкой цепи, причем гибридная цепь иммуноглобулина человека содержит вариабельный домен легкой цепи иммуноглобулина человека (hVL/CH × ULC), слитую с константным участком тяжелой цепи IgG, IgG, IgE или IgA, содержащей функциональный домен СН1, и в котором универсальная легкая цепь человека содержит легкую цепь иммуноглобулина человека, слитую с константным доменом легкой цепи. См., например, PCT/US 2016/023289, включенный в данный документ в качестве ссылки во всей полноте для всех целей. Примером такого отличного от человека животного является отличное от человека животное, пригодное для получения домена VLН × ULC человека, содержащего в геноме своей зародышевой линии: (i) модифицированный эндогенный локус тяжелой цепи иммуноглобулинов, содержащий замену всех функциональных эндогенных вариабельных генных сегментов VH тяжелой цепи иммуноглобулина отличного от человека животного, всех функциональных эндогенных разнообразных генных сегментов DH тяжелой цепи иммуноглобулина отличного от человека животного, и всех функциональных эндогенных соединительных генных сегментов JH тяжелой цепи иммуноглобулина отличного от человека животного со множеством неперестроенных вариабельных Vk генных сегментов легкой цепи иммуноглобулина человека и множеством неперестроенных соединительных Jk генных сегментов легкой цепи иммуноглобулина человека, функционально связанных с эндогенным константным участком тяжелой цепи иммуноглобулина отличного от человека животного, содержащей один или более генов константного участка тяжелой цепи, каждый из которых кодирует по меньшей мере функциональный домен СН1, причем множество неперестроенных генных Vk сегментов легкой цепи иммуноглобулина человека и множество неперестроенных генных Jk сегментов легкой цепи иммуноглобулина человека участвуют в перестраивании в В-клетке при развитии В-клеток с образованием первой перестроенной нуклеотидной последовательности вариабельного участка легкой цепи Vk/Jk иммуноглобулина человека, функционально связанной с последовательность нуклеиновой кислоты эндогенного константного участка тяжелой цепи иммуноглобулина отличного от человека животного в эндогенном локусе тяжелой цепи иммуноглобулина отличного от человека животного; и (ii) модифицированный эндогенный локус легкой цепи, содержащий одну перестроенную последовательность гена вариабельного участка легкой цепи иммуноглобулина человека, полученную из перестроенной последовательности гена Vк1-39/Jк5 или Vк3-20/Jк1, причем одна перестроенная последовательность гена вариабельного участка легкой цепи иммуноглобулина человека функционально связана с последовательностью гена эндогенного константного участка k легкой цепи иммуноглобулина отличного от человека животного; причем отличное от человека животное способно продуцировать антигенсвязывающий белок, который содержит гибридную цепь иммуноглобулина человека, полученную из модифицированного эндогенного локуса тяжелой цепи иммуноглобулина, и родственную универсальную легкую цепи человека, полученную из модифицированного эндогенного локуса легкой цепи, причем гибридная цепь иммуноглобулина человека содержит вариабельный домен легкой цепи иммуноглобулина человека (hVL/CH × ULC), слитый с константным участком тяжелой цепи IgD, IgG, IgE или IgA, содержащим функциональный домен СН1, и в котором универсальная легкая цепь человека содержит легкую цепь иммуноглобулина человека, слитую с константным доменом легкой цепи.[000382] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal useful for producing a human V L / CH x ULC domain comprising in its germline genome: (i) a hybrid immunoglobulin locus that encodes a hybrid immunoglobulin chain, wherein the hybrid immunoglobulin locus comprises unrearranged human immunoglobulin light chain variable region gene segments (V L and J L ) operably linked to an immunoglobulin heavy chain constant region nucleic acid sequence comprising one or more heavy chain constant region genes each encoding at least a functional CH 1 domain, wherein the V L and J L gene segments are capable of rearranging to form a hybrid sequence comprising a rearranged human V L /J L gene sequence operably linked to an immunoglobulin heavy chain constant region nucleic acid sequence; (ii) a light chain locus that encodes a human universal light chain and comprises a rearranged nucleotide sequence of a human universal light chain variable region operably linked to a nucleic acid sequence of an immunoglobulin light chain constant region; wherein the non-human animal is capable of producing an antigen-binding protein that comprises a hybrid human immunoglobulin chain derived from the hybrid locus and a related human universal light chain derived from the light chain locus, wherein the hybrid human immunoglobulin chain comprises a human immunoglobulin light chain variable domain (hV L / CH x ULC) fused to a constant region of an IgG, IgG, IgE, or IgA heavy chain comprising a functional CH1 domain, and wherein the human universal light chain comprises a human immunoglobulin light chain fused to a light chain constant domain. See, for example, PCT/US2016/023289, which is incorporated herein by reference in its entirety for all purposes. An example of such a non-human animal is a non-human animal suitable for receiving a human V L / CH x ULC domain comprising in its germline genome: (i) a modified endogenous immunoglobulin heavy chain locus comprising a replacement of all functional endogenous non-human animal immunoglobulin heavy chain variable V H gene segments, all functional endogenous non-human animal immunoglobulin heavy chain diverse D H gene segments, and all functional endogenous non-human animal immunoglobulin heavy chain joining J H gene segments with a plurality of unrearranged human immunoglobulin light chain variable Vk gene segments and a plurality of unrearranged human immunoglobulin light chain joining Jk gene segments operably linked to an endogenous non-human animal immunoglobulin heavy chain constant region comprising one or more heavy chain constant region genes each encoding at least a functional CH 1 domain, wherein the plurality of unrearranged human immunoglobulin light chain Vk gene segments and a plurality of unrearranged human immunoglobulin light chain Jk gene segments participate in rearrangement in a B cell during B cell development to form a first rearranged human immunoglobulin light chain variable region Vk/Jk nucleotide sequence operably linked to a nucleic acid sequence of an endogenous non-human immunoglobulin heavy chain constant region at an endogenous non-human immunoglobulin heavy chain locus; and (ii) a modified endogenous light chain locus comprising one rearranged human immunoglobulin light chain variable region gene sequence derived from a rearranged Vk1-39/Jk5 or Vk3-20/Jk1 gene sequence, wherein the one rearranged human immunoglobulin light chain variable region gene sequence is operably linked to an endogenous non-human immunoglobulin light chain constant region k gene sequence; wherein the non-human animal is capable of producing an antigen-binding protein that comprises a human immunoglobulin hybrid chain derived from a modified endogenous immunoglobulin heavy chain locus and a related human universal light chain derived from a modified endogenous light chain locus, wherein the human immunoglobulin hybrid chain comprises a human immunoglobulin light chain variable domain (hV L / CH x ULC) fused to a heavy chain constant region of IgD, IgG, IgE, or IgA comprising a functional CH 1 domain, and wherein the human universal light chain comprises a human immunoglobulin light chain fused to a light chain constant domain.

[000383] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают отличное от человека животное, содержащее в геноме своей зародышевой линии локус иммуноглобулина легкой цепи, например, в эндогенном локусе легкой цепи, отличного от человека, содержащем перестроенную нуклеотидную последовательность вариабельного участка легкой цепи иммуноглобулина человека, функционально связанную с последовательностью нуклеиновой кислоты константного участка легкой цепи иммуноглобулина, причем перестроенная нуклеотидная последовательность вариабельного участка легкой цепи иммуноглобулина человека, функционально связанная с последовательностью нуклеиновой кислоты константного участка легкой цепи иммуноглобулина, кодирует универсальную легкую цепь, и причем отличное от человека животное способно продуцировать или продуцировать клетку, например, лимфоцит, например В-клетку, которая экспрессирует антигенсвязывающий белок, содержащий гибридную цепь иммуноглобулина и универсальную легкую цепь. См., например, US 2013/0247234, US 2014/0329711, US 2014/0013456, US 2015/0119556, US 2015/0250151, US 9334334, and US 9332742, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Некоторые такие отличные от человека животные являются гомозиготными по отношению к перестроенной нуклеотидной последовательности вариабельного участка легкой цепи иммуноглобулина человека. Некоторые такие отличные от человека животные являются гетерозиготными по отношению к перестроенной нуклеотидной последовательности вариабельного участка легкой цепи иммуноглобулина человека. У некоторых таких отличных от человека животных, последовательность нуклеиновой кислоты константного участка легкой цепи представляет собой последовательность каппа. У некоторых таких отличных от человека животных, последовательность нуклеиновой кислоты константного участка легкой цепи представляет собой последовательность лямбда. У некоторых таких отличных от человека животных, второй локус иммуноглобулина представляет собой локус легкой цепи каппа. В некоторых вариантах осуществления изобретения, второй локус иммуноглобулина представляет собой локус легкой цепи лямбда. Примером такого отличного от человека животного является отличное от человека животное, содержащее в своей зародышевой линии локус легкой цепи иммуноглобулина, который содержит единственную перестроенную последовательность гена вариабельного участка легкой цепи человека иммуноглобулина человека, содержащую последовательности сегментов Vk и J к человека, причем последовательность сегмента Vk получают из генного сегмента Vк1-39 или Vк3-20 человека, и причем одна перестроенная последовательность гена вариабельного участка легкой цепи иммуноглобулина человека содержит замещение по меньшей мере одного негистидинового кодона последовательности сегмента Vk на гистидиновый кодон, который экспрессирован в положении, выбранном из группы, состоящей из 105, 106, 107, 108, 109, 111 и их комбинации (согласно нумерации IMGT).[000383] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal that comprises in its germline genome a light chain immunoglobulin locus, such as an endogenous non-human light chain locus that comprises a rearranged human immunoglobulin light chain variable region nucleotide sequence operably linked to an immunoglobulin light chain constant region nucleic acid sequence, wherein the rearranged human immunoglobulin light chain variable region nucleotide sequence operably linked to an immunoglobulin light chain constant region nucleic acid sequence encodes a universal light chain, and wherein the non-human animal is capable of producing or has produced a cell, such as a lymphocyte, such as a B cell, that expresses an antigen-binding protein that comprises a hybrid immunoglobulin chain and a universal light chain. See, for example, US 2013/0247234, US 2014/0329711, US 2014/0013456, US 2015/0119556, US 2015/0250151, US 9334334, and US 9332742, each of which is incorporated herein by reference in its entirety for all purposes. Some such non-human animals are homozygous for a rearranged human immunoglobulin light chain variable region nucleotide sequence. Some such non-human animals are heterozygous for a rearranged human immunoglobulin light chain variable region nucleotide sequence. In some such non-human animals, the light chain constant region nucleic acid sequence is a kappa sequence. In some such non-human animals, the nucleic acid sequence of the light chain constant region is a lambda sequence. In some such non-human animals, the second immunoglobulin locus is a kappa light chain locus. In some embodiments, the second immunoglobulin locus is a lambda light chain locus. An example of such a non-human animal is a non-human animal that comprises in its germline an immunoglobulin light chain locus that comprises a single rearranged human immunoglobulin light chain variable region gene sequence comprising human Vk and Jk segment sequences, wherein the Vk segment sequence is derived from a human Vk1-39 or Vk3-20 gene segment, and wherein the single rearranged human immunoglobulin light chain variable region gene sequence comprises a substitution of at least one non-histidine codon of the Vk segment sequence with a histidine codon that is expressed at a position selected from the group consisting of 105, 106, 107, 108, 109, 111, and combinations thereof (according to IMGT numbering).

[000384] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают отличное от человека животное, чей геном содержит: (а) вариабельный локус тяжелой цепи гуманизированного иммуноглобулина, содержащий по меньшей мере один неперестроенный VH человека, по меньшей мере один неперестроенный DH человека, и по меньшей мере один неперестроенный сегмент JH человека, функционально связанный с геном константного участка тяжелой цепи; (b) вариабельный локус легкой цепи гуманизированного иммуноглобулина, содержащий не более одной, или не более двух перестроенных последовательностей V/J легкой цепи человека, функционально связанных с геном константного участка легкой цепи; и (с) эктопическая последовательность нуклеиновой кислоты, которая экспрессирует функциональный белок ADAM6 отличного от человека животного, или функциональный ортолог или функциональный голлолог или его функциональный фрагмент. См., например, US 2013/0198879, включенную в данном документе в качестве ссылки в полном объеме для всех целей. Примером такого отличного от человека животного является отличное от человека животное, содержащее в своей зародышевой линии: (а) вариабельный локус тяжелой цепи гуманизированного иммуноглобулина, содержащий по меньшей мере один неперестроенный генный сегмент VH человека, по меньшей мере один неперестроенный генный сегмент DH человека, и по меньшей мере один неперестроенный генный сегмент JH человека, причем вариабельный локус тяжелой цепи гуманизированного иммуноглобулина функционально связан с геном константного участка тяжелой цепи иммуноглобулина; (b) вариабельный локус легкой цепи гуманизированного иммуноглобулина, содержащий (i) одну перестроенную последовательность V/J легкой цепи человека, причем одна перестроенная последовательность V/J легкой цепи человека представляет собой перестроенную последовательность Vк1-39/Jk человека или перестроенную последовательность Vк3-20/Jk человека, или (ii) не более одного генного сегмента V легкой цепи человека и не более одного генного сегмента J легкой цепи человека, причем не более одного генного сегмента V легкой цепи человека представляет собой Vк1-39 или Vк3-20, причем вариабельный локус легкой цепи гуманизированного иммуноглобулина функционально связан с геном константного участка легкой цепи иммуноглобулина; и (с) эктопическая последовательность нуклеиновой кислоты, которая экспрессирует белок ADAM6 отличного от человека животного, или ортолог, или гомолог или его функциональный фрагмент, который функционирует у самца отличного от человека животного.[000384] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal whose genome comprises: (a) a humanized immunoglobulin heavy chain variable locus comprising at least one non-rearranged human V H , at least one non-rearranged human D H , and at least one non-rearranged human J H segment operably linked to a heavy chain constant region gene; (b) a humanized immunoglobulin light chain variable locus comprising no more than one, or no more than two, rearranged human light chain V/J sequences operably linked to a light chain constant region gene; and (c) an ectopic nucleic acid sequence that expresses a functional non-human ADAM6 protein, or a functional ortholog or functional hololog, or a functional fragment thereof. See, for example, US 2013/0198879, incorporated herein by reference in its entirety for all purposes. An example of such a non-human animal is a non-human animal comprising in its germline: (a) a humanized immunoglobulin heavy chain variable locus comprising at least one unrearranged human V H gene segment, at least one unrearranged human D H gene segment, and at least one unrearranged human J H gene segment, wherein the humanized immunoglobulin heavy chain variable locus is operably linked to an immunoglobulin heavy chain constant region gene; (b) a humanized immunoglobulin light chain variable locus comprising (i) one rearranged human light chain V/J sequence, wherein the one rearranged human light chain V/J sequence is a rearranged human Vκ1-39/Jκ sequence or a rearranged human Vκ3-20/Jκ sequence, or (ii) no more than one human light chain V gene segment and no more than one human light chain J gene segment, wherein no more than one human light chain V gene segment is Vκ1-39 or Vκ3-20, wherein the humanized immunoglobulin light chain variable locus is operably linked to an immunoglobulin light chain constant region gene; and (c) an ectopic nucleic acid sequence that expresses a non-human animal ADAM6 protein, or an ortholog or homolog, or a functional fragment thereof, that functions in a male non-human animal.

[000385] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают отличное от человека животного, содержащее в своей зародышевой линии: (а) делецию или инактивирующую мутацию в нуклеотидной последовательности, кодирующей домен СН1 по меньшей мере одного гена константного участка тяжелой цепи эндогенного иммуноглобулина в эндогенном локусе тяжелой цепи иммуноглобулина, причем по меньшей мере один ген константного участка тяжелой цепи эндогенного иммуноглобулина представляет собой IgG, IgA, IgE, IgD или их комбинацию; и (b) одну или обе (i) последовательности нуклеиновой кислоты, содержащую по меньшей мере один неперестроенный генный сегмент вариабельного участка легкой цепи иммуноглобулина (VL), и по меньшей мере один неперестроенный соединительный генный сегмент (JL) легкой цепи иммуноглобулина, причем неперестроенные генные сегменты VL и JL способны к рекомбинации с образованием перестроенной нуклеотидной последовательности вариабельного участка легкой цепи иммуноглобулина (VL/JL), функционально связанной с геном константного участка тяжелой цепи иммуноглобулина, содержащим делецию или инактивирующую мутацию в нуклеотидной последовательности, кодирующей домен СН1; и/или (ii) локус легкой цепи иммуноглобулина, который содержит одну перестроенную последовательность гена VL/JL вариабельного участка легкой цепи иммуноглобулина, содержащую последовательности генных сегментов VL и JL, причем одна перестроенная последовательность гена вариабельного участка легкой цепи иммуноглобулина функционально связана с последовательностью гена константного участка легкой цепи иммуноглобулина. См., например, US 2015/0289489, включенную в данном документе в качестве ссылки в полном объеме для всех целей. Примером такое отличное от человека животное представляет собой отличное от человека животное, содержащее: (а) замещение в локусе тяжелой цепи отличного от человека животного всех или практически всех генных сегментов V, D и J тяжелой цепи эндогенного иммуноглобулина с либо (i) одним или более неперестроенными генными сегментами VH тяжелой цепи иммуноглобулина человека, одним или более неперестроенными генными сегментов DH тяжелой цепи иммуноглобулина человека, и одним или более неперестроенными генными сегментов JH тяжелой цепи иммуноглобулина человека, причем один или более неперестроенные генные сегменты VH, DH и JH тяжелой цепи иммуноглобулина человека функционально связаны с последовательностью гена константного участка тяжелой цепи отличного от человека животного; или (ii) одним или более неперестроенными генными сегментами VL легкой цепи человека, и одним или более неперестроенными генными сегментами JL легкой цепи человека, причем один или более неперестроенные генные сегменты VL и JL легкой цепи человека функционально связаны с последовательностью гена константного участка тяжелой цепи отличного от человека животного, причем последовательность гена константного участка тяжелой цепи отличного от человека животного содержит полноразмерный ген IgM и делецию или инактивирующую мутацию в нуклеотидной последовательности, кодирующей домен СН1 в гене IgG, выбранном из группы, состоящей из IgG 1, IgG2a, IgG2b, IgG2c, IgG3 и их комбинации; и (b) замещение всех или практически всех генных сегментов V и J легкой цепи эндогенного иммуноглобулина с одной перестроенной вариабельной последовательностью гена Vk/Jk человека, и причем отличное от человека животное, экспрессирует рецептор В-клетки, которая содержит тяжелую цепь IgM связанную с родственной легкой цепью.[000385] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal comprising in its germline: (a) a deletion or inactivating mutation in a nucleotide sequence encoding a CH1 domain of at least one endogenous immunoglobulin heavy chain constant region gene in an endogenous immunoglobulin heavy chain locus, wherein the at least one endogenous immunoglobulin heavy chain constant region gene is IgG, IgA, IgE, IgD, or a combination thereof; and (b) one or both of (i) a nucleic acid sequence comprising at least one non-rearranged immunoglobulin light chain variable region (V L ) gene segment and at least one non-rearranged immunoglobulin light chain joining gene segment (J L ), wherein the non-rearranged V L and J L gene segments are capable of recombination to form a rearranged immunoglobulin light chain variable region (V L /J L ) nucleotide sequence operably linked to an immunoglobulin heavy chain constant region gene comprising a deletion or inactivating mutation in a nucleotide sequence encoding a CH1 domain; and/or (ii) an immunoglobulin light chain locus that comprises a single rearranged V L /J L immunoglobulin light chain variable region gene sequence comprising V L and J L gene segment sequences, wherein the single rearranged immunoglobulin light chain variable region gene sequence is operably linked to an immunoglobulin light chain constant region gene sequence. See, for example, US 2015/0289489, incorporated herein by reference in its entirety for all purposes. An example of such a non-human animal is a non-human animal comprising: (a) a replacement at a heavy chain locus of the non-human animal of all or substantially all of the V, D, and J gene segments of an endogenous immunoglobulin heavy chain with either (i) one or more unrearranged human immunoglobulin heavy chain VH gene segments, one or more unrearranged human immunoglobulin heavy chain DH gene segments, and one or more unrearranged human immunoglobulin heavy chain JH gene segments, wherein the one or more unrearranged human immunoglobulin heavy chain VH , DH , and JH gene segments are operably linked to a heavy chain constant region gene sequence of the non-human animal; or (ii) one or more unrearranged human V L light chain gene segments and one or more unrearranged human J L light chain gene segments, wherein the one or more unrearranged human V L and J L light chain gene segments are operably linked to a heavy chain constant region gene sequence of a non-human animal, wherein the heavy chain constant region gene sequence of the non-human animal comprises a full-length IgM gene and a deletion or inactivating mutation in a nucleotide sequence encoding a CH1 domain in an IgG gene selected from the group consisting of IgG1, IgG2a, IgG2b, IgG2c, IgG3, and a combination thereof; and (b) replacing all or substantially all of the V and J light chain gene segments of an endogenous immunoglobulin with a single rearranged human Vk/Jk variable gene sequence, and wherein the non-human animal expresses a B cell receptor that comprises an IgM heavy chain associated with a cognate light chain.

[000386] Другие отличные от человека животные (например, грызуны, такие как крысы или мыши), которые могут быть использованы, включают в себя отличное от человека животное, содержащее в своей зародышевой линии локус легкой цепи иммуноглобулина, содержащий не более двух генных сегментов VL человека, и один или более генных сегментов JL человека, функционально связанные с последовательностью константного участка легкой цепи иммуноглобулина, причем каждый из не более чем двух генных сегментов VL человека содержит по меньшей мере один гистидиновый кодон, который не кодируется соответствующим генным сегментом VL зародышевой линии человека, и причем генные сегменты VL и генные сегменты JL человека способны перестраивать и кодировать вариабельный домен легкой цепи антитела человека. См., например, US 2014/0013456, US 2015/0119556, US 2015/0250151, US 2013/0247234 и US 9332742, каждая из которых включена в настоящее описание посредством ссылки во всей их полноте для всех целей. Примером такого отличного от человека животного является отличное от человека животное, которое содержит не более двух генных сегментов VL человека, каждый из которых способен перестраиваться с генным сегментом JL человека (выбранным из одного или множества сегментов JL) и кодирование вариабельного домена человека легкой цепи иммуноглобулина, причем каждый из не более двух генных сегментов VL и/или генного сегмента JL содержит замену по меньшей мере одного негистидинового остатка гистидиновым остатком. См., например, US 2014/0013456. Еще одним примером такого отличного от человека животного является отличное от человека животное, содержащее в своей зародышевой линии локус легкой цепи иммуноглобулина, содержащий два неперестроенных генных сегмента Vk человека, и один или более неперестроенный генный сегмент(ов) Jk человека, функционально связанных с последовательностью константного участка легкой цепи иммуноглобулина, причем два неперестроенных генных сегментов Vk человека представляют собой генные сегменты Vк1-39 и Vк3-20 человека, каждый из которых содержит одну или более замен негистидинового кодона с гистидиновым кодоном, и причем генные сегменты Vk и Jk человека могут быть перестраивать, а генные сегменты Vk и Jk человека кодируют вариабельный домен легкой цепи человека, содержащий один или более гистиди нов в положении, выбранном из группы, состоящей из 105, 106, 107, 108, 109, 111 (согласно нумерации IMGT), и их комбинацию, причем один или более гистидинов получают из одной или более замен. См., например, US 2015/0250151.[000386] Other non-human animals (e.g., rodents such as rats or mice) that can be used include a non-human animal that comprises in its germline an immunoglobulin light chain locus comprising no more than two human V L gene segments and one or more human J L gene segments operably linked to an immunoglobulin light chain constant region sequence, wherein each of the no more than two human V L gene segments comprises at least one histidine codon that is not encoded by the corresponding human germline V L gene segment, and wherein the human V L gene segments and the J L gene segments are capable of rearranging and encoding a light chain variable domain of a human antibody. See, for example, US2014/0013456, US2015/0119556, US2015/0250151, US2013/0247234, and US9332742, each of which is incorporated herein by reference in its entirety for all purposes. An example of such a non-human animal is a non-human animal that comprises no more than two human VL gene segments, each of which is capable of rearrangement with a human JL gene segment (selected from one or a plurality of JL segments) and encoding a human variable domain of an immunoglobulin light chain, wherein each of the no more than two VL gene segments and/or the JL gene segment comprises a substitution of at least one non-histidine residue with a histidine residue. See, for example, US2014/0013456. Another example of such a non-human animal is a non-human animal that comprises in its germline an immunoglobulin light chain locus comprising two unrearranged human Vk gene segments and one or more unrearranged human Jk gene segment(s) operably linked to an immunoglobulin light chain constant region sequence, wherein the two unrearranged human Vk gene segments are human Vk1-39 and Vk3-20 gene segments that each comprise one or more non-histidine to histidine codon substitutions, and wherein the human Vk and Jk gene segments are rearrangeable and wherein the human Vk and Jk gene segments encode a human light chain variable domain comprising one or more histidines at a position selected from the group consisting of 105, 106, 107, 108, 109, 111 (according to IMGT numbering), and a combination thereof, wherein one or more histidines are obtained from one or more substitutions. See, for example, US 2015/0250151.

IV. Способы генерации антигенсвязывающих белковIV. Methods of generating antigen-binding proteins

[000387] Генетически модифицированное F0 поколение отличных от человека животных, полученных описанными в данном документе способами, могут быть использованы для создания антигенсвязывающего белка против представляющего интерес чужеродного антигена-ллишени. Было описано несколько методов получения антигенсвязывающих белков (например, антител). Антигенсвязывающие белки могут быть выделены непосредственно из В-клеток иммунизированной мыши (см., например, US 2007/0280945, включенную в данный документ в качестве ссылки во всей своей полноте для всех целей), и/или В-клетки иммунизированной мыши могут быть использованы для создания гибридомы (см., например, Kohler and Milstein (1975) Nature 256: 495-497, включенную в данный документ в качестве ссылки во всей своей полноте для всех целей). ДНК, кодирующая антигенсвязывающие белки (тяжелые и/или легкие цепи) из отличных от человека животных, как описано в данном документе, может быть легко выделена и сиквенирована с использованием обычных методов. Гибридомы и/или В-клетки, полученные из отличных от человека животных, как описано в данном документе, служат в качестве предпочтительного источника такой ДНК. После выделения ДНК можно помещать в экспрессирующие векторы, которые затем трансфицируют в клетки-хозяева, которые иначе не продуцируют белок иммуноглобулина, чтобы получить синтез моноклональных антител в рекомбинантных клетках-хозяевах.[000387] The genetically modified F0 generation of non-human animals produced by the methods described herein can be used to generate an antigen-binding protein against a foreign target antigen of interest. Several methods for producing antigen-binding proteins (e.g., antibodies) have been described. Antigen-binding proteins can be isolated directly from B cells of an immunized mouse (see, e.g., US 2007/0280945, incorporated herein by reference in its entirety for all purposes), and/or B cells of an immunized mouse can be used to generate a hybridoma (see, e.g., Kohler and Milstein (1975) Nature 256: 495-497, incorporated herein by reference in its entirety for all purposes). DNA encoding antigen-binding proteins (heavy and/or light chains) from non-human animals as described herein can be readily isolated and sequenced using conventional techniques. Hybridomas and/or B cells derived from non-human animals as described herein serve as a preferred source of such DNA. Once isolated, the DNA can be placed into expression vectors that are then transfected into host cells that do not otherwise produce immunoglobulin protein to produce monoclonal antibodies in recombinant host cells.

[000388] Например, генетически модифицированное F0 поколение отличных от человека животных, полученное описанными в данном документе способами, может быть подвергнуто воздействию антигена-мишени и поддерживаться в условиях, достаточных для инициирования иммунного ответа на представляющий интерес чужеродный антиген-мишень. Первая последовательность нуклеиновой кислоты, кодирующая вариабельный домен тяжелой цепи иммуноглобулина человека, и/или вторая последовательность нуклеиновой кислоты, кодирующая вариабельный домен легкой цепи иммуноглобулина человека, затем может быть получена из генетически модифицированного F0 поколения отличного от человека животного. Альтернативно, антигенсвязывающий белок может быть затем выделен из генетически модифицированного F0 поколения отличного от человека животного. В качестве примера может быть идентифицирован клонально выбранный лимфоцит, который экспрессирует антитело, которое специфически связывает представляющий интерес чужеродный антиген.[000388] For example, a genetically modified F0 generation of non-human animals produced by the methods described herein can be exposed to a target antigen and maintained under conditions sufficient to initiate an immune response to a foreign target antigen of interest. A first nucleic acid sequence encoding a human immunoglobulin heavy chain variable domain and/or a second nucleic acid sequence encoding a human immunoglobulin light chain variable domain can then be obtained from the genetically modified F0 generation of non-human animals. Alternatively, an antigen-binding protein can then be isolated from the genetically modified F0 generation of non-human animals. As an example, a clonally selected lymphocyte can be identified that expresses an antibody that specifically binds a foreign antigen of interest.

[000389] В одном примере антигенсвязывающие белки могут быть получены путем иммунизации генетически модифицированного F0-поколения отличного от человека животного с представляющим интерес чужеродным антигеном-мишенью, позволяя отличному от человека животному повышать иммунный ответ, собирая лимфоцит (например, В-клетку) от иммунизованного животного, сливая лимфоцит с клеткой миеломы с образованием клетки гибридомы, получая из клетки гибридомы последовательность нуклеиновой кислоты, которая кодирует домен VH, который специфически связывает антиген-мишень и/или последовательность нуклеиновой кислоты, которая кодирует домен VL, который специфически связывает антиген-мишень, клонируя последовательность нуклеиновой кислоты в рамке (то есть в функциональной связи) с последовательностью нуклеиновой кислоты, кодирующей константный участок иммуноглобулина или его функциональную часть, чтобы создать тяжелую цепь иммуноглобулина и/или легкую цепь иммуноглобулина, и экспрессируя тяжелые и легкие цепи в клетке (например, клетке СНО), способной экспрессировать антигенсвязывающий белок.[000389] In one example, antigen-binding proteins can be produced by immunizing a genetically modified F0 generation non-human animal with a foreign target antigen of interest, allowing the non-human animal to mount an immune response, collecting a lymphocyte (e.g., a B cell) from the immunized animal, fusing the lymphocyte with a myeloma cell to form a hybridoma cell, obtaining from the hybridoma cell a nucleic acid sequence that encodes a V H domain that specifically binds the target antigen and/or a nucleic acid sequence that encodes a V L domain that specifically binds the target antigen, cloning the nucleic acid sequence in frame (i.e., in functional linkage) with a nucleic acid sequence encoding an immunoglobulin constant region or a functional portion thereof to create an immunoglobulin heavy chain and/or an immunoglobulin light chain, and expressing the heavy and light chains in a cell (eg, a CHO cell) capable of expressing the antigen-binding protein.

[000390] В другом примере антигенсвязывающие белки могут быть получены путем иммунизации генетически модифицированного F0-поколения отличного от человека животного с представляющим интерес чужеродным антигеном-мишенью, позволяя отличному от человека животному повышать иммунный ответ, собирая лимфоцит (например, В-клетку) от иммунизованного животного, получая из лимфоцита последовательность нуклеиновой кислоты, которая кодирует домен VH, который специфически связывает антиген-мишень и/или последовательность нуклеиновой кислоты, которая кодирует домен VL, который специфически связывает антиген-мишень, клонируя последовательность нуклеиновой кислоты в рамке (то есть в функциональной связи) с последовательностью нуклеиновой кислоты, кодирующей константный участок иммуноглобулина или его функциональную часть, чтобы создать тяжелую цепь иммуноглобулина и/или легкую цепь иммуноглобулина, и экспрессируя тяжелые и легкие цепи в клетке (например, клетке СНО), способной экспрессировать антигенсвязывающий белок.[000390] In another example, antigen-binding proteins can be produced by immunizing a genetically modified F0 generation non-human animal with a foreign target antigen of interest, allowing the non-human animal to mount an immune response, collecting a lymphocyte (e.g., a B cell) from the immunized animal, obtaining from the lymphocyte a nucleic acid sequence that encodes a V H domain that specifically binds the target antigen and/or a nucleic acid sequence that encodes a V L domain that specifically binds the target antigen, cloning the nucleic acid sequence in frame (i.e., in functional linkage) with a nucleic acid sequence encoding an immunoglobulin constant region or a functional portion thereof to create an immunoglobulin heavy chain and/or an immunoglobulin light chain, and expressing the heavy and light chains in a cell (e.g., a CHO cell) capable of expressing the antigen-binding protein.

[000391] Иммунизация чужеродным антигеном, представляющим интерес, может быть проведена с белком, ДНК, комбинацией ДНК и белка, или клетками, экспрессирующими представляющий интерес чужеродный антиген. Полученные лимфоциты могут быть получены из любого источника, включая, например, селезенку, лимфатический узел или костный мозг иммунизованного животного.[000391] Immunization with a foreign antigen of interest can be carried out with protein, DNA, a combination of DNA and protein, or cells expressing the foreign antigen of interest. The lymphocytes obtained can be obtained from any source, including, for example, the spleen, lymph node, or bone marrow of an immunized animal.

[000392] В некоторых таких способах, домен VH и/или домен VL являются человеческими (например, когда генетически модифицированное F0-поколение отличного от человека животного является гомозиготно гуманизированным как у IgH, так и Igк), домен VH и/или домен VL клонируют в рамке с последовательностью нуклеиновой кислоты, кодирующей константный участок человека, и образующиеся антигенсвязывающие белки являются полностью антителами человека.[000392] In some such methods, the V H domain and/or V L domain are human (e.g., when a genetically modified F0 generation of a non-human animal is homozygous humanized in both IgH and IgK), the V H domain and/or V L domain are cloned in frame with a nucleic acid sequence encoding a human constant region, and the resulting antigen-binding proteins are fully human antibodies.

[000393] Получение антигенсвязывающих белков против представляющего интерес чужеродного антигена, полученного в генетически модифицированном F0 поколении отличных от человека животных, описанных в данном документе (т.е. генетически модифицированный в первом геномном локусе-мишени), обычно увеличивается по сравнению с контрольными отличными от человека животными (т.е., которые являются диким типом в первом геномном локусе-мишени). То есть антигенсвязывающие белки против представляющего интерес чужеродного антигена, полученного в генетически модифицированном F0 поколении отличных от человека животных, описанных в данном документе (т.е. генетически модифицированный в первом геномном локусе-мишени), обычно имеют более высокий титр, чем антигенсвязывающие белки, полученные после иммунизации контрольного отличного от человека животного, которое является диким типом в первом геномном локусе-мишени. Например, титр может быть по меньшей мере в 1,5 раза, в 2 раза, в 3 раза, в 4 раза, в 5 раз, в 6 раз, в 7 раз, в 8 раз, в 9 раз или в 10 раз выше. Термин титр антител включает в себя измерение концентрации специфического антитела, присутствующего в сыворотке. Например, титр антител может быть измерением количества антител, продуцируемых организмом, которые распознают конкретный эпитоп, экспрессированный как инверсия наибольшего разведения, которая все еще дает положительный результат.Аналогично, более разнообразный репертуар антигенсвязывающих белков против чужеродного антигена, представляющего интерес, обычно получают после иммунизации генетически модифицированного F0-поколения отличных от человека животных с интересующим чужеродным антигеном, по сравнению с антигенсвязывающими белками, полученными после иммунизации контрольного отличного от человека животного, которое являются диким типом в первом геномном локусе-мишени. Контрольное отличное от человека животное относится к отличному от человека животному, которое является диким типом в первом геномном локусе-мишени. Предпочтительно, единственное существенное различие между генетически модифицированным F0 поколением отличного от человека животного, и контрольным животным является статусом первого геномного локуса-мишени. Например, предпочтительно, чтобы контрольное животное не имело других существенных генетических модификаций и являлось одним и тем же видом отличного от человека животного, являлось одной и той же линией отличного от человека животного, имело тот же генетический фон (отличный от первого геномного локуса-мишени), и было того же возраста, что и генетически модифицированное F0 поколение отличного от человека животного.[000393] The production of antigen-binding proteins against a foreign antigen of interest produced in the genetically modified F0 generation of non-human animals described herein (i.e., genetically modified at the first genomic target locus) is typically increased compared to control non-human animals (i.e., which are wild type at the first genomic target locus). That is, antigen-binding proteins against a foreign antigen of interest produced in the genetically modified F0 generation of non-human animals described herein (i.e., genetically modified at the first genomic target locus) are typically of higher titer than antigen-binding proteins produced after immunization of a control non-human animal that is wild type at the first genomic target locus. For example, the titer may be at least 1.5-fold, 2-fold, 3-fold, 4-fold, 5-fold, 6-fold, 7-fold, 8-fold, 9-fold, or 10-fold higher. The term antibody titer includes a measurement of the concentration of a specific antibody present in serum. For example, the antibody titer may be a measurement of the amount of antibodies produced by an organism that recognize a particular epitope expressed as the highest dilution inverse that still yields a positive result. Similarly, a more diverse repertoire of antigen-binding proteins against a foreign antigen of interest is typically obtained after immunization of genetically modified F0-generation non-human animals with the foreign antigen of interest, compared to the antigen-binding proteins obtained after immunization of a control non-human animal that is wild type at the first genomic target locus. A control non-human animal refers to a non-human animal that is wild type at the first genomic target locus. Preferably, the only significant difference between the genetically modified F0 generation of the non-human animal and the control animal is the status of the first genomic target locus. For example, it is preferred that the control animal does not have other significant genetic modifications and is the same species of non-human animal, is the same strain of non-human animal, has the same genetic background (other than the first genomic target locus), and is the same age as the genetically modified F0 generation of the non-human animal.

[000394] Все патентные заявки, веб-сайты, другие публикации, номера доступа и тому подобное, упомянутые выше или ниже, включены в качестве ссылки во всей их полноте для всех целей в той же степени, как если бы каждый отдельный элемент был конкретно и индивидуально указан, чтобы быть включенным путем ссылки. Если разные версии последовательности связаны с номером доступа в разное время, подразумевается версия, связанная с номером доступа, в эффективную дату подачи этой заявки. Эффективная дата подачи означает более раннюю дату фактической подачи или дату подачи приоритетного приложения, относящуюся к номеру доступа, если это применимо. Аналогичным образом, если разные версии публикации, веб-сайта или тому подобного публикуются в разное время, подразумевается версия, которая была недавно опубликована в дату фактической подачи заявки, если не указано иное. Любая функция, шаг, элемент, вариант осуществления изобретения или аспект изобретения могут использоваться в сочетании с любым другим, если специально не указано иное. Хотя настоящее изобретение было описано более подробно с помощью иллюстрации и примера для ясности и понимания, будет очевидно, что некоторые изменения и модификации могут быть реализованы в рамках прилагаемой формулы изобретения.[000394] All patent applications, websites, other publications, accession numbers, and the like, whether referenced above or below, are hereby incorporated by reference in their entirety for all purposes to the same extent as if each individual element were specifically and individually indicated to be incorporated by reference. If different versions of a sequence are associated with an accession number at different times, the version associated with the accession number on the effective filing date of that application is intended. The effective filing date means the earlier of the actual filing date or the filing date of the priority application associated with the accession number, as applicable. Likewise, if different versions of a publication, website, or the like are published at different times, the version that was most recently published on the actual filing date of the application is intended, unless otherwise indicated. Any feature, step, element, embodiment, or aspect of the invention may be used in combination with any other unless otherwise specifically indicated. Although the present invention has been described in more detail by way of illustration and example for the purpose of clarity and understanding, it will be apparent that certain changes and modifications may be practiced within the scope of the appended claims.

КРАТКОЕ ОПИСАНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙBRIEF DESCRIPTION OF SEQUENCES

[000395] Нуклеотидные и аминокислотные последовательности, перечисленные в списке сопровождающих последовательностей, показаны с использованием стандартных сокращений для нуклеотидных оснований и трехбуквенного кода для аминокислот.Нуклеотидные последовательности следуют стандартному соглашению, начинающемуся с 5'-конца последовательности и идущему вперед (т.е. слева направо в каждой строке) до 3'-конца. Показана только одна цепь каждой нуклеотидной последовательности, но понимается, что комплементарная цепь включает любую ссылку на отображаемую цепь. Аминокислотные последовательности следуют стандартному соглашению, начинающемуся с аминоконца последовательности и идущей вперед (т.е. слева направо в каждой линии) на карбоксильный конец.[000395] The nucleotide and amino acid sequences listed in the Accompanying Sequence Listing are shown using standard abbreviations for nucleotide bases and a three-letter code for amino acids. The nucleotide sequences follow the standard convention of starting at the 5' end of the sequence and proceeding forward (i.e., from left to right in each line) to the 3' end. Only one strand of each nucleotide sequence is shown, but it is understood that the complementary strand includes any reference to the strand shown. The amino acid sequences follow the standard convention of starting at the amino terminus of the sequence and proceeding forward (i.e., from left to right in each line) to the carboxyl terminus.

ПРИМЕРЫEXAMPLES

Пример 1. Генерирование эмбриональных стволовых клеток KO (ЭС), эмбрионов на одноклеточной стадии, и мышей для производства антител с использованием спаренных направляющих РНК, нацеленных на старт и стоп кодоны.Example 1: Generation of KO embryonic stem cells (ES), one-cell stage embryos, and mice for antibody production using paired guide RNAs targeting start and stop codons.

[000397] Технологии VELOCIGENE® и VELOCIMOUSE® позволили создать мышь VELOCIMMUNE®, которая позволяет производить полностью человеческие антитела. Мыши VELOCIMMUNE® экспрессируют каппа (Igκ) и тяжелые (IgH) цепи иммуноглобулина, в которых полностью гуманизированный вариабельный участок соединен с константным участком мыши. Поскольку функционально важные участки белков, как правило, сохраняются у разных видов, иммунологическая толерантность к аутоантигенам часто создает проблему для получения антител к этим ключевым эпиталам. Традиционно, мышей VELOCIMMUNE® разводили для F0 мышей, несущих гетерозиготную нокаутную мутацию в представляющем интерес аутоантигене-мишени, для преодоления иммунологической толерантности. Чтобы получать трижды гомозиготных мышей (гомозиготных нулевых по интересующей мишени и гомозиготных гуманизированных как IgH, так и Igκ), подходящих для иммунизации, потребовалось еще два поколения разведения и от 15 до 16 месяцев общего времени. Для ускорения этого процесса, были получены эмбриональные стволовые клетки (ЭС) VELOCIMMUNE®, которые могут быть нацелены для создания нулевых аллелей в представляющей интерес мишени. Однако, к сожалению, для получения гомозиготных нулевых клонов ЭС клеток VELOCIMMUNE® требуются последовательные шаги нацеливания, что отнимает много времени. Что еще более важно, не только клоны ЭС клеток VELOCIMMUNE® традиционно демонстрируют небольшую способность продуцировать полностью полученное на основе ЭС-клеток F0 VELOCIMICE® (то есть полностью полученное на основе ЭС-клеток F0 поколение мыши, полученное от инъекции ЭС-клеток в эмбрионы на 8-клеточной стадии) в KO для проектов иммунизации (см., например, таблицу 2), но также последовательно нацеленные клоны ЭС клеток VELOCIMMUNE® демонстрируют еще более уменьшенную способность продуцировать полностью полученное на основе ЭС-клеток F0 VELOCIMICE® (то есть полностью полученное на основе ЭС-клеток F0 поколение мыши, полученное от инъекции ЭС-клеток в эмбрионы на 8-клеточной стадии). См., например, таблицу 3 (сравнивается эффективность продукции VELOCIMOUSE® с использованием типичной ЭС клеточной линии, используемой для получения нацеленных генетических модификаций и VELOCIMICE® (F1H4 ЭС клеточной линии) и двух ЭС клеточных линий с универсальной легкой цепью (ULC) и VELOCIMMUNE® ЭС клеточной линии (VI-3Adam6)).[000397] VELOCIGENE® and VELOCIMOUSE® technologies have enabled the creation of the VELOCIMMUNE® mouse, which is capable of producing fully human antibodies. VELOCIMMUNE® mice express immunoglobulin kappa (Igκ) and heavy (IgH) chains in which a fully humanized variable region is fused to a mouse constant region. Because functionally important regions of proteins are typically conserved across species, immunological tolerance to self-antigens often poses a challenge to producing antibodies to these key epithelials. Traditionally, VELOCIMMUNE® mice have been bred to F0 mice carrying a heterozygous knockout mutation in the target self-antigen of interest to overcome immunological tolerance. To generate triply homozygous mice (homozygous null for the target of interest and homozygous humanized for both IgH and Igκ) suitable for immunization, two more generations of breeding and 15 to 16 months of total time were required. To expedite this process, VELOCIMMUNE® embryonic stem (ES) cells were developed that can be targeted to create null alleles in the target of interest. Unfortunately, however, generating homozygous null clones of VELOCIMMUNE® ES cells requires sequential targeting steps, which is time-consuming. More importantly, not only do VELOCIMMUNE® ES cell clones traditionally show little capacity to produce fully F0 ES cell-derived VELOCIMICE® (i.e., fully F0 ES cell-derived mouse generation obtained from injection of ES cells into 8-cell stage embryos) in KO immunization projects (see, e.g., Table 2), but also sequentially targeted VELOCIMMUNE® ES cell clones show even less capacity to produce fully F0 ES cell-derived VELOCIMICE® (i.e., fully F0 ES cell-derived mouse generation obtained from injection of ES cells into 8-cell stage embryos). See, for example, Table 3 (comparing the performance of VELOCIMOUSE® products using a typical ES cell line used to produce targeted genetic modifications and VELOCIMICE® (F1H4 ES cell line) and two ES cell lines with the universal light chain (ULC) and VELOCIMMUNE® ES cell line (VI-3Adam6)).

[000398][000398]

[000399][000399]

[000400] Для того чтобы получать мышей с пониженной толерантностью к чужеродным антигенам-мишени человека, которые представляют интерес, мы разработали способ быстрого получения ЭС клеток VELOCIMMUNE®, содержащих функциональный эктопический ген мыши Adam6, которые гомозиготны для нулевых аллелей в представляющей интерес мишени в одном этапе модификации. Мы оптимизировали процедуру для использования пары направляющих РНК для эффективного создания больших делеций на обоих аллелях представляющей интерес мишени в ЭС клетках VELOCIMMUNE®, содержащих функциональный эктопический ген мыши Adam6, тем самым устраняя необходимость разработки и создания больших направленных векторов (LTVECs). Используя этот подход, F0 VELOCIMICE®, гомозиготные по нулевой аллели в представляющей интерес мишени и готовое к иммунизации, может быть получено через 4-5 месяцев вместо 15-16 месяцев (мышиные щенки, гомозиготные по нулевой аллели в представляющей интерес мишени, могут быть получены через ~ 3 месяца, но затем подвергаются в возрасте 4-5 недель иммунизации). В этом эксперименте спаренные направляющие РНК были спроектированы и клонированы для нацеливания на аутоантигены, ортологичные для этих представляющих интерес чужеродных антигенов-мишеней для гомозиготной делеций. Направляющие РНК были предназначены для нацеливания научастки старти конца кодона эндогенных генов, кодирующих аутоантигены. Для некоторых целей были разработаны две пары гРНК (v1 и v2). Процесс конструирования направляющей РНК описан в нижеприведенных Материалах и Методах. Направляющие РНК были электропорированы или нуклеотидированы вместе с Cas9 в ЭС-клетки, полученные от мышей VELOCIMMUNE®, содержащих функциональный эктопический ген мыши Adam6 (VI-3 Adam6) мышей (замененный эндогенный вариабельный участок тяжелой и легкой цепи иммуноглобулина мыши с соответствующей ДНК человека вместе с регенерированным мышиным геном Adam6) или мышей с универсальной легкой цепью (ULC 1-39) (мышей с одним перестроенным вариабельным участком легкой цепи иммуноглобулина человека, которая является генным сегментом Vκ1-39/J человека). См. Фигуру 32. Протоколы электропорации и нуклеофекции описаны в нижеприведенных Материалах и Методах. В некоторых экспериментах, Cas9 и спаренные направляющие РНК были электропорированы вместе с большим направленным вектором (LTVEC), нацеленным на эндогенный ген, кодирующий аутоантиген для делеций (см., например, фигуру 4). Сравнительная эффективность делеций наблюдалась с использованием CRISPR/Cas9 (СС9) с или без LTVEC (см. Таблицу 4).[000400] To generate mice with reduced tolerance to foreign human target antigens of interest, we have developed a method for rapidly generating VELOCIMMUNE® ES cells containing a functional ectopic mouse Adam6 gene that are homozygous for null alleles at the target of interest in a single modification step. We optimized the procedure to use a pair of guide RNAs to efficiently create large deletions at both alleles of the target of interest in VELOCIMMUNE® ES cells containing a functional ectopic mouse Adam6 gene, thereby eliminating the need to design and construct large targeting vectors (LTVECs). Using this approach, F0 VELOCIMICE®, homozygous for the null allele in the target of interest and ready for immunization, can be produced in 4-5 months instead of 15-16 months (mouse pups homozygous for the null allele in the target of interest can be produced in ~3 months but are then immunized at 4-5 weeks of age). In this experiment, paired gRNAs were designed and cloned to target self-antigens orthologous to these homozygous deletion target foreign antigens of interest. The gRNAs were designed to target the start and stop codon regions of the endogenous genes encoding the self-antigens. For some targets, two pairs of gRNAs (v1 and v2) were designed. The guide RNA construction process is described in the Materials and Methods below. Guide RNAs were electroporated or co-nucleotideed with Cas9 into ES cells derived from VELOCIMMUNE® mice containing a functional ectopic mouse Adam6 gene (VI-3 Adam6) mouse (replaced endogenous mouse heavy and light chain variable regions with the corresponding human DNA together with a regenerated mouse Adam6 gene) or universal light chain (ULC 1-39) mice (mice with one rearranged human light chain variable region, which is the human Vκ1-39/J gene segment). See Figure 32. Electroporation and nucleofection protocols are described in the Materials and Methods below. In some experiments, Cas9 and paired guide RNAs were electroporated together with a large targeting vector (LTVEC) targeting the endogenous gene encoding the deletion autoantigen (see, e.g., Figure 4). Comparative deletion efficiencies were observed using CRISPR/Cas9 (CC9) with or without LTVEC (see Table 4).

[000401][000401]

[000402] Временна шкала от начала эксперимента (дизайн гРНК) до конца (генотипированное F0 мыши с гомозиготным нулевым аллелем в отношении эндогенного гена, кодирующего аутоантиген) составляла приблизительно 3 месяца. В качестве примера, временная шкала для получения F0 мышей гомозиготных нулевых в отношении аутоантигена, соответствующего Мишени 1 (ауто-антиген 1), показан в таблице 5.[000402] The timeline from the start of the experiment (gRNA design) to the end (genotyped F0 mice with a homozygous null allele for the endogenous gene encoding the self-antigen) was approximately 3 months. As an example, the timeline for generating F0 mice homozygous null for the self-antigen corresponding to Target 1 (self-antigen 1) is shown in Table 5.

[000403][000403]

[000404] Было проведено несколько экспериментов с целью нацеливания на различные аутоантигены для делеции в эмбриональных стволовых клетках (ЭС) у мышей VI-3-Adam6 и ULC 1-39 с использованием спаренных направляющих РНК, нацеленных на участки старт и стоп кодона каждого аутоантигена, в одиночку или вместе с большим направленным вектором (LTVEC), нацеленным на аутоантиген для делеции. Cas9 и направляющие РНК вводили в ЭС-клетки в форме ДНК. Как показано в таблице 6 и на фигуре 28, делеция (т.е. разрушение) была достигнута для всех тестируемых аутоантигенов с размерами делеции в диапазоне между 0,1 т.п.о. до 165 т.п.о., и была отрицательная корреляция между размером делеции (т.е. разрушением) и эффективностью производства мышат, несущих делеции (т.е. разрушения). Биаллельное разрушение также может быть достигнут для гораздо больших размеров. Например, мы достигли биаллельного разрушения для размера делеции ~ 400 т.п.о. Аналогично, биаллельное разрушение ~ 900 т.п.о. - 1 Мб в локусе IgH мыши был достигнут за счет использования двух 5'-гРНК и двух 3'-гРНК и вектора репарации с эффективностью ~ 1,2% (данные не показаны).[000404] Several experiments were performed to target various autoantigens for deletion in embryonic stem (ES) cells from VI-3-Adam6 and ULC 1-39 mice using paired guide RNAs targeting the start and stop codon sites of each autoantigen, alone or together with a large targeting vector (LTVEC) targeting the autoantigen for deletion. Cas9 and guide RNAs were introduced into ES cells in the form of DNA. As shown in Table 6 and Figure 28, deletion (i.e., disruption) was achieved for all autoantigens tested with deletion sizes ranging between 0.1 kb to 165 kb, and there was a negative correlation between the size of the deletion (i.e., disruption) and the efficiency of producing deletion (i.e., disruption) bearing pups. Biallelic disruption can also be achieved for much larger sizes. For example, we achieved biallelic disruption for a deletion size of ~400 kb. Similarly, biallelic disruption of ~900 kb - 1 Mb in the mouse IgH locus was achieved by using two 5' gRNAs and two 3' gRNAs and a repair vector with an efficiency of ~1.2% (data not shown).

[000405][000405]

[000406] Подобно процедуре с использованием ЭС-клеток, для того чтобы получать мышей с пониженной толерантностью к чужеродным антигенам-мишени человека, которые представляют интерес, мы разработали способ быстрого получения эмбрионов на одноклеточной стадии, которые гомозиготны для нулевых аллелей в представляющей интерес мишени в одном этапе модификации. Мы оптимизировали процедуру для использования пары направляющих РНК для эффективного создания больших делеций на обоих аллелях представляющей интерес мишени в эмбрионах на одноклеточной стадии, тем самым устраняя необходимость разработки и создания больших направленных векторов (LTVEC). Кроме того, использование эмбрионов на одноклеточной стадии может повысить эффективность производства целевых мышей по сравнению с использованием ЭС клеточных линий (например, ЭС клеточных линий ULC 1-39). Используя этот подход, F0 мыши гомозиготные по нулевой аллели в представляющей интерес мишени, которые готовы к иммунизации, может быть получено через 4-5 месяцев (мышиные щенки F0, гомозиготные по нулевой аллели в представляющей интерес мишени, могут быть получены через ~ 3 месяца) вместо 15-16 месяцев. В этом эксперименте спаренные направляющие РНК были спроектированы и клонированы для нацеливания на аутоантигены, ортологичные для этих представляющих интерес чужеродных антигенов-мишеней для гомозиготной делеций. Направляющие РНК были предназначены для нацеливания на участки старт и конца кодона эндогенных генов, кодирующих аутоантигены. Процесс конструирования направляющей РНК описан в нижеприведенных Материалах и Методах. Вкратце, супер-овулированные самки спаривались с племенными самцами для получения эмбрионов. Если бы имелось только несколько самцов, использовалось оплодотворение in vitro. Возраст самок составлял 3-16 недель, ооциты на донора варьировались от 15-46 (медиана=32 ооцита), а зиготы на донора варьировались от 5-32 (медиана=15 зигот). Направляющие РНК подвергали микроинъекции (цитоплазматическая инъекция) вместе с мРНК Cas9 в эмбрионах на одноклеточной стадии от мышей VELOCIMMUNE®, содержащих функциональный эктопический ген мыши Adam6 (VI-3 Adam6) мышей (замененный эндогенный вариабельный участок тяжелой и легкой цепи иммуноглобулина мыши с соответствующей ДНК человека вместе с регенерированным мышиным геном Adam6) или мышей с универсальной легкой цепью (ULC 1-39) (мышей с одним перестроенным вариабельным участком легкой цепи иммуноглобулина человека, которая является генным сегментом Vκ1-39/J κ5 человека). Количество инъектированных эмбрионов варьировалось от 99-784 (медиана=334), процент выживших эмбрионов варьировался от 56% до 73% (медиана=63%), количество перенесенных эмбрионов варьировалось от 59-442 (медиана =226), количество щенков для каждого проекта варьировалось от 10-46 (медиана=32), а коэффициент рождаемости варьировался от 2%-59% (медиана=13%). Как показано в таблице 7 и на фигуре 29, живые щенки, имеющие целевую делеция (т.е. разрушение) были получены для всех тестируемых аутоантигенов с размерами делеции в диапазоне между 0,1 т.п.о. до 94 т.п.о., и была отрицательная корреляция между размером делеции (т.е. разрушением) и эффективностью производства мышат, несущих делеции (т.е. разрушения).[000406] Similar to the procedure using ES cells, in order to generate mice with reduced tolerance to foreign human target antigens of interest, we developed a method for rapidly generating one-cell stage embryos that are homozygous for null alleles at the target of interest in a single modification step. We optimized the procedure to use a pair of guide RNAs to efficiently create large deletions at both alleles of the target of interest in one-cell stage embryos, thereby eliminating the need to design and construct large targeting vectors (LTVECs). In addition, the use of one-cell stage embryos can improve the efficiency of producing target mice compared to the use of ES cell lines (e.g., ULC 1-39 ES cell lines). Using this approach, F0 mice homozygous for the null allele in the target of interest that are ready for immunization can be obtained in 4-5 months (F0 mouse pups homozygous for the null allele in the target of interest can be obtained in ~3 months) instead of 15-16 months. In this experiment, paired guide RNAs were designed and cloned to target self-antigens orthologous to the homozygous deletion target foreign antigens of interest. The guide RNAs were designed to target the start and stop codon regions of the endogenous genes encoding the self-antigens. The process of guide RNA construction is described in the Materials and Methods below. Briefly, superovulated females were mated with breeding males to generate embryos. If only a few males were available, in vitro fertilization was used. Females were 3-16 weeks old, oocytes per donor ranged from 15-46 (median=32 oocytes), and zygotes per donor ranged from 5-32 (median=15 zygotes). Guide RNAs were microinjected (cytoplasmic injection) together with Cas9 mRNA into one-cell stage embryos from VELOCIMMUNE® mice containing a functional ectopic mouse Adam6 gene (VI-3 Adam6) mice (replaced endogenous mouse heavy and light chain variable region with the corresponding human DNA together with a regenerated mouse Adam6 gene) or universal light chain (ULC 1-39) mice (mice with one rearranged human immunoglobulin light chain variable region, which is the human Vκ1-39/J κ5 gene segment). The number of injected embryos ranged from 99-784 (median=334), the percentage of surviving embryos ranged from 56% to 73% (median=63%), the number of transferred embryos ranged from 59-442 (median=226), the number of pups for each project ranged from 10-46 (median=32), and the live birth rate ranged from 2%-59% (median=13%). As shown in Table 7 and Figure 29, live pups bearing the targeted deletion (i.e. disruption) were obtained for all tested autoantigens with deletion sizes ranging between 0.1 kb to 94 kb, and there was a negative correlation between the size of the deletion (i.e. disruption) and the efficiency of producing deletion (i.e. disruption) bearing mice.

[000407][000407]

Материалы и методыMaterials and methods

[000408] Дизайн анализа направляющей РНК и TAQMAN®: Направляющие РНК (гРНК) длиной 23 пары оснований были сконструированы на основе кодирующей последовательности консенсуса (CCDS) для каждого локуса в формате 5' NNNNNNNNNNNNNNNNnnNNNGG 3' (SEQ ID NO: 2), где N представляет собой любой нуклеотид. Последние три нуклеотида (NGG) представляют собой мотив, прилегающий к протоспейсеру (РАМ), а двухцепочечное расщепление ДНК с тупым концом ферментом Cas9 имеет 3 нуклеотида 5' в NGG (между остатками нижнего регистра выше). ГРНК были выбраны на основе оценок, полученных из различных поисковых систем гРНК, включая crispr.mit.edu, crispr.med.harvard.edu/sgRNAScorer/ и broadinstitute.org/rnai/public/analysis-tools/sgrna-design. Вкратце, 100-150 п.о. последовательности непосредственно 5' и 3' старт ATG и 100-150 п.о. непосредственно 5' и 3' стоп-кодона соответственно анализировали на гРНК на обеих цепях ДНК. Две гРНК (перекрывающиеся каждая друг с другом не более чем на 25%) вблизи ATG и две гРНК около стоп-кодона с высокими оценками из всех используемых поисковых систем были дополнительно опрошены на предмет уникальности в геноме мыши и ни одной вариации нуклеотидов (SNV) в Универсальной легкой цепи (ULC или общая легкая цепь), мыши VELOCIMMUNE®, содержащие функциональный эктопический ген Adam6 мыши (VI-3-Adam6), и эмбриональные стволовые клетки (ЭСК) VGB6 VELOCIGENE® мыши. Если не были найдены гиды с высокими оценками с использованием вышеприведенных спецификаций поиска, была осуществлен поиск дополнительной последовательности вокруг ATG и стоп-кодонов до тех пор, пока не будут найдены два высококачественных гида.[000408] Guide RNA and TAQMAN® Assay Design: Guide RNAs (gRNAs) of 23 bp in length were designed based on the consensus coding sequence (CCDS) for each locus in the format 5' NNNNNNNNNNNNNNNNNNNNNGG 3' (SEQ ID NO: 2), where N is any nucleotide. The last three nucleotides (NGG) are a protospacer adjacent motif (PAM), and the Cas9 blunt-end double-stranded DNA cleavage site is 3 nucleotides 5' in the NGG (between the lowercase residues above). gRNAs were selected based on scores obtained from various gRNA search engines including crispr.mit.edu, crispr.med.harvard.edu/sgRNAScorer/, and broadinstitute.org/rnai/public/analysis-tools/sgrna-design. Briefly, 100-150 bp of sequence immediately 5' and 3' of the ATG start and 100-150 bp immediately 5' and 3' of the stop codon, respectively, were analyzed for gRNAs on both DNA strands. Two gRNAs (each overlapping with each other by no more than 25%) near the ATG and two gRNAs near the stop codon with high scores from all used search engines were further queried for uniqueness in the mouse genome and no single nucleotide variations (SNVs) in the Universal Light Chain (ULC or common light chain), VELOCIMMUNE® mice containing a functional ectopic mouse Adam6 gene (VI-3-Adam6), and VELOCIGENE® mouse VGB6 embryonic stem cells (ESCs). If no high scoring guides were found using the above search specifications, additional sequence around the ATG and stop codons was searched until two high quality guides were found.

[000409] Анализы TAQMAN® были спроектированы с использованием PRIMER EXPRESS® с помощью APPLIED BIOSYSTEMS® Custom TAQMAN® MGB-зондов, так что последовательности зондов всегда перекрывали участки среза cas9 для каждого гида. Некоторые анализы TAQMAN® были также получены с использованием зондов Biosearch Technologies Dual Labeled BHQ® (biosearchtech.com/ProbelTy/design/inputsequences.aspx). Эти анализы служат анализом потери аллеля, если Cas9 разрезает последовательность, связанную с помощью гида. Все анализы были скринированы для SNV. Гиды были названы следующим образом: mGU и mGU2 (вверх по ходу транскрипции для мышиного геномного); и mGD и mGD2 (вниз по ходу транскрипции для мышиного геномного). Анализы TAQMAN® были названы следующим образом: mTGU и mTGU2 (для анализов TAQMAN®, охватывающих mGU и mGU2 соответственно) и mTGD и mTGD2 (для анализов TAQMAN®, охватывающих mGD и mGD2 соответственно). Дополнительный анализ TAQMAN® был спроектирован примерно на равном расстоянии от гидов mGU/mGU2 и mGD/mGD2 в середине локуса, который был разрушен, называемый mTM (для мышиного TAQMAN® Middle). Этот анализ потери аллеля определяет, происходит ли делеция участка, фланкированного с помощью гида (разрушения).[000409] TAQMAN® assays were designed using PRIMER EXPRESS® with APPLIED BIOSYSTEMS® Custom TAQMAN® MGB probes such that the probe sequences always overlapped the Cas9 cut sites for each guide. Some TAQMAN® assays were also generated using Biosearch Technologies Dual Labeled BHQ® probes (biosearchtech.com/ProbelTy/design/inputsequences.aspx). These assays serve as an allele loss assay if Cas9 cuts the sequence bound by the guide. All assays were screened for SNVs. The guides were named as follows: mGU and mGU2 (upstream for mouse genomic); and mGD and mGD2 (downstream for mouse genomic). The TAQMAN® assays were named as follows: mTGU and mTGU2 (for TAQMAN® assays spanning mGU and mGU2, respectively) and mTGD and mTGD2 (for TAQMAN® assays spanning mGD and mGD2, respectively). An additional TAQMAN® assay was designed approximately equidistant from the mGU/mGU2 and mGD/mGD2 guides in the middle of the locus that was disrupted, called mTM (for mouse TAQMAN® Middle). This allele loss assay determines whether a deletion of the region flanked by the guide (disruption) occurs.

[000410] Дальнейшие анализы TAQMAN® были спроектированы на 200-800 п.о. вверх по ходу транскрипции mGU/mGU2 (в зависимости от того, что больше всего 5') и вниз по ходу транскрипции mGD/mGD2 (в зависимости от того, что больше всего 3'). Эти анализы назывались retU (для удерживания вверх по ходу транскрипции) и retD (для удерживания вниз по ходу транскрипции) соответственно. Эти анализы определяют наибольший допустимый размер делеции и были проведены для скрининга на SNV, как указано выше.[000410] Further TAQMAN® assays were designed 200-800 bp upstream of mGU/mGU2 (whichever was largest 5') and downstream of mGD/mGD2 (whichever was largest 3'). These assays were called retU (for upstream retention) and retD (for downstream retention), respectively. These assays determine the largest allowable deletion size and were performed to screen for SNVs as described above.

[000411] Клонирование направляющей РНК: Дуплексы направляющей РНК были спроектированы и синтезированы. Поскольку промотор U6 предпочитает начинать с гуанина, гуанин добавляли к 5', если последовательность уже не начиналась с гуанина. Лиофилизированные дуплексы гРНК ресуспендировали до 100 мкМ со стерильной водой, и в микроцентрифужной пробирке 0,5 мл проводили следующую реакцию лигирования: 14,5 мкл воды, сертифицированной для ПЦР; 2 мкл 10Х Т4 ДНК-лигазный буфер (NEB), 1 мкл pMB_огРНК_BsmBI Вектор (~ 60 нг), 1 мкл гРНК-дуплекса (100 мкМ) и 1,5 мкл ДНК-лигазы Т4 (40 ед/мкл, NEB). Реакцию лигирования затем инкубировали в течение 1 часа при комнатной температуре и затем использовали в реакции трансформации в клетках ТОР 10. Колонии затем отбирали и проверяли с помощью ПЦР и сиквенирования.[000411] Guide RNA cloning: Guide RNA duplexes were designed and synthesized. Since the U6 promoter prefers to start with guanine, guanine was added at 5' unless the sequence already started with guanine. Lyophilized gRNA duplexes were resuspended to 100 µM with sterile water and the following ligation reaction was performed in a 0.5 ml microcentrifuge tube: 14.5 µl PCR-grade water; 2 µl 10X T4 DNA Ligase Buffer (NEB), 1 µl pMB_gRNA_BsmBI Vector (~60 ng), 1 µl gRNA duplex (100 µM), and 1.5 µl T4 DNA Ligase (40 U/µl, NEB). The ligation reaction was then incubated for 1 hour at room temperature and then used in a transformation reaction in TOP 10 cells. Colonies were then selected and verified by PCR and sequencing.

[000412] Протокол электропорации ВТХ®: Направляющую смесь готовили следующим образом: 10 мкг каждой плазмиды огРНК и 5 мкг плазмиды дикого типа Cas9. В день электропорации клетки питали ЭС-средой за полчаса до часа до процесса электропорации. Клетки затем дважды промывали PBS и добавляли 0,25% трипсин-ЭДТА и клетки инкубировали при 37°С в течение 15 минут. Планшет(ы) удаляли после инкубации, добавляли ЭС-среду для нейтрализации трипсина, клетки осторожно пипетировали 4 раза, чтобы разбить клеточные агрегаты, и переносили на желатинированный планшет(ы), и клетки инкубировали в течение 20 минут при 37°С. Планшет(ы) встряхивали и осторожно промывали один раз средой, и все клетки затем переносили в 15-мл пробирки, которые затем вращали в течение 5 минут при 1200 об/мин. Все осадки объединяли в 10 мл PBS и клетки подсчитывали и при необходимости разбавляли. Объем 20 мкл клеточной суспензии добавляли к стеклу CELLOMETER® и подсчитывали с использованием счетчика жизнеспособности клеток Nexcelom CELLOMETER AUTO Т4™. Затем пробирки центрифугировали в течение 5 минут при 1200 об/мин. Осадок ресуспендировали в буфере для электропорации, используя 7,5×106 клеток для каждой электропорации. Клетки добавляли к направляющей смеси в микроцентрифужных пробирках с объемом в каждой пробирке 120 мкл. Пробирки перемешивали 2-3 раза и переносили в 96-луночный кювет для электропорации (зазор 2 мм) с использованием насадок с широкими отверстиями, и кювету герметизировали. Электрический импульс подавался при 700 В, 400 Ом, 25 мкФ с использованием электропоратора ВТХ® ЕСМ® 630. Затем кювету инкубировали на льду в течение 10 минут.Электропорированные клетки затем переносили в планшет с глубокой лункой (добавляли 0,8 мл/лунка, в то время как кювета находилась на льду). Клетки высевали на 2×15 см желатинизированные планшеты/проект с 25 мл среды в каждом планшете. Переходный отбор начинался с 1 мкг/мл пиромицина в течение 3 дней и среду заменяли на неселективную среду до 10 дней после электропорации, после чего колонии собирали.[000412] BTX® Electroporation Protocol: The targeting mixture was prepared as follows: 10 μg of each sigRNA plasmid and 5 μg of wild-type Cas9 plasmid. On the day of electroporation, the cells were fed with ES medium for half an hour to an hour prior to the electroporation process. The cells were then washed twice with PBS and 0.25% trypsin-EDTA was added and the cells were incubated at 37°C for 15 minutes. The plate(s) were removed after incubation, ES medium was added to neutralize trypsin, the cells were gently pipetted 4 times to break up cell aggregates and transferred to gelatinized plate(s) and the cells were incubated for 20 minutes at 37°C. The plate(s) were vortexed and gently washed once with medium and all cells were then transferred to 15 ml tubes which were then spun for 5 min at 1200 rpm. All pellets were combined in 10 ml PBS and cells were counted and diluted if necessary. A volume of 20 µl of the cell suspension was added to the CELLOMETER® glass and counted using a Nexcelom CELLOMETER AUTO T4™ cell viability counter. The tubes were then centrifuged for 5 min at 1200 rpm. The pellet was resuspended in electroporation buffer using 7.5 x 10 6 cells for each electroporation. Cells were added to the feed mix in microcentrifuge tubes with a volume of 120 µl in each tube. The tubes were mixed 2-3 times and transferred to a 96-well electroporation cuvette (2 mm gap) using wide bore tips and the cuvette was sealed. The electrical pulse was applied at 700 V, 400 Ω, 25 μF using a BTX® ECM® 630 Electroporator. The cuvette was then incubated on ice for 10 min. Electroporated cells were then transferred to a deep well plate (0.8 ml/well was added while the cuvette was on ice). Cells were seeded on 2 x 15 cm gelatinized plates/project with 25 ml of medium in each plate. Transitional selection was initiated with 1 μg/ml pyromycin for 3 days and the medium was replaced with non-selective medium until 10 days after electroporation, after which colonies were harvested.

[000413] Протокол электропорации NUCLEOFECTOR®: В день электропорации клетки питали ЭС-средой за полчаса до часа до процесса электропорации. Клетки затем дважды промывали 10 мл PBS и добавляли 2 мл 0,25% трипсин-ЭДТА и клетки инкубировали при 37°С в течение 15 минут. Планшет(ы) удаляли после инкубации, добавляли 8 мл ЭС-среды для нейтрализации трипсина, клетки осторожно пипетировали 4 раза, чтобы разбить клеточные агрегаты, и переносили на желатинированный планшет(ы), и клетки инкубировали в течение 20 минут при 37°С. Планшет(ы) встряхивали и осторожно промывали один раз средой, и все клетки затем переносили в 15-мл пробирки, которые затем вращали в течение 3 минут при 90 X g. Осадки ресуспендировали в 10 мл PBS и клетки подсчитывали и при необходимости разбавляли. Объем 20 мкл клеточной суспензии добавляли к стеклу CELLOMETER® и подсчитывали с использованием системы Nexcelom Vision СВА. В общей сложности 2×106 клеток были разделены на аликвоты и центрифугированы в пробирках EPPENDORF® в течение 3 минут при 90×g. Затем осадок ресуспендировали в буфере LONZA® Р4, смешанном с 5 мкг плазмиды Cas9 дикого типа и 2,5 мкг каждой плазмиды огРНК в общем объеме 100 мкл. Затем клетки переносили в большую кювету LONZA®. Электрический импульс подавался с использованием LONZA® 4D-NUCLEOFECTOR™ и программы CP-105. Добавляли объем 400 мкл свежей среды ЭС, и клетки переносили в новую пробирку EPPENDORF® для перемешивания. Затем клетки высевали на желатинизированные чашки размером 2×10 см с 10 мл среды ЭС. Переходный отбор начинали через 2 дня пост-ЕР с пиромицином (1,5 мкг/мл) в течение 2 дней. После отбора использовалась неселективная среда до 10 дней после электропорации, после чего отбирались колонии.[000413] NUCLEOFECTOR® Electroporation Protocol: On the day of electroporation, cells were fed with ES medium for one half hour to one hour prior to the electroporation process. Cells were then washed twice with 10 ml PBS and 2 ml 0.25% trypsin-EDTA was added and cells were incubated at 37°C for 15 minutes. The plate(s) were removed after incubation, 8 ml ES medium was added to neutralize trypsin, cells were gently pipetted 4 times to break up cell aggregates and transferred to gelatinized plate(s) and cells were incubated for 20 minutes at 37°C. The plate(s) were vortexed and gently washed once with medium and all cells were then transferred to 15 ml tubes which were then spun for 3 minutes at 90 X g. The pellets were resuspended in 10 ml PBS and the cells were counted and diluted if necessary. A volume of 20 µl of the cell suspension was added to a glass CELLOMETER® and counted using the Nexcelom Vision CBA system. A total of 2 x 10 6 cells were aliquoted and centrifuged in EPPENDORF® tubes for 3 min at 90 x g. The pellet was then resuspended in LONZA® buffer P4 mixed with 5 µg of wild-type Cas9 plasmid and 2.5 µg of each sgRNA plasmid in a total volume of 100 µl. The cells were then transferred to a large LONZA® cuvette. The electrical pulse was applied using the LONZA® 4D-NUCLEOFECTOR™ and the CP-105 program. A volume of 400 µl fresh ES medium was added and the cells were transferred to a new EPPENDORF® tube for mixing. The cells were then plated on 2 x 10 cm gelatinized dishes with 10 ml ES medium. Transitional selection was started 2 days post-EP with pyromycin (1.5 µg/ml) for 2 days. After selection, non-selective medium was used until 10 days post-electroporation, after which colonies were picked.

[000414] Скрининг: Разрезание с помощью Cas9 с помощью направляющих mGU, mGU2, mGD и mGD2 оценивали с использованием анализов TAQMAN® mTGU, mTGU2, mTGD и mTGD2. Разрезание по одному аллелю, но не по-другому, определяли, когда количество копий уменьшилось с двух (родительская не модифицированная контрольная ДНК) до одной. Гомозиготное расщепление по Cas9 определяли, когда анализы давали число копий ноль. Поскольку разрезание Cas9 рядом с ATG и стоп-кодоном не гарантирует удаления промежуточной последовательности, гетерозиготное и гомозиготное разрушение оценивали, когда числа анализов mTM переходили от двух (родительских) к одному или нулю соответственно. Наконец, внешний лимит размера делеций был установлен с использованием анализов retU и retD. Анализы удерживания должны были остаться интактными (удержанными) с копией номер два, как родительскими.[000414] Screening: Cas9 cleavage of the mGU, mGU2, mGD, and mGD2 guides was assessed using the TAQMAN® mTGU, mTGU2, mTGD, and mTGD2 assays. Cleavage at one allele, but not the other, was defined when the copy number was reduced from two (parental unmodified control DNA) to one. Homozygous Cas9 cleavage was defined when the assays yielded a copy number of zero. Because Cas9 cleavage near the ATG and stop codon does not guarantee removal of the intervening sequence, heterozygous and homozygous disruption were assessed when the mTM assay numbers went from two (parental) to one or zero, respectively. Finally, an external limit on the size of the deletions was established using the retU and retD assays. Retention assays were required to remain intact (retained) with copy number two as the parent.

[000415] Клоны ЭСК, полученные после электропорации с mGU, mGU2, mGD и mGD2 или какой-либо их комбинацией, сначала подвергали скринингу на расщепление Cas9 и/или разрушение с использованием анализов mTGU, mTGU2, mTM, mTGD и mTGD2 или какой-либо их комбинации. Колонии с нулевымчислом копий для всеханализов затем подвергали дополнительному скринингу с использованием retU и retD, и только колонии с числом копий retU и retD, равным двум, были переданы для дальнейшего анализа.[000415] ESC clones obtained after electroporation with mGU, mGU2, mGD, and mGD2, or any combination thereof, were first screened for Cas9 cleavage and/or disruption using the mTGU, mTGU2, mTM, mTGD, and mTGD2 assays, or any combination thereof. Colonies with zero copy numbers for all assays were then further screened using retU and retD, and only colonies with retU and retD copy numbers of two were passed on for further analysis.

[000416] Первичный и повторный скрининг эмбриональных стволовых клеток мыши:[000416] Primary and secondary screening of mouse embryonic stem cells:

Модифицированные колонии mESC подвергали скринингу на гомозиготную делецию локуса-мишени с помощью мультиплекса ПЦР TAQMAN® LOA (Loss-Of-Allele) (4-плексная). Для первого прохода скрининга (первичного), ДНК 176 уникальных клонов выделяли в колонках 1-11 двух 96-луночных планшетов. Колонка 12 была заполнена ДНК ЭС клеток дикого типа, которая была ранее выделена из той же родительской линии mESC и использовалась в качестве калибратора для числа копий; так что каждая ДНК-пластина для скрининга содержит 88 модифицированных клонов и 8 калибровочных клонов. ДНК каждого клона распределяли в четырех экземплярах на 384-луночный планшет и анализировали на гомозиготный LOA по трем участкам локуса-мишени в одной реакционной смеси, с помощью зондов TAQMAN® в FAM, VIC, ABY и Quasar, используемых для одновременного определения числа копий в относительных участках вверх, по средине и вниз по ходу транскрипции гена-мишени с Quasar, амплифицирующим Wnt-2b для калибровки по концентрации ДНК. После определения числа копий до восьми клонов «наилучшего» качества с нулевыми копиями всех трех анализов, охватывающих локус-мишень, были отобраны для последующего роста расширением, повторной посадки и подвергнуты анализу расширенного репертуара числа копий (подтверждение). Каждый размноженный клон высевали и выделяли ДНК в шести повторностях, занимая первые шесть колонок одного ряда (А-Н) 96-луночного планшета, предоставляя тем самым дополнительный генетический материал и повторы данных для дополнительных используемых анализов. Анализы, используемые при первичном скрининге, повторяли для подтверждения первичного генотипа, а анализы удерживания использовали для определения степени делеции. Анализы удерживания были расположены непосредственно вверх и вниз по ходу транскрипции от участка, на который нацелена делеция, и обычно равны двум копиям. Дополнительные анализы были использованы для подтверждения родительского генотипа ЭСК в Иммуноглобулин тяжелый (IgH) и каппа (Igκ) мышиных локусах (LOA для IgH и Igκ мыши, и GOA для гуманизации).Modified mESC colonies were screened for homozygous deletion of the target locus using the TAQMAN® LOA (Loss-Of-Allele) PCR multiplex (4-plex). For the first pass of screening (primary), DNA from 176 unique clones was isolated in columns 1–11 of two 96-well plates. Column 12 was filled with wild-type ES cell DNA that had been previously isolated from the same parental mESC line and was used as a copy number calibrator; thus, each DNA screening plate contained 88 modified clones and 8 calibrator clones. DNA from each clone was distributed in quadruplicate per 384-well plate and assayed for homozygous LOA across three regions of the target locus in a single reaction, with TAQMAN® probes in FAM, VIC, ABY, and Quasar used to simultaneously determine copy numbers at relative upstream, midstream, and downstream regions of the target gene with Quasar amplifying Wnt-2b to calibrate for DNA concentration. Following copy number determination, up to eight “best” quality clones with zero copies of all three assays covering the target locus were selected for further expansion growth, replating, and subjected to expanded copy number repertoire analysis (confirmation). Each expanded clone was plated and DNA isolated in six replicates, occupying the first six columns of one row (A-H) of a 96-well plate, thereby providing additional genetic material and replicate data for additional assays used. The assays used in the primary screen were repeated to confirm the primary genotype, and retention assays were used to determine the extent of the deletion. Retention assays were located immediately upstream and downstream of the region targeted by the deletion and were typically equal to two copies. Additional assays were used to confirm the parental genotype of the ESCs at the mouse immunoglobulin heavy (IgH) and kappa (Igκ) loci (LOA for mouse IgH and Igκ, and GOA for humanization).

[000417] Сиквенирование следующего поколения (NGS) для идентификации Cas9-опосредованных аллелей: Небольшую биопсию хвоста у F0 Cas9-модифицированных мышей, экстрагировали на геномную ДНК с использованием стандартных способов солевой преципитации. Для каждого локуса-мишени были разработаны ПЦР-праймеры со следующими ограничениями: (1) размер ампликона составляет между 280-380 п.о. в длину; (2) сайты расщепления гРНК центрированы в продукте ПЦРс праймерами на расстоянии по меньшей мере 35 п.о. для размещения более крупных вставок/делеций (инделей), (3) длина праймера составляет 22-25 п.о. с температурой плавления (Tm) между 62-65°С, с зажимом CG 2 п.о. на 3' конце; и (4) праймеры проверяются по геномным последовательностям на вариации мононуклеотида линии BALB/c, C57BL/6 или 129. Затем к локус-специфическим последовательностям добавляли специфические универсальные адаптерные последовательности, предоставленные Illumina®. Полученные ампликоны визуализировали на агарозных гелях и очищали/нормализовали с использованием набора для нормализации планшетов Thermo Fisher Scientific® SequalPrep™. Продукты количественно определяли с помощью Qubit ®, и 1 нг каждого продукта использовали в качестве матрицы для штрих-кодирования с помощью дополнительной ПЦРс праймерами Nextera® и ПР мастер-смесью Nextera®. ПЦР проводили в термоциклере при 72°С в течение 3 минут, 95°С в течение 30 секунд, 12 циклов {95°С в течение 10 секунд, 55°С в течение 30 секунд, 72°С в течение 30 секунд}, 72°С в течение 5 минут, и выдерживали 10°С. Полученные продукты ПЦР со штрих-кодом очищали с помощью шариков Ampure® ХР, нормализовали с помощью нормализующих шариков Illumina® в наборе Nextera® XT, объединяли и загружали в MiSeq™ для сиквенирования и сбора необработанных данных.[000417] Next-generation sequencing (NGS) to identify Cas9-mediated alleles: Small tail biopsies from F0 Cas9-modified mice were extracted for genomic DNA using standard salt precipitation methods. For each target locus, PCR primers were designed with the following constraints: (1) the amplicon size is between 280-380 bp in length; (2) gRNA cleavage sites are centered in the PCR product with primers spaced at least 35 bp apart to accommodate larger insertions/deletions (indels); (3) the primer length is 22-25 bp with a melting temperature (Tm) between 62-65°C, with a 2 bp CG clamp at the 3' end; and (4) primers were validated against genomic sequences for BALB/c, C57BL/6, or 129 mononucleotide variations. Locus-specific sequences were then supplemented with specific universal adapter sequences provided by Illumina®. The resulting amplicons were visualized on agarose gels and purified/normalized using the Thermo Fisher Scientific® SequalPrep™ Plate Normalization Kit. Products were quantified using Qubit®, and 1 ng of each product was used as template for barcoding using additional PCR with Nextera® primers and Nextera® PR Master Mix. PCR was performed in a thermal cycler at 72°C for 3 minutes, 95°C for 30 seconds, 12 cycles of {95°C for 10 seconds, 55°C for 30 seconds, 72°C for 30 seconds}, 72°C for 5 minutes, and a hold at 10°C. The resulting barcoded PCR products were purified with Ampure® XP beads, normalized with Illumina® Normalization Beads in the Nextera® XT Kit, pooled, and loaded into MiSeq™ for sequencing and raw data collection.

[000418] Микроинъекция эмбрионов мыши на 8-клеточной стадии: Приблизительно 2 мл стандартной среды для клеток ЭС (- LIF) добавляли в стерильную крышку для культуральной чашки диаметром 35 мм и покрывали отфильтрованным минеральным маслом. ЭС клетки высевали на нижнюю половину чашки с помощью ротовой пипетки. Криоконсервированные SW эмбрионы-хозяева на 8-клеточной стадии были депонированы к верхней части чашки. Чтобы свести к минимуму повреждение эмбриона во время инъекции, кончик новой инъекционной пипетки был притуплен путем легкого удара по удерживающей пипетке. ЭС-клетки выбирали на основе морфологии и яркости и собирали в инъекционную пипетку. Эмбрион был помещен на удерживающую пипетку так, чтобы пространство между бластомерами присутствовало в положении на 3 часа. ЭС клетки вводили в перивителлиновое пространство эмбриона с помощью осторожного прокалывания зоны в положении на 3 часа и осаждая клетки в этом месте. Всего 7-9 ЭС клеток на эмбрион было введено. Инъектированные эмбрионы помещали в 35-мм чашку, содержащую каплю культуральной среды для эмбрионов KSOM, покрытой отфильтрованным минеральным маслом, и эмбрионы культивировали в течение ночи при 37,0°С с 7,5% CO2. Эмбрионы были перенесены хирургическим путем в псевдобеременных самок на следующее утро.[000418] Microinjection of 8-cell stage mouse embryos: Approximately 2 ml of standard ES cell medium (-LIF) was added to a sterile 35 mm culture dish lid and covered with filtered mineral oil. ES cells were seeded on the lower half of the dish using a mouth pipette. Cryopreserved 8-cell stage SW host embryos were deposited at the top of the dish. To minimize damage to the embryo during injection, the tip of a new injection pipette was blunted by gently tapping the holding pipette. ES cells were selected based on morphology and brightness and collected in the injection pipette. The embryo was placed on the holding pipette such that the interblastomere space was present at the 3 o'clock position. ES cells were injected into the perivitelline space of the embryo by gently puncturing the 3 o'clock position and depositing the cells at this site. A total of 7-9 ES cells were injected per embryo. The injected embryos were placed in a 35 mm dish containing a drop of KSOM embryo culture medium coated with filtered mineral oil, and the embryos were cultured overnight at 37.0°C with 7.5% CO2 . Embryos were surgically transferred into pseudopregnant females the following morning.

Пример 2 Генерирование KO ЭС-клеток и мышей для продуцирования антител с использованием многих направляющих РНК, нацеленных на участок стартового кодона.Example 2 Generation of KO ES cells and mice for antibody production using multiple guide RNAs targeting the start codon region.

[000419] В другом эксперименте по получению мышей с пониженной толерантностью к представляющим интерес чужеродным антигенам-мишеням были сконструированы и клонированы три направляющие РНК для нацеливания аутоантигенов, ортологичных к этим чужеродным антигенам-мишеням для гомозиготной делеции. Три перекрывающиеся направляющие РНК были разработаны для нацеливания на перекрывающиеся участки, охватывающие старт кодон эндогенного гена, кодирующего аутоантиген (см. Фигуру 5). Направляющие РНК подвергали электропорации или нуклеофекции вместе с Cas9 в клетки ЭС, полученные от мышей с универсальной легкой цепью (ULC 1-39) (мышей, содержащих в своей зародышевой линии: (i) вставку в эндогенный локус вариабельного участка легкой цепи иммуноглобулина к мыши перестроенной последовательности Vκ/Jκ, содержащей: одну последовательность Vκ зародышевой линии человека; и одну последовательность Jκ зародышевой линии человека, причем перестроенная последовательность Vκ/Jκ функционально связана с эндогенным константным участком к мыши; и (ii) вставку в эндогенный локус вариабельного участка тяжелой цепи иммуноглобулина мыши из множества генных сегментов вариабельного участка тяжелой цепи иммуноглобулина человека, функционально связанных с константным участком эндогенной тяжелой цепи иммуноглобулина мыши). В некоторых экспериментах, Cas9 и три направляющие РНК были электропорированы вместе с большим направленным вектором (LTVEC), нацеленным на эндогенный ген, кодирующий аутоантиген для делеции (см., например, фигуру 5).[000419] In another experiment to generate mice with reduced tolerance to foreign target antigens of interest, three guide RNAs were designed and cloned to target self-antigens orthologous to these foreign target antigens for homozygous deletion. Three overlapping guide RNAs were designed to target overlapping regions encompassing the start codon of the endogenous gene encoding the self-antigen (see Figure 5). Guide RNAs were electroporated or nucleofected together with Cas9 into ES cells derived from universal light chain (ULC 1-39) mice (mice containing in their germline: (i) an insertion into the endogenous mouse κ immunoglobulin light chain variable region locus of a rearranged Vκ/Jκ sequence comprising: one human germline Vκ sequence; and one human germline Jκ sequence, wherein the rearranged Vκ/Jκ sequence is operably linked to an endogenous mouse κ constant region; and (ii) an insertion into the endogenous mouse immunoglobulin heavy chain variable region locus of multiple human immunoglobulin heavy chain variable region gene segments operably linked to an endogenous mouse immunoglobulin heavy chain constant region). In some experiments, Cas9 and three guide RNAs were electroporated together with a large targeting vector (LTVEC) targeting the endogenous gene encoding the self-antigen to be deleted (see, for example, Figure 5).

Использование LTVEC в сочетании с CRISPR/Cas9 (СС9) значительно увеличило шансы на получение биаллельной мутации в локусе-ллишени (см. Таблицу 8), но нацеливание с помощью LTVEC и CRISPR/Cas9 требует гораздо большего скрининга, чтобы исключить ложно-позитивные результаты.The use of LTVEC in combination with CRISPR/Cas9 (CC9) significantly increased the chances of obtaining a biallelic mutation at the target locus (see Table 8), but targeting with LTVEC and CRISPR/Cas9 requires much more screening to exclude false positives.

[000420][000420]

Пример 3 Иммунизация мышей и анализ сывороточных антител в ответ на иммуногены.Example 3 Immunization of mice and analysis of serum antibodies in response to immunogens.

ИммунизацияImmunization

[000421] Мыши VELOCIMMUNE®, содержащие функциональный эктопический ген Adam6 мыши (VI-3), мыши с универсальной легкой цепью (ULC 1-39) (мыши, содержащие в своей зародышевой линии: (i) вставку в эндогенный локус вариабельного участка легкой цепи иммуноглобулина к мыши перестроенной последовательности Vκ/Jκ, содержащей: одну последовательность Vκ зародышевой линии человека; и одну последовательность Jκ зародышевой линии человека, причем перестроенная последовательность Vκ/Jκ функционально связана с эндогенным константным участком к мыши; и (ii) вставку в эндогенный локус вариабельного участка тяжелой цепи иммуноглобулина мыши из множества генных сегментов вариабельного участка тяжелой цепи иммуноглобулина человека, функционально связанных с константным участком эндогенной тяжелой цепи иммуноглобулина мыши), KO (нокаут)/VI-3 мыши (мыши VI-3, у которых аутоантигены, ортологичные по отношению к чужеродным антигенам-мишеням, нокаутированы), и мыши KO/ULC 1-39 (мыши ULC 1-39, у которых аутоантигены, ортологичные по отношению к чужеродным антигенам-мишеням, нокаутированы) иммунизировали многочисленными транс-мембранами мишенями, с использованием различных иммуногенов, таких как белки. Преиммунную сыворотку собирали у мышей до начала иммунизации. Мышей бустировали различными путями с различными интервалами времени в общей сложности 3-6 бустов с использованием стандартных адъювантов. У мышей периодически брали кровь и анализировали титры антисыворотки на соответствующие антигены. В примере с мишенью 8 мышей иммунизировали рекомбинантным внеклеточнымдоменоммишени8 с Fc-меткой мыши через лапку. Титры были от 2-го взятия крови (после первичного +6 бустов для ULC 1-39) или от 3-го взятия крови (после первичного +3 бустов для ауто-антигена-8-KO/ULC 1-39).[000421] VELOCIMMUNE® mice comprising a functional ectopic mouse Adam6 gene (VI-3), universal light chain (ULC 1-39) mice (mice comprising in their germline: (i) an insertion into the endogenous mouse κ immunoglobulin light chain variable region locus of a rearranged Vκ/Jκ sequence comprising: one human germline Vκ sequence; and one human germline Jκ sequence, wherein the rearranged Vκ/Jκ sequence is operably linked to an endogenous mouse κ constant region; and (ii) an insertion into the endogenous mouse immunoglobulin heavy chain variable region locus of a plurality of human immunoglobulin heavy chain variable region gene segments operably linked to an endogenous mouse immunoglobulin heavy chain constant region), KO (knockout)/VI-3 mice (VI-3 mice in which (self-antigens orthologous to foreign target antigens are knocked out) and KO/ULC 1-39 mice (ULC 1-39 mice in which self-antigens orthologous to foreign target antigens are knocked out) were immunized with multiple transmembrane targets using different immunogens such as proteins. Preimmune sera were collected from mice prior to immunization. Mice were boosted by different routes at different time intervals for a total of 3-6 boosts using standard adjuvants. Mice were bled periodically and antiserum titers to the respective antigens were analyzed. In the target 8 example, mice were immunized with recombinant Fc-tagged mouse target 8 extracellular domain via the foot. Titers were from the 2nd blood draw (after the primary +6 boosts for ULC 1-39) or from the 3rd blood draw (after the primary +3 boosts for auto-antigen-8-KO/ULC 1-39).

Определение антисывороточных титровDetermination of antiserum titers

[000422] Титры антител в сыворотке против соответствующих иммуногенов определяли с помощью ИФА. Девяносто шести-луночные планшеты для микротитрования (Thermo Scientific®) покрывали соответствующими антигенами-мишенями в натрий-фосфатном буфере (PBS, Irvine Scientific ®) в течение ночи при 2 мкг/мл. Планшеты промывали натрий-фосфатным буфером, содержащим 0,05% Твин 20 (PBS-T, Sigma-Aldrich®), и блокировали 250 мкл 0,5% бычьим сывороточным альбумином (BSA, Sigma-Aldrich®) в PBS в течение 1 часа при комнатной температуре. Планшеты промывали PBS-T. Преиммунные и иммунные антисыворотки серийно разводили в три раза в 0,5% BSA-PBS и добавляли в планшеты в течение 1 часа при комнатной температуре. Планшеты промывали и к планшетам добавляли козью антимышиную IgG-Fc-конскую пероксидазу (HRP) конъюгированную с вторичным антителом (Jackson ImmunoResearch) и инкубировали в течение 1 часа при комнатной температуре. Планшеты промывали и проявляли, используя ТМВ/H2O2 в качестве субстрата, путем инкубации в течение 20 минут. Реакцию останавливали кислотой и планшеты считывали на спектрофотометре (Victor®, PerkinElmer®) при 450 нм. Титры антител рассчитывали с использованием программного обеспечения Graphpad PRISM®. В примере с мишенью 8 использованный титровый антиген представлял собой рекомбинантный внеклеточный домен мишени 8 человека с метками Myc-Myc-His.[000422] Serum antibody titers against the respective immunogens were determined by ELISA. Ninety-six-well microtiter plates (Thermo Scientific®) were coated with the respective target antigens in phosphate buffered saline (PBS, Irvine Scientific®) overnight at 2 μg/mL. The plates were washed with phosphate buffered saline containing 0.05% Tween 20 (PBS-T, Sigma-Aldrich®) and blocked with 250 μL of 0.5% bovine serum albumin (BSA, Sigma-Aldrich®) in PBS for 1 hour at room temperature. The plates were washed with PBS-T. Preimmune and immune antisera were serially diluted three-fold in 0.5% BSA-PBS and added to the plates for 1 hour at room temperature. The plates were washed and goat anti-mouse IgG-Fc-horse peroxidase (HRP)-conjugated secondary antibody (Jackson ImmunoResearch) was added to the plates and incubated for 1 hour at room temperature. The plates were washed and developed using TMB/ H2O2 as a substrate by incubation for 20 minutes. The reaction was stopped with acid and the plates were read on a spectrophotometer (Victor®, PerkinElmer®) at 450 nm. Antibody titers were calculated using Graphpad PRISM® software. In the target 8 example, the titer antigen used was a recombinant extracellular domain of human target 8 with Myc-Myc-His tags.

РезультатыResults

[000423] Гуморальные иммунные ответы у мышей VI-3, ULC1-39, KO/VI-3 и KO/ULC 1-39 были исследованы путем иммунизации различными трансмембранными мишенями. Высокие титры антител были выявлены в линиях KO/VI-3 и KO/ULC 1-39 для всех иммунизированных мишеней. Титры также были высокими у мышей линий VI-3 и ULC 1-39. В целом, однако, линии KO, по-видимому, имели более высокий титр ответа. Полученный иммунный ответ представлен в таблице 9 в виде титров антител, определяемых как обратная величина от самого высокого разведения сыворотки, при котором абсорбция связывания антигена в два раза выше по сравнению с фоном. Следовательно, чем выше число, тем больше гуморальный иммунный ответ на иммуноген. В общей сложности более 16 мишеней были успешно иммунизированы в линиях KO. Моноклональные антитела были выделены с помощью платформ BST и гибридом для мишеней 1 и 9 и с помощью BST для мишеней 4 и 5, и дальнейшая характеристика этих антител продолжается. Данные по выработке антител против одного представляющего интерес человеческого антигена-мишени (мишень 8; ортологичны аутоантигену 8 мыши, выше) у мышей ULC 1-39 и аутоантиген-8-KO/ULC 1-39 представлены в таблице 9 и на фигуре 6. F0 KO мыши давали приблизительно в 5 раз более высокий ответ на заражение белком, чем мыши дикого типа ULC 1-39, на что указывает средний титр антител к мишени. В Таблице 9 также представлено число антител, которые специфически связываются с антигеном (при поглощении, вдвое превышающем поглощение фона). Подобные результаты показаны у мышей ауто-антиген-9-KO/VI-3 по сравнению с мышами VI-3. См. фигуры 30А и 30 В. В этом эксперименте мышей дикого типа VI-3-Adam6 и мышей ауто-антиген-9-KO/VI-3-Adam6 иммунизировали либо ДНК, кодирующей мишень 9 дикого типа, интрадермальным путем. Титры определяли с использованием клеток, сконструированных для экспрессии мишени 9 или родительских клеток VI-3T3. Тогда как титры антител у мышей VI-3-Adam6 были не лучше контрольных, титры антител у мышей ауто-антиген-9-KO/VI-3-Adam6 были значительно повышены. Это показывает, что линии KO/VI-3 и KO/ULC вызывают устойчивые иммунные ответы.[000423] Humoral immune responses in VI-3, ULC1-39, KO/VI-3, and KO/ULC 1-39 mice were examined by immunization with various transmembrane targets. High antibody titers were elicited in the KO/VI-3 and KO/ULC 1-39 strains for all targets immunized. Titers were also high in VI-3 and ULC 1-39 mice. In general, however, the KO strains appeared to have a higher titer response. The resulting immune response is presented in Table 9 as antibody titers, defined as the reciprocal of the highest serum dilution at which antigen-binding absorbance was two-fold higher than background. Therefore, the higher the number, the greater the humoral immune response to the immunogen. A total of more than 16 targets were successfully immunized in the KO strains. Monoclonal antibodies were isolated by BST and hybridoma platforms for targets 1 and 9 and by BST for targets 4 and 5, and further characterization of these antibodies is ongoing. Data on the production of antibodies against one human target antigen of interest (target 8; orthologous to mouse autoantigen 8, above) in ULC 1-39 and autoantigen-8-KO/ULC 1-39 mice are presented in Table 9 and Figure 6. F0 KO mice responded approximately 5-fold to the protein challenge than wild-type ULC 1-39 mice, as indicated by the mean antibody titer to the target. Table 9 also presents the number of antibodies that specifically bound the antigen (at an absorbance twice that of background). Similar results were seen in autoantigen-9-KO/VI-3 mice compared to VI-3 mice. See Figures 30A and 30B. In this experiment, wild-type VI-3-Adam6 mice and autoantigen-9-KO/VI-3-Adam6 mice were immunized with either DNA encoding wild-type target 9 by the intradermal route. Titers were determined using cells engineered to express target 9 or parental VI-3T3 cells. While antibody titers in VI-3-Adam6 mice were no better than controls, antibody titers in autoantigen-9-KO/VI-3-Adam6 mice were significantly increased. This demonstrates that the KO/VI-3 and KO/ULC lines elicit robust immune responses.

[000424][000424]

Пример 4 Иммунизация мышей и анализ разнообразия антител и использование V генных сегментов.Example 4 Immunization of mice and analysis of antibody diversity using V gene segments.

[000425] Мышей VELOCIMMUNE®, содержащих функциональный эктопический ген Adam6 мыши (VI-3) и мышей ауто-антиген-3-KO (нокаут)/VI-3, иммунизировали мишенью 3. Преиммунную сыворотку собирали у мышей до начала иммунизации. Мышей бустировали различными путями с различными интервалами времени в общей сложности 3-6 бустов с использованием стандартных адъювантов. У мышей периодически брали кровь и анализировали титры антисыворотки на соответствующие антигены.[000425] VELOCIMMUNE® mice containing a functional ectopic mouse Adam6 gene (VI-3) and autoantigen-3-KO (knockout)/VI-3 mice were immunized with target 3. Preimmune serum was collected from the mice prior to immunization. Mice were boosted by various routes at various time intervals for a total of 3-6 boosts using standard adjuvants. Mice were bled periodically and antiserum titers to the respective antigens were analyzed.

[000426] В-клетки выделяли из селезенки мышей VI-3 дикого типа и мышей ауто-антиген-3-KO VI-3, и антитела сиквенировали для определения использования V-гена. ДНК, кодирующая домены VH и VL, была выделена непосредственно из одиночных антиген-позитивных В-клеток и сиквенирована. См., например, US 7582298, включенную в данном документе в качестве ссылки в полном объеме для всех целей. Данные об использовании гена V для мышей VI-3 дикого типа представлены в таблице 10, а данные об использовании гена V для мышей ауто-антиген-3-KO VI-3 представлены в таблице 11. Как показано в таблицах 10 и 11, у мышей ауто-антиген-3-KO VI-3 наблюдалось большее разнообразие в использовании как V генных сегментов тяжелой цепи, так и V генных сегментов легкой цепи по сравнению с мышами дикого типа VI-3. Например, только 4 V генных сегмента тяжелой цепи и 6 V генных сегментов легкой цепи были использованы для антител у мышей VI-3 дикого типа, и 79% антител использовали V генные сегменты IgH V4-59 и Igκ V1-12. Напротив, 6 V генных сегмента тяжелой цепи и 10 V генных сегментов легкой цепи были использованы для антител у мышей ауто-антиген-3-KO VI-3, с наиболее распространенной комбинацией использования (IgH V3-23 и Igκ V4-1) составляет только 42% антител.[000426] B cells were isolated from the spleens of wild-type VI-3 mice and autoantigen-3-KO VI-3 mice, and antibodies were sequenced to determine V gene usage. DNA encoding the VH and VL domains was isolated directly from single antigen-positive B cells and sequenced. See, for example, U.S. Patent No. 7,582,298, incorporated herein by reference in its entirety for all purposes. V gene usage data for wild-type VI-3 mice are presented in Table 10, and V gene usage data for autoantigen-3-KO VI-3 mice are presented in Table 11. As shown in Tables 10 and 11, autoantigen-3-KO VI-3 mice had greater diversity in the usage of both the heavy chain V gene segments and the light chain V gene segments compared to wild-type VI-3 mice. For example, only 4 heavy chain V gene segments and 6 light chain V gene segments were used for antibodies in wild-type VI-3 mice, and 79% of antibodies used the IgH V4-59 and Igκ V1-12 V gene segments. In contrast, 6 heavy chain V gene segments and 10 light chain V gene segments were used for antibodies in autoantigen-3-KO VI-3 mice, with the most common combination of usage (IgH V3-23 and Igκ V4-1) accounting for only 42% of antibodies.

[000427][000427]

[000428][000428]

[000429] Кроме того, у мышей ауто-антиген-3-KO VI-3 продуцировались антитела с перекрестной реактивностью к ауто-антигену 3 мыши (т.е. антитела, которые связывают как мишень 3 человека, так и аутоантиген 3 мыши) (см., например, Таблицу 12). Сходные результаты были получены с аутоантигеном 4 и мишенью 4 человека у мышей VI-3 и ULC 1-39. См. фигуры 31А и 31В. В этом эксперименте мышей ауто-антиген-4-KO/VI-3-Adam6 и ауто-антиген-4-KO/ULC 1-39 иммунизировали His-меченным белком мишени 4 человека и/или His-меченным белком аутоантигена 4 мыши (His-меченным) с использованием пути введения в лапки. Титры определяли с использованием His-меченой мишени 4 человека, His-меченого ауто-антигена 4 мыши или His-меченого Fel d 1 (контроль) в качестве антигена для покрытия.[000429] In addition, autoantigen-3-KO VI-3 mice produced antibodies that were cross-reactive to mouse autoantigen 3 (i.e., antibodies that bind both human target 3 and mouse autoantigen 3) (see, e.g., Table 12). Similar results were obtained with autoantigen 4 and human target 4 in VI-3 and ULC 1-39 mice. See Figures 31A and 31B. In this experiment, autoantigen-4-KO/VI-3-Adam6 and autoantigen-4-KO/ULC 1-39 mice were immunized with His-tagged human target 4 protein and/or His-tagged mouse autoantigen 4 protein (His-tagged) using the paw route. Titers were determined using His-tagged human target 4, His-tagged mouse autoantigen 4, or His-tagged Fel d 1 (control) as the coating antigen.

[000430] Способность генерировать антитела против эпитопов, которые делятся между аутоантигеном 3 мыши и мишенью 3 (или делятся между аутоантигеном 4 мыши и мишенью 4 человека), выгодна тем, что расширяет пул антител: антитела без перекрестной реактивности к аутоантигену 3 мыши были получены у мышей дикого типа VI-3. Кроме того, фармакокинетические свойства перекрестно реагирующих антител можно легче тестировать in vivo из-за их перекрестной реактивности с эндогенными аутоантигенами у мышей дикого типа. Следовательно, мыши, генетически сконструированные для экспрессии антигенов-мишеней (например, антигенов-мишеней человека) таких перекрестно реагирующих антител, могут не нуждаться в генерировании.[000430] The ability to generate antibodies against epitopes that share between mouse autoantigen 3 and target 3 (or share between mouse autoantigen 4 and human target 4) is advantageous in that it expands the antibody pool: antibodies without cross-reactivity to mouse autoantigen 3 have been generated in wild-type VI-3 mice. In addition, the pharmacokinetic properties of cross-reactive antibodies can be more easily tested in vivo due to their cross-reactivity with endogenous autoantigens in wild-type mice. Consequently, mice genetically engineered to express target antigens (e.g., human target antigens) may not require the generation of such cross-reactive antibodies.

[000431][000431]

Пример 5 CRISPR/Cas9-опосредованное нацеливание с использованием одной направляющей РНК или двух направляющих РНК.Example 5 CRISPR/Cas9-mediated targeting using one guide RNA or two guide RNAs.

Материалы и методыMaterials and methods

ЭС клеточная культура, скрининг и электропорацииES cell culture, screening and electroporation

[000432] Описанные в данном документе эксперименты были выполнены с VGF1, нашей гибридной XY ЭС-клеточной линией C57BL6NTac/129S6SvEvF1 (Poueymirou et al. (2007) Nat. Biotechnol. 25:91-99; Valenzuela et al. (2003) Nat. Biotechnol. 21:652-659). ЭС клетки культивировали, как описано ранее (Matise et al. (2000) in Joyner, A.L ed. Gene Targeting: a practical approach, pp.100-132, Oxford University Press, Нью-Йорк). Клетки VGF1 были созданы путем скрещивания самки мыши C57BL/6NTac с самцом мыши 129S6/SvEvTac для получения мышей C57BL6(XB6)/129S6(Y129). См. Фигуру 7.[000432] The experiments described herein were performed with VGF1, our XY hybrid ES cell line C57BL6NTac/129S6SvEvF1 (Poueymirou et al. (2007) Nat. Biotechnol. 25:91-99; Valenzuela et al. (2003) Nat. Biotechnol. 21:652-659). ES cells were cultured as described previously (Matise et al. (2000) in Joyner, AL ed. Gene Targeting: a practical approach, pp.100-132, Oxford University Press, New York). VGF1 cells were generated by crossing a female C57BL/6NTac mouse with a male 129S6/SvEvTac mouse to produce C57BL6(X B6 )/129S6(Y 129 ) mice. See Figure 7.

[000433] Электропорацию (ЕР) проводили с 7,5 миллионами клеток в кювете с 2-мм зазором в конечном объеме 0,12 мл. Электрические условия для ЕР составляли 700 В, сопротивление 400 Ом и емкость 25 мкФ с использованием системы электропорации ВТХ ЕСМ 630 (Harvard Apparatus, Холлистон, Массачусетс). Количество LTVEC на ЕР составило 0,0015 мг, плазмиды, экспрессирующей Cas9, было 0,005 мг, а плазмиды, экспрессирующей огРНК, было 0,010 мг. Некоторые ЕР выполняли с добавлением 100 нг плазмиды, обеспечивающей устойчивость к пиромицину, чтобы обеспечить отбор клонов без отбора на устойчивость к неомицину, экспрессируемую с помощью LTVEC. После ЕР клетки высевали на две 15 см желатинизированные чашки и среду меняли ежедневно. Отбор сред, содержащих либо 100 мкг/мл сульфата G-418, либо 0,0015 мг/мл пиромицина, начинался через 48 часов после ЕР и продолжался до 10 дней после ЕР. Колонии отбирали в PBS и добавляли в 96-луночный планшет, содержащий 0,05% трипсина, и позволяли диссоциировать в течение 15 минут, нейтрализовали средой и использовали для выделения ДНК для скрининга.[000433] Electroporation (EP) was performed with 7.5 million cells in a 2-mm gap cuvette in a final volume of 0.12 mL. Electrical conditions for EP were 700 V, 400 Ω, and 25 μF using a BTX ECM 630 Electroporation System (Harvard Apparatus, Holliston, MA). The amount of LTVEC per EP was 0.0015 mg, Cas9 expression plasmid was 0.005 mg, and sgRNA expression plasmid was 0.010 mg. Some EPs were performed with the addition of 100 ng of neomycin resistance plasmid to allow for selection of clones without selection for neomycin resistance expressed by LTVEC. After EP, cells were plated onto two 15 cm gelatinized dishes and the medium was changed daily. Selection of media containing either 100 μg/ml G-418 sulfate or 0.0015 mg/ml pyromycin was initiated 48 h after EP and continued until 10 days after EP. Colonies were picked in PBS and added to a 96-well plate containing 0.05% trypsin and allowed to dissociate for 15 min, neutralized with medium, and used to extract DNA for screening.

[000434] Способ модификации аллеля (Frendewey et al. (2010) Methods Enzymol. 476:295-307) использовали для идентификации правильно нацеленных клонов ЭС-клеток и для определения генотипов аллелей мыши.[000434] The allele modification method (Frendewey et al. (2010) Methods Enzymol. 476:295-307) was used to identify correctly targeted ES cell clones and to determine the genotypes of mouse alleles.

Дизайн направляющей последовательностиDesign of the guide sequence

[000435] Приблизительно 200 п.о. ДНК, окружающей положение 50 п.о., 100 п.о., 500 п.о. или 1 т.п.о. внутри удаленного участка Lrp5 или других целевых генов как вверх, так и вниз по ходу транскрипции, было введено в инструмент проектирования CRISPR (crispr.mit.edu) чтобы получить возможные последовательности гРНК. Потенциальные последовательности гРНК затем фильтровали, чтобы гарантировать, что они позволят только разрезать эндогенную ДНК, а не вставку гуманизации в LTVEC.[000435] Approximately 200 bp of DNA surrounding the 50 bp, 100 bp, 500 bp, or 1 kb position within the deleted region of Lrp5 or other target genes both upstream and downstream were entered into the CRISPR design tool (crispr.mit.edu) to obtain candidate gRNA sequences. Potential gRNA sequences were then filtered to ensure that they would only allow the cut of endogenous DNA and not the humanization insertion into LTVEC.

Клонирование одной направляющей РНКCloning of a single guide RNA

[000436] огРНК были либо клонированы в виде дуплексных олигонуклеотидов (IDT) в рМВ_огРНК (промотор U6) в сайтах Bsmbl, слитых с каркасом размером 77 п.о. для бесшовной экспрессии РНК, либо приобретены в качестве валидированных плазмид экспрессии из GeneCopoeia (LRP5 гиды А, В, В2, Е2, Е и F). Плазмиды собственного производства были подтверждены с помощью ПЦР и сиквенирования по Сенгеру.[000436] ogRNAs were either cloned as duplex oligonucleotides (IDT) into pMB_ogRNA (U6 promoter) at the Bsmbl sites fused to a 77 bp framework for seamless RNA expression or purchased as validated expression plasmids from GeneCopoeia (LRP5 guides A, B, B2, E2, E, and F). In-house produced plasmids were confirmed by PCR and Sanger sequencing.

Матрицы ДНИ для подтверждения генотипаDNI matrices for genotype confirmation

[000437] ДНК очищали из ЭС-клеток, клонов, полученных из ЭС-клеток, которые были подвергнуты электропорации с направленным вектором, и плазмидой, экспрессирующей Cas9, и плазмидой, экспрессирующей одну из нескольких направляющих РНК (гРНК) или двумя плазмидами, экспрессирующими различные комбинации гРНК. Клоны, идентифицированные с помощью количественных анализов ПЦР с модификацией аллеля (то есть с потерей аллеля или усилением аллеля), имеют целевую делецию локуса-мишени мыши и вставку нацеливающего вектора или имеют Cas9/гРНК-индуцированные делеций, были отобраны для последующих обычных анализов ПЦР.[000437] DNA was purified from ES cells, clones derived from ES cells that had been electroporated with a targeting vector and a plasmid expressing Cas9 and a plasmid expressing one of several guide RNAs (gRNAs) or two plasmids expressing different combinations of gRNAs. Clones identified by quantitative allelic modification PCR assays (i.e., allele loss or allele gain), having a targeted deletion of the mouse target locus and insertion of the targeting vector, or having Cas9/gRNA-induced deletions were selected for subsequent conventional PCR assays.

Дизайн олигонуклеотидаOligonucleotide design

[000438] Два ПЦР-анализа были разработаны для каждой комбинации гРНК. Первая ПЦР представляла собой анализ делеций для выявления разрушения между последовательностями, узнаваемыми направляющей РНК, различных комбинаций гРНК. Второй анализ ПЦР, который представляет собой 5'-анализ, включал два анализа ПЦР. Первым был анализ 5'-человека для гуманизированных аллелей, который был разработан через участок соединения мыши-человека. Вторым был 5'-анализ мыши на эндогенные мышиные аллели, и он был разработан через участок соединения 5'-целевую делецию.[000438] Two PCR assays were designed for each gRNA combination. The first PCR was a deletion assay to detect disruption between the guide RNA recognition sequences of the different gRNA combinations. The second PCR assay, which was a 5' assay, included two PCR assays. The first was a human 5' assay for humanized alleles, which was designed through a mouse-human junction site. The second was a mouse 5' assay for endogenous mouse alleles, and was designed through a 5' targeted deletion junction site.

Реакция ПЦР и клонирование ТОРОPCR reaction and TOPO cloning

[000439] TaKaRa LA Taq ДНК-полимераза (кат. № RR002M) была использована для амплификации ДНК-матрицы ЭС-клетки. Каждую реакционную смесь для анализа ПЦР проводили с отрицательным контролем воды. Смеси для анализа содержали следующее: 0,005 мл ДНК-матрицы ЭС-клеток; 1X LA ПЦР-буфер II (Mg2+ плюс); 0,01 мМ смесь дНТФ; 0,0075 мМ прямого олигонуклеотида (каждый); 0,0075 мМ обратного олигонуклеотида (каждый); 5000 единиц/мл LA Taq-полимеразы; и ddH2O до 0,025 мл.[000439] TaKaRa LA Taq DNA Polymerase (Cat# RR002M) was used to amplify ES cell template DNA. Each PCR assay reaction was performed with a negative water control. The assay mixtures contained the following: 0.005 mL ES cell template DNA; 1X LA PCR Buffer II (Mg2 + plus); 0.01 mM dNTP mix; 0.0075 mM forward oligonucleotide (each); 0.0075 mM reverse oligonucleotide (each); 5000 units/mL LA Taq Polymerase; and ddH2O to 0.025 mL.

[000440] Программа термоциклирования ПЦР состояла из 94°С в течение одной минуты; затем 35 циклов при 94°С в течение 30 секунд, градиенте отжига при 60°С в течение 30 секунд и амплификация при 68°С в течение одной минуты на т.п.о.; с последующей полимеризацией при 72°С в течение 10 минут.[000440] The PCR thermal cycling program consisted of 94°C for one minute; then 35 cycles of 94°C for 30 seconds, an annealing gradient of 60°C for 30 seconds, and amplification at 68°C for one minute per kb; followed by polymerization at 72°C for 10 minutes.

[000441] Продукты ПЦР фракционировали электрофорезом в 2% агарозном геле с Invitrogen 1 т.п.о. плюс ДНК-лестницей (кат. №10787-018) и/или Invitrogen 50 п.о. ДНК-лестницей (кат. №10416-014). Оставшиеся продукты ПЦР клонировали в вектор pCR4-TOPO, следуя инструкциям из набора для клонирования Invitrogen ТОРО ТА (кат. № K4575-02) для сиквенирования. Реакции клонирования химически трансформировали в клетках One Shot Тор10 и высевали на чашки с агаром 0,06 мг/мл X-gal и 0,025 мг/мл канамицина.[000441] PCR products were fractionated by electrophoresis on 2% agarose gels with Invitrogen 1 kb plus DNA ladder (cat. #10787-018) and/or Invitrogen 50 bp DNA ladder (cat. #10416-014). The remaining PCR products were cloned into the pCR4-TOPO vector following the instructions in the Invitrogen TOPO TA Cloning Kit (cat. #K4575-02) for sequencing. Cloning reactions were chemically transformed in One Shot Top10 cells and plated on 0.06 mg/ml X-gal and 0.025 mg/ml kanamycin agar plates.

СиквенированиеSequencing

[000442] Белые колонии инокулировали в LB, содержащий 0,025 мг/мл канамицина, и инкубировали в течение ночи при встряхивании при 37°С. Каждая колония представляла один ампликон из популяции проанализированных продуктов. ДНК выделяли из каждой бактериальной культуры с использованием набора для минимизации плазмиды QIAGEN (кат. №12123). Последовательность ДНК вставок определяли в реакционной смеси для сиквенирования, которая содержала 0,002 мл ТОРО-клонированной ПЦР, 1x PCRx Усиливающий раствор (10× исходный раствор) (кат. Х11495-017), 0,0075 мМ олигонуклеотида (M13F или M13R) и ddH20 до 0,015 мл.[000442] White colonies were inoculated into LB containing 0.025 mg/ml kanamycin and incubated overnight with shaking at 37°C. Each colony represented a single amplicon from the population of products analyzed. DNA was isolated from each bacterial culture using the QIAGEN Plasmid Minimization Kit (Cat. #12123). The DNA sequence of the inserts was determined in a sequencing reaction mixture containing 0.002 ml TOPO-cloned PCR, 1x PCRx Enhancer Solution (10x Stock) (Cat. #X11495-017), 0.0075 mM oligonucleotide (M13F or M13R), and ddH20 to 0.015 ml.

АнализсиквенированияSequencing Analysis

[000443] От результатов сиквенирования отрезали промежуточную последовательность и последовательность вектора pCR4-TOPO, изолируя последовательность ПЦР-вставки. Сиквенированные фрагменты были затем выровнены с эталоном, и вариации были проанализированы.[000443] The intermediate sequence and the pCR4-TOPO vector sequence were excised from the sequencing results, isolating the PCR insert sequence. The sequenced fragments were then aligned to the reference and variations were analyzed.

Сиквенирование разрушенных клоновSequencing of disrupted clones

[000444] Продукты ПЦР из разрушенных положительных клонов клонировали в вектор pCR4-ТОРО, следуя инструкциям производителя (Invitrogen cat. # K4575-02), затем химически трансформировали в клетки One Shot Тор10 и высевали на чашки с агаром 0,060 мг/мл X-gal и 0,025 мг/мл канамицина. ДНК выделяли из бактериальных культур с использованием набора для минимизации плазмиды QIAGEN (кат. №12123). Затем результаты сиквенирования вставки были выровнены в соответствие с прогнозируемым эталоном разрушения, и индел вариации были проанализированы. Было предсказано, что Cas9 расщепляет 3 пары оснований из РАМ в последовательность, распознаваемую гРНК.[000444] PCR products from disrupted positive clones were cloned into the pCR4-TOPO vector following the manufacturer's instructions (Invitrogen cat. # K4575-02) then chemically transformed into One Shot Top10 cells and plated on 0.060 mg/ml X-gal and 0.025 mg/ml kanamycin agar plates. DNA was isolated from bacterial cultures using the QIAGEN Plasmid Minimization Kit (Cat. # 12123). Insert sequencing results were then aligned against the predicted disruption reference and indel variations were analyzed. Cas9 was predicted to cleave 3 base pairs from the PAM into the gRNA recognition sequence.

Последовательность в пределах предсказанного расщепления была удалена из эталона, а оставшаяся часть была использована для выравнивания результатов.The sequence within the predicted cleavage was removed from the reference and the remaining portion was used to align the results.

Анализы TAQMAN® для аллельной дискриминации для одиночных нуклеотидных вариантов (SNV)TAQMAN® assays for allelic discrimination for single nucleotide variants (SNVs)

[000445] Реакция аллельной дискриминации TAQMAN® на 0,008 мл содержала геномную ДНК, специфические зонды/праймеры для каждого полиморфизма, и ПЦР мастер-смесь TAQMAN® для экспрессии гена. Зонды были заказаны у Life Technologies (Thermo) и праймеры от IDT. Зонд для аллеля 129 был помечен красителем VIC; зонд для аллеля В6 был помечен красителем FAM. Каждый аллельный анализ TAQMAN® проводили в четырех повторностях на 384-луночном планшете и проводили на платформе Applied BioSystems ViiA 7. Цикловая программа ПЦР SNV была следующей: при 95°С в течение 10 минут следует 40 циклов следующего: 95°С в течение 15 секунд, 60°С в течение 60 секунд и 60°С в течение 30 секунд. Анализ прогона и оценка результатов были выполнены с использованием программного обеспечения ViiA 7 v1.1.[000445] The 0.008 ml TAQMAN® Allele Discrimination Assay contained genomic DNA, specific probes/primers for each polymorphism, and TAQMAN® Gene Expression PCR Master Mix. Probes were purchased from Life Technologies (Thermo) and primers from IDT. The probe for the 129 allele was labeled with VIC dye; the probe for the B6 allele was labeled with FAM dye. Each TAQMAN® allele assay was performed in quadruplicate on a 384-well plate and run on an Applied BioSystems ViiA 7 platform. The SNV PCR cycling program was 95°C for 10 minutes followed by 40 cycles of 95°C for 15 seconds, 60°C for 60 seconds, and 60°C for 30 seconds. The run analysis and results evaluation were performed using ViiA 7 v1.1 software.

Анализ FISHFISH analysis

[000446] Отобранные клоны ЭС-клеток анализировали либо с помощью Cell Line Genetics (Мэдисон, Висконсин), либо с помощью Института Ван-Андела (Гранд-Рапидс, Мичиган), используя флуоресцентную гибридизацию in situ (FISH) с помощью их стандартных процедур. Мы предоставили ВАС мыши и человека в качестве зондов для двухцветного анализа.[000446] Selected ES cell clones were analyzed by either Cell Line Genetics (Madison, WI) or the Van Andel Institute (Grand Rapids, MI) using fluorescence in situ hybridization (FISH) using their standard procedures. We provided mouse and human BAC as probes for the two-color analysis.

Улучшенное разрушение генома и/или гуманизация лонусов-мишенейEnhanced genome disruption and/or humanization of target lonuses

[000447] Чтобы добиться точной, одноэтапной делеций всего или части гена грызуна и, возможно, одновременной замены всего или части его человеческого гомолога, мы ввели электропорацией в ЭС клетки грызунов следующие молекулы нуклеиновой кислоты: (1) LTVEC; (2) плазмида или мРНК, кодирующая эндонуклеазу Cas9; и (3) одну или более плазмид, кодирующих одну или более CRISPR одиночных направляющих РНК (гРНК) или сами гРНК. В каждом эксперименте LTVEC линеаризовали. В некоторых экспериментах, LTVEC включал весь человеческий ген или его часть, которая кодирует продукт гена (белок или РНК), фланкированный плечами гомологии ДНК грызунов, предназначенный для направления события гомологичной рекомбинации, которое удаляет ген грызуна и вставляет ген человека. В других экспериментах, LTVEC был разработан, чтобы нацеливаться на отдельный локус, такой как локус Ch25h. В любом случае, LTVEC также содержал кассету селекции лекарств, которая направляет экспрессию фермента (например, неомицин фосфотрансферазы), который придает устойчивость к препарату антибиотика (например, G418).[000447] To achieve precise, single-step deletion of all or part of a rodent gene and, optionally, simultaneous replacement of all or part of its human homolog, we electroporated into rodent ES cells the following nucleic acid molecules: (1) LTVEC; (2) a plasmid or mRNA encoding the Cas9 endonuclease; and (3) one or more plasmids encoding one or more CRISPR single guide RNAs (gRNAs) or gRNAs themselves. In each experiment, LTVEC were linearized. In some experiments, LTVEC included all or a portion of a human gene that encodes a gene product (protein or RNA) flanked by rodent DNA homology arms designed to direct a homologous recombination event that removes the rodent gene and inserts the human gene. In other experiments, LTVEC were designed to target a single locus, such as the Ch25h locus. In any case, LTVEC also contained a drug selection cassette that directs the expression of an enzyme (eg, neomycin phosphotransferase) that confers resistance to an antibiotic drug (eg, G418).

[000448] ЭС клетки, которые брали LTVEC и включали его в свои геномы, были способны расти и образовывать колонии на чашке для тканевых культур в среде для выращивания, содержащей препарат антибиотика. Поскольку мы ввели в 500-1000 раз больше CRISPR/Cas9-кодирующих и гРНК-кодирующих нуклеиновых молекул, чем молекул LTVEC, большинство LTVEC-содержащих устойчивых к лекарственным средствам колоний также содержали, по меньшей мере временно, компоненты CRISPR/Cas9. Мы отобрали устойчивые к лекарствам колонии и провели скрининг их способом модификации аллелей (Valenzuela et al. (2003) War. Biotech. 21:652-660; Frendewey et al. (2010) Methods Enzymol. 476:295-307; включенный в данное описание посредством ссылки во всей их полноте) для идентификации клонов, которые имели правильно нацеленный гуманизированный аллель. Кроме того, анализы ПЦР в реальном времени, распознающие последовательности в плечах гомологии LTVEC, называемые анализами удерживания, были использованы для проверки правильного нацеливания LTVEC в геном мыши. Определение количества копий этих анализов удерживания дало дополнительное пояснение, чтобы помочь отличить правильно нацеленные ЭС клоны, которые сохранили число копий два, от клонов, в которых большая Cas9-индуцированная делеция локуса-мишени мыши совпадает со случайной интеграцией LTVEC в другом месте в геноме, и в этом случае анализы удерживания имели число копий три (или более). Способность спаренных гРНК создавать большие Cas9-опосредованные делеции в локусе-мишени мыши означала, что стандартные анализы LOA и GOA, как описано ранее, могут быть дополнены анализами удерживания, чтобы обеспечить дополнительное уточнение и проверить правильность нацеливания. Поэтому анализы удерживания были разработаны и использованы в сочетании с анализами LOA и GOA.[000448] ES cells that took up LTVEC and incorporated it into their genomes were able to grow and form colonies on a tissue culture dish in growth medium containing the antibiotic drug. Because we introduced 500-1000 times more CRISPR/Cas9-encoding and gRNA-encoding nucleic acid molecules than LTVEC molecules, most of the LTVEC-containing drug-resistant colonies also contained, at least transiently, CRISPR/Cas9 components. We selected drug-resistant colonies and screened them using the allelic modification assay (Valenzuela et al. (2003) War. Biotech. 21:652–660; Frendewey et al. (2010) Methods Enzymol. 476:295–307; incorporated herein by reference in their entirety) to identify clones that had the correctly targeted humanized allele. In addition, real-time PCR assays recognizing sequences in the LTVEC homology arms, called retention assays, were used to verify the correct targeting of LTVEC into the mouse genome. Determining the copy number of these retention assays provided additional clarification to help distinguish correctly targeted ES clones that retained a copy number of two from clones in which a large Cas9-induced deletion of the mouse target locus coincided with random integration of LTVEC elsewhere in the genome, in which case the retention assays had a copy number of three (or more). The ability of paired gRNAs to create large Cas9-mediated deletions at the mouse target locus meant that standard LOA and GOA assays, as described previously, could be complemented by retention assays to provide additional clarification and verify correct targeting. Retention assays were therefore developed and used in conjunction with LOA and GOA assays.

[000449] В каждом эксперименте использовали одну или две гРНК. ГРНК использовали однонаправленное Cas9 расщепление вблизи 5'-конца локуса-мишени (т.е. делеция гена-мишени мыши), середины локуса-мишени или 3'-конца локуса-мишени. Когда использовали две гРНК, одна гРНК направила Cas9 расщепление рядом с 5'-концом локуса-мишени, а другая гРНК направила Cas9 расщепление в середине локуса-мишени или около 3'-конца локуса-мишени.[000449] One or two gRNAs were used in each experiment. The gRNAs directed unidirectional Cas9 cleavage near the 5' end of the target locus (i.e., the mouse target gene deletion), the middle of the target locus, or the 3' end of the target locus. When two gRNAs were used, one gRNA directed Cas9 cleavage near the 5' end of the target locus and the other gRNA directed Cas9 cleavage in the middle of the target locus or near the 3' end of the target locus.

Lrp5 ЛокусLrp5 Locus

[000450] В одной серии экспериментов, LTVEC был спроектирован для создания делеции 68 т.п.о. части гена Lrp5 мыши (белка 5, связанного с рецептором липопротеина низкой плотности), кодирующего эктодомен, и одновременной замены на фрагмент 91 т.п.о. гомологичной последовательности из гена LRP5 человека (см. фигуру 8). LTVEC содержал фрагмент размером 91 т.п.о. гена LRP5 человека, фланкированный плечами гомологии, содержащий 7 т.п.о. и 33 т.п.о. геномной ДНК, полученной из частей локуса Lrp5 мыши, которые фланкируют последовательность 68 т.п.о. гена Lrp5 мыши, являющегося мишенью для делеции. В отдельных экспериментах, Lrp5 гуманизированный LTVEC комбинировали с плазмидой, кодирующей Cas9, и второй плазмидой, кодирующей одну из восьми гРНК (А, В, В2, С, D, Е2, Е, F), предназначенную для создания двухцепочечных разрывов внутри участка гена Lrp5 мыши, которая была нацелена на делецию. Эти гРНК были сконструированы так, чтобы избежать распознавание любой последовательности во вставленной части гена LRP5 человека. В других экспериментах мы объединили LTVEC и Cas9-кодирующую плазмиду с плазмидами, кодирующими две разные гРНК, которые нацелены на разные сайты в участке гена Lrp5 мыши, который был нацелен на делецию.[000450] In one set of experiments, LTVEC were engineered to create a deletion of a 68 kb portion of the mouse Lrp5 (low density lipoprotein receptor-related protein 5) gene encoding the ectodomain and a simultaneous replacement with a 91 kb fragment of homologous sequence from the human LRP5 gene (see Figure 8). The LTVEC contained a 91 kb fragment of the human LRP5 gene flanked by homology arms containing 7 kb and 33 kb of genomic DNA derived from portions of the mouse Lrp5 locus that flank the 68 kb sequence of the mouse Lrp5 gene targeted for deletion. In separate experiments, Lrp5 humanized LTVEC was combined with a plasmid encoding Cas9 and a second plasmid encoding one of eight gRNAs (A, B, B2, C, D, E2, E, F) designed to create double-strand breaks within the region of the mouse Lrp5 gene that was targeted for deletion. These gRNAs were designed to avoid recognizing any sequence in the inserted portion of the human LRP5 gene. In other experiments, we combined LTVEC and a Cas9-encoding plasmid with plasmids encoding two different gRNAs that target different sites within the region of the mouse Lrp5 gene that was targeted for deletion.

[000451] Устойчивые к лекарственным средствам клоны ЭС-клеток подвергали скринингу на предмет целевой гуманизации с помощью анализа модификации аллелей (Valenzuela et al. (2003) Nat. Biotechnol. 21:652-659; Frendewey et al. (2010) Methods Enzymol. 476:295-307) для последовательностей в делеции и для последовательностей в кассете селекции лекарств и вставке гена человека. Клоны были оценены как правильно нацеленные, если они потеряли одну из двух эндогенных последовательностей мышиных генов и получили одну копию человеческой вставки, а также сохранили две копии удерживающих последовательностей (расположенных в плече гомологии LTVEC). Двумя анализами удерживания для этого скрининга были анализы TAQMAN® с использованием следующих праймеров и зондов: 7064retU прямой праймер CCTCCTGAGCTTTCCTTTGCAG (SEQ ID NO: 100); 7064retU обратный праймер CCTAGACAACACAGACACTGTATCA (SEQ ID NO: 101); 7064retU TAQMAN® зонд TTCTGCCCTTGAAAAGGAGAGGC (SEQ ID NO: 102); 7064retD прямой праймер CCTCTGAGGCCACCTGAA (SEQ ID NO: 103); 7064retD обратный праймер CCCTGACAAGTTCTGCCTTCTAC (SEQ ID NO: 104); 7064retD TAQMAN® зонд TGCCCAAGCCTCTGCAGCTTT (SEQ ID NO: 105).[000451] Drug-resistant ES cell clones were screened for targeted humanization using allelic modification analysis (Valenzuela et al. (2003) Nat. Biotechnol. 21:652–659; Frendewey et al. (2010) Methods Enzymol. 476:295–307) for sequences in the deletion and for sequences in the drug selection cassette and human gene insertion. Clones were scored as correctly targeted if they had lost one of the two endogenous mouse gene sequences and gained one copy of the human insertion, and retained two copies of the retention sequences (located in the LTVEC homology arm). The two retention assays for this screen were TAQMAN® assays using the following primers and probes: 7064retU forward primer CCTCCTGAGCTTTCCTTTGCAG (SEQ ID NO: 100); 7064retU reverse primer CCTAGACAACACAGACACTGTATCA (SEQ ID NO: 101); 7064retU TAQMAN® probe TTCTGCCCTTGAAAAGGAGAGGC (SEQ ID NO: 102); 7064retD forward primer CCTCTGAGGCCACCTGAA (SEQ ID NO: 103); 7064retD reverse primer CCCTGACAAGTTCTGCCTTCTAC (SEQ ID NO: 104); 7064retD TAQMAN® probe TGCCCAAGCCTCTGCAGCTTT (SEQ ID NO: 105).

[000452] Результаты CRISPR/Cas9-ассистированной гуманизации гена Lrp5 суммированы в таблице 13. Когда в ЭС клетки вводили только LTVEC, 1,9% скринированных лекарственно-устойчивых клонов содержали правильно нацеленный гетерозиготный гуманизированный аллель (см. Гет. Нац. столбец в таблице 13, который включает клоны, в которых нецелевой аллель не был мутирован вообще или имел небольшую CRISPR-индуцированную мутацию такую как небольшая делеция, вызванная NHEJ). Напротив, объединение LTVEC с эндонуклеазами Cas9, управляемыми семью из восьми протестированных гРНК (А, В, В2, С, D, Е2, Е и F; см. Таблицу 1), приводило к правильно нацеленным моноаллельным гетерозиготным мутациям с эффективностью, варьирующейся от 2,1 до 7,8%. Для Cas9-управляемого расщепления с помощью В2 и D, помимо моноаллельного нацеливания, была обнаружена биаллельная гомозиготная гуманизация с частотой 1,0-2,1%. Мы никогда не наблюдали биаллельного нацеливания с помощью LTVEC, даже для небольших простых делеционных аллелей. Гомозиготные Lrp5 гуманизированные ЭС-клетки могут быть преобразованы способом VELOCIMOUSE® (Poueymirou et al. (2007) Nat. Biotech. 25:91-99, включенной в настоящее описание в качестве ссылки во всей своей полноте) непосредственно на полностью полученных из ЭС клеток мышей, готовых к фенотипическим исследованиям и исследованиям эффективности лекарственных средств.[000452] The results of CRISPR/Cas9-assisted humanization of the Lrp5 gene are summarized in Table 13. When LTVEC alone was introduced into ES cells, 1.9% of the screened drug-resistant clones contained the correctly targeted heterozygous humanized allele (see the Het. Nat. column in Table 13, which includes clones in which the off-target allele was not mutated at all or had a minor CRISPR-induced mutation such as a small NHEJ-induced deletion). In contrast, combining LTVEC with Cas9 endonucleases driven by seven of the eight gRNAs tested (A, B, B2, C, D, E2, E, and F; see Table 1) resulted in correctly targeted monoallelic heterozygous mutations with efficiencies ranging from 2.1 to 7.8%. For Cas9-driven cleavage by B2 and D, in addition to monoallelic targeting, biallelic homozygous humanization was detected at a frequency of 1.0-2.1%. We have never observed biallelic targeting with LTVEC, even for small simple deletion alleles. Homozygous Lrp5 humanized ES cells can be transduced by the VELOCIMOUSE® method (Poueymirou et al. (2007) Nat. Biotech. 25:91-99, incorporated herein by reference in its entirety) directly into fully ES cell-derived mice, ready for phenotypic and drug efficacy studies.

[000453] Анализы МОА, разработанные для обнаружения гРНК/Cas9-индуцированных NHEJ мутаций в или около предсказанных сайтов расщепления, продемонстрировали мутационную активность для всех протестированных гРНК (данные не показаны). Доля моноаллельных или биаллельных гРНК-индуцированных мутаций, обнаруженных среди всех проанализированных клонов, варьировалась с помощью локуса и положения. Не было сильной корреляции между мутационной активностью гРНК и нацеливанием LTVEC, но самая низкая эффективность нацеливания часто ассоциировалась с гРНК, которые имели самые низкие частоты мутаций.[000453] MOA assays designed to detect gRNA/Cas9-induced NHEJ mutations at or near predicted cleavage sites demonstrated mutational activity for all gRNAs tested (data not shown). The proportion of monoallelic or biallelic gRNA-induced mutations detected among all clones analyzed varied by locus and position. There was no strong correlation between gRNA mutational activity and LTVEC targeting, but the lowest targeting efficiency was often associated with gRNAs that had the lowest mutation frequencies.

[000454] Объединение двух гРНК, которые распознают разные концы участка гена Lrp5, который был нацелен на делецию, увеличивало общую эффективность нацеливания на гуманизацию, преимущественно за счет увеличения частоты гомозиготных событий нацеливания для трех из пяти протестированных комбинаций (таблица 13). Поскольку комбинация гРНК потенциально может создавать большие делеции между сайтами расщепления Cas9, запрограммированными с помощью гРНК, мы также наблюдали клоны гемизиготных ЭС-клеток, которые несут целевую гуманизацию на одном аллеле Lrp5 и большую CRISPR-индуцированную делецию на другом аллеле (комбинация гРНК А+F, таблица 13). Кроме того, для двух комбинаций гРНК (А+F и А+Е2) мы идентифицировали клоны ЭС-клеток с уникальным генотипом: большие CRISPR-опосредованные делеции на обоих аллелях Lrp5.[000454] Combining two gRNAs that recognize different ends of the Lrp5 gene region targeted for deletion increased the overall efficiency of humanization targeting, primarily by increasing the frequency of homozygous targeting events for three of the five combinations tested (Table 13). Because a gRNA combination has the potential to create large deletions between gRNA-programmed Cas9 cleavage sites, we also observed hemizygous ES cell clones that carry targeted humanization on one Lrp5 allele and a large CRISPR-induced deletion on the other allele (gRNA combination A+F, Table 13). Additionally, for two gRNA combinations (A+F and A+E2), we identified ES cell clones with a unique genotype: large CRISPR-mediated deletions on both Lrp5 alleles.

[000455][000455]

[000456] Как показано в Таблице 13, значительное увеличение процента клонов, у которых было биаллельное нацеливание, наблюдалось при использовании двух гРНК, которые нацелены на один локус, а не на одну гРНК (см. Фигуру 9А), что указывает на то, что использование комбинаций гРНК способствует биаллельным модификациям. На фигуре 9А показана общая схема одновременной делеции мышиного гена и замены соответствующей человеческой версии с использованием LTVEC и двух направляющих РНК (А и В). Уникальные мутантные типы аллелей, которые наблюдаются с гораздо более высокой частотой при использовании двух гРНК, включают гомозиготно разрушенные аллели (фигура 9В; Δ/Δ), гомозиготно нацеленные аллели (фигура 9С; Hum/Hum), гемизиготно нацеленные аллели (фигура 9D; (Hum/Δ)) и другие сложные гетерозиготно нацеленные аллели (например, один аллель имеет LTVEC-нацеленную гуманизацию, а другой аллель имеет CRISPR-индуцированную мутацию, такую как небольшая делеция) (фигура 9Е).[000456] As shown in Table 13, a significant increase in the percentage of clones that had biallelic targeting was observed when using two gRNAs that target a single locus rather than a single gRNA (see Figure 9A), indicating that the use of combinations of gRNAs facilitates biallelic modifications. Figure 9A shows the general scheme for the simultaneous deletion of a mouse gene and replacement of the corresponding human version using LTVEC and two guide RNAs (A and B). Unique mutant allele types that are observed at much higher frequencies when using two gRNAs include homozygous disrupted alleles (Figure 9B; Δ/Δ), homozygous targeted alleles (Figure 9C; Hum/Hum), hemizygous targeted alleles (Figure 9D; (Hum/Δ)) and other complex heterozygous targeted alleles (e.g., one allele has LTVEC-targeted humanization and the other allele has a CRISPR-induced mutation such as a small deletion) (Figure 9E).

[000457] Было проведено несколько анализов ПЦР для поддержания и подтверждения генотипов на основе анализов МОА. Праймеры можно найти в таблице 1. Lrp5 LTVEC имел 5' плечо гомологии, которая была достаточно короткой (6,9 т.п.о.), чтобы доказать нацеливание с помощью ПЦР, которая анализировала физическую связь между человеческой вставкой и соседней последовательностью генома мыши. Мы наблюдали ожидаемый 7,5 т.п.о. продукт ПЦР с ДНК из клонов, оцениваемых как гетерозиготные, гемизиготные или гомозиготные, но не с ДНК из линии родительских ЭС-клеток или из клонов, оцениваемых как имеющие биаллельные большие делеции (фигуры 10А), таким образом подтверждая направленные вызовы, сделанные с помощью МОА (т.е. LOA и GOA) скрининга и поддержки предполагаемых биаллельных больших делеции. ПЦР-анализ 5'-Del-J, в котором изучались последовательности в соединениях делеции и вставки (фигура 10 В), позволил получить продукт размером 330 п.о. с ДНК из родительской линии ЭС-клеток и из большинства гетерозиготных гуманизированных клонов (данные не представлены). Для гетерозиготного клона AW-C3, в результате анализа 5'-Del-J был получен продукт, меньший, чем ожидалось (фигура 10В), что позволяет предположить, что расщепление гРНК A/Cas9 индуцировало небольшую делеционную мутацию на нецелевом аллеле, которая также была обнаружена с помощью анализа МОА для расщепления гРНК А (данные не показаны). Как и ожидалось, 5'-Del-J анализ был отрицательным для клонов с гемизиготными, гомозиготными и биаллельными делеционными аллелями. ПЦР 5'-lns-J (фигура 10В), которая исследовала последовательности на стыке между 5'-концом вставки ДНК человека и соседней фланкирующей последовательности мыши, продуцировала продукт длиной 478 п.о. в гетерозиготных, гемизиготных и гомозиготных клонах, поскольку они имеют по меньшей мере один целевой гуманизированный аллель. ПЦР-анализ 5'-lns-J не дал продукта для клонов с биаллельнылли большими делециями (фигура 10В). Чтобы подтвердить большие делеций в гемизиготных и биаллельных делеционных клонах, мы провели ПЦР с праймерами, которые распознавали последовательности вне сайтов-мишеней двойной гРНК. Del(A+F) ПЦР, которая анализировала делецию между сайтами гРНК А и F, давала один продукт размером приблизительно 360 п.о. с ДНК из клонов AW-A8 и BO-F10 (фигура 10В), подтверждая, что по меньшей мере один из аллелей Lrp5 имел большую делецию. Аналогично, Del(A+Е2) ПЦР, которая анализировала большую делецию между сайтами гРНК А и Е2, давала один продукт размером приблизительно 250 п.о. с ДНК из клона ВА-А7. ПЦР делеций вместе с анализами соединения, LOA и GOA поддерживают биаллельный генотип большой делеций. Результаты анализа, показанные на фигуре 10А и 10В, являются репрезентативными примерами аналогичных анализов, которые мы проводили в дополнение к флуоресцентной гибридизации in situ (FISH; фигура 11А-С), чтобы подтвердить биаллельные генотипы, обобщенные в таблице 13.[000457] Several PCR assays were performed to maintain and confirm the genotypes based on the MOA assays. Primers can be found in Table 1. Lrp5 LTVEC had a 5' homology arm that was short enough (6.9 kb) to be proven to be targeted by PCR that analyzed the physical linkage between the human insert and the adjacent mouse genomic sequence. We observed the expected 7.5 kb PCR product with DNA from clones assessed as heterozygous, hemizygous, or homozygous, but not with DNA from the parental ES cell line or from clones assessed as having biallelic large deletions (Figure 10A), thus confirming the targeted calls made by the MOA (i.e., LOA and GOA) screening and supporting the putative biallelic large deletions. 5′-Del-J PCR analysis examining sequences at the deletion and insertion junctions (Figure 10B) yielded a 330 bp product with DNA from the parental ES cell line and from most heterozygous humanized clones (data not shown). For the heterozygous clone AW-C3, 5′-Del-J analysis yielded a smaller-than-expected product (Figure 10B), suggesting that A/Cas9 gRNA cleavage induced a small deletion mutation on the off-target allele that was also detected by MOA analysis for gRNA A cleavage (data not shown). As expected, 5′-Del-J analysis was negative for clones with hemizygous, homozygous, and biallelic deletion alleles. 5′-lns-J PCR (Figure 10B), which probed sequences at the junction between the 5′ end of the human DNA insert and adjacent murine flanking sequence, produced a 478-bp product in heterozygous, hemizygous, and homozygous clones because they have at least one targeted humanized allele. 5′-lns-J PCR analysis yielded no product for clones with biallelic large deletions (Figure 10B). To confirm large deletions in hemizygous and biallelic deletion clones, we performed PCR with primers that recognized sequences outside the dual gRNA target sites. Del(A+F) PCR, which probed the deletion between the A and F gRNA sites, yielded a single product of approximately 360 bp. with DNA from clones AW-A8 and BO-F10 (Figure 10B), confirming that at least one of the Lrp5 alleles had a large deletion. Similarly, Del(A+E2) PCR, which analyzed the large deletion between the A and E2 gRNA sites, yielded a single product of approximately 250 bp with DNA from clone BA-A7. The deletion PCR, together with the junction, LOA, and GOA assays, support the biallelic genotype of the large deletion. The assay results shown in Figures 10A and 10B are representative examples of similar assays we performed in addition to fluorescence in situ hybridization (FISH; Figure 11A–C) to confirm the biallelic genotypes summarized in Table 13.

[000458] Флуоресцентную гибридизацию in situ (FISH) использовали для подтверждения гомозиготной направленной гуманизации гена Lrp5. Клоны ЭС-клеток, оцениваемые с помощью количественных и общепринятых анализов ПЦР как гомозиготные по мишеням из экспериментов по нацеливанию, в которых Lrp5 гуманизацию LTVEC объединяли с Cas9, и две гРНК (А плюс F или А плюс Е2) отправляли в коммерческую цитологическую службу для анализа FISH и кариотипа. Бактериальная искусственная хромосома (ВАС), несущая ген Lrp5 мыши, была помечена красным флуоресцентным маркером и использована в качестве зонда для идентификации эндогенных локусов Lrp5, а ВАС, несущий ген LRP5 человека, был помечен зеленым флуоресцентным маркером и использован в качестве зонда для идентификации хроматиды, на которые нацелена человеческая вставка. Меченые зонды ВАС были гибридизованы с метафазными пластинками от клонов-мишеней и визуализированы с помощью флуоресцентной микроскопии. Хромосомы на пластинках визуализировали путем окрашивания DAPI (4',6-диамидино-2-фенилиндол), а отдельные кариотипы для каждого клона определяли окрашиванием по Гимзе. Типичный результат показан на фигуре 11А для клона AW-D9, у которого был обнаружен нормальный кариотип 40XY (не показан). Сводная фотография на фигуре 11А показывает, что как сигнал красного зонда ВАС мыши, так и сигнал зеленого человеческого зонда ВАС совмещены с цитологической полосой В на обеих копиях хромосомы 19 мыши, известного местоположения гена Lrp5. Сводная фотография на фигуре 11С показывает то же гомозиготное нацеливание для другого клона (BA-D5). Эти результаты подтверждают, что фрагмент размером 91 т.п.о. гена LRP5 человека в гуманизированном LTVEC был правильно вставлен в предполагаемый локус Lrp5 мыши в обеих гомологах хромосомы 19 в клонах AW-D9 и BA-D5. Напротив, сводная фотография на фигуре 11В показывает, что как сигнал красного зонда ВАС мыши, так и сигнал зеленого человеческого зонда ВАС совмещены с цитологической полосой В на одной копии хромосомы 19 мыши (закрашенная стрелка), тогда как только сигнал красного зонда ВАС мыши локализуется в цитологической полосе В на другой копии хромосомы 19 мыши. Эти результаты подтверждают, что фрагмент размером 91 т.п.о. гена LRP5 человека в гуманизированном LTVEC был правильно вставлен в предполагаемый локус Lrp5 мыши только на одну копию хромосомы 19 (гетерозиготное нацеливание). Они также указывают (наряду с другими контролями не показано), что зонд ВАС человека не подвергается перекрестной гибридизации с локусом Lrp5 мыши, но распознает только вставку LRP5 человека.[000458] Fluorescence in situ hybridization (FISH) was used to confirm homozygous targeted humanization of the Lrp5 gene. ES cell clones assessed by quantitative and conventional PCR assays as being homozygous for the targets from targeting experiments in which Lrp5 humanization of LTVEC was combined with Cas9 and two gRNAs (A plus F or A plus E2) were submitted to a commercial cytology service for FISH and karyotyping analysis. A bacterial artificial chromosome (BAC) carrying the mouse Lrp5 gene was labeled with a red fluorescent marker and used as a probe to identify endogenous Lrp5 loci, and a BAC carrying the human LRP5 gene was labeled with a green fluorescent marker and used as a probe to identify chromatids targeted by the human insertion. Labeled BAC probes were hybridized to metaphase plates from target clones and visualized by fluorescence microscopy. Chromosomes on the plates were visualized by DAPI (4',6-diamidino-2-phenylindole) staining, and individual karyotypes for each clone were determined by Giemsa staining. A typical result is shown in Figure 11A for clone AW-D9, which was found to have a normal 40XY karyotype (not shown). The summary photograph in Figure 11A shows that both the red mouse BAC probe signal and the green human BAC probe signal aligned with cytologic band B on both copies of mouse chromosome 19, the known location of the Lrp5 gene. The summary photograph in Figure 11C shows the same homozygous targeting for another clone (BA-D5). These results confirm that the 91 kb fragment of the human LRP5 gene in humanized LTVEC was correctly inserted into the putative mouse Lrp5 locus on both chromosome 19 homologs in clones AW-D9 and BA-D5. In contrast, the composite photograph in Figure 11B shows that both the mouse red BAC probe signal and the green human BAC probe signal are aligned with cytologic band B on one copy of mouse chromosome 19 (filled arrow), whereas only the mouse red BAC probe signal is localized to cytologic band B on the other copy of mouse chromosome 19. These results confirm that the 91 kb fragment of the human LRP5 gene in humanized LTVEC was correctly inserted into the putative mouse Lrp5 locus on only one copy of chromosome 19 (heterozygous targeting). They also indicate (along with other controls not shown) that the human BAC probe does not cross-hybridize with the mouse Lrp5 locus, but only recognizes the human LRP5 insert.

[000459] Присутствие в определенных клонах идентичных CRISPR-индуцированным инделям мутаций, образованных на обоих аллелях посредством явной не гомологичной репарации соединения конца, наводит на мысль о возникновении событий конверсии генов в гибридных клетках F1H4 (которые состоят из 50% линии 129SvS6 и 50% C57BL/6N линии). Чтобы получить представление о механизме, лежащем в основе усиленного биаллельного нацеливания, когда используются две гРНК, был проведен скрининг семи клонов, которые были нацелены либо на гомозиготные гуманизации, либо на гомозиготные CRISPR-индуцированные большие делеции после нацеливания с LTVEC и, либо с А+F, либо с А+Е2 комбинации гРНК.[000459] The presence in certain clones of identical CRISPR-induced indel mutations generated on both alleles by apparent non-homologous end joining repair suggests the occurrence of gene conversion events in F1H4 hybrid cells (which are composed of 50% 129SvS6 and 50% C57BL/6N). To gain insight into the mechanism underlying the enhanced biallelic targeting when two gRNAs are used, seven clones were screened that targeted either homozygous humanizations or homozygous CRISPR-induced large deletions after targeting with LTVEC and either the A+F or A+E2 gRNA combination.

[000460] На фигуре 12 показаны примеры анализов, предназначенных для изучения событий конверсии генов, опосредованных двумя направляющими РНК. В частности, возможность конверсии генов была исследована путем анализа потери гетерозиготности (LOH) в гибридных F1H4 ЭС-клетках (которые состоят из 50% линии 129 SvS6 и 50% линии C57BL/6N). Конверсия генов может быть продемонстрирована потерей гетерозиготности в известных полиморфизмах между 129SvS6 (129) и C57BL/6N (В6), и, таким образом, ПЦР-анализы были разработаны для дифференциации между этими двумя типами аллелей. Структурные варианты (SV) полиморфизмов анализировали с помощью обычных ПЦР, разработанных для выявления различий между 129 и В6 аллелями. Хотя только один из SV-анализов, использованных ниже, показан на фигуре 12, концепция для всех одинакова. Праймеры были разработаны на основе структурных вариаций (SV) между линиями мышей В6 и 129 и показаны в таблице 1. Условия конструирования праймера были ограничены необходимостью идентификации ~25 п.о. SV и получения продуктов ПЦР ~ 300 п.о.; эти условия были выбраны таким образом, чтобы любые изменения были видны при гель-электрофорезе.[000460] Figure 12 shows examples of assays designed to study gene conversion events mediated by two guide RNAs. Specifically, the possibility of gene conversion was investigated by analyzing loss of heterozygosity (LOH) in hybrid F1H4 ES cells (which consist of 50% 129 SvS6 and 50% C57BL/6N). Gene conversion can be demonstrated by loss of heterozygosity at known polymorphisms between 129SvS6 (129) and C57BL/6N (B6), and thus PCR assays were designed to differentiate between these two allele types. Structural variants (SV) of the polymorphisms were analyzed using conventional PCR assays designed to detect differences between the 129 and B6 alleles. Although only one of the SV assays used below is shown in Figure 12, the concept is the same for all. Primers were designed based on structural variations (SVs) between the B6 and 129 mouse strains and are shown in Table 1. Primer design conditions were limited to identifying ~25 bp of SVs and producing ~300 bp PCR products; these conditions were chosen such that any changes would be visible on gel electrophoresis.

[000461] Перед проведением ПЦР на клонаханализы были валидированы и оптимизированы против ДНК ЭС-клеток дикого типа из линий В6, 129 и из F1H4 линии ЭС клеток. Наборы праймеров, которые продуцировали различимые полосы ПЦР, специфичные для аллелей В6 или 129, и были последовательны в получении этих же двух различимых полос с использованием ДНК F1H4, были отобраны для тестирования на клонах. Для хромосомы 19 (местоположение гена Lrp5), шесть праймеров наборов - ID 190045,190061,190068,190030, 190033, 190013 - были выбраны для использования на гуманизированных клонах Lrp5, генотипированных как «гомозиготная мишень» или «гомозиготное разрушение» с помощью анализов модификации аллеля (МОА) и обычной ПЦР. SV ПЦР-анализы были разнесены вдоль хромосомы 19 от локуса Lrp5 до теломерного конца хромосомы, в пределах от ~ 13,7 до ~ 56,2 Мб от локуса Lrp5. Приблизительные расстояния (в Мб) SV анализов на хромосоме 19 от локуса Lrp5 следующие: 13,7 для анализа 190045, 19,0 для анализа 190061, 35,0 для анализа 190068,37,4 для анализа 190030,48,3 для анализа 190033, и 56,2 для анализа 190013. Только анализ 190033 показан на фигуре 12 (показан как SV 48,3), но праймеры для анализов 190045, 190061, 190068, 190030, 190033 и 190013 показаны в таблице 1.[000461] Prior to performing PCR on clones, the assays were validated and optimized against wild-type ES cell DNA from the B6, 129, and F1H4 ES cell lines. Primer sets that produced distinct PCR bands specific for the B6 or 129 alleles and were consistent in producing the same two distinct bands using F1H4 DNA were selected for testing on clones. For chromosome 19 (location of the Lrp5 gene), six primer sets - IDs 190045,190061,190068,190030, 190033, 190013 - were selected for use on humanized Lrp5 clones genotyped as "homozygous target" or "homozygous disruption" by allele modification assays (AMAs) and conventional PCR. SV PCR assays were spaced along chromosome 19 from the Lrp5 locus to the telomeric end of the chromosome, ranging from ~13.7 to ~56.2 Mb from the Lrp5 locus. The approximate distances (in Mb) of the SV assays on chromosome 19 from the Lrp5 locus are as follows: 13.7 for assay 190045, 19.0 for assay 190061, 35.0 for assay 190068, 37.4 for assay 190030, 48.3 for assay 190033, and 56.2 for assay 190013. Only assay 190033 is shown in Figure 12 (shown as SV 48.3), but the primers for assays 190045, 190061, 190068, 190030, 190033, and 190013 are shown in Table 1.

[000462] ПЦР проводили на ДНК этих клонов, а также на контрольной ДНК F1H4, контрольной ДНК 129 и контрольной ДНК В6. Продукты ПЦР фракционировали электрофорезом на 6% полиакриламидных гелях, которые впоследствии окрашивали GelRed. Клоны, продуцирующие две полосы, соответствовали контролю F1H4, который из предыдущей оптимизации показал, что верхняя полоса специфична для аллеля 129, а нижняя полоса специфична для аллеля В6. Клоны, которые создали только одну полосу, отображали либо только В6, либо только 129 полос. Клоны AW-A7, AW-F10, BA-D5, BA-F2, ВС-Н9 и BR-B4 показали только полосу В6 для всех шести анализов, тогда как клон ВО-А8 показал только полосу 129 для всех шести анализов. Как упоминалось ранее, эти клоны были генотипированы как гомозиготно нацеленные или гомозиготно разрушенные с помощью МОА и/или ПЦР, и включали различные комбинации гРНК (А плюс F, А плюс Е2, В2 и D). Присутствие только одной аллельной полосы указывает на то, что имеет место событие конверсии гена - если бы не было конверсии, обе полосы все равно присутствовали бы, как в контроле F1H4.[000462] PCR was performed on DNA from these clones as well as on control F1H4 DNA, control 129 DNA, and control B6 DNA. PCR products were fractionated by electrophoresis on 6% polyacrylamide gels that were subsequently stained with GelRed. Clones producing two bands corresponded to the F1H4 control, which from previous optimization showed that the upper band was specific for the 129 allele and the lower band was specific for the B6 allele. Clones that produced only one band displayed either only B6 or only 129 bands. Clones AW-A7, AW-F10, BA-D5, BA-F2, BC-H9, and BR-B4 showed only the B6 band for all six assays, whereas clone BO-A8 showed only the 129 band for all six assays. As mentioned earlier, these clones were genotyped as homozygous targeted or homozygous disrupted by MOA and/or PCR, and included various combinations of gRNAs (A plus F, A plus E2, B2, and D). The presence of only one allelic band indicates that a gene conversion event has occurred - if there had been no conversion, both bands would still be present, as in the F1H4 control.

[000463] Кроме того, одиночные нуклеотидные варианты (SNV) между аллелями 129 и В6 были проанализированы с помощью анализа аллельной дискриминации TAQMAN®. Приблизительные положения анализов SNV на карте хромосомы 19 на фигуре 12 показаны стрелками с их расстояниями (в Мб) от локуса Lrp5, приведенными ниже. Расстояния (в Мб) от локуса Lrp5 следующие: 0,32 центромера Lrp5 (С2), 1,2 теломера Lrp5 (Т3), 11,1 теломера Lrp5 (T6), 13,2 телоллера Lrp5 (Т7), 17,5 телоллера Lrp5 (Т8), 25,8 теломера Lrp5 (Т9), 33,0 теломера Lrp5 (Т10), 38,3 телоллера Lrp5 (T11), 49,6 телоллера Lrp5 (Т13) и 57,2 телоллера Lrp5 (Т14). 129-специфичные и В6-специфичные зонды и пары прайллеров показаны в таблице 1.[000463] In addition, single nucleotide variants (SNVs) between the 129 and B6 alleles were analyzed using TAQMAN® allelic discrimination analysis. The approximate positions of the SNV assays on the chromosome 19 map in Figure 12 are shown by arrows with their distances (in Mb) from the Lrp5 locus shown below. The distances (in Mb) from the Lrp5 locus are as follows: 0.32 Lrp5 centromere (C2), 1.2 Lrp5 telomere (T3), 11.1 Lrp5 telomere (T6), 13.2 Lrp5 teller (T7), 17.5 Lrp5 teller (T8), 25.8 Lrp5 telomere (T9), 33.0 Lrp5 telomere (T10), 38.3 Lrp5 teller (T11), 49.6 Lrp5 teller (T13), and 57.2 Lrp5 teller (T14). The 129-specific and B6-specific probes and primer pairs are shown in Table 1.

[000464] В таблице 14 показаны селль примеров клонов ЭС-клеток, которые демонстрировали явные события конверсии генов в длинном плече хромосомы 19 в направлении теломеры от локуса-мишени Lrp5 с помощью LOH как для аллелей SV, так и для SNV. Клоны ЭС-клеток были получены из независимых экспериментов по нацеливанию, которые объединяли Lrp5 гуманизированный LTVEC с одной или двумя гРНК, как указано. Положения последовательностей узнавания гРНК показаны над изображением гена Lrp5 на фигуре 12 (толстая стрелка, указывающая влево). Анализ генотипирования показал, что шесть из семи клонов имели гомозиготную целевую гуманизацию гена Lrp5, в то время как один из них имел гомозиготное разрушение (большую делецию между сайтами гРНК). В шести из семи клонов, 129 аллели были потеряны, оставив только аллели В6. В другом клоне, аллели В6 были потеряны, оставив только 129 аллели. Все клоны оставались гетерозиготными по аллелям, проанализированным на центромерной стороне локуса Lrp5 (то есть все клоны были гетерозиготными по В6/129 с помощью анализа С2 SNV). LOH, наблюдаемый в семи клонах, указывает на то, что один механизм, посредством которого гомозиготные генетически модифицированные аллели получают, когда LTVEC комбинируется с одной или более часто двумя гРНК, представляет собой первую нацеленную генетическую модификацию на одном аллеле с последующим гомологически направленным рекомбинацией событием конверсии гена, которое копирует нацеленную генетическую модификацию из одной хромосомы в ее гомолог.[000464] Table 14 shows a sample of ES cell clones that exhibited clear gene conversion events on the long arm of chromosome 19 toward the telomere from the Lrp5 target locus by LOH for both SV and SNV alleles. ES cell clones were obtained from independent targeting experiments that combined Lrp5 humanized LTVEC with one or two gRNAs, as indicated. The positions of the gRNA recognition sequences are shown above the Lrp5 gene image in Figure 12 (thick left-pointing arrow). Genotyping analysis revealed that six of the seven clones had homozygous target humanization of the Lrp5 gene, while one had a homozygous disruption (large deletion between gRNA sites). In six of the seven clones, 129 alleles were lost, leaving only the B6 alleles. In the other clone, the B6 alleles were lost, leaving only 129 alleles. All clones remained heterozygous for the alleles analyzed at the centromeric side of the Lrp5 locus (i.e., all clones were heterozygous for B6/129 by C2 SNV analysis). The LOH observed in the seven clones suggests that one mechanism by which homozygous genetically modified alleles are produced when LTVEC is combined with one or more often two gRNAs is a first targeted genetic modification on one allele followed by a homology-directed recombination gene conversion event that copies the targeted genetic modification from one chromosome to its homolog.

[000465][000465]

С5 (Hc) локусC5 (Hc) locus

[000466] В другой серии экспериментов LTVEC был разработан для создания делеции 76 т.п.о. гена мыши для комплемента компонента 5 (С5 или Hc (гемолитический комплемент)) и одновременной замены фрагментом 97 т.п.о. гомологичного гена С5 человека. Локус-мишень содержал экзон 2 для стоп-кодона гена С5 (Hc). LTVEC содержал фрагмент размером 97 т.п.о. гена С5 человека, фланкированный плечами гомологии, содержащий 35 т.п.о. и 31 т.п.о. геномной ДНК, полученной из частей локуса С5 (Hc) мыши, которые фланкируют последовательность 76 т.п.о. гена С5 (Hc) мыши, являющегося мишенью для делеции. В отдельных экспериментах, С5 (Hc) гуманизированный LTVEC комбинировали с плазмидой, кодирующей Cas9, и второй плазмидой, кодирующей одну из шести гРНК (А, В, С, D, Е и Е2; см. таблицу 1), предназначенную для создания двухцепочечных разрывов внутри участка гена С5 (Hc) мыши, который был нацелен на делецию. Эти гРНК были сконструированы так, чтобы избежать распознавание любой последовательности во вставленной части гена С5 человека. В других экспериментах мы объединили LTVEC и Cas9 кодирующую плазллиду с плазмидалли, кодирующими две разные гРНК, которые нацелены на разные сайты в участке гена С5 (Hc) мыши, который был нацелен на делецию. В некоторых экспериментах, контрольный LTVEC, нацеленный на локус Ch25h, использовали вместо С5 (Hc), гуманизирующего LTVEC. Контрольный LTVEC, который предназначен для удаления всей кодирующей последовательности Ch25h (~ 1 т.п.о.) и вставки селекционных кассет пиромицина и неомицина в локус Ch25h, использовали в качестве средства для отбора устойчивых к лекарствам клонов, которые не были нацелены на гомологичную рекомбинацию в локусе С5 (Hc).[000466] In another series of experiments, LTVEC was designed to create a 76 kb deletion of the mouse complement component 5 (C5 or Hc (hemolytic complement)) gene and simultaneously replace it with a 97 kb fragment of the homologous human C5 gene. The target locus contained exon 2 for the stop codon of the C5 (Hc) gene. The LTVEC contained the 97 kb fragment of the human C5 gene flanked by homology arms containing 35 kb and 31 kb genomic DNA derived from portions of the mouse C5 (Hc) locus that flank the 76 kb sequence of the mouse C5 (Hc) gene targeted for the deletion. In separate experiments, C5(Hc) humanized LTVEC was combined with a plasmid encoding Cas9 and a second plasmid encoding one of six gRNAs (A, B, C, D, E, and E2; see Table 1) designed to create double-strand breaks within the region of the mouse C5(Hc) gene that was targeted for deletion. These gRNAs were designed to avoid recognizing any sequence in the inserted portion of the human C5 gene. In other experiments, we combined LTVEC and a Cas9-encoding plasmid with plasmids encoding two different gRNAs that target different sites within the region of the mouse C5(Hc) gene that was targeted for deletion. In some experiments, a control LTVEC targeting the Ch25h locus was used in place of C5(Hc) humanized LTVEC. A control LTVEC designed to remove the entire Ch25h coding sequence (~1 kb) and insert the piromycin and neomycin selection cassettes into the Ch25h locus was used as a means to select for drug-resistant clones that were not targeted for homologous recombination at the C5 (Hc) locus.

[000467] Результаты CRISPR/Cas9-ассистированной гуманизации гена С5 (Hc) показаны в таблице 15 и аналогичны результатам, полученным для CRISPR/Cas9-ассистированной гуманизации гена Lrp5. Эффективность нацеливания с одним LTVEC была выше (6,1%) для гуманизации С5 (Hc), чем для Lrp5, но добавление Cas9 и гРНК усилило эффективность нацеливания для четырех из шести протестированных гРНК. Как и в случае Lrp5, комбинирование гРНК (то есть использование двух гРНК) для гуманизации С5 (Hc) еще более увеличивало общую эффективность нацеливания, главным образом за счет увеличения частоты гемизиготных и гомозиготных событий нацеливания. Мы также обнаружили клоны ЭС-клеток с большими CRISPR-индуцированными делециями на обоих аллелях (наблюдаемые с частотами от 1,8% до 3,6%). Кроме того, когда LTVEC, нацеленный на локус Ch25h, использовали в комбинации с двумя С5 (Hc) гРНК, клоны с гомозиготными аллелями, которые были разрушены между двумя последовательностями, распознаваемыми направляющей РНК, наблюдались с частотами от 1,2% до 6%, что указывает на то, что события разрушения происходят независимо от событий гомологичной рекомбинации в локусе-мишени. Как и в случае Lrp5, для подтверждения правильности нацеленных клонов использовались анализы удерживания. Двумя анализами удерживания для этого скрининга были анализы TAQMAN® с использованием следующих праймеров и зондов: 7140retU прямой праймер CCCAGCATCTGACGACACC (SEQ ID NO: 106); 7140retU обратный праймер GACCACTGTGGGCATCTGTAG (SEQ ID NO: 107); 7140retU TAQMAN®-зонд CCGAGTCTGCTGTTACTGTTAGCATCA (SEQ ID NO: 108); 7140retD прямой праймер CCCGACACCTTCTGAGCATG (SEQ ID NO: 109); 7140retD обратный праймер TGCAGGCTGAGTCAGGATTTG (SEQ ID NO: 110); 7140retD TAQMAN®-зонд TAGTCACGTTTTGTGACACCCCAGA (SEQ ID NO: 111).[000467] The results of CRISPR/Cas9-assisted humanization of the C5(Hc) gene are shown in Table 15 and are similar to those obtained for CRISPR/Cas9-assisted humanization of the Lrp5 gene. Targeting efficiency with a single LTVEC was higher (6.1%) for humanization of C5(Hc) than for Lrp5, but the addition of Cas9 and gRNA enhanced targeting efficiency for four of the six gRNAs tested. As with Lrp5, combining gRNAs (i.e., using two gRNAs) for humanization of C5(Hc) further increased overall targeting efficiency, primarily by increasing the frequency of hemizygous and homozygous targeting events. We also detected ES cell clones with large CRISPR-induced deletions on both alleles (observed at frequencies ranging from 1.8% to 3.6%). Furthermore, when LTVEC targeting the Ch25h locus was used in combination with two C5(Hc) gRNAs, clones with homozygous alleles that were disrupted between the two sequences recognized by the guide RNA were observed at frequencies ranging from 1.2% to 6%, indicating that disruption events occur independently of homologous recombination events at the target locus. As with Lrp5, retention assays were used to confirm the correctness of the targeted clones. The two retention assays for this screen were TAQMAN® assays using the following primers and probes: 7140retU forward primer CCCAGCATCTGACGACACC (SEQ ID NO: 106); 7140retU reverse primer GACCACTGTGGGCATCTGTAG (SEQ ID NO: 107); 7140retU TAQMAN® probe CCGAGTCTGCTGTTACTGTTAGCATCA (SEQ ID NO: 108); 7140retD forward primer CCCGACACCTTCTGAGCATG (SEQ ID NO: 109); 7140retD reverse primer TGCAGGCTGAGTCAGGATTTG (SEQ ID NO: 110); 7140retD TAQMAN® probe TAGTCACGTTTTGTGACACCCCAGA (SEQ ID NO: 111).

[000468][000468]

[000469] Флуоресцентную гибридизацию in situ (FISH) использовали для подтверждения гомозиготной направленной гуманизации гена С5 (Нс). Клоны ЭС-клеток, оцениваемые с помощью количественных и общепринятых анализов ПЦР как гомозиготные по мишеням из экспериментов по нацеливанию, в которых С5 (Нс) гуманизацию LTVEC объединяли с Cas9, и две гРНК отправляли в коммерческую цитологическую службу для анализа FISH и кариотипа. Бактериальная искусственная хромосома (ВАС), несущая ген С5 (Нс) мыши, была помечена красным флуоресцентным маркером и использована в качестве зонда для идентификации эндогенных локусов, а ВАС, несущий ген С5 человека, был помечен зеленым флуоресцентным маркером и использован в качестве зонда для идентификации хроматиды, на которые нацелена человеческая вставка. Меченые зонды ВАС были гибридизованы с метафазными пластинками от клонов-мишеней и визуализированы с помощью флуоресцентной микроскопии. Хромосомы на пластинках визуализировали путем окрашивания DAPI (4',6-диамидино-2-фенилиндол), а отдельные кариотипы для каждого клона определяли окрашиванием по Гимзе. Типичный результат показан на фигуре 13В для клона О-Е. Сводная фотография на фигуре 13В показывает, что как сигнал красного зонда ВАС мыши, так и сигнал зеленого человеческого зонда ВАС совмещены с локусом С5 (Нс) на обеих копиях хромосомы 2 мыши, известного местоположения гена С5 (Нс). Эти результаты подтверждают, что фрагмент размером 97 т.п.о. гена С5 человека в гуманизированном LTVEC был правильно вставлен в предполагаемый локус С5 (Нс) мыши в обеих гомологах хромосомы 2 в клонах О-Е3. Напротив, сводная фотография на фигуре 13А показывает, что как сигнал красного зонда ВАС мыши, так и сигнал зеленого человеческого зонда ВАС совмещены на одной копии хромосомы 2 мыши (закрашенная стрелка), тогда как только сигнал красного зонда ВАС мыши локализуется в локусе С5 (Нс) на другой копии хромосомы 2 мыши. Эти результаты подтверждают, что фрагмент размером 97 т.п.о. гена С5 человека в гуманизированном LTVEC был правильно вставлен в предполагаемый локус С5 (Нс) мыши только на одну копию хромосомы 2 (гетерозиготное нацеливание) в клоне Q-Е9.[000469] Fluorescence in situ hybridization (FISH) was used to confirm homozygous targeted humanization of the C5(Hc) gene. ES cell clones assessed by quantitative and conventional PCR assays as being homozygous for the targets from targeting experiments in which C5(Hc) humanization of LTVEC was combined with Cas9 and the two gRNAs were submitted to a commercial cytology service for FISH and karyotyping analysis. A bacterial artificial chromosome (BAC) carrying the mouse C5(Hc) gene was labeled with a red fluorescent marker and used as a probe to identify endogenous loci, and a BAC carrying the human C5 gene was labeled with a green fluorescent marker and used as a probe to identify chromatids targeted by the human insert. Labeled BAC probes were hybridized to metaphase plates from target clones and visualized by fluorescence microscopy. Chromosomes on the plates were visualized by DAPI (4',6-diamidino-2-phenylindole) staining, and individual karyotypes for each clone were determined by Giemsa staining. A typical result is shown in Figure 13B for clone O-E. The composite photograph in Figure 13B shows that both the red mouse BAC probe signal and the green human BAC probe signal aligned with the C5(Hc) locus on both copies of mouse chromosome 2, the known location of the C5(Hc) gene. These results confirm that the 97 kb fragment of the human C5 gene in humanized LTVEC was correctly inserted into the putative mouse C5(Hc) locus in both chromosome 2 homologs in clones O-E3. In contrast, the composite photograph in Figure 13A shows that both the mouse red BAC probe signal and the human green BAC probe signal are colocalized on one copy of mouse chromosome 2 (filled arrow), whereas only the mouse red BAC probe signal is localized to the C5 (Hc) locus on another copy of mouse chromosome 2. These results confirm that the 97 kb fragment of the human C5 gene in humanized LTVEC was correctly inserted into the putative mouse C5 (Hc) locus on only one copy of chromosome 2 (heterozygous targeting) in clone Q-E9.

[000470] Затем клоны анализировали для изучения событий конверсии генов, опосредованных двумя направляющими РНК. В частности, возможность конверсии генов была исследована путем анализа потери гетерозиготности (LOH) в гибридных F1H4 ЭС-клетках (которые состоят из 50% линии 129 SvS6 и 50% линии C57BL/6N). Конверсия генов может быть продемонстрирована потерей гетерозиготности в известных полиморфизмах между 129SvS6 (129) и C57BL/6N (В6), и, таким образом, ПЦР-анализы были разработаны для дифференциации между этими двумя типами аллелей. Структурные варианты (SV) полиморфизмов анализировали с помощью обычных ПЦР, разработанных для выявления различий между 129 и В6 аллелями. Праймеры были разработаны на основе структурных вариаций (SV) между линиями мышей В6 и 129 и показаны в таблице 1. Условия конструирования праймера были ограничены необходимостью идентификации ~25 п.о. SV и получения продуктов ПЦР ~ 300 п.о.; эти условия были выбраны таким образом, чтобы любые изменения были видны при гель-электрофорезе.[000470] The clones were then analyzed to examine gene conversion events mediated by the two guide RNAs. Specifically, the possibility of gene conversion was investigated by analyzing loss of heterozygosity (LOH) in hybrid F1H4 ES cells (which consist of 50% 129 SvS6 and 50% C57BL/6N). Gene conversion can be demonstrated by loss of heterozygosity at known polymorphisms between 129SvS6 (129) and C57BL/6N (B6), and thus PCR assays were designed to differentiate between these two allele types. Structural variants (SV) of the polymorphisms were analyzed by conventional PCR assays designed to detect differences between the 129 and B6 alleles. Primers were designed based on structural variations (SVs) between the B6 and 129 mouse strains and are shown in Table 1. Primer design conditions were limited to identify ~25 bp SVs and produce ~300 bp PCR products; these conditions were chosen such that any changes would be visible by gel electrophoresis.

[000471] Перед проведением ПЦР на клонаханализы были валидированы и оптимизированы против ДНК ЭС-клеток дикого типа из линий В6, 129 и из F1H4 линии ЭС клеток. Наборы праймеров, которые продуцировали различимые полосы ПЦР, специфичные для аллелей В6 или 129, и были последовательны в получении этих же двух различимых полос с использованием ДНК F1H4, были отобраны для тестирования на клонах. Пять наборов праймеров - ID SV 6,1, SV 6,3, SV 7,8, SV 16 и SV 25,5 - были выбраны для использования на клонах из эксперимента по нацеливанию. Четыре из ПЦР-анализа SV были распределены вдоль хромосомы от локуса С5 до теломерного конца хромосомы, в пределах от ~ 6,3 до ~ 25,5 Мб от локуса С5. Финальный SV ПЦР-анализ составлял ~ 6,1 Мб центромеры к локусу С5. Приблизительные расстояния (в Мб) SV анализов от локуса С5 следующие: 6,1 (центромерный) для анализа SV 6,1, 6,3 (теломерный) для анализа SV 6,3, 7,8 (теломерный) для анализа SV 7,8, 16,0 для анализа SV 16,0 и 25,5 для анализа SV 25,5 (см. фигуру 14).[000471] Prior to performing PCR on clones, the assays were validated and optimized against wild-type ES cell DNA from the B6, 129, and F1H4 ES cell lines. Primer sets that produced distinguishable PCR bands specific for the B6 or 129 alleles and were consistent in producing the same two distinguishable bands using F1H4 DNA were selected for testing on clones. Five primer sets - ID SV 6.1, SV 6.3, SV 7.8, SV 16, and SV 25.5 - were selected for use on clones from the targeting experiment. Four of the PCR assay SVs were distributed along the chromosome from the C5 locus to the telomeric end of the chromosome, ranging from ~6.3 to ~25.5 Mb from the C5 locus. The final SV PCR assay was ~6.1 Mb centromere to the C5 locus. The approximate distances (in Mb) of the SV assays from the C5 locus are: 6.1 (centromeric) for the SV 6.1 assay, 6.3 (telomeric) for the SV 6.3 assay, 7.8 (telomeric) for the SV 7.8 assay, 16.0 for the SV 16.0 assay, and 25.5 for the SV 25.5 assay (see Figure 14).

[000472] Все 21 клонов оставались гетерозиготными по аллелям, проанализированным на центромерной стороне локуса С4 (то есть все клоны были гетерозиготными по В6/129). Два из 21 протестированных клонов демонстрировали явные события конверсии генов в направлении теломер от локуса-мишени С5 с помощью LOH (см. Таблицу 16). Анализ генотипирования показал, что один из клонов был гомозиготно нацелен на гуманизацию гена С5, а другой клон имел гомозиготное разрушение. LOH, наблюдаемый в двух клонах, указывает на то, что один механизм, посредством которого гомозиготные генетически модифицированные аллели получают, когда LTVEC комбинируется с одной или более часто двумя гРНК, представляет собой первую нацеленную генетическую модификацию на одном аллеле с последующим гомологически направленным рекомбинацией событием конверсии гена, которое копирует нацеленную генетическую модификацию из одной хромосомы в ее гомолог.[000472] All 21 clones remained heterozygous for the alleles analyzed at the centromeric side of the C4 locus (i.e., all clones were heterozygous for B6/129). Two of the 21 clones tested showed clear gene conversion events toward the telomeres from the C5 target locus by LOH (see Table 16). Genotyping analysis revealed that one of the clones was homozygous for humanization of the C5 gene and the other clone had a homozygous disruption. The LOH observed in two clones suggests that one mechanism by which homozygous genetically modified alleles are produced when LTVEC is combined with one or more often two gRNAs is a first targeted genetic modification on one allele followed by a homology-directed recombination gene conversion event that copies the targeted genetic modification from one chromosome to its homolog.

[000473][000473]

Ror1 ЛокусRor1 Locus

[000474] В другой серии экспериментов LTVEC был спроектирован для создания делеции 110 т.п.о. гена Ror1 мыши (тирозин-протеинкиназного трансмембранного рецептора ROR1) и одновременной замены фрагментом 134 т.п.о. гомологичного гена ROR1 человека. LTVEC содержал фрагмент размером 134 т.п.о. гена ROR1 человека, фланкированный плечами гомологии, содержащий 41,8 т.п.о. и 96,4 т.п.о. геномной ДНК, полученной из частей локуса Ror1 мыши, которые фланкируют последовательность 110 т.п.о. гена Ror1 мыши, являющегося мишенью для делеции. В отдельных экспериментах, Ror1 гуманизированный LTVEC комбинировали с плазмидой, кодирующей Cas9, и второй плазмидой, кодирующей одну из шести гРНК (А, В, С, D, Е и F; см. таблицу 1), предназначенную для создания двухцепочечных разрывов внутри участка гена Ror1 мыши, который был нацелен на делецию. Эти гРНК были сконструированы так, чтобы избежать распознавание любой последовательности во вставленной части гена ROR1 человека. В других экспериментах мы объединили LTVEC и Cas9-кодирующую плазмиду с плазмидами, кодирующими две разные гРНК, которые нацелены на разные сайты в гене Ror1, который был нацелен на делецию.[000474] In another series of experiments, LTVEC were engineered to create a 110 kb deletion of the mouse Ror1 gene (the tyrosine-protein kinase transmembrane receptor ROR1) and a simultaneous replacement with a 134 kb fragment of the homologous human ROR1 gene. The LTVEC contained the 134 kb fragment of the human ROR1 gene flanked by homology arms containing 41.8 kb and 96.4 kb genomic DNA derived from portions of the mouse Ror1 locus that flank the 110 kb sequence of the mouse Ror1 gene targeted for the deletion. In separate experiments, Ror1 humanized LTVEC was combined with a plasmid encoding Cas9 and a second plasmid encoding one of six gRNAs (A, B, C, D, E, and F; see Table 1) designed to create double-strand breaks within the region of the mouse Ror1 gene that was targeted for deletion. These gRNAs were designed to avoid recognizing any sequence in the inserted portion of the human ROR1 gene. In other experiments, we combined LTVEC and a Cas9-encoding plasmid with plasmids encoding two different gRNAs that target different sites in the Ror1 gene that was targeted for deletion.

[000475] Результаты CRISPR/Cas9-ассистированной гуманизации гена Ror1 показаны в таблице 17 и аналогичны результатам, полученным для CRISPR/Cas9-ассистированной гуманизации генов Lrp5 и С5 (Нс). Эффективность нацеливания только с LTVEC составила 0,3%, и добавление Cas9 и гРНК слегка увеличивало эффективность нацеливания для двух из шести протестированных гРНК. Сочетание А и F гРНК увеличило общую эффективность нацеливания на Ror1 до 6,3% за счет увеличения частоты как гетерозиготных, так и гемизиготных событий нацеливания. Мы также обнаружили клоны ЭС-клеток с большими CRISPR-индуцированными делециями на обоих аллелях (наблюдаемые с частотой 1,6%). Гомозиготных клонов-мишеней не наблюдалось. В дополнительных экспериментах, гРНК А и D также объединяли, но гомозиготного нацеливания все еще не наблюдалось.[000475] The results of CRISPR/Cas9-assisted humanization of the Ror1 gene are shown in Table 17 and are similar to those obtained for CRISPR/Cas9-assisted humanization of the Lrp5 and C5 (Hc) genes. The targeting efficiency with LTVEC alone was 0.3%, and the addition of Cas9 and gRNA slightly increased the targeting efficiency for two of the six gRNAs tested. The combination of A and F gRNAs increased the overall targeting efficiency of Ror1 to 6.3% by increasing the frequency of both heterozygous and hemizygous targeting events. We also detected ES cell clones with large CRISPR-induced deletions on both alleles (observed at a frequency of 1.6%). No homozygous target clones were observed. In additional experiments, gRNAs A and D were also combined, but homozygous targeting was still not observed.

[000476][000476]

Trpa1 ЛокусTrpa1 Locus

[000477] В другой серии экспериментов, LTVEC был спроектирован для создания делеций в 45,3 т.п.о. гена Trpa1 мыши (катионный канал транзиторного рецепторного потенциала, подсемейство А, член 1) и одновременной замены фрагментом 54,5 т.п.о. гомологичного гена TRPA1 человека. LTVEC содержал фрагмент размером 54,5 т.п.о. гена TRPA1 человека, фланкированный плечами гомологии, содержащий 41,0 т.п.о. и 58,0 т.п.о. геномной ДНК, полученной из частей локуса Trpa1 мыши, которые фланкируют последовательность 45,3 т.п.о. гена Trpa1 мыши, являющегося мишенью для делеций. В отдельных экспериментах, Trpa1 гуманизированный LTVEC комбинировали с плазмидой, кодирующей Cas9, и второй плазмидой, кодирующей одну из восьми гРНК (А, А2, В, С, D, Е2, Е и F; см. таблицу 1), предназначенную для создания двухцепочечных разрывов внутри участка гена Trpa1 мыши, который был нацелен на делецию. Эти гРНК были сконструированы так, чтобы избежать распознавание любой последовательности во вставленной части гена TRPA1 человека. В других экспериментах мы объединили LTVEC и Cas9-кодирующую плазмиду с плазмидами, кодирующими две разные гРНК, которые нацелены на разные сайты в гене Trpa1, который был нацелен на делецию.[000477] In another set of experiments, LTVEC were engineered to create a 45.3 kb deletion of the mouse Trpa1 (transient receptor potential cation channel, subfamily A, member 1) gene and a simultaneous replacement with a 54.5 kb fragment of the homologous human TRPA1 gene. The LTVEC contained the 54.5 kb fragment of the human TRPA1 gene flanked by homology arms containing 41.0 kb and 58.0 kb genomic DNA derived from portions of the mouse Trpa1 locus that flank the 45.3 kb sequence of the mouse Trpa1 gene targeted by the deletions. In separate experiments, Trpa1 humanized LTVEC was combined with a plasmid encoding Cas9 and a second plasmid encoding one of eight gRNAs (A, A2, B, C, D, E2, E, and F; see Table 1) designed to create double-strand breaks within the region of the mouse Trpa1 gene that was targeted for deletion. These gRNAs were designed to avoid recognizing any sequence in the inserted portion of the human TRPA1 gene. In other experiments, we combined LTVEC and a Cas9-encoding plasmid with plasmids encoding two different gRNAs that target different sites in the Trpa1 gene that was targeted for deletion.

[000478] Результаты CRISPR/Cas9-ассистированной гуманизации гена Trpa1 показаны в таблице 18 и аналогичны результатам, полученным для CRISPR/Cas9-ассистированной гуманизации генов Lrp5 и С5 (Hc). Эффективность нацеливания только с LTVEC составила 0,3%, и добавление Cas9 и гРНК увеличивало эффективность нацеливания для шести из восьми протестированных гРНК. Сочетание В и F гРНК увеличило общую эффективность нацеливания на Trpa1 до 3,4% за счет увеличения частоты гетерозиготных, гемизиготных и гомозиготных событий нацеливания. Мы также обнаружили клоны ЭС-клеток с большими CRISPR-индуцированными делециями на обоих аллелях (наблюдаемые с частотой 0,3%).[000478] The results of CRISPR/Cas9-assisted humanization of the Trpa1 gene are shown in Table 18 and are similar to those obtained for CRISPR/Cas9-assisted humanization of the Lrp5 and C5 (Hc) genes. The targeting efficiency with LTVEC alone was 0.3%, and the addition of Cas9 and gRNA increased the targeting efficiency for six of the eight gRNAs tested. The combination of B and F gRNAs increased the overall targeting efficiency of Trpa1 to 3.4% by increasing the frequency of heterozygous, hemizygous, and homozygous targeting events. We also detected ES cell clones with large CRISPR-induced deletions on both alleles (observed at a frequency of 0.3%).

[000479][000479]

[000480] Как показывают эти примеры, использование двойных направляющих РНК в широко разделенных сайтах улучшило усиление гетерозиготной гуманизации по сравнению с одиночными гРНК. Кроме того, использование двойных направляющих РНК способствует развитию биаллельных событий по сравнению с одиночными гРНК. В отличие от нацеливания на одну гРНК, нацеливание на две гРНК приводит к созданию гомозиготно нацеленных клеток (Hum/Hum), в которых оба аллеля обладали направленной гуманизацией, гомозиготно удаленными клетками (Δ/Δ), в которых ни один аллель не был нацелен с помощью гуманизации LTVEC, но обе имели большие делеции, и гемизиготно нацеленные клетки (Hum/Δ), в которых один аллель имел направленную гуманизацию, а другой имел большую двойную гРНК/Cas9-индуцированную делецию. Во-первых, мы нашли правильно нацеленные клоны, которые имели точные и идентичные очень большие гуманизации на обоих аллелях-мишенях (например, клетки, которые были гомозиготными по нацеленной модификации гена). Хотя гомозиготно нацеленные клоны также наблюдались, когда мы использовали одну гРНК для достижения гуманизации Lrp5, они происходили с гораздо меньшей частотой, чем, когда мы использовали две гРНК (см. Таблицу 13). Аналогично, мы не наблюдали гомозиготного нацеливания при использовании одной гРНК для достижения гуманизации С5 (Hc) или гуманизации Trpa1, но мы наблюдали гомозиготное нацеливание при использовании двух гРНК с направленным вектором (см. Таблицы 15 и 18). Точно так же мы нашли правильно нацеленные клоны, которые были гемизиготными по модификации гена (т.е. они имели точно нацеленную гуманизацию на один аллель и очень большую, иногда генную абляцию, делецию на другом аллеле) для нацеливания на Lrp5, нацеливания на С5 (Hc), нацеливания на Ror1 и нацеливания на Trpa1. Таких модификаций вообще не происходило при использовании одной гРНК для достижения гуманизации Lrp5, С5 (Hc), Ror1 или Trpa1 (см. Таблицы 13, 15, 17 и 18 соответственно).[000480] As these examples demonstrate, the use of dual guide RNAs at widely separated sites improved the amplification of heterozygous humanization compared to single gRNAs. Furthermore, the use of dual guide RNAs favored the development of biallelic events compared to single gRNAs. In contrast to targeting a single gRNA, targeting two gRNAs resulted in the generation of homozygously targeted cells (Hum/Hum) in which both alleles had targeted humanization, homozygously deleted cells (Δ/Δ) in which neither allele was targeted by LTVEC humanization but both had large deletions, and hemizygously targeted cells (Hum/Δ) in which one allele had targeted humanization and the other had a large dual gRNA/Cas9-induced deletion. First, we found correctly targeted clones that had precise and identical very large humanizations on both target alleles (e.g., cells that were homozygous for the targeted gene modification). Although homozygous targeted clones were also observed when we used a single gRNA to achieve Lrp5 humanization, they occurred at a much lower frequency than when we used two gRNAs (see Table 13). Similarly, we did not observe homozygous targeting when using a single gRNA to achieve C5 (Hc) humanization or Trpa1 humanization, but we did observe homozygous targeting when using two gRNAs with a targeting vector (see Tables 15 and 18). Similarly, we found correctly targeted clones that were hemizygous for a gene modification (i.e., they had a precisely targeted humanization on one allele and a very large, sometimes gene-ablative, deletion on the other allele) for targeting Lrp5, targeting C5(Hc), targeting Ror1, and targeting Trpa1. No such modifications occurred at all when using a single gRNA to achieve humanization of Lrp5, C5(Hc), Ror1, or Trpa1 (see Tables 13, 15, 17, and 18, respectively).

[000481] Во-вторых, мы обнаружили клоны, которые имели идентичные очень большие делеции (>45 т.п.о.), индуцированные событиями расщепления Cas9, управляемыми обеими гРНК на обоих нацеленных аллелях (т.е. клетки были гомозиготными по большой, иногда генно-абляционной, делеции в локусе-мишени). Эти типы мутаций не требуют нацеливающего вектора, направленного против того же гена. Например, как показано в таблице 15, мы получили ЭС-клетки с гомозиготными CRISPR-индуцированными делециями, путем объединения Cas9 и двух гРНК с направленным вектором, направленным против другого гена, не связанного с геном, на который нацелены гРНК. Таким образом, нуклеаза Cas9, управляемая двумя гРНК, может индуцировать большую делецию в клетках без добавления нацеливающего вектора. В таких случаях временный или стабильный лекарственный отбор, обеспечиваемый вектором, который экспрессирует ген лекарственной устойчивости, может облегчить выделение редких гомозиготных делеционных клонов путем обогащения ЭС-клеток, которые поглощают ДНК.[000481] Second, we found clones that had identical very large deletions (>45 kb) induced by Cas9 cleavage events driven by both gRNAs on both targeted alleles (i.e., the cells were homozygous for a large, sometimes gene-ablative, deletion at the target locus). These types of mutations do not require a targeting vector directed against the same gene. For example, as shown in Table 15, we generated ES cells with homozygous CRISPR-induced deletions by combining Cas9 and two gRNAs with a targeting vector directed against a different gene unrelated to the gene targeted by the gRNAs. Thus, Cas9 nuclease driven by two gRNAs can induce a large deletion in cells without the addition of a targeting vector. In such cases, transient or stable drug selection provided by a vector that expresses a drug resistance gene may facilitate the isolation of rare homozygous deletion clones by enriching ES cells that take up the DNA.

Пример 6. Анализ больших делеции, вызванных комбинированными гРНК.Example 6. Analysis of large deletions caused by combined gRNAs.

Аллельные структуры для больших делеции, индуцированных комбинированными гРННAllelic patterns for large deletions induced by combined rRNFs

[000482] Дополнительный анализ последовательности проводили на клонах, содержащих большие делеции, индуцированные событиями расщепления Cas9, управляемыми двумя гРНК (см. Таблицу 19). Эти большие делеций, по-видимому, не зависят от событий LTVEC-направленной гомологичной рекомбинации в том же локусе, поскольку мы получили большие делеций в локусе Lrp5 примерно с той же частотой, когда мы объединили гРНК либо с LTVEC Lrp5, либо с одной, направленной на ген Ch25h почти 30 Мб (данные не показаны). Чтобы охарактеризовать большие делеций, мы провели ПЦР, охватывающую делецию, для 40 клонов, 15 гемизиготных и 25 с биаллельными крупными делециями, из шести гуманизации и сиквенированных отдельных клонов продуктов ПЦР. Последовательности подтвердили большие делеций, которые варьировались от 38 т.п.о. до 109 т.п.о. Три из клонов ЭС-клеток (Lrp5 клоны AW-A8 и BP-D3 и Adamts5 клон Х-В11) имели идеально восстановленные точные делеций (68,2 т.п.о.) между предсказанными сайтами расщепления Cas9, в то время как один клон (Hc клон Р-В12) имел вставку одной пары оснований в дополнение к делеций 38,1 т.п.о. Двадцать семь из клонов ЭС-клеток имели делеций, которые выходили за пределы сайтов расщепления Cas9, что согласуется с неточной репарацией посредством негомологичного соединения конца (NHEJ). Оставшиеся девять клонов ЭС-клеток имели мутации, которые объединяли очевидные NHEJ-индуцированные делеций и вставки (например, клон Lrp5 BP-F6 и клон Hc O-Е4), пять из которых имели вставки размером более чем 200 п.о., которые мы могли сопоставить с их источником геномных локусов (данные не показаны). Вставка длиной 210 п.о. в клоне Lrp5 ВО-Е9 находилась в инвертированной ориентации относительно идентичной последовательности, лежащей примерно в 2600 п.о. за пределами сайта-мишени гРНК F в центромерном направлении (хромосома 19+, 3589138-3589347). Эта последовательность присутствовала в длинном 3' плече гомологии Lrp5 LTVEC. Клоны Lrp5 BP-F6 и BP-G7 были получены из эксперимента, в котором мы объединили Lrp5 гРНК А и F с Cas9 и LTVEC, который нацелен на ген Ch25h на расстоянии 30 Мб от Lrp5 в теломерном направлении. Клон BP-F6 имел вставку размером 266 п.о., которая, по-видимому, происходила от одного конца LTVEC Ch25h, поскольку он состоял из фрагмента длиной 103 п.о., идентичного части вектора остова, связанной с фрагментом длиной 163 п.о., который был идентичен последовательности около Ch25h и также присутствует в длинном плече LTVEC (хромосома 19+, 34478136-34478298); этот фрагмент был вставлен при делеций в инвертированной ориентации по отношению к эндогенной хромосомной последовательности. Hc клон O-Е4 имел вставку размером 254 п.о., которая была инвертирована относительно идентичной последовательности, обнаруженной в удаленной последовательности, приблизительно на расстоянии 3,1 т.п.о. от последовательности, узнаваемой гРНК А. Вставка длиной 1304 п.о. в Hc клон S-D5 была составлена из двух фрагментов: кусок размером в 1238 п.о., который находился в той же ориентации, что и идентичная последовательность, обнаруженная в удаленной последовательности, на расстоянии приблизительно 1,4 т.п.о. от предсказанного гРНК Е2-направленного сайта расщепления Cas9, и второй кусок размером в 66 п.о., который представлял собой дупликацию в инвертированной ориентации идентичной последовательности в 25 п.о. вне сайта разрезания гРНК Е2.[000482] Additional sequence analysis was performed on clones containing large deletions induced by Cas9 cleavage events driven by the two gRNAs (see Table 19). These large deletions appear to be independent of LTVEC-directed homologous recombination events at the same locus, as we obtained large deletions at the Lrp5 locus at approximately the same frequency when we combined gRNAs with either LTVEC Lrp5 or one targeting the nearly 30 Mb Ch25h gene (data not shown). To characterize the large deletions, we performed deletion-spanning PCR on 40 clones, 15 hemizygous and 25 with biallelic large deletions, from the six humanized and sequenced individual clones of the PCR products. Sequences confirmed the large deletions, which ranged from 38 kb to 10 kb. Three of the ES cell clones (Lrp5 clones AW-A8 and BP-D3 and Adamts5 clone X-B11) had perfectly repaired precise deletions (68.2 kb) between the predicted Cas9 cleavage sites, while one clone (Hc clone P-B12) had a single base pair insertion in addition to the 38.1 kb deletion. Twenty-seven of the ES cell clones had deletions that extended beyond the Cas9 cleavage sites, consistent with imprecise repair via non-homologous end joining (NHEJ). The remaining nine ES cell clones had mutations that combined apparent NHEJ-induced deletions and insertions (e.g., Lrp5 clone BP-F6 and Hc O-E4 clone), five of which had insertions larger than 200 bp that we could map to their source genomic loci (data not shown). The 210 bp insertion in Lrp5 clone BO-E9 was in an inverted orientation relative to an identical sequence lying approximately 2,600 bp beyond the F gRNA target site in the centromeric direction (chromosome 19+, 3589138-3589347). This sequence was present in the long 3′ arm of Lrp5 homology in LTVEC. Lrp5 clones BP-F6 and BP-G7 were obtained from an experiment in which we combined Lrp5 gRNAs A and F with Cas9 and LTVEC, which targets the Ch25h gene 30 Mb telomeric to Lrp5. Clone BP-F6 had a 266 bp insert that appeared to originate from one end of LTVEC Ch25h, as it consisted of a 103 bp fragment identical to part of the backbone vector linked to a 163 bp fragment that was identical to sequence near Ch25h and also present in the long arm of LTVEC (chromosome 19+, 34478136-34478298); this fragment was inserted by deletion in an inverted orientation with respect to the endogenous chromosomal sequence. Hc clone O-E4 had a 254 bp insert that was inverted relative to the identical sequence found in the deleted sequence, approximately 3.1 kb from the gRNA A recognition sequence. The 1304 bp insert in Hc clone S-D5 was composed of two fragments: a 1238 bp piece that was in the same orientation as the identical sequence found in the deleted sequence, approximately 1.4 kb from the predicted gRNA E2-directed Cas9 cleavage site, and a second 66 bp piece that was a duplication in inverted orientation of the identical sequence 25 bp outside the E2 gRNA cleavage site.

[000483][000483]

Доказательства конверсии генов в гомозиготных аллеляхEvidence of gene conversion in homozygous alleles

[000484] Двадцать четыре из двадцати пяти клонов ЭС-клеток с биаллельными крупными делециями имели только одну уникальную последовательность (таблица 19), что указывает на то, что они были гомозиготными аллелями. Для Hc клона S-A11 мы нашли ту же последовательность в 11 из 12 ПЦР клонов. Одиночный клон с другой последовательностью может указывать на два разных делеционных аллеля, но мы также обнаружили один и тот же результат для двух гемизиготных Hc клонов, N-D11 и O-F12. Различные гомозиготные делеционные аллели во многих клонах позволяют предположить, что они могли возникнуть по механизму конверсии генов, в котором делеция на одной хромосоме служила матрицей для гомологичной рекомбинационной репарации Cas9 расщеплений на гомологичной хромосоме. Мы использовали гибридную композицию 129S6SvEvTac (129) и C57BL/6NTac (В6) F1 клеточной линии VGF1 ЭС (Poueymirou et al. (2007) Nat. Biotechnol. 25:91-99; Valenzuela et al. (2003) Nat. Biotechnol. 21: 652-659) для анализа конверсии генов в виде потери гетерозиготности (Lefebvre et al. (2001) Nat. Genet. 27: 257-258) для структурных (SV) и однонуклеотидных (SNV) вариантов между линиями вокруг локуса Lrp5 на хромосоме 19 (см. фигуру 12 для пяти SV-анализов и десяти SNV-анализов, использованных ниже) и локуса Hc на хромосоме 2 (не показано). Чтобы подтвердить, что любая потеря гетерозиготности не была результатом потери всей хромосомы, мы выполнили анализы количества копий хромосом (CCN) в сайтах, которые были идентичны между линиями 129 и В6. Для Lrp5 гуманизированных или удаленных аллелей мы проанализировали многие SV и SNV, расположенные на расстоянии 1,2 Мб от Lrp5 в теломерном направлении до конца длинного плеча хромосомы 19 (фигура 12). Из-за местоположения Lrp5 вблизи центромеры мы не обнаружили SV и только одно SNV на центромерной стороне гена. Для Hc мы смогли проанализировать многие SV и SNV с обеих сторон гена в хромосоме 2 (не показано). Результаты для шести клонов Lrp5 показаны на фигуре 15А-Е и 16А-С.[000484] Twenty-four of the twenty-five ES cell clones with biallelic large deletions had only one unique sequence (Table 19), indicating that they were homozygous alleles. For the Hc clone S-A11, we found the same sequence in 11 of 12 PCR clones. A single clone with a different sequence could indicate two different deletion alleles, but we also found the same result for two hemizygous Hc clones, N-D11 and O-F12. The different homozygous deletion alleles in many clones suggest that they may have arisen by a gene conversion mechanism in which a deletion on one chromosome served as a template for homologous recombinational repair of Cas9 cleavages on the homologous chromosome. We used a hybrid composition of 129S6SvEvTac (129) and C57BL/6NTac (B6) F1 VGF1 ES cell line (Poueymirou et al. (2007) Nat. Biotechnol. 25:91–99; Valenzuela et al. (2003) Nat. Biotechnol. 21: 652–659) to analyze gene conversion as loss of heterozygosity (Lefebvre et al. (2001) Nat. Genet. 27: 257–258) for structural (SV) and single nucleotide (SNV) variants between lines around the Lrp5 locus on chromosome 19 (see Figure 12 for the five SV and ten SNV analyses used below) and the Hc locus on chromosome 2 (not shown). To confirm that any loss of heterozygosity was not the result of loss of an entire chromosome, we performed chromosome copy number (CCN) analyses at sites that were identical between lines 129 and B6. For the Lrp5 humanized or deleted alleles, we analyzed many SVs and SNVs located 1.2 Mb telomeric from Lrp5 to the end of the long arm of chromosome 19 (Figure 12). Because of the location of Lrp5 near the centromere, we detected no SVs and only one SNV on the centromeric side of the gene. For Hc, we were able to analyze many SVs and SNVs on both sides of the gene on chromosome 2 (not shown). The results for the six Lrp5 clones are shown in Figures 15A–E and 16A–C.

[000485] На фигуре 15А-Е показаны результаты пяти анализов SV, чьи позиции варьировались от 13,7 Мб от Lrp5 до 56,7 Мб рядом с теломерным концом длинного плеча. В результате пяти SV-анализов были получены два продукта разных размеров для аллелей 129 (больше) и В6 (меньше) в контролях 129, В6 и VGF1. Приблизительные положения SV-анализов на карте хромосомы 19 показаны на фигуре 12 (см. анализ SV 13,7, анализ SV 20,0, анализ SV 36,9, анализ SV 48,3 и анализ SV 56,7). Номер анализа представляет количество Мб теломера до Lrp5. Прайллеры для этих анализов показаны в Таблице 1, а результаты показаны на Фигуре 15А-Е. Два из клонов, ВС-Н9 (Lrp5Hum/Hum, гРНК В2) и BR-B4 (Lrp5Hum/Hum, гРНК D), продемонстрировали потерю гетерозиготности, которая сохранила все аллели В6 SV, в то время как третий клон, BO-А8 (Lrp5Hum/Hum, гРНК А+F), сохранил все 129 аллелей. Остальные три клона, BO-F10 (Lrp5Hum/Hum, гРНК А+F), BO-G11 (Lrp5Hum/Hum, гРНК А+F) и BP-G7 (Lrp5Δ/Δ, гРНК А+F), остались гетерозиготными.[000485] Figure 15A-E shows the results of five SV assays whose positions ranged from 13.7 Mb from Lrp5 to 56.7 Mb near the telomeric end of the long arm. The five SV assays yielded two different sized products for the 129 (larger) and B6 (smaller) alleles in the 129, B6, and VGF1 controls. The approximate positions of the SV assays on the chromosome 19 map are shown in Figure 12 (see SV 13.7 assay, SV 20.0 assay, SV 36.9 assay, SV 48.3 assay, and SV 56.7 assay). The assay number represents the number of Mb of telomere before Lrp5. The primers for these assays are shown in Table 1 and the results are shown in Figure 15A-E. Two of the clones, BC-H9 (Lrp5 Hum/Hum , gRNA B2) and BR-B4 (Lrp5 Hum/Hum , gRNA D), showed loss of heterozygosity that retained all B6 SV alleles, while the third clone, BO-A8 (Lrp5 Hum/Hum , gRNA A+F), retained all 129 alleles. The remaining three clones, BO-F10 (Lrp5 Hum/Hum , gRNA A+F), BO-G11 (Lrp5 Hum/Hum , gRNA A+F), and BP-G7 (Lrp5 Δ/Δ , gRNA A+F), remained heterozygous.

[000486] Кроме того, одиночные нуклеотидные варианты (SNV) между аллелями 129 и В6 были проанализированы с помощью анализа аллельной дискриминации TAQMAN®. Приблизительные положения анализов SNV на карте хромосом 19 на фигуре 12 показаны стрелками с номерами анализов внизу, а их расстояния (в Мб) от локуса Lrp5 приведены ниже. Расстояния (в Мб) от локуса Lrp5 следующие: 0,32 центромера Lrp5 (С2), 1,2 теломера Lrp5 (Т3), 11,1 теломера Lrp5 (Т6), 13,2 теломера Lrp5 (11), 17,5 теломера Lrp5 (18), 25,8 теломера Lrp5 (19), 33,0 теломера Lrp5 (110), 38,3 теломера Lrp5 (111), 49,6 теломера Lrp5 (113) и 57,2 теломера Lrp5 (Т14). 129-специфичные и В6-специфичные зонды и пары праймеров показаны в таблице 1. Результаты для трех клонов (ВС-Н9, ВО-А8 и BR-B4), которые показали теломерную потерю гетерозиготности (LOH) с помощью SV-анализов, показаны на фигуре 16А-С. Анализы SNV (фигура 16А-С и данные не показаны) подтвердили события конверсии генов на длинном плече хромосомы 19 на теломерной стороне Lrp5 (SNV 1,2 и SNV 57,2; см. фигуру 16 В и фигуру 16С соответственно), но анализ SNV 0,32 (см. фигуру 16А) показал, что все клоны оставались гетерозиготными для аллеля в 320 т.п.о. от Lrp5 на центромерной стороне. Из 24 проанализированных клонов Lrp5Hum/Hum или Lrp5Δ/Δ мы обнаружили шесть, у которых были признаки потери гетерозиготности по всему длинному плечу хромосомы 19 на теломерной стороне Lrp5. Пять из клонов (четыре Lrp5Hum/Hum и один Lrp5Δ/Δ) превращаются из гетерозиготных в гомозиготные В6, а шестой клон (Lrp5Hum/Hum) превращается в гомозиготный 129. Анализы CCN продемонстрировали сохранение двух копий хромосомы 19. Аналогичные анализы потери гетерозиготности для 21 гомозиготных Hc клона показали, что два, R-E2 (HcHum/Hum, гРНК А+F) и R-E8 (НсΔ/Δ, гРНК А+F), показали потерю гетерозиготности по отношению к гомозиготным 129 для всех SV и SNV на теломерной стороне гена Hc, сохраняя при этом гетерозиготность по всем аллелям на центромерной стороне. Анализы CCN показали отсутствие потери хромосомы 2.[000486] In addition, single nucleotide variants (SNVs) between the 129 and B6 alleles were analyzed using TAQMAN® Allelic Discrimination Analysis. The approximate positions of the SNV assays on the chromosome 19 map in Figure 12 are shown by arrows with assay numbers below, and their distances (in Mb) from the Lrp5 locus are given below. The distances (in Mb) from the Lrp5 locus are as follows: 0.32 Lrp5 centromere (C2), 1.2 Lrp5 telomere (T3), 11.1 Lrp5 telomere (T6), 13.2 Lrp5 telomere (11), 17.5 Lrp5 telomere (18), 25.8 Lrp5 telomere (19), 33.0 Lrp5 telomere (110), 38.3 Lrp5 telomere (111), 49.6 Lrp5 telomere (113), and 57.2 Lrp5 telomere (T14). The 129-specific and B6-specific probes and primer pairs are shown in Table 1. The results for three clones (BC-H9, BO-A8, and BR-B4) that showed telomeric loss of heterozygosity (LOH) by SV analyses are shown in Figures 16A–C. SNV analyses (Figures 16A–C and data not shown) confirmed gene conversion events on the long arm of chromosome 19 on the telomeric side of Lrp5 (SNVs 1.2 and SNVs 57.2; see Figure 16B and Figure 16C, respectively), but analysis of SNV 0.32 (see Figure 16A) showed that all clones remained heterozygous for the allele 320 kb from Lrp5 on the centromeric side. Of the 24 Lrp5 Hum/Hum or Lrp5 Δ/Δ clones analyzed, we found six that showed evidence of loss of heterozygosity across the entire long arm of chromosome 19 on the telomeric side of Lrp5. Five of the clones (four Lrp5 Hum/Hum and one Lrp5 Δ/Δ ) converted from heterozygous to homozygous B6, and the sixth clone (Lrp5 Hum/Hum ) converted to homozygous 129. CCN analyses demonstrated retention of two copies of chromosome 19. Similar loss of heterozygosity analyses for the 21 homozygous Hc clones showed that two, R-E2 (Hc Hum/Hum , gRNA A+F) and R-E8 (Hc Δ/Δ , gRNA A+F), showed loss of heterozygosity relative to homozygous 129 for all SVs and SNVs on the telomeric side of the Hc gene, while maintaining heterozygosity for all alleles on the centromeric side. CCN analyses showed no loss of chromosome 2.

[000487] Наши результаты впервые демонстрируют, что CRISPR/Cas9 может улучшить гомологически направленную репарацию для больших одношаговых гуманизации размером более 100 т.п.о., что расширяет возможности для крупномасштабной инженерии генома. Самым замечательным и неожиданным преимуществом объединения LTVEC и rPHK/Cas9 была их способность стимулировать гомозиготную целевую гуманизацию. Хотя в других экспериментах CRISPR/Cas9 сообщалось о биаллельных мутациях и событиях гомозиготного нацеливания, большинство этих модификаций генов и вставок были на порядки меньше, чем наши гуманизированные аллели. До использования CRISPR/Cas9 мы никогда не обнаруживали гомозиготное нацеливание с помощью LTVEC, и мы не видели одновременного нацеливания более чем на один ген, когда мы объединяли несколько LTVEC, нацеленных на отдельные гены. Учитывая этот опыт, гомозиготное rPHK/Cas9-индуцированное нацеливание, позволило предположить, что вместо двух LTVEC, по отдельности нацеливающихся на оба аллеля, начальное событие нацеливания на один аллель может служить матрицей для гомологичного превращения другого аллеля, стимулируемого одним или более разрезами Cas9. Раскрытие того факта, что двойные гРНК/Cas9-индуцированные большие биаллельные делеции также были гомозиготными (таблица 19), обеспечило дополнительную поддержку механизма конверсии генов.[000487] Our results demonstrate for the first time that CRISPR/Cas9 can improve homology-directed repair for large single-step humanizations greater than 100 kb, expanding the possibilities for large-scale genome engineering. The most remarkable and unexpected benefit of combining LTVECs and rRNA/Cas9 was their ability to promote homozygous targeted humanization. Although biallelic mutations and homozygous targeting events have been reported in other CRISPR/Cas9 experiments, most of these gene modifications and insertions were orders of magnitude smaller than our humanized alleles. Before using CRISPR/Cas9, we had never detected homozygous targeting with LTVECs, and we did not see simultaneous targeting of more than one gene when we combined multiple LTVECs targeting individual genes. Given this experience, homozygous rRNA/Cas9-induced targeting suggested that, rather than two LTVECs separately targeting both alleles, an initial targeting event on one allele may serve as a template for homologous conversion of the other allele, stimulated by one or more Cas9 cuts. The discovery that dual gRNA/Cas9-induced large biallelic deletions were also homozygous (Table 19) provided further support for a gene conversion mechanism.

[000488] Анализ потери гетерозиготности (фигура 12) продемонстрировал, что крупномасштабная конверсия генов многих аллелей, покрывающих большой фрагмент хромосомы на теломерной стороне гена-мишени, была ответственна за некоторые гомозиготные гуманизации и большие делеции. Этот тип направленной конверсии генов на большие расстояния согласуется с митотической рекомбинацией между реплицированными хроматидами гомологичных хромосом в фазе G2 клеточного цикла (Lefebvre et al. (2001) Nat. Genet. 27:257-258) (Фигура 17A-C). Хотя это объяснило лишь меньшую часть гомозиготных событий, этот механизм может обеспечить средство, с помощью которого расщепление rPHK/Cas9 может использоваться для стимулирования крупномасштабной конверсии из гетерозиготного в гомозиготного по многим аллелям на большой части хромосомы. Однако большинство гомозиготных явлений, по-видимому, были результатом локальной конверсии генов, механизм которой заслуживает дальнейшего изучения.[000488] Loss of heterozygosity analysis (Figure 12) demonstrated that large-scale gene conversion of multiple alleles covering a large fragment of the chromosome on the telomeric side of the target gene was responsible for some of the homozygous humanizations and large deletions. This type of long-distance targeted gene conversion is consistent with mitotic recombination between replicated chromatids of homologous chromosomes in the G2 phase of the cell cycle (Lefebvre et al. (2001) Nat. Genet. 27:257-258) (Figure 17A-C). Although this explained only a minority of homozygous events, this mechanism may provide a means by which rRNA/Cas9 cleavage can be used to promote large-scale heterozygous-to-homozygous conversion of multiple alleles over a large portion of a chromosome. However, most homozygous events appeared to be the result of local gene conversion, the mechanism of which deserves further study.

[000489] Дальнейшие доказательства направленной конверсии генов на большие расстояния были предоставлены с помощью анализа трех клонов, полученных после электропорации гибридных ЭС-клеток F1H4 (которые состоят из 50% линии 129SvS6 и 50% линии C57BL/6N) с плазмидами, кодирующими Lrp5 гРНК А и F, а плазмида, кодирующая Cas9, и LTVEC, который нацелен на ген Ch25h в 30 Мб от Lrp5 в теломерном направлении. Три клона первоначально были оценены как дикий тип после первичного скрининга с использованием анализов TAQMAN® внутри предсказанной делеции между 2 гРНК (500 п.о. на 5'-конце и 2 т.п.о. на 3'-конце), но последующие анализы аллельной дискриминации TAQMAN®, анализирующие только варианты нуклеотидов (SNV) между аллелями 129 и В6 неожиданно выявили потерю гетерозиготности. Использовали анализы SNV: один центромерный анализ (SNV 0,32) и два теломерных анализа (SNV 1,2 и SNV 57,2) (см. фигуру 12). Как показано в таблице 20, центромерный SNV анализ (0,32 Мб) подтвердил сохранение гетерозиготности во всех трех клонах. Однако оба теломерных анализа SNV показали, что ВР-Е7 и BP-Н4 были гомозиготными по аллелю 129, а оба теломерных анализа SNV показали, что ВР-Е6 был гомозиготным по аллелю В6. Все три клона показали сохранение двух копий хромосомы 19, и все три клона были трансгенными для нацеливания LTVEC (то есть, был нацелен на локус Ch25h). Эти результаты открывают возможность принудительной гомозиготности с помощью направленного расщепления CRISPR/Cas9.[000489] Further evidence for long-distance targeted gene conversion was provided by analysis of three clones obtained after electroporation of hybrid F1H4 ES cells (which consist of 50% 129SvS6 and 50% C57BL/6N) with plasmids encoding Lrp5 gRNAs A and F, a plasmid encoding Cas9, and LTVEC, which targets the Ch25h gene 30 Mb telomeric from Lrp5. Three clones were initially scored as wild type after primary screening using TAQMAN® assays within the predicted deletion between the two gRNAs (500 bp at the 5′ end and 2 kb at the 3′ end), but subsequent TAQMAN® allelic discrimination assays analyzing only single nucleotide variants (SNVs) between the 129 and B6 alleles unexpectedly revealed loss of heterozygosity. The SNV assays used were one centromeric assay (SNV 0.32) and two telomeric assays (SNV 1.2 and SNV 57.2) (see Figure 12). As shown in Table 20, the centromeric SNV analysis (0.32 Mb) confirmed retention of heterozygosity in all three clones. However, both telomeric SNV analyses showed that BP-E7 and BP-H4 were homozygous for the 129 allele, and both telomeric SNV analyses showed that BP-E6 was homozygous for the B6 allele. All three clones showed retention of two copies of chromosome 19, and all three clones were transgenic to target LTVEC (i.e., targeted the Ch25h locus). These results raise the possibility of forced homozygosity using targeted CRISPR/Cas9 cleavage.

[000490][000490]

[000491] Несколько возможных механизмов могут объяснить результаты, наблюдаемые в экспериментах по CRISPR/Cas9-ассистированной гуманизации LTVEC в гибридных ЭС-клетках F1H4 мыши (которые состоят из 50% линии 129SvS6 и 50% линии C57BL/6N) (см. Фигуру 18A-F). Такие механизмы могут происходить посредством реципрокного обмена хроматидами путем митотического кроссинговера (см. Фигуру 18А-С) или путем копирования хроматид посредством репликации, вызванной разрывом (см. Фигуру 18D-E). В любом случае может произойти гетерозиготная модификация, в которой хромосома 129 или хромосома В6 нацеливается с помощью LTVEC до репликации генома (см. Фигуру 18А и 18D). В качестве альтернативы, одна хроматида 129 или одна хроматида В6 может быть мишенью LTVEC после репликации генома с последующей конверсией гена между хроматидами (см. Фигуру 18В и 18Е). Альтернативно, может быть недостаток нацеливания LTVEC на геномный локус-мишень, но расщепление Cas9 может происходить на хромосоме 129 или В6 (см. Фигуру 18С и 18 F). Эта последняя возможность может объяснить результаты, наблюдаемые с клонами ВР-Е7, ВР-Н4 и ВР-Е6. Потенциальные результаты показаны на фигуре 18A-F. На фигуре 18F также можно наблюдать потерю гетерозиготности (LOH), сохраняя аллели В6, если Cas9 расщепляет хроматиду 129. В описанных выше экспериментах наблюдались события потери гетерозиготности, в результате чего оба аллеля были целевыми (Hum/Hum) или оба аллеля были аллелями дикого типа (+/+).[000491] Several possible mechanisms could explain the results observed in the CRISPR/Cas9-assisted humanization experiments of LTVEC in mouse F1H4 hybrid ES cells (which are composed of 50% 129SvS6 and 50% C57BL/6N) (see Figure 18A-F). Such mechanisms could occur through reciprocal chromatid exchange by mitotic crossing over (see Figure 18A-C) or by chromatid copying by break-induced replication (see Figure 18D-E). In either case, a heterozygous modification could occur in which chromosome 129 or chromosome B6 is targeted by LTVEC prior to genome replication (see Figure 18A and 18D). Alternatively, one chromatid 129 or one chromatid B6 could be targeted by LTVEC following genomic replication followed by gene conversion between the chromatids (see Figures 18B and 18E). Alternatively, there could be a lack of LTVEC targeting to the genomic target locus, but Cas9 cleavage could occur on chromosome 129 or B6 (see Figures 18C and 18F). This latter possibility could explain the results observed with clones BP-E7, BP-H4, and BP-E6. Potential results are shown in Figures 18A-F. In Figure 18F, loss of heterozygosity (LOH) can also be observed, retaining the B6 alleles when Cas9 cleaves chromatid 129. In the experiments described above, loss of heterozygosity events were observed whereby both alleles were targeted (Hum/Hum) or both alleles were wild-type (+/+).

Пример 7. Гомозиготное нацеливание на гены с наименьшим изменением между В6 и 129 аллелями.Example 7. Homozygous targeting of genes with the least change between the B6 and 129 alleles.

[000492] Несколько других локусов также были протестированы на гомозиготное нацеливание. В другом эксперименте, LTVEC был разработан для создания 38 т.п.о. делеции гена Adamts5 мыши (дисинтегрин и металлопротеиназа с мотивами тромбоспондина 5) и одновременной замены фрагментом в 43 т.п.о. гена ADAMTS5 человека. LTVEC содержал фрагмент размером 43 т.п.о. гена ADAMTS5 человека, фланкированный плечами гомологии, содержащий 22 т.п.о. и 46 т.п.о. геномной ДНК, полученной из частей локуса Adamts5 мыши, которые фланкируют последовательность 38 т.п.о. гена Adamts5 мыши, являющегося мишенью для делеции. В отдельных экспериментах, мы объединяли Adamts5 гуманизирующий LTVEC с плазмидой, кодирующей Cas9, и второй плазмидой или плазмидами, кодирующими одну или две из восьми огРНК (gA, gA2, gB, gC, gD, gE, gE2 и gF), предназначенных для создания двухцепочечных разрывы цепи в участке гена Adamts5 мыши, который был нацелен на делецию. Эти огРНК были сконструированы так, чтобы избежать распознавание любой последовательности во вставленной части ADAMTS5 человека.[000492] Several other loci were also tested for homozygous targeting. In another experiment, LTVEC was designed to create a 38 kb deletion of the mouse Adamts5 gene (a disintegrin and metalloproteinase with thrombospondin 5 motifs) and simultaneously replace it with a 43 kb fragment of the human ADAMTS5 gene. The LTVEC contained the 43 kb fragment of the human ADAMTS5 gene flanked by homology arms containing 22 kb and 46 kb genomic DNA derived from portions of the mouse Adamts5 locus that flank the 38 kb sequence of the mouse Adamts5 gene targeted by the deletion. In separate experiments, we combined Adamts5 humanizing LTVEC with a plasmid encoding Cas9 and a second plasmid or plasmids encoding one or two of eight ogRNAs (gA, gA2, gB, gC, gD, gE, gE2, and gF) designed to create double-strand breaks in the region of the mouse Adamts5 gene that was targeted for deletion. These ogRNAs were designed to avoid recognizing any sequence in the inserted portion of human ADAMTS5.

[000493] Результаты CRISPR/Cas9-ассистированной гуманизации гена Adamts5 показаны в таблице 21. Когда в ЭС клетки вводили только LTVEC, мы обнаружили, что ни один из 96 скринированных устойчивых к лекарству клонов не содержит правильно нацеленного моноаллельного гетерозиготного гуманизированного аллеля. Напротив, объединение LTVEC с эндонуклеазой Cas9, управляемой двумя из восьми протестированных огРНК (В и F; см. Таблицу 1), давало правильно нацеленные моноаллельные гетерозиготные мутации или гетерозиготные мутации биаллельного соединения с эффективностью 1,0%. Гомозиготных целевых модификаций не наблюдалось. В дополнительных экспериментах, гРНК А2 и Е2 также объединяли, но гомозиготного нацеливания все еще не наблюдалось.[000493] The results of CRISPR/Cas9-assisted humanization of the Adamts5 gene are shown in Table 21. When LTVEC alone was injected into ES cells, we found that none of the 96 drug-resistant clones screened contained a correctly targeted monoallelic heterozygous humanized allele. In contrast, combining LTVEC with Cas9 endonuclease driven by two of the eight gRNAs tested (B and F; see Table 1) yielded correctly targeted monoallelic heterozygous mutations or biallelic heterozygous mutations with an efficiency of 1.0%. No homozygous targeting was observed. In additional experiments, A2 and E2 gRNAs were also combined, but homozygous targeting was still not observed.

[000494][000494]

[000495] В другом эксперименте, LTVEC был разработан для создания делеции размером 79 т.п.о. гена Dpp4 мыши (дипептидил пептидазы 4) и одновременной замены фрагментом размером 82 т.п.о. гомологичного гена DPP4 человека. LTVEC содержал фрагмент размером 82 т.п.о. гена DPP4 человека, фланкированный 5' и 3' плечами гомологии, каждое из которых содержит 46 т.п.о. геномной ДНК, полученной из частей локуса Dpp4 мыши, которые фланкируют последовательность 79 т.п.о. гена Dpp4 мыши, являющегося мишенью для делеции. В отдельных экспериментах, мы объединяли Dpp4 гуманизирующий LTVEC с плазмидой, кодирующей Cas9, и второй плазмидой или плазмидами, кодирующими одну или две из восьми огРНК (gA, gB, gB2, gC, gD, gE, gE2 и gF), предназначенных для создания двухцепочечных разрывы цепи в участке гена Dpp4 мыши, который был нацелен на делецию. Эти огРНК были сконструированы так, чтобы избежать распознавание любой последовательности во вставленной части генаОРР4 человека.[000495] In another experiment, LTVEC was designed to create a 79 kb deletion of the mouse Dpp4 (dipeptidyl peptidase 4) gene and simultaneously replace it with an 82 kb fragment of the homologous human DPP4 gene. The LTVEC contained the 82 kb fragment of the human DPP4 gene flanked by 5' and 3' homology arms, each containing 46 kb of genomic DNA derived from portions of the mouse Dpp4 locus that flank the 79 kb sequence of the mouse Dpp4 gene targeted for the deletion. In separate experiments, we combined Dpp4 humanizing LTVEC with a plasmid encoding Cas9 and a second plasmid or plasmids encoding one or two of eight ogRNAs (gA, gB, gB2, gC, gD, gE, gE2, and gF) designed to create double-strand breaks in the region of the mouse Dpp4 gene that was targeted for deletion. These ogRNAs were designed to avoid recognizing any sequence in the inserted portion of the human Dpp4 gene.

[000496] Результаты гуманизации гена Dpp4 с помощью CRISPR/Cas9 показаны в таблице 22.[000496] The results of humanization of the Dpp4 gene using CRISPR/Cas9 are shown in Table 22.

Когда в ЭС клетки вводили только LTVEC, мы обнаружили, что 2,1% скринированных устойчивых к лекарству клонов не содержит правильно нацеленного ллоноаллельного гетерозиготного гуманизированного аллеля. Напротив, объединение LTVEC с эндонуклеазой Cas9, управляемой любой из восьми протестированных огРНК (А, В, В2, С, D, Е, Е2 и F; см. Таблицу 1), приводит к правильно нацеленным моноаллельным гетерозиготным мутациям с эффективностью, которая варьируется от 2,1 до 7,3%. Гомозиготных целевых модификаций не наблюдалось. В дополнительных экспериментах, гРНК А и F или гРНК А и D также объединяли, но гомозиготного нацеливания все еще не наблюдалось.When LTVEC alone was injected into ES cells, we found that 2.1% of the drug-resistant clones screened did not contain the correctly targeted monoallelic heterozygous humanized allele. In contrast, combining LTVEC with Cas9 endonuclease driven by any of the eight gRNAs tested (A, B, B2, C, D, E, E2, and F; see Table 1) resulted in correctly targeted monoallelic heterozygous mutations with efficiencies ranging from 2.1 to 7.3%. No homozygous targeting was observed. In additional experiments, gRNAs A and F or gRNAs A and D were also combined, but homozygous targeting was still not observed.

[000497][000497]

[000498] В другом эксперименте, LTVEC был разработан для создания делеций размером 55 т.п.о. гена Folh1 мыши (глутамат карбоксипептидазы 2) и одновременной замены фрагментом размером 61 т.п.о. гомологичного гена FOLH1 человека. LTVEC содержал фрагмент размером 61 т.п.о. гена FOLH1 человека, фланкированный плечами гомологии, содержащий 22 т.п.о. и 46 т.п.о. геномной ДНК, полученной из частей локуса Folh1 мыши, которые фланкируют последовательность 55 т.п.о. гена Folh1 мыши, являющегося мишенью для делеции. В отдельных экспериментах, мы объединяли Folh1 гуманизирующий LTVEC с плазмидой, кодирующей Cas9, и второй плазмидой или плазмидами, кодирующими одну или две из восьми огРНК (gA, gA2, gB, gC, gD, gF, gE и gE2), предназначенных для создания двухцепочечных разрывов цепи в участке гена Folh1 мыши, который был нацелен на делецию. Эти огРНК были сконструированы так, чтобы избежать распознавание любой последовательности во вставленной части гена FOLH1 человека.[000498] In another experiment, LTVEC were designed to create a 55 kb deletion of the mouse Folh1 (glutamate carboxypeptidase 2) gene and simultaneously replace it with a 61 kb fragment of the homologous human FOLH1 gene. The LTVEC contained the 61 kb fragment of the human FOLH1 gene flanked by homology arms containing 22 kb and 46 kb genomic DNA derived from portions of the mouse Folh1 locus that flank the 55 kb sequence of the mouse Folh1 gene targeted for deletion. In separate experiments, we combined Folh1 humanizing LTVEC with a plasmid encoding Cas9 and a second plasmid or plasmids encoding one or two of eight ogRNAs (gA, gA2, gB, gC, gD, gF, gE, and gE2) designed to create double-strand breaks in the region of the mouse Folh1 gene that was targeted for deletion. These ogRNAs were designed to avoid recognizing any sequence in the inserted portion of the human FOLH1 gene.

[000499] Результаты CRISPR/Cas9-ассистированной гуманизации гена Folh1 показаны в таблице 23. Когда в ЭС клетки вводили только LTVEC, мы обнаружили, что ни один из 96 скринированных устойчивых к лекарству клонов не содержит правильно нацеленного моноаллельного гетерозиготного гуманизированного аллеля. Напротив, объединение LTVEC с эндонуклеазой Cas9, управляемой тремя из шести протестированных огРНК (A, D, и Е2; см. Таблицу 1), приводит к правильно нацеленным моноаллельным гетерозиготным мутациям с эффективностью, которая варьируется от 1,0 до 3,1%. Гомозиготных целевых модификаций не наблюдалось. В дополнительных экспериментах, гРНК А и Е2 или гРНК А и D также объединяли, но гомозиготного нацеливания все еще не наблюдалось.[000499] The results of CRISPR/Cas9-assisted humanization of the Folh1 gene are shown in Table 23. When LTVEC alone was injected into ES cells, we found that none of the 96 drug-resistant clones screened contained a correctly targeted monoallelic heterozygous humanized allele. In contrast, combining LTVEC with Cas9 endonuclease driven by three of the six gRNAs tested (A, D, and E2; see Table 1) resulted in correctly targeted monoallelic heterozygous mutations with efficiencies ranging from 1.0 to 3.1%. No homozygous targeting was observed. In additional experiments, gRNAs A and E2 or gRNAs A and D were also combined, but homozygous targeting was still not observed.

[000500][000500]

[000501] Сумма гомозиготных целевых клонов, наблюдаемых при нацеливании на разные локусы, представлена в таблице 24.[000501] The sum of homozygous target clones observed when targeting different loci is presented in Table 24.

[000502][000502]

[000503] В этих экспериментах, гомозиготное нацеливание было самым высоким для генов с наименьшей вариацией последовательности между аллелями В6 и 129. Это изображено на фигурах 19-25.Участок внутри пунктирных вертикальныхлиний на каждой фигуре указывает на целевой участок (участок внутри 5' и 3' последовательностей-мишеней LTVEC). Например, для Lrp5 (см. фигуру 19) плечи гомологии LTVEC были разработаны на основе генома 129. Эталонной последовательностью для определения одиночных нуклеотидных вариаций была геномная последовательность линии мыши C57BL/6J от Jackson Laboratory. Эта эталонная последовательность сравнивалась с линией 129S6/SvEv от Taconic Biosciences, линией C57BL/6N от Taconic Biosciences и гибридной клеточной линией VGF1, полученной из линии 129S6/SvEv и линии C57BL/6N. Вертикальные линии представляют собой одиночные нуклеотидные вариации по сравнению с эталонной последовательностью. На фигурах 20-25 представлен аналогичный анализ для Hc, Trpa1, Adamts5, Folh1, Dpp4, Ror1 и CD3 соответственно.[000503] In these experiments, homozygous targeting was highest for genes with the least sequence variation between the B6 and 129 alleles. This is depicted in Figures 19-25. The region within the dashed vertical lines in each figure indicates the target region (the region within the 5' and 3' of the LTVEC target sequences). For example, for Lrp5 (see Figure 19), the LTVEC homology arms were designed based on the 129 genome. The reference sequence for determining single nucleotide variations was the genomic sequence of the C57BL/6J mouse strain from the Jackson Laboratory. This reference sequence was compared to the 129S6/SvEv line from Taconic Biosciences, the C57BL/6N line from Taconic Biosciences, and a hybrid VGF1 cell line derived from the 129S6/SvEv line and the C57BL/6N line. The vertical bars represent single nucleotide variations compared to the reference sequence. Figures 20–25 show a similar analysis for Hc, Trpa1, Adamts5, Folh1, Dpp4, Ror1, and CD3, respectively.

[000504] Как показано в таблице 24 и на фигурах 19-25, наибольшее количество нацеленных гомозиготных клонов было продуцировано в локусе Lrp5 (12 гомозиготных клонов) и локусе Нс/С5 (4 гомозиготных клона). Каждый из этих геномных локусов-мишеней имел очень мало единичных нуклеотидных вариаций, особенно в или около последовательностей, распознаваемых гРНК, или фланкирующих участок, являющийся мишенью для делеций и замены (см. Фигуру 19 (Lrp5) и 20 (С5)).[000504] As shown in Table 24 and Figures 19-25, the largest number of targeted homozygous clones were produced at the Lrp5 locus (12 homozygous clones) and the Hc/C5 locus (4 homozygous clones). Each of these target genomic loci had very few single nucleotide variations, particularly in or near the gRNA recognition sequences or flanking the region targeted for deletions and substitutions (see Figures 19 (Lrp5) and 20 (C5)).

[000505] Напротив, гомозиготное нацеливание было низким или отсутствовало для генов с высокой плотностью вариации аллельной последовательности между аллелями В6 и 129, особенно в или около последовательностей, распознаваемых гРНК, или фланкирующих участок, являющуюся мишенью для делеций и замены. Например, при нацеливании на локусы Adamts5, Folh1, Dpp4 или Ror1 не было получено гомозиготных клонов (Фигуры 22-25, соответственно). Однако при нацеливании на локус Trpa1 был получен гомозиготный клон, который имеет высокую плотность вариации аллельной последовательности 3' участка, являющегося мишенью для делеций и замены, но низкую плотность вариации аллельной последовательности 5' участка, являющегося мишенью для делеций и замены (т.е. в или около 5'-последовательности, распознаваемой гРНК) (Фигура 21).[000505] In contrast, homozygous targeting was low or absent for genes with a high density of allelic sequence variation between the B6 and 129 alleles, particularly in or near gRNA recognition sequences or flanking the region targeted for deletions and substitutions. For example, targeting the Adamts5, Folh1, Dpp4, or Ror1 loci did not yield homozygous clones (Figures 22-25, respectively). However, when targeting the Trpa1 locus, a homozygous clone was obtained that has a high density of allelic sequence variation in the 3' region targeted for deletions and substitutions, but a low density of allelic sequence variation in the 5' region targeted for deletions and substitutions (i.e., in or near the 5' sequence recognized by the gRNA) (Figure 21).

Пример 8. Использование направленных векторов, созданных против каждой хромосомы в гомологичной хромосомной паре, не увеличивает гомозиготное нацеливание.Example 8: Using targeted vectors generated against each chromosome in a homologous chromosome pair does not increase homozygous targeting.

[000506] Чтобы дополнительно проверить, генерировались ли гомозиготные нацеленные модификации с помощью независимых событий нацеливания на каждую хромосому в гомологичной паре хромосом или с помощью события нацеливания на одну хромосому в гомологичной паре хромосом, а затем конверсии гена или потери гетерозиготности даже между гомологичной парой хромосом, был нацелен другой геномный локус, который имеет большое количество вариаций аллельной последовательности между гомологичной парой хромосом в или около последовательности, распознаваемой гРНК, или фланкирующей участок, являющийся мишенью для делеций и замены. См., например, Фигура 26. Это позволило нам изучить влияние аллельных вариаций на гомозиготное разрушение или гомозиготное нацеливание. Участок внутри пунктирных вертикальных линий является участком-мишенью (участок внутри 5 'и 3' последовательностей-мишеней LTVEC). Эталонной последовательностью для определения одиночных нуклеотидных вариаций была геномная последовательность линии мыши C57BL/6J от Jackson Laboratory. Эта эталонная последовательность сравнивалась с вариантом MP линии 129S6/SvEv от Taconic Biosciences, вариантом RGC линии C57BL/6N от Taconic Biosciences и гибридной клеточной линией VGF1, полученной из линии 129S6/SvEv и линии C57BL/6N (представленного в трех рядах в нижней части фигуры). Вертикальные линии в каждом из трех рядов представляют собой одиночные нуклеотидные вариации по сравнению с эталонной последовательностью.[000506] To further test whether homozygous targeted modifications were generated by independent targeting events on each chromosome in a homologous chromosome pair or by a targeting event on a single chromosome in a homologous chromosome pair followed by gene conversion or loss of heterozygosity even between the homologous chromosome pair, another genomic locus that has a large amount of allelic sequence variation between the homologous chromosome pair at or near the gRNA recognition sequence or flanking the region targeted for deletion and substitution was targeted. See, for example, Figure 26. This allowed us to study the effect of allelic variation on homozygous disruption or homozygous targeting. The region within the dotted vertical lines is the target region (the region within the 5' and 3' of the LTVEC target sequences). The reference sequence for identifying single nucleotide variations was the genomic sequence of the C57BL/6J mouse strain from the Jackson Laboratory. This reference sequence was compared with the MP variant of the 129S6/SvEv strain from Taconic Biosciences, the RGC variant of the C57BL/6N strain from Taconic Biosciences, and the hybrid cell line VGF1 derived from the 129S6/SvEv strain and the C57BL/6N strain (shown in the three rows at the bottom of the figure). The vertical lines in each of the three rows represent single nucleotide variations compared to the reference sequence.

[000507] В этом эксперименте два LTVEC были спроектированы для создания делеции мышиного локуса размером 33 т.п.о. и одновременной замены фрагментом размером 34,5 т.п.о., включающим три сегмента (6,8 т.п.о., 0,1 т.п.о. и 1,7 т.п.о.) ортологичного гена человека с промежуточными сегментами локуса мыши между человеческими сегментами. Эксперименты были выполнены с VGF1 (F1H4), нашей гибридной XY ЭС-клеточной линией C57BL6NTac/129S6SvEvF1 (Poueymirou et al. (2007) Nat Biotechnol. 25:91-99; Valenzuela et al. (2003) Nat. Biotechnol. 21:652-659). ЭС клетки культивировали, как описано ранее (Matise et al. (2000) in Joyner, A.L. ed. Gene Targeting: a practical approach, pp.100-132, Oxford University Press, Нью-Йорк). Клетки VGF1 были созданы путем скрещивания самки мыши C57BL/6NTac с самцом мыши 129S6/SvEvTac для получения мышей C57BL6(XB6)/129S6(Y129). См. Фигуру 7.[000507] In this experiment, two LTVECs were engineered to create a 33 kb deletion of the mouse locus and a simultaneous replacement with a 34.5 kb fragment comprising three segments (6.8 kb, 0.1 kb, and 1.7 kb) of the human orthologous gene with intervening segments of the mouse locus between the human segments. The experiments were performed with VGF1(F1H4), our C57BL6NTac/129S6SvEvF1 XY hybrid ES cell line (Poueymirou et al. (2007) Nat Biotechnol. 25:91–99; Valenzuela et al. (2003) Nat. Biotechnol. 21:652–659). ES cells were cultured as described previously (Matise et al. (2000) in Joyner, AL ed. Gene Targeting: a practical approach, pp.100-132, Oxford University Press, New York). VGF1 cells were generated by crossing a female C57BL/6NTac mouse with a male 129S6/SvEvTac mouse to produce C57BL6(X B6 )/129S6(Y 129 ) mice. See Figure 7.

[000508] Один LTVEC имел плечи гомологии, сконструированные против хромосомы 129 в клетках VGF1, и включал в себя кассету для селекции Neo (MAID # 7170), а другой LTVEC имел плечи гомологии, сконструированные против хромосомы C57BL6, и включал кассету для селекции Hyg (MAID # 7314). В остальном два LTVEC были одинаковыми.[000508] One LTVEC had homology arms engineered against chromosome 129 in VGF1 cells and included a Neo selection cassette (MAID#7170), and the other LTVEC had homology arms engineered against chromosome C57BL6 and included a Hyg selection cassette (MAID#7314). The two LTVECs were otherwise identical.

[000509] В отдельных экспериментах мы объединили два гуманизированных LTVEC с плазмидой, кодирующей Cas9, и второй плазмидой или плазмидой, кодирующей четыре огРНК (mGU, mGU2, mGD, mGD2), предназначенных для создания двухцепочечных разрывов в участке гена мыши, который являлся мишенью для делеции. Эти огРНК были сконструированы так, чтобы избежать распознавание любой последовательности во вставленной части человеческого гена.[000509] In separate experiments, we combined two humanized LTVECs with a plasmid encoding Cas9 and a second plasmid or a plasmid encoding four ogRNAs (mGU, mGU2, mGD, mGD2) designed to create double-strand breaks in the region of the mouse gene that was targeted for deletion. These ogRNAs were designed to avoid recognizing any sequence in the inserted portion of the human gene.

[000510] Всего был проведен скрининг 192 клонов Neo+, 128 клонов Hyg+ и 16 клонов Neo+/Hyg+. Комбинирование LTVEC с эндонуклеазой Cas9, управляемой четырьмя огРНК, привело к образованию некоторых гетерозиготно нацеленных клонов, гемизиготно нацеленных клонов, клонов с двойным разрушением, гетерозиготно нацеленных клонов с делециями NHEJ, клонов с биаллельными делециями NHEJ, и гетерозиготно разрушенных клонов с NHEJ делециями. Однако, гомозиготных клонов-мишеней не наблюдалось. Это говорит о том, что события локальной конверсии генов ответственны за гомозиготно нацеленные клоны, наблюдаемые в других экспериментах, а не за отдельные события нацеливания на каждую хромосому в пределах гомологичной пары хромосом. Если независимые события нацеливания на каждую хромосому в пределах гомологичной пары хромосом ответственны за гомозиготно нацеленные клоны, наблюдаемые в других экспериментах, можно ожидать, что использование двух направленных векторов, специально предназначенных для каждой из двух хромосом в пределах гомологичной пары хромосом, приведет к получению гомозиготно нацеленных клонов, несмотря на высокий процент вариации аллельных последовательностей в 5'- и 3'-последовательностях-мишенях для 5'- и 3'-плечах гомологии, поскольку нацеливающие векторы, предназначенные для каждого адреса хромосомы, которые имеют вариации аллельных последовательностей в 5'- и 3'-последовательностях-мишенях. Однако использование двух LTVEC не давало любых гомозиготно нацеленных клонов. Это также подтверждает идею о том, что гомозиготно нацеленные модификации или продуцируются в результате локальных событий конверсии генов, как изображено на фигуре 27. Мы наблюдали локальную потерю гетерозиготности по обеим сторонам целевых делеции и вставок с более высокой скоростью, чем полярную генную конверсию.[000510] A total of 192 Neo+, 128 Hyg+, and 16 Neo+/Hyg+ clones were screened. Combining LTVEC with the four ogRNA-guided Cas9 endonuclease resulted in some heterozygous targeted clones, hemizygous targeted clones, double disruption clones, heterozygous targeted clones with NHEJ deletions, clones with biallelic NHEJ deletions, and heterozygous disruption clones with NHEJ deletions. However, no homozygous targeted clones were observed. This suggests that local gene conversion events are responsible for the homozygous targeted clones observed in other experiments rather than separate targeting events on each chromosome within a homologous chromosome pair. If independent targeting events on each chromosome within a homologous chromosome pair are responsible for the homozygously targeted clones observed in other experiments, one would expect that using two targeting vectors specifically designed for each of the two chromosomes within a homologous chromosome pair would result in homozygously targeted clones despite the high percentage of allelic sequence variation in the 5' and 3' target sequences for the 5' and 3' arms of homology, since targeting vectors designed for each chromosome address allelic sequence variations in the 5' and 3' target sequences. However, using two LTVECs did not yield any homozygously targeted clones. This also supports the idea that homozygosity-targeted modifications are either produced by local gene conversion events, as depicted in Figure 27. We observed local loss of heterozygosity on both sides of targeted deletions and insertions at a higher rate than polar gene conversion.

--->--->

Перечень последовательностейList of sequences

<110> Regeneron Pharmaceuticals, Inc.<110> Regeneron Pharmaceuticals, Inc.

<120> СПОСОБЫ НАРУШЕНИЯ ИММУНОЛОГИЧЕСКОЙ ТОЛЕРАНТНОСТИ С ИСПОЛЬЗОВАНИЕМ<120> WAYS TO BREAK IMMUNOLOGICAL TOLERANCE USING

МНОЖЕСТВА НАПРАВЛЯЮЩИХ РНКSET OF GUIDE RNAS

<130> 057766/497023<130> 057766/497023

<150> 62/339472 <150> 62/339472

<151> 2016-05-20 <151> 2016-05-20

<150> 62/368604 <150> 62/368604

<151> 2016-07-29 <151> 2016-07-29

<160> 152<160> 152

<170> FastSEQ для Windows версия 4.0<170> FastSEQ for Windows version 4.0

<210> 1<210> 1

<211> 23<211> 23

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Последовательность, распознаваемая направляющей РНК<223> Sequence recognized by guide RNA

<220> <220>

<221> misc_feature <221> misc_feature

<222> (2)...(21)<222> (2)...(21)

<223> n = A, T, C, или G<223> n = A, T, C, or G

<400> 1<400> 1

gnnnnnnnnn nnnnnnnnnn ngg 23gnnnnnnnnn nnnnnnnnnn ngg 23

<210> 2<210> 2

<211> 23<211> 23

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Последовательность, распознаваемая направляющей РНК<223> Sequence recognized by guide RNA

<220> <220>

<221> misc_feature <221> misc_feature

<222> (1)...(21)<222> (1)...(21)

<223> n = A, T, C, или G<223> n = A, T, C, or G

<400> 2<400> 2

nnnnnnnnnn nnnnnnnnnn ngg 23nnnnnnnnnn nnnnnnnnnn ngg 23

<210> 3<210> 3

<211> 25<211> 25

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Последовательность, распознаваемая направляющей РНК<223> Sequence recognized by guide RNA

<220> <220>

<221> misc_feature <221> misc_feature

<222> (3)...(23)<222> (3)...(23)

<223> n = A, T, C, или G<223> n = A, T, C, or G

<400> 3<400> 3

ggnnnnnnnn nnnnnnnnnn nnngg 25ggnnnnnnnn nnnnnnnnnn nnngg 25

<210> 4<210> 4

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> C5 (Hc) гРНК A ДНК-нацеливающий сегмент (100 п.о. от конечной точки<223> C5 (Hc) gRNA A DNA targeting segment (100 bp from endpoint

локуса-мишени)target locus)

<400> 4<400> 4

atcacaaacc agttaaccgg 20atcacaaacc agttaaccgg 20

<210> 5<210> 5

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> C5 (Hc) гРНК B ДНК-нацеливающий сегмент (500 п.о. от конечной точки<223> C5 (Hc) gRNA B DNA targeting segment (500 bp from endpoint

локуса-мишени)target locus)

<400> 5<400> 5

tttcagacga gccgacccgg 20tttcagacga gccgacccgg 20

<210> 6<210> 6

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> C5 (Hc) гРНК C ДНК-нацеливающий сегмент (38200 и 37500 п.о. от конечной<223> C5 (Hc) gRNA C DNA-targeting segment (38,200 and 37,500 bp from the final

точки локуса-мишени) target locus points)

<400> 6<400> 6

tgtgtgtcat agcgatgtcg 20tgtgtgtcat agcgatgtcg 20

<210> 7<210> 7

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> C5 (Hc) гРНК D ДНК-нацеливающий сегмент (43500 и 32200 п.о. от конечной<223> C5 (Hc) gRNA D DNA targeting segment (43,500 and 32,200 bp from the final

точки локуса-мишени) target locus points)

<400> 7<400> 7

aacaggtacc ctatcctcac 20aacaggtacc ctatcctcac 20

<210> 8<210> 8

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> C5 (Hc) гРНК E ДНК-нацеливающий сегмент (500 п.о. от конечной точки<223> C5 (Hc) gRNA E DNA targeting segment (500 bp from endpoint

локуса-мишени)target locus)

<400> 8<400> 8

ggcccggacc tagtctctct 20ggcccggacc tagtctctct 20

<210> 9<210> 9

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> C5 (Hc) гРНК E2 ДНК-нацеливающий сегмент (100 п.о. от конечной точки<223> C5 (Hc) gRNA E2 DNA targeting segment (100 bp from endpoint

локуса-мишени)target locus)

<400> 9<400> 9

tcgtggttgc atgcgcactg 20tcgtggttgc atgcgcactg 20

<210> 10<210> 10

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Lrp5 гРНК A ДНК-нацеливающий сегмент (50 п.о. от конечной точки<223> Lrp5 gRNA A DNA targeting segment (50 bp from the endpoint

локуса-мишени)target locus)

<400> 10<400> 10

gggaacccac agcatactcc 20gggaacccac agcatactcc 20

<210> 11<210> 11

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Lrp5 гРНК B ДНК-нацеливающий сегмент (500 п.о. от конечной точки<223> Lrp5 gRNA B DNA targeting segment (500 bp from endpoint

локуса-мишени)target locus)

<400> 11<400> 11

gaatcatgca cggctacccc 20gaatcatgca cggctacccc 20

<210> 12<210> 12

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Lrp5 гРНК B2 ДНК-нацеливающий сегмент (1000 п.о. от конечной точки<223> Lrp5 gRNA B2 DNA targeting segment (1000 bp from endpoint

локуса-мишени)target locus)

<400> 12<400> 12

tgctcctatg gggaggcgcg 20tgctcctatggggaggcgcg 20

<210> 13<210> 13

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Lrp5 гРНК C ДНК-нацеливающий сегмент (29900 и 38430 п.о. от конечной<223> Lrp5 gRNA C DNA-targeting segment (29,900 and 38,430 bp from the final

точки локуса-мишени) target locus points)

<400> 13<400> 13

actgagatca atgaccccga 20actgagatca atgaccccga 20

<210> 14<210> 14

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Lrp5 гРНК D ДНК-нацеливающий сегмент (29950 и 38380 п.о. от конечной<223> Lrp5 gRNA D DNA targeting segment (29950 and 38380 bp from the final

точки локуса-мишени) target locus points)

<400> 14<400> 14

gggtcgcccg gaacctctac 20gggtcgcccg gaacctctac 20

<210> 15<210> 15

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Lrp5 гРНК E2 ДНК-нацеливающий сегмент (1000 п.о. от конечной точки<223> Lrp5 gRNA E2 DNA targeting segment (1000 bp from endpoint

локуса-мишени)target locus)

<400> 15<400> 15

cttggataac attgataccc 20cttggataac attgataccc 20

<210> 16<210> 16

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Lrp5 гРНК E ДНК-нацеливающий сегмент (500 п.о. от конечной точки<223> Lrp5 gRNA E DNA targeting segment (500 bp from endpoint

локуса-мишени)target locus)

<400> 16<400> 16

ggggcagagc ccttatatca 20ggggcagagc ccttatatca 20

<210> 17<210> 17

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Lrp5 гРНК F ДНК-нацеливающий сегмент (50 п.о. от конечной точки<223> Lrp5 gRNA F DNA targeting segment (50 bp from endpoint

локуса-мишени)target locus)

<400> 17<400> 17

tcgctcacat taatccctag 20tcgctcacat taatccctag 20

<210> 18<210> 18

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Ror1 гРНК A ДНК-нацеливающий сегмент (200 п.о. от конечной точки<223> Ror1 gRNA A DNA-targeting segment (200 bp from the endpoint

локуса-мишени)target locus)

<400> 18<400> 18

tgtgggcctt tgctgatcac 20tgtgggcctt tgctgatcac 20

<210> 19<210> 19

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Ror1 гРНК B ДНК-нацеливающий сегмент (1000 п.о. от конечной точки<223> Ror1 gRNA B DNA targeting segment (1000 bp from the endpoint

локуса-мишени)target locus)

<400> 19<400> 19

aatctatgat cctatggcct 20aatctatgat cctatggcct 20

<210> 20<210> 20

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Ror1 гРНК D ДНК-нацеливающий сегмент (54300 и 55500 п.о. от конечной<223> Ror1 gRNA D DNA targeting segment (54,300 and 55,500 bp from the final

точки локуса-мишени) target locus points)

<400> 20<400> 20

tgccaatagc agtgacttga 20tgccaatagc agtgacttga 20

<210> 21<210> 21

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Ror1 гРНК C ДНК-нацеливающий сегмент (54500 и 55300 п.о. от конечной<223> Ror1 gRNA C DNA-targeting segment (54,500 and 55,300 bp from the final

точки локуса-мишени) target locus points)

<400> 21<400> 21

gggaagaatg ggctattgtc 20gggaagaatg ggctattgtc 20

<210> 22<210> 22

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Ror1 гРНК E ДНК-нацеливающий сегмент (1000 п.о. от конечной точки<223> Ror1 gRNA E DNA targeting segment (1000 bp from the endpoint

локуса-мишени)target locus)

<400> 22<400> 22

ggttgtttgt gctgatgacg 20ggttgtttgt gctgatgacg 20

<210> 23<210> 23

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Ror1 гРНК F ДНК-нацеливающий сегмент (200 п.о. от конечной точки<223> Ror1 gRNA F DNA targeting segment (200 bp from the endpoint

локуса-мишени)target locus)

<400> 23<400> 23

ccgtcctagg ccttctacgt 20ccgtcctagg ccttctacgt 20

<210> 24<210> 24

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Trpa1 гРНК A ДНК-нацеливающий сегмент (100 п.о. от конечной точки<223> Trpa1 gRNA A DNA targeting segment (100 bp from the endpoint

локуса-мишени)target locus)

<400> 24<400> 24

gtactgggga atcggtggtc 20gtactgggga atcggtggtc 20

<210> 25<210> 25

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Trpa1 гРНК A2 ДНК-нацеливающий сегмент (500 п.о. от конечной точки<223> Trpa1 gRNA A2 DNA targeting segment (500 bp from the endpoint

локуса-мишени)target locus)

<400> 25<400> 25

cacgcactcc aaatttatcc 20cacgcactcc aaatttatcc 20

<210> 26<210> 26

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Trpa1 гРНК B ДНК-нацеливающий сегмент (1000 п.о. от конечной точки<223> Trpa1 gRNA B DNA targeting segment (1000 bp from the endpoint

локуса-мишени)target locus)

<400> 26<400> 26

ctaagtgtgt atcagtacat 20ctaagtgtgt atcagtacat 20

<210> 27<210> 27

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Trpa1 гРНК C ДНК-нацеливающий сегмент (25600 и 19740 п.о. от конечной<223> Trpa1 gRNA C DNA-targeting segment (25,600 and 19,740 bp from the final

точки локуса-мишени) target locus points)

<400> 27<400> 27

tgccctgcac aataagcgca 20tgccctgcac aataagcgca 20

<210> 28<210> 28

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Trpa1 гРНК D ДНК-нацеливающий сегмент (26970 и 18370 п.о. от конечной<223> Trpa1 gRNA D DNA targeting segment (26970 and 18370 bp from the final

точки локуса-мишени) target locus points)

<400> 28<400> 28

actcattgaa acgttatggc 20actcattgaa acgttatggc 20

<210> 29<210> 29

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Trpa1 гРНК E2 ДНК-нацеливающий сегмент (1000 п.о. от конечной точки<223> Trpa1 gRNA E2 DNA targeting segment (1000 bp from endpoint

локуса-мишени)target locus)

<400> 29<400> 29

agtaagggtg gattaaattc 20agtaagggtg gattaaattc 20

<210> 30<210> 30

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Trpa1 гРНК E ДНК-нацеливающий сегмент (500 п.о. от конечной точки<223> Trpa1 gRNA E DNA targeting segment (500 bp from the endpoint

локуса-мишени)target locus)

<400> 30<400> 30

gccatctaga ttcatgtaac 20gccatctaga ttcatgtaac 20

<210> 31<210> 31

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Trpa1 гРНК F ДНК-нацеливающий сегмент (100 п.о. от конечной точки<223> Trpa1 gRNA F DNA targeting segment (100 bp from the endpoint

локуса-мишени)target locus)

<400> 31<400> 31

gactagaaat gttctgcacc 20gactagaaat gttctgcacc 20

<210> 32<210> 32

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 190045 прямой праймер<223> 190045 direct primer

<400> 32<400> 32

gagctcatag ccaacagctt g 21gagctcatag ccaacagctt g 21

<210> 33<210> 33

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 190061 прямой праймер<223> 190061 direct primer

<400> 33<400> 33

atgcatcaga tcacgctcag 20atgcatcaga tcacgctcag 20

<210> 34<210> 34

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 190068 прямой праймер<223> 190068 direct primer

<400> 34<400> 34

gtccttgtgg catttccaac 20gtccttgtgg catttccaac 20

<210> 35<210> 35

<211> 24<211> 24

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 190030 прямой праймер<223> 190030 direct primer

<400> 35<400> 35

ccagtatggt gtcagttaat agcg 24ccagtatggt gtcagttaat agcg 24

<210> 36<210> 36

<211> 19<211> 19

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 190033 прямой праймер (такой же как прямой праймер для SV 48.3 <223> 190033 forward primer (same as forward primer for SV 48.3

на Фиг. 6)in Fig. 6)

<400> 36<400> 36

ctgtgcagaa agcagcctc 19ctgtgcagaa agcagcctc 19

<210> 37<210> 37

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 190013 прямой праймер<223> 190013 direct primer

<400> 37<400> 37

cctctccctc taggcacctg 20cctctccctc taggcacctg 20

<210> 38<210> 38

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 190045 обратный праймер<223> 190045 reverse primer

<400> 38<400> 38

tctttaaggg ctccgttgtc 20tctttaaggg ctccgttgtc 20

<210> 39<210> 39

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 190061 обратный праймер<223> 190061 reverse primer

<400> 39<400> 39

aagaccaacc attcacccag 20aagaccaacc attcaccag 20

<210> 40<210> 40

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 190068 обратный праймер<223> 190068 reverse primer

<400> 40<400> 40

ttcccagtcc aagtcaaagg 20ttcccagtcc aagtcaaagg 20

<210> 41<210> 41

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 190030 обратный праймер<223> 190030 Reverse Primer

<400> 41<400> 41

ctgttatctg caaggcaccc 20ctgttatctg caaggcaccc 20

<210> 42<210> 42

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 190033 обратный праймер (такой же как обратный праймер для SV 48.3<223> 190033 Reverse primer (same as reverse primer for SV 48.3

на Фиг. 6)in Fig. 6)

<400> 42<400> 42

acaactggat cctgattcgc 20acaactggat cctgattcgc 20

<210> 43<210> 43

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 190013 обратный праймер<223> 190013 Reverse Primer

<400> 43<400> 43

taagagggca tgggtgagac 20taagagggca tgggtgagac 20

<210> 44<210> 44

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> C2 зонд (B6) - SNV 0.32 на Фиг. 6<223> C2 probe (B6) - SNV 0.32 in Fig. 6

<400> 44<400> 44

aattcagaag acctatcgta 20aattcagaag acctatcgta 20

<210> 45<210> 45

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T3 зонд (B6) - SNV 1.2 на Фиг. 6<223> T3 probe (B6) - SNV 1.2 in Fig. 6

<400> 45<400> 45

tatgtgtata ggtgtttgga t 21tatgtgtata ggtgtttgga t 21

<210> 46<210> 46

<211> 19<211> 19

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T6 зонд (B6) - SNV 11.1 на Фиг. 6<223> T6 probe (B6) - SNV 11.1 in Fig. 6

<400> 46<400> 46

tacattgcta aatgaaacc 19tacattgcta aatgaaacc 19

<210> 47<210> 47

<211> 16<211> 16

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T7 зонд (B6) - SNV 13.2 на Фиг. 6<223> T7 probe (B6) - SNV 13.2 in Fig. 6

<400> 47<400> 47

cgcagtcatg cacata 16cgcagtcatg cacata 16

<210> 48<210> 48

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T8 зонд (B6) - SNV 17.5 на Фиг. 6<223> T8 probe (B6) - SNV 17.5 in Fig. 6

<400> 48<400> 48

ttataaagcc cagtatgtac 20ttataaagcc cagtatgtac 20

<210> 49<210> 49

<211> 14<211> 14

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T9 зонд (B6) - SNV 25.8 на Фиг. 6<223> T9 probe (B6) - SNV 25.8 in Fig. 6

<400> 49<400> 49

tgctgcataa tcag 14tgctgcataa tcag 14

<210> 50<210> 50

<211> 18<211> 18

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T10 зонд (B6) - SNV 33.0 на Фиг. 6<223> T10 probe (B6) - SNV 33.0 in Fig. 6

<400> 50<400> 50

tcaggagtga attggata 18tcaggagtga attggata 18

<210> 51<210> 51

<211> 16<211> 16

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T11 зонд (B6) - SNV 38.3 на Фиг. 6<223> T11 probe (B6) - SNV 38.3 in Fig. 6

<400> 51<400> 51

ctgctactta cctttg 16ctgctactta cctttg 16

<210> 52<210> 52

<211> 13<211> 13

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T13 зонд (B6) - SNV 49.6 на Фиг. 6<223> T13 probe (B6) - SNV 49.6 in Fig. 6

<400> 52<400> 52

aggaggaaaa cgc 13aggaggaaaa cgc 13

<210> 53<210> 53

<211> 17<211> 17

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T14 зонд (B6) - SNV 57.2 на Фиг. 6<223> T14 probe (B6) - SNV 57.2 in Fig. 6

<400> 53<400> 53

cctttgttcc tcataag 17cctttgttcc tcataag 17

<210> 54<210> 54

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> C2 зонд (129) - SNV 0.32 на Фиг. 6<223> C2 probe (129) - SNV 0.32 in Fig. 6

<400> 54<400> 54

aattcagaag acctattgta 20aattcagaag acctattgta 20

<210> 55<210> 55

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T3 зонд (129) - SNV 1.2 на Фиг. 6<223> T3 probe (129) - SNV 1.2 in Fig. 6

<400> 55<400> 55

tatgtgtata ggtgtttgca t 21tatgtgtata ggtgtttgca t 21

<210> 56<210> 56

<211> 16<211> 16

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T6 зонд (129) - SNV 11.1 на Фиг. 6<223> T6 probe (129) - SNV 11.1 in Fig. 6

<400> 56<400> 56

cattgctaca tgaaac 16cattgctaca tgaaac 16

<210> 57<210> 57

<211> 16<211> 16

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T7 зонд (129) - SNV 13.2 на Фиг. 6<223> T7 probe (129) - SNV 13.2 in Fig. 6

<400> 57<400> 57

cgcagtcatg cacgta 16cgcagtcatg cacgta 16

<210> 58<210> 58

<211> 23<211> 23

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T8 зонд (129) - SNV 17.5 на Фиг. 6<223> T8 probe (129) - SNV 17.5 in Fig. 6

<400> 58<400> 58

tgagaattta taaagcccaa tat 23tgagaattta taaagcccaa tat 23

<210> 59<210> 59

<211> 14<211> 14

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T9 зонд (129) - SNV 25.8 на Фиг. 6<223> T9 probe (129) - SNV 25.8 in Fig. 6

<400> 59<400> 59

tgctgcatga tcag 14tgctgcatga tcag 14

<210> 60<210> 60

<211> 15<211> 15

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T10 зонд (129) - SNV 33.0 на Фиг. 6<223> T10 probe (129) - SNV 33.0 in Fig. 6

<400> 60<400> 60

tcaggagtga atcgg 15tcaggagtga atcgg 15

<210> 61<210> 61

<211> 16<211> 16

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T11 зонд (129) - SNV 38.3 на Фиг. 6<223> T11 probe (129) - SNV 38.3 in Fig. 6

<400> 61<400> 61

ctgctagtta cctttg 16ctgctagtta cctttg 16

<210> 62<210> 62

<211> 15<211> 15

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T13 зонд (129) - SNV 49.6 на Фиг. 6<223> T13 probe (129) - SNV 49.6 in Fig. 6

<400> 62<400> 62

aggaggaaga cgcag 15aggaggaaga cgcag 15

<210> 63<210> 63

<211> 17<211> 17

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T14 зонд (129) - SNV 57.2 на Фиг. 6<223> T14 probe (129) - SNV 57.2 in Fig. 6

<400> 63<400> 63

ctttgttctt cataagc 17ctttgttctt cataagc 17

<210> 64<210> 64

<211> 25<211> 25

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> C2 прямой праймер - SNV 0.32 на Фиг. 6<223> C2 forward primer - SNV 0.32 in Fig. 6

<400> 64<400> 64

atgagggatt tccttaatca gacaa 25atgaggatt tccttaatca gacaa 25

<210> 65<210> 65

<211> 29<211> 29

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T3 прямой праймер - SNV 1.2 на Фиг. 6<223> T3 forward primer - SNV 1.2 in Fig. 6

<400> 65<400> 65

tggtatgttt attcttactc aaggttttg 29tggtatgttt attcttactc aaggttttg 29

<210> 66<210> 66

<211> 22<211> 22

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T6 прямой праймер - SNV 11.1 на Фиг. 6<223> T6 forward primer - SNV 11.1 in Fig. 6

<400> 66<400> 66

gggcaactga tggaaagaac tc 22gggcaactga tggaaagaac tc 22

<210> 67<210> 67

<211> 23<211> 23

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T7 прямой праймер - SNV 13.2 на Фиг. 6<223> T7 forward primer - SNV 13.2 in Fig. 6

<400> 67<400> 67

gactgacgca caaacttgtc ctt 23gactgacgca caaacttgtc ctt 23

<210> 68<210> 68

<211> 26<211> 26

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T8 прямой праймер - SNV 17.5 на Фиг. 6<223> T8 forward primer - SNV 17.5 in Fig. 6

<400> 68<400> 68

cccaaagcat ataacaagaa caaatg 26cccaaagcat ataacaagaa caaatg 26

<210> 69<210> 69

<211> 18<211> 18

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T9 прямой праймер - SNV 25.8 на Фиг. 6<223> T9 forward primer - SNV 25.8 in Fig. 6

<400> 69<400> 69

gcaggacgca ggcgttta 18gcaggacgca ggcgttta 18

<210> 70<210> 70

<211> 23<211> 23

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T10 прямой праймер - SNV 33.0 на Фиг. 6<223> T10 forward primer - SNV 33.0 in Fig. 6

<400> 70<400> 70

gcatcctcat ggcagtctac atc 23gcatcctcat ggcagtctac atc 23

<210> 71<210> 71

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T11 прямой праймер - SNV 38.3 на Фиг. 6<223> T11 forward primer - SNV 38.3 in Fig. 6

<400> 71<400> 71

cctgcccctt gatgagtgtt 20cctgcccctt gatgagtgtt 20

<210> 72<210> 72

<211> 23<211> 23

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T13 прямой праймер - SNV 49.6 на Фиг. 6<223> T13 forward primer - SNV 49.6 in Fig. 6

<400> 72<400> 72

ccctctttga tatgctcgtg tgt 23ccctctttga tatgctcgtg tgt 23

<210> 73<210> 73

<211> 22<211> 22

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T14 прямой праймер - SNV 57.2 на Фиг. 6<223> T14 forward primer - SNV 57.2 in Fig. 6

<400> 73<400> 73

tcccacaggt ccatgtcttt aa 22tccacaggt ccatgtcttt aa 22

<210> 74<210> 74

<211> 28<211> 28

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> C2 обратный праймер - SNV 0.32 на Фиг. 6<223> C2 reverse primer - SNV 0.32 in Fig. 6

<400> 74<400> 74

agactacaat gagctaccat cataaggt 28agactacaat gagctaccat cataaggt 28

<210> 75<210> 75

<211> 24<211> 24

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T3 обратный праймер - SNV 1.2 на Фиг. 6<223> T3 reverse primer - SNV 1.2 in Fig. 6

<400> 75<400> 75

caaccatcta aaactccagt tcca 24caaccatcta aaactccagt tcca 24

<210> 76<210> 76

<211> 28<211> 28

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T6 обратный праймер - SNV 11.1 на Фиг. 6<223> T6 reverse primer - SNV 11.1 in Fig. 6

<400> 76<400> 76

tgtgtaacag gacagttgaa tgtagaga 28tgtgtaacag gacagttgaa tgtagaga 28

<210> 77<210> 77

<211> 19<211> 19

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T7 обратный праймер - SNV 13.2 на Фиг. 6<223> T7 reverse primer - SNV 13.2 in Fig. 6

<400> 77<400> 77

cttaaaaccc gccctgcat 19cttaaaaccc gccctgcat 19

<210> 78<210> 78

<211> 26<211> 26

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T8 обратный праймер - SNV 17.5 на Фиг. 6<223> T8 reverse primer - SNV 17.5 in Fig. 6

<400> 78<400> 78

ctacaggaga tgtggctgtt ctatgt 26ctacaggaga tgtggctgtt ctatgt 26

<210> 79<210> 79

<211> 22<211> 22

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T9 обратный праймер - SNV 25.8 на Фиг. 6<223> T9 reverse primer - SNV 25.8 in Fig. 6

<400> 79<400> 79

tcagcgtgat tcgcttgtag tc 22tcagcgtgat tcgcttgtag tc 22

<210> 80<210> 80

<211> 26<211> 26

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T10 обратный праймер - SNV 33.0 на Фиг. 6<223> T10 reverse primer - SNV 33.0 in Fig. 6

<400> 80<400> 80

tgcatagctg tttgaataat gacaag 26tgcatagctg tttgaataat gacaag 26

<210> 81<210> 81

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T11 обратный праймер - SNV 38.3 на Фиг. 6<223> T11 reverse primer - SNV 38.3 in Fig. 6

<400> 81<400> 81

tgcagcatct ctgtcaagca a 21tgcagcatctctgtcaagcaa 21

<210> 82<210> 82

<211> 24<211> 24

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T13 обратный праймер - SNV 49.6 на Фиг. 6<223> T13 reverse primer - SNV 49.6 in Fig. 6

<400> 82<400> 82

gcaacaacat aacccacagc ataa 24gcaacaacat aacccacagc ataa 24

<210> 83<210> 83

<211> 23<211> 23

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> T14 обратный праймер - SNV 57.2 на Фиг. 6<223> T14 reverse primer - SNV 57.2 in Fig. 6

<400> 83<400> 83

gctaagcgtt tggaagaaat tcc 23gctaagcgtt tggaagaaat tcc 23

<210> 84<210> 84

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Прямой праймер для SV 13.7 на Фиг. 6<223> Forward primer for SV 13.7 in Fig. 6

<400> 84<400> 84

taggctctaa ggatgctggc 20taggctctaa ggatgctggc 20

<210> 85<210> 85

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Обратный праймер для SV 13.7 на Фиг. 6<223> Reverse primer for SV 13.7 in Fig. 6

<400> 85<400> 85

aagcagcttc aaaccctctg 20aagcagcttc aaaccctctg 20

<210> 86<210> 86

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Прямой праймер для SV 20.0 на Фиг. 6<223> Forward primer for SV 20.0 in Fig. 6

<400> 86<400> 86

ttacttggcc ttggaactgc 20ttacttggcc ttggaactgc 20

<210> 87<210> 87

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Обратный праймер для SV 20.0 на Фиг. 6<223> Reverse primer for SV 20.0 in Fig. 6

<400> 87<400> 87

tgattcgtaa tcgtcactgc c 21tgattcgtaa tcgtcactgc from 21

<210> 88<210> 88

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Прямой праймер для SV 36.9 на Фиг. 6<223> Forward primer for SV 36.9 in Fig. 6

<400> 88<400> 88

tcctgtcccg agaaactgtc 20tcctgtcccg agaaactgtc 20

<210> 89<210> 89

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Обратный праймер для SV 36.9 на Фиг. 6<223> Reverse primer for SV 36.9 in Fig. 6

<400> 89<400> 89

agctggcttt cagagagctg 20agctggcttt cagagagctg 20

<210> 90<210> 90

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Прямой праймер для SV 56.7 на Фиг. 6<223> Forward primer for SV 56.7 in Fig. 6

<400> 90<400> 90

ttagaaagtg ccaaccaggc 20ttagaaagtg ccaaccaggc 20

<210> 91<210> 91

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Обратный праймер для SV 56.7 на Фиг. 6<223> Reverse primer for SV 56.7 in Fig. 6

<400> 91<400> 91

ctctggctag gaacaatggc 20ctctggctag gaacaatggc 20

<210> 92<210> 92

<211> 25<211> 25

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> m-lr-f праймер для Lrp5 локуса<223> m-lr-f primer for Lrp5 locus

<400> 92<400> 92

gttaggtgca gggtctactc agctg 25gttaggtgca gggtctactc agctg 25

<210> 93<210> 93

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> m-5'-f праймер для Lrp5 локуса<223> m-5'-f primer for Lrp5 locus

<400> 93<400> 93

ggaggagagg agaagcagcc 20ggaggagagg agaagcagcc 20

<210> 94<210> 94

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> m-A праймер для Lrp5 локуса<223> m-A primer for Lrp5 locus

<400> 94<400> 94

ggaggagagg agaagcagcc 20ggaggagagg agaagcagcc 20

<210> 95<210> 95

<211> 26<211> 26

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> h-lr-r праймер для Lrp5 локуса<223> h-lr-r primer for Lrp5 locus

<400> 95<400> 95

gcaaacagcc ttcttcccac attcgg 26gcaaacagcc ttcttcccac attcgg 26

<210> 96<210> 96

<211> 24<211> 24

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> m-5'-r праймер для Lrp5 локуса<223> m-5'-r primer for Lrp5 locus

<400> 96<400> 96

ttgctttcag tagttcaggt gtgc 24ttgctttcag tagttcaggt gtgc 24

<210> 97<210> 97

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> h-5'-r праймер для Lrp5 локуса<223> h-5'-r primer for Lrp5 locus

<400> 97<400> 97

ggcgttgtca ggaagttgcc 20ggcgttgtca ggaagttgcc 20

<210> 98<210> 98

<211> 22<211> 22

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> m-F праймер для Lrp5 локуса<223> m-F primer for Lrp5 locus

<400> 98<400> 98

tgaagttgag aggcacatga gg 22tgaagttgag aggcacatga gg 22

<210> 99<210> 99

<211> 24<211> 24

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> m-E2 праймер для Lrp5 локуса<223> m-E2 primer for Lrp5 locus

<400> 99<400> 99

tagagtagcc acaggcagca aagc 24tagagtagcc acaggcagca aagc 24

<210> 100<210> 100

<211> 22<211> 22

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 7064retU прямой праймер<223> 7064retU forward primer

<400> 100<400> 100

cctcctgagc tttcctttgc ag 22cctcctgagc tttcctttgc ag 22

<210> 101<210> 101

<211> 25<211> 25

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 7064retU обратный праймер<223> 7064retU reverse primer

<400> 101<400> 101

cctagacaac acagacactg tatca 25cctagacaac agacactg tatca 25

<210> 102<210> 102

<211> 23<211> 23

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 7064retU TAQMAN зонд<223> 7064retU TAQMAN probe

<400> 102<400> 102

ttctgccctt gaaaaggaga ggc 23ttctgccctt gaaaaggaga ggc 23

<210> 103<210> 103

<211> 18<211> 18

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 7064retD прямой праймер<223> 7064retD direct primer

<400> 103<400> 103

cctctgaggc cacctgaa 18cctctgaggc cacctgaa 18

<210> 104<210> 104

<211> 23<211> 23

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 7064retD обратный праймер<223> 7064retD reverse primer

<400> 104<400> 104

ccctgacaag ttctgccttc tac 23ccctgacaag ttctgccttc tac 23

<210> 105<210> 105

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 7064retD TAQMAN зонд<223> 7064retD TAQMAN probe

<400> 105<400> 105

tgcccaagcc tctgcagctt t 21tgcccaagcc tctgcagctt t 21

<210> 106<210> 106

<211> 19<211> 19

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 7140retU прямой праймер<223> 7140retU direct primer

<400> 106<400> 106

cccagcatct gacgacacc 19cccagcatct gacgacacc 19

<210> 107<210> 107

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 7140retU обратный праймер<223> 7140retU reverse primer

<400> 107<400> 107

gaccactgtg ggcatctgta g 21gaccactgtg ggcatctgta g 21

<210> 108<210> 108

<211> 27<211> 27

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 7140retU TAQMAN зонд<223> 7140retU TAQMAN probe

<400> 108<400> 108

ccgagtctgc tgttactgtt agcatca 27ccgagtctgc tgttactgtt agcatca 27

<210> 109<210> 109

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 7140retD прямой праймер<223> 7140retD direct primer

<400> 109<400> 109

cccgacacct tctgagcatg 20cccgacacct tctgagcatg 20

<210> 110<210> 110

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 7140retD обратный праймер<223> 7140retD reverse primer

<400> 110<400> 110

tgcaggctga gtcaggattt g 21tgcaggctga gtcaggattt g 21

<210> 111<210> 111

<211> 25<211> 25

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> 7140retD TAQMAN зонд<223> 7140retD TAQMAN probe

<400> 111<400> 111

tagtcacgtt ttgtgacacc ccaga 25tagtcacgtt ttgtgacacc ccaga 25

<210> 112<210> 112

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Folh1 гРНК A ДНК-нацеливающий сегмент <223> Folh1 gRNA A DNA-targeting segment

<400> 112<400> 112

tgaaccaatt gtgtagcctt 20tgaaccaatt gtgtagcctt 20

<210> 113<210> 113

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Folh1 гРНК A2 ДНК-нацеливающий сегмент <223> Folh1 gRNA A2 DNA-targeting segment

<400> 113<400> 113

aatagtggta aagcaccatg 20aatagtggta aagcaccatg 20

<210> 114<210> 114

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Folh1 гРНК B ДНК-нацеливающий сегмент <223> Folh1 gRNA B DNA-targeting segment

<400> 114<400> 114

gtgtgctaag gatcgaagtc 20gtgtgctaag gatcgaagtc 20

<210> 115<210> 115

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Folh1 гРНК C ДНК-нацеливающий сегмент <223> Folh1 gRNA C DNA-targeting segment

<400> 115<400> 115

caccgagatg cttgggtatt 20caccgagatg cttgggtatt 20

<210> 116<210> 116

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Folh1 гРНК D ДНК-нацеливающий сегмент <223> Folh1 gRNA D DNA-targeting segment

<400> 116<400> 116

tgtaaccgcc ctgaatgacc 20tgtaaccgcc ctgaatgacc 20

<210> 117<210> 117

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Folh1 гРНК E ДНК-нацеливающий сегмент <223> Folh1 gRNA E DNA-targeting segment

<400> 117<400> 117

aaaagggcat cataaatccc 20aaaagggcat cataaatccc 20

<210> 118<210> 118

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Folh1 гРНК E2 ДНК-нацеливающий сегмент <223> Folh1 gRNA E2 DNA-targeting segment

<400> 118<400> 118

tcaaaaatag tcatacacct 20tcaaaaatag tcatacacct 20

<210> 119<210> 119

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Folh1 гРНК F ДНК-нацеливающий сегмент <223> Folh1 gRNA F DNA-targeting segment

<400> 119<400> 119

ggtctctagt acattgtaga 20ggtctctagt acattgtaga 20

<210> 120<210> 120

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Adamts5 гРНК A ДНК-нацеливающий сегмент <223> Adamts5 gRNA A DNA targeting segment

<400> 120<400> 120

ggtggtggtg ctgacggaca 20ggtggtggtg ctgacggaca 20

<210> 121<210> 121

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Adamts5 гРНК A2 ДНК-нацеливающий сегмент <223> Adamts5 gRNA A2 DNA-targeting segment

<400> 121<400> 121

tatgagatca acactcgcta 20tatgagatca acactcgcta 20

<210> 122<210> 122

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Adamts5 гРНК B ДНК-нацеливающий сегмент <223> Adamts5 gRNA B DNA targeting segment

<400> 122<400> 122

ccaaggactt ccccacgtta 20ccaaggactt ccccacgtta 20

<210> 123<210> 123

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Adamts5 гРНК C ДНК-нацеливающий сегмент <223> Adamts5 gRNA C DNA targeting segment

<400> 123<400> 123

tgcttccctt atgcaagatt 20tgcttccctt atgcaagatt 20

<210> 124<210> 124

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Adamts5 гРНК D ДНК-нацеливающий сегмент <223> Adamts5 gRNA D DNA targeting segment

<400> 124<400> 124

ttaggtaccc tatttgaata 20ttaggtaccc tatttgaata 20

<210> 125<210> 125

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Adamts5 гРНК E2 ДНК-нацеливающий сегмент <223> Adamts5 gRNA E2 DNA targeting segment

<400> 125<400> 125

tgcagtgggt gacaggtcca 20tgcagtgggt gacaggtcca 20

<210> 126<210> 126

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Adamts5 гРНК E ДНК-нацеливающий сегмент <223> Adamts5 gRNA E DNA targeting segment

<400> 126<400> 126

agggttatac tgacgttgtg 20agggttatac tgacgttgtg 20

<210> 127<210> 127

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Adamts5 гРНК F ДНК-нацеливающий сегмент <223> Adamts5 gRNA F DNA-targeting segment

<400> 127<400> 127

tgtctttcaa ggagggctac 20tgtctttcaa ggagggctac 20

<210> 128<210> 128

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Dpp4 гРНК A ДНК-нацеливающий сегмент <223> Dpp4 gRNA A DNA targeting segment

<400> 128<400> 128

actagtagac ctgaggggtt 20actagtagac ctgaggggtt 20

<210> 129<210> 129

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Dpp4 гРНК B ДНК-нацеливающий сегмент <223> Dpp4 gRNA B DNA targeting segment

<400> 129<400> 129

gctccagtgt ttaggccttg 20gctccagtgt ttaggccttg 20

<210> 130<210> 130

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Dpp4 гРНК B2 ДНК-нацеливающий сегмент <223> Dpp4 gRNA B2 DNA targeting segment

<400> 130<400> 130

ggcaagctga aaacgcatgc 20ggcaagctga aaacgcatgc 20

<210> 131<210> 131

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Dpp4 гРНК C ДНК-нацеливающий сегмент <223> Dpp4 gRNA C DNA-targeting segment

<400> 131<400> 131

gtagatcgct ttccactacc 20gtagatcgct ttccactacc 20

<210> 132<210> 132

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Dpp4 гРНК D ДНК-нацеливающий сегмент <223> Dpp4 gRNA D DNA targeting segment

<400> 132<400> 132

gaactccact gctcgtgagc 20gaactccact gctcgtgagc 20

<210> 133<210> 133

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Dpp4 гРНК E2 ДНК-нацеливающий сегмент <223> Dpp4 gRNA E2 DNA-targeting segment

<400> 133<400> 133

ataggtgggc actattgaag 20ataggtgggc actattgaag 20

<210> 134<210> 134

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Dpp4 гРНК E ДНК-нацеливающий сегмент <223> Dpp4 gRNA E DNA-targeting segment

<400> 134<400> 134

atgggaaggt ttataccagc 20atgggaaggt ttataccagc 20

<210> 135<210> 135

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Dpp4 гРНК F ДНК-нацеливающий сегмент <223> Dpp4 gRNA F DNA-targeting segment

<400> 135<400> 135

cggtgtaaaa acaacgggaa 20cggtgtaaaa acaacgggaa 20

<210> 136<210> 136

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Прямой праймер для SV 6.1 на Фиг. 8<223> Forward primer for SV 6.1 in Fig. 8

<400> 136<400> 136

ggaatgccaa ggctactgtc 20ggaatgccaa ggctactgtc 20

<210> 137<210> 137

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Обратный праймер для SV 6.1 на Фиг. 8<223> Reverse primer for SV 6.1 in Fig. 8

<400> 137<400> 137

aaaagtctgc tttgggtggt 20aaaagtctgc tttgggtggt 20

<210> 138<210> 138

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Прямой праймер для SV 6.3 на Фиг. 8<223> Forward primer for SV 6.3 in Fig. 8

<400> 138<400> 138

cttcatgaac ctcactcagg a 21cttcatgaac ctcactcagg a 21

<210> 139<210> 139

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Обратный праймер для SV 6.3 на Фиг. 8<223> Reverse primer for SV 6.3 in Fig. 8

<400> 139<400> 139

tctcggagtc aggatttacc t 21tctcggagtc aggatttacct 21

<210> 140<210> 140

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Прямой праймер для SV 7.8 на Фиг. 8<223> Forward primer for SV 7.8 in Fig. 8

<400> 140<400> 140

tgtctctttg cctgttgctg 20tgtctctttg cctgttgctg 20

<210> 141<210> 141

<211> 22<211> 22

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Обратный праймер для SV 7.8 на Фиг. 8<223> Reverse primer for SV 7.8 in Fig. 8

<400> 141<400> 141

tctgctctac aaggcttacg tg 22tctgctctac aaggcttacg tg 22

<210> 142<210> 142

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Прямой праймер для SV 16 на Фиг. 8<223> Forward primer for SV 16 in Fig. 8

<400> 142<400> 142

caaccaggca gacttacagc 20caaccaggca gacttacagc 20

<210> 143<210> 143

<211> 20<211> 20

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Обратный праймер для SV 16 на Фиг. 8<223> Reverse primer for SV 16 in Fig. 8

<400> 143<400> 143

ggcctaggaa ccagtcaaaa 20ggcctaggaa ccagtcaaaa 20

<210> 144<210> 144

<211> 23<211> 23

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Прямой праймер для SV 25.5 на Фиг. 8<223> Forward primer for SV 25.5 in Fig. 8

<400> 144<400> 144

gcttactgga aagctacata ggg 23gcttactgga aagctacata ggg 23

<210> 145<210> 145

<211> 22<211> 22

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Обратный праймер для SV 25.5 на Фиг. 8<223> Reverse primer for SV 25.5 in Fig. 8

<400> 145<400> 145

caacaacata gaaacccctg tc 22caacaacata gaaacccctg tc 22

<210> 146<210> 146

<211> 6<211> 6

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Последовательность S. aureus Cas9 PAM <223> S. aureus Cas9 PAM sequence

<220> <220>

<221> misc_feature <221> misc_feature

<222> (1)...(2)<222> (1)...(2)

<223> n = A, T, C, или G<223> n = A, T, C, or G

<220> <220>

<221> misc_feature <221> misc_feature

<222> (4)...(5)<222> (4)...(5)

<223> r = A или G<223> r = A or G

<400> 146<400> 146

nngrrt 6nngrrt 6

<210> 147<210> 147

<211> 5<211> 5

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Последовательность S. aureus Cas9 PAM <223> S. aureus Cas9 PAM sequence

<220> <220>

<221> misc_feature <221> misc_feature

<222> (1)...(2)<222> (1)...(2)

<223> n = A, T, C, или G<223> n = A, T, C, or G

<220> <220>

<221> misc_feature <221> misc_feature

<222> (4)...(5)<222> (4)...(5)

<223> r = A или G<223> r = A or G

<400> 147<400> 147

nngrr 5nngrr 5

<210> 148<210> 148

<211> 3155<211> 3155

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Сконструированный человеческий Vk1-39Jk5 локус<223> Engineered human Vk1-39Jk5 locus

<400> 148<400> 148

ggcgcgccgt agctttgaat tttaaacatc tatttgacaa gaaatgcata gttccttctc 60ggcgcgccgt agctttgaat tttaaacatc tatttgacaa gaaatgcata gttccttctc 60

tttaaaataa tgtaatgttt ctttcaagaa taagcttggt ttgatgcctc tctccccaac 120tttaaaataa tgtaatgttt ctttcaagaa taagcttggt ttgatgcctc tctccccaac 120

atgatagaag tgtagcataa atctatgaaa aattccattt ccctgtgcct acaacaacta 180atgatagaag tgtagcataa atctatgaaa aattccatt ccctgtgcct acaacaacta 180

cctgggattg aaaacttctt cccttgctct agtcctttct tctacaccta cttccacatc 240cctgggattg aaaacttctt cccttgctct agtcctttct tctacaccta cttccacatc 240

atctgtgact caaaacaata cttgtcagga aagatcccgg aaagagcaaa aaagacttcc 300atctgtgact caaaacaata cttgtcagga aagatcccgg aaagagcaaa aaagacttcc 300

ttagaggtgt cagagattcc tatgccacta tctgtcatct ctagaagggg ttgtgagtat 360ttagaggtgt cagagattcc tatgccacta tctgtcatct ctagaagggg ttgtgagtat 360

gaggaagagc agagcttgta aattttctac ttgctttgac ttccactgta tttcctaaca 420gaggaagagc agagcttgta aattttctac ttgctttgac ttccactgta tttcctaaca 420

acaacaacca cagcaacacc cataacatca caggacaaac ttctagtact tccaaggctt 480acaacaacca cagcaacacc cataacatca caggacaaac ttctagtact tccaaggctt 480

tagtctcagt aaatcttctc tacctccatc acagcagcta gaaggtttga tactcataca 540tagtctcagt aaatcttctc tacctccatc acagcagcta gaaggtttga tactcataca 540

aatagtactg tagctttctg ttcataattg gaaaaataga caagacccaa tgtaatacag 600aatagtactg tagctttctg ttcataattg gaaaaataga caagacccaa tgtaatacag 600

gctttccttc agccagttag cgttcagttt ttggatcacc attgcacaca tatacccagc 660gctttccttc agccagttag cgttcagttt ttggatcacc attgcacaca tatacccagc 660

atatgtctaa tatatatgta gaaatccgtg aagcaagagt tataatagct tgtgttttct 720atatgtctaa tatatatgta gaaatccgtg aagcaagagt tataatagct tgtgttttct 720

attgtattgt attttcctct tatatcatct tcttcttcgt tcattaaaaa aaaaccgttc 780attgtattgt attttcctct tatatcatct tcttcttcgt tcattaaaaa aaaaccgttc 780

aagtaggtct aaattaatta ttggatcata agtagataaa atattttatt tcataacaca 840aagtaggtct aaattaatta ttggatcata agtagataaa atattttatt tcataacaca 840

ttgacccgat gaatatgttt ctttgccaga catagtcctc atttccaagg taacaagcct 900ttgacccgat gaatatgttt ctttgccaga catagtcctc atttccaagg taacaagcct 900

gaaaaaatta tactggagca agtcaacagg taatgatggt agcttttcct tattgtcctg 960gaaaaaatta tactggagca agtcaacagg taatgatggt agcttttcct tattgtcctg 960

gggcaagaat aagacaaaag ataacagggt agaataaaga ttgtgtaaga aagaaggaca 1020gggcaagaat aagacaaaag ataacagggt agaataaaga ttgtgtaaga aagaaggaca 1020

gcaacaggac atgggaacct tttatagagt aacattttga taatggatga tgagaattaa 1080gcaacaggac atgggaacct tttatagagt aacattttga taatggatga tgagaattaa 1080

tgagttagac agggatgggt gggaatgatt gaaggtgtga gtactttagc acagattaag 1140tgagttagac agggatgggt gggaatgatt gaaggtgtga gtactttagc acagattaag 1140

accaaatcat taggatttaa agagttgtgt agagttagtg aaggaaaagc cttagaatta 1200accaaatcat taggatttaa agagttgtgt agagttagtg aaggaaaagc cttagaatta 1200

aatttggctg cggataaaac attcttggat tagactgaag actcttttct gtgctaagta 1260aatttggctg cggataaaac attcttggat tagactgaag actcttttct gtgctaagta 1260

agtatattta tgataatgat gatgactgta gtgctgaata tttaataaat aaaaacaaaa 1320agtatattta tgataatgat gatgactgta gtgctgaata tttaataaat aaaaacaaaa 1320

ttaattgccg catacataat gtcctgaata ctattgtaaa tgttttatct tatttccttt 1380ttaattgccg catacataat gtcctgaata ctattgtaaa tgttttatct tatttccttt 1380

aaactgtcta cagcactata aggtaggtac cagtattgtc acagttacac agatatggaa 1440aaactgtcta cagcactata aggtaggtac cagtattgtc acagttacac agatatggaa 1440

accgagacac agggaagtta agttacttga tcaatttcaa gcaatcggca agccatggag 1500accgagacac agggaagtta agttacttga tcaatttcaa gcaatcggca agccatggag 1500

catctatgtc agggctgcca ggacatgtga ctgtaaacag aagtttttca ctttttaact 1560catctatgtc agggctgcca ggacatgtga ctgtaaacag aagtttttca ctttttaact 1560

caaagagggt atgtggctgg gttaatggaa agcttcagga ccctcagaaa acattactaa 1620caaagaggt atgtggctgg gttaatggaa agcttcagga ccctcagaaa acattactaa 1620

caagcaaatg aaaggtgtat ctggaagatt aagttttaac agactcttca tttccatcga 1680caagcaaatg aaaggtgtat ctggaagatt aagttttaac agactcttca tttccatcga 1680

tccaataatg cacttaggga gatgactggg catattgagg ataggaagag agaagtgaaa 1740tccaataatg cacttaggga gatgactggg catattgagg ataggaagag agaagtgaaa 1740

acacagcttt ttatattgtt cttaacaggc ttgtgccaaa catcttctgg gtggatttag 1800acacagcttt ttatattgtt cttaacaggc ttgtgccaaa catcttctgg gtggatttag 1800

gtgattgagg agaagaaaga cacaggagcg aaattctctg agcacaaggg aggagttcta 1860gtgattgagg agaagaaaga cacaggagcg aaattctctg agcacaaggg aggagttcta 1860

cactcagact gagccaacag acttttctgg cctgacaacc agggcggcgc aggatgctca 1920cactcagact gagccaacag acttttctgg cctgacaacc agggcggcgc aggatgctca 1920

gtgcagagag gaagaagcag gtggtctttg cagctgaaag ctcagctgat ttgcatatgg 1980gtgcagagag gaagaagcag gtggtctttg cagctgaaag ctcagctgat ttgcatatgg 1980

agtcattata caacatccca gaattcttta agggcagctg ccaggaagct aagaagcatc 2040agtcattata caacatccca gaattcttta agggcagctg cccaggaagct aagaagcatc 2040

ctctcttcta gctctcagag atggagacag acacactcct gctatgggtg ctgctgctct 2100ctctcttcta gctctcagag atggagacag acacactcct gctatgggtg ctgctgctct 2100

gggttccagg tgagggtaca gataagtgtt atgagcaacc tctgtggcca ttatgatgct 2160gggttccagg tgagggtaca gataagtgtt atgagcaacc tctgtggcca ttatgatgct 2160

ccatgcctct ctgttcttga tcactataat tagggcattt gtcactggtt ttaagtttcc 2220ccatgcctct ctgttcttga tcactataat tagggcattt gtcactggtt ttaagtttcc 2220

ccagtcccct gaattttcca ttttctcaga gtgatgtcca aaattattct taaaaattta 2280ccagtcccct gaattttcca ttttctcaga gtgatgtcca aaattattct taaaaattta 2280

aatgaaaagg tcctctgctg tgaaggcttt taaagatata taaaaataat ctttgtgttt 2340aatgaaaagg tcctctgctg tgaaggcttt taaagatata taaaaataat ctttgtgttt 2340

atcattccag gtgccagatg tgacatccag atgacccagt ctccatcctc cctgtctgca 2400atcattccag gtgccagatg tgacatccag atgacccagt ctccatcctc cctgtctgca 2400

tctgtaggag acagagtcac catcacttgc cgggcaagtc agagcattag cagctattta 2460tctgtaggag acagagtcac catcacttgc cgggcaagtc agagcattag cagctattta 2460

aattggtatc agcagaaacc agggaaagcc cctaagctcc tgatctatgc tgcatccagt 2520aattggtatc agcagaaacc agggaaagcc cctaagctcc tgatctatgc tgcatccagt 2520

ttgcaaagtg gggtcccatc aaggttcagt ggcagtggat ctgggacaga tttcactctc 2580ttgcaaagtg gggtcccatc aaggttcagt ggcagtggat ctgggacaga tttcactctc 2580

accatcagca gtctgcaacc tgaagatttt gcaacttact actgtcaaca gagttacagt 2640accatcagca gtctgcaacc tgaagatttt gcaacttact actgtcaaca gagttacagt 2640

acccctccga tcaccttcgg ccaagggaca cgactggaga ttaaacgtaa gtaatttttc 2700acccctccga tcaccttcgg ccaagggaca cgactggaga ttaaacgtaa gtaatttttc 2700

actattgtct tctgaaattt gggtctgatg gccagtattg acttttagag gcttaaatag 2760actattgtct tctgaaattt gggtctgatg gccagtattg acttttagag gcttaaatag 2760

gagtttggta aagattggta aatgagggca tttaagattt gccatgggtt gcaaaagtta 2820gagtttggta aagattggta aatgagggca tttaagattt gccatgggtt gcaaaagtta 2820

aactcagctt caaaaatgga tttggagaaa aaaagattaa attgctctaa actgaatgac 2880aactcagctt caaaaatgga tttggagaaa aaaagattaa attgctctaa actgaatgac 2880

acaaagtaaa aaaaaaaagt gtaactaaaa aggaaccctt gtatttctaa ggagcaaaag 2940acaaagtaaa aaaaaaaagt gtaactaaaa aggaaccctt gtatttctaa ggagcaaaag 2940

taaatttatt tttgttcact cttgccaaat attgtattgg ttgttgctga ttatgcatga 3000taaatttatt tttgttcact cttgccaaat attgtattgg ttgttgctga ttatgcatga 3000

tacagaaaag tggaaaaata cattttttag tctttctccc ttttgtttga taaattattt 3060tacagaaaag tggaaaaata cattttttag tctttctccc ttttgtttga taaattattt 3060

tgtcagacaa caataaaaat caatagcacg ccctaagatc tagatgcatg ctcgagtgcc 3120tgtcagacaa caataaaaat caatagcacg ccctaagatc tagatgcatg ctcgagtgcc 3120

atttcattac ctctttctcc gcacccgaca tagat 3155atttcattac ctctttctcc gcacccgaca tagat 3155

<210> 149<210> 149

<211> 3166<211> 3166

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Сконструированный человеческий Vk3-20Jk1 локус<223> Engineered human Vk3-20Jk1 locus

<400> 149<400> 149

ggcgcgccgt agctttgaat tttaaacatc tatttgacaa gaaatgcata gttccttctc 60ggcgcgccgt agctttgaat tttaaacatc tatttgacaa gaaatgcata gttccttctc 60

tttaaaataa tgtaatgttt ctttcaagaa taagcttggt ttgatgcctc tctccccaac 120tttaaaataa tgtaatgttt ctttcaagaa taagcttggt ttgatgcctc tctccccaac 120

atgatagaag tgtagcataa atctatgaaa aattccattt ccctgtgcct acaacaacta 180atgatagaag tgtagcataa atctatgaaa aattccatt ccctgtgcct acaacaacta 180

cctgggattg aaaacttctt cccttgctct agtcctttct tctacaccta cttccacatc 240cctgggattg aaaacttctt cccttgctct agtcctttct tctacaccta cttccacatc 240

atctgtgact caaaacaata cttgtcagga aagatcccgg aaagagcaaa aaagacttcc 300atctgtgact caaaacaata cttgtcagga aagatcccgg aaagagcaaa aaagacttcc 300

ttagaggtgt cagagattcc tatgccacta tctgtcatct ctagaagggg ttgtgagtat 360ttagaggtgt cagagattcc tatgccacta tctgtcatct ctagaagggg ttgtgagtat 360

gaggaagagc agagcttgta aattttctac ttgctttgac ttccactgta tttcctaaca 420gaggaagagc agagcttgta aattttctac ttgctttgac ttccactgta tttcctaaca 420

acaacaacca cagcaacacc cataacatca caggacaaac ttctagtact tccaaggctt 480acaacaacca cagcaacacc cataacatca caggacaaac ttctagtact tccaaggctt 480

tagtctcagt aaatcttctc tacctccatc acagcagcta gaaggtttga tactcataca 540tagtctcagt aaatcttctc tacctccatc acagcagcta gaaggtttga tactcataca 540

aatagtactg tagctttctg ttcataattg gaaaaataga caagacccaa tgtaatacag 600aatagtactg tagctttctg ttcataattg gaaaaataga caagacccaa tgtaatacag 600

gctttccttc agccagttag cgttcagttt ttggatcacc attgcacaca tatacccagc 660gctttccttc agccagttag cgttcagttt ttggatcacc attgcacaca tatacccagc 660

atatgtctaa tatatatgta gaaatccgtg aagcaagagt tataatagct tgtgttttct 720atatgtctaa tatatatgta gaaatccgtg aagcaagagt tataatagct tgtgttttct 720

attgtattgt attttcctct tatatcatct tcttcttcgt tcattaaaaa aaaaccgttc 780attgtattgt attttcctct tatatcatct tcttcttcgt tcattaaaaa aaaaccgttc 780

aagtaggtct aaattaatta ttggatcata agtagataaa atattttatt tcataacaca 840aagtaggtct aaattaatta ttggatcata agtagataaa atattttatt tcataacaca 840

ttgacccgat gaatatgttt ctttgccaga catagtcctc atttccaagg taacaagcct 900ttgacccgat gaatatgttt ctttgccaga catagtcctc atttccaagg taacaagcct 900

gaaaaaatta tactggagca agtcaacagg taatgatggt agcttttcct tattgtcctg 960gaaaaaatta tactggagca agtcaacagg taatgatggt agcttttcct tattgtcctg 960

gggcaagaat aagacaaaag ataacagggt agaataaaga ttgtgtaaga aagaaggaca 1020gggcaagaat aagacaaaag ataacagggt agaataaaga ttgtgtaaga aagaaggaca 1020

gcaacaggac atgggaacct tttatagagt aacattttga taatggatga tgagaattaa 1080gcaacaggac atgggaacct tttatagagt aacattttga taatggatga tgagaattaa 1080

tgagttagac agggatgggt gggaatgatt gaaggtgtga gtactttagc acagattaag 1140tgagttagac agggatgggt gggaatgatt gaaggtgtga gtactttagc acagattaag 1140

accaaatcat taggatttaa agagttgtgt agagttagtg aaggaaaagc cttagaatta 1200accaaatcat taggatttaa agagttgtgt agagttagtg aaggaaaagc cttagaatta 1200

aatttggctg cggataaaac attcttggat tagactgaag actcttttct gtgctaagta 1260aatttggctg cggataaaac attcttggat tagactgaag actcttttct gtgctaagta 1260

agtatattta tgataatgat gatgactgta gtgctgaata tttaataaat aaaaacaaaa 1320agtatattta tgataatgat gatgactgta gtgctgaata tttaataaat aaaaacaaaa 1320

ttaattgccg catacataat gtcctgaata ctattgtaaa tgttttatct tatttccttt 1380ttaattgccg catacataat gtcctgaata ctattgtaaa tgttttatct tatttccttt 1380

aaactgtcta cagcactata aggtaggtac cagtattgtc acagttacac agatatggaa 1440aaactgtcta cagcactata aggtaggtac cagtattgtc acagttacac agatatggaa 1440

accgagacac agggaagtta agttacttga tcaatttcaa gcaatcggca agccatggag 1500accgagacac agggaagtta agttacttga tcaatttcaa gcaatcggca agccatggag 1500

catctatgtc agggctgcca ggacatgtga ctgtaaacag aagtttttca ctttttaact 1560catctatgtc agggctgcca ggacatgtga ctgtaaacag aagtttttca ctttttaact 1560

caaagagggt atgtggctgg gttaatggaa agcttcagga ccctcagaaa acattactaa 1620caaagaggt atgtggctgg gttaatggaa agcttcagga ccctcagaaa acattactaa 1620

caagcaaatg aaaggtgtat ctggaagatt aagttttaac agactcttca tttccatcga 1680caagcaaatg aaaggtgtat ctggaagatt aagttttaac agactcttca tttccatcga 1680

tccaataatg cacttaggga gatgactggg catattgagg ataggaagag agaagtgaaa 1740tccaataatg cacttaggga gatgactggg catattgagg ataggaagag agaagtgaaa 1740

acacagcttt ttatattgtt cttaacaggc ttgtgccaaa catcttctgg gtggatttag 1800acacagcttt ttatattgtt cttaacaggc ttgtgccaaa catcttctgg gtggatttag 1800

gtgattgagg agaagaaaga cacaggagcg aaattctctg agcacaaggg aggagttcta 1860gtgattgagg agaagaaaga cacaggagcg aaattctctg agcacaaggg aggagttcta 1860

cactcagact gagccaacag acttttctgg cctgacaacc agggcggcgc aggatgctca 1920cactcagact gagccaacag acttttctgg cctgacaacc agggcggcgc aggatgctca 1920

gtgcagagag gaagaagcag gtggtctttg cagctgaaag ctcagctgat ttgcatatgg 1980gtgcagagag gaagaagcag gtggtctttg cagctgaaag ctcagctgat ttgcatatgg 1980

agtcattata caacatccca gaattcttta agggcagctg ccaggaagct aagaagcatc 2040agtcattata caacatccca gaattcttta agggcagctg cccaggaagct aagaagcatc 2040

ctctcttcta gctctcagag atggagacag acacactcct gctatgggtg ctgctgctct 2100ctctcttcta gctctcagag atggagacag acacactcct gctatgggtg ctgctgctct 2100

gggttccagg tgagggtaca gataagtgtt atgagcaacc tctgtggcca ttatgatgct 2160gggttccagg tgagggtaca gataagtgtt atgagcaacc tctgtggcca ttatgatgct 2160

ccatgcctct ctgttcttga tcactataat tagggcattt gtcactggtt ttaagtttcc 2220ccatgcctct ctgttcttga tcactataat tagggcattt gtcactggtt ttaagtttcc 2220

ccagtcccct gaattttcca ttttctcaga gtgatgtcca aaattattct taaaaattta 2280ccagtcccct gaattttcca ttttctcaga gtgatgtcca aaattattct taaaaattta 2280

aatgaaaagg tcctctgctg tgaaggcttt taaagatata taaaaataat ctttgtgttt 2340aatgaaaagg tcctctgctg tgaaggcttt taaagatata taaaaataat ctttgtgttt 2340

atcattccag gtgccagatg tataccaccg gagaaattgt gttgacgcag tctccaggca 2400atcattccag gtgccagatg tataccaccg gagaaattgt gttgacgcag tctccaggca 2400

ccctgtcttt gtctccaggg gaaagagcca ccctctcctg cagggccagt cagagtgtta 2460ccctgtcttt gtctccaggg gaaagagcca ccctctcctg caggggccagt cagagtgtta 2460

gcagcagcta cttagcctgg taccagcaga aacctggcca ggctcccagg ctcctcatct 2520gcagcagcta cttagcctgg taccagcaga aacctggcca ggctcccagg ctcctcatct 2520

atggtgcatc cagcagggcc actggcatcc cagacaggtt cagtggcagt gggtctggga 2580atggtgcatc cagcaggggcc actggcatcc cagacaggtt cagtggcagt gggtctggga 2580

cagacttcac tctcaccatc agcagactgg agcctgaaga ttttgcagtg tattactgtc 2640cagacttcac tctcaccatc agcagactgg agcctgaaga ttttgcagtg tattactgtc 2640

agcagtatgg tagctcacct tggacgttcg gccaagggac caaggtggaa atcaaacgta 2700agcagtatgg tagctcacct tggacgttcg gccaagggac caaggtggaa atcaaacgta 2700

agtaattttt cactattgtc ttctgaaatt tgggtctgat ggccagtatt gacttttaga 2760agtaattttt cactattgtc ttctgaaatt tgggtctgat ggccagtatt gacttttaga 2760

ggcttaaata ggagtttggt aaagattggt aaatgagggc atttaagatt tgccatgggt 2820ggcttaaata ggagtttggt aaagattggt aaatgagggc atttaagatt tgccatgggt 2820

tgcaaaagtt aaactcagct tcaaaaatgg atttggagaa aaaaagatta aattgctcta 2880tgcaaaagtt aaactcagct tcaaaaatgg atttggagaa aaaaagatta aattgctcta 2880

aactgaatga cacaaagtaa aaaaaaaaag tgtaactaaa aaggaaccct tgtatttcta 2940aactgaatga cacaaagtaa aaaaaaaaag tgtaactaaa aaggaaccct tgtatttcta 2940

aggagcaaaa gtaaatttat ttttgttcac tcttgccaaa tattgtattg gttgttgctg 3000aggagcaaaa gtaaatttat ttttgttcac tcttgccaaa tattgtattg gttgttgctg 3000

attatgcatg atacagaaaa gtggaaaaat acatttttta gtctttctcc cttttgtttg 3060attatgcatg atacagaaaa gtggaaaaat acatttttta gtctttctcc cttttgtttg 3060

ataaattatt ttgtcagaca acaataaaaa tcaatagcac gccctaagat ctagatgcat 3120ataaattatt ttgtcagaca acaataaaaa tcaatagcac gccctaagat ctagatgcat 3120

gctcgagtgc catttcatta cctctttctc cgcacccgac atagat 3166gctcgagtgc catttcatta cctctttctc cgcacccgac atagat 3166

<210> 150<210> 150

<211> 82<211> 82

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Каркас v1 направляющей РНК<223> v1 guide RNA scaffold

<400> 150<400> 150

gttggaacca ttcaaaacag catagcaagt taaaataagg ctagtccgtt atcaacttga 60gttggaacca ttcaaaacag catagcaagt taaaataagg ctagtccgtt atcaacttga 60

aaaagtggca ccgagtcggt gc 82aaaagtggca ccgagtcggt gc 82

<210> 151<210> 151

<211> 76<211> 76

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Каркас v2 направляющей РНК<223> v2 guide RNA scaffold

<400> 151<400> 151

gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60

ggcaccgagt cggtgc 76ggcaccgagt cggtgc 76

<210> 152<210> 152

<211> 86<211> 86

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220> <220>

<223> Каркас v3 направляющей РНК<223> v3 guide RNA scaffold

<400> 152<400> 152

gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggctagtc cgttatcaac 60gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggctagtc cgttatcaac 60

ttgaaaaagt ggcaccgagt cggtgc 86ttgaaaaagt ggcaccgagt cggtgc 86

<---<---

Claims (100)

1. Способ получения антигенсвязывающих белков против представляющего интерес чужеродного антигена, включающий:1. A method for producing antigen-binding proteins against a foreign antigen of interest, comprising: (a) создание генетически модифицированного отличного от человека животного, которым является мышь или крыса, с пониженной толерантностью к представляющему интерес чужеродному антигену, включающее: (a) the creation of a genetically modified non-human animal, which is a mouse or rat, with reduced tolerance to a foreign antigen of interest, comprising: (i) введение в эмбрион мыши или крысы на одноклеточной стадии или эмбриональную стволовую (ЭС) клетку мыши или крысы:(i) introducing into a single-cell stage mouse or rat embryo or mouse or rat embryonic stem (ES) cell: (I) белка Cas9 или нуклеиновой кислоты, кодирующей белок Cas9,(I) the Cas9 protein or a nucleic acid encoding the Cas9 protein, (II) первой направляющей РНК или ДНК, кодирующей первую направляющую РНК, причем первая направляющая РНК гибридизуется с последовательностью, распознаваемой первой направляющей РНК в геномном локусе-мишени, причем геномный локус-мишень содержит весь или часть гена, кодирующего аутоантиген, гомологичный, ортологичный, или обладающий общим представляющим интерес эпитопом с представляющим интерес чужеродным антигеном, и(II) a first guide RNA or DNA encoding a first guide RNA, wherein the first guide RNA hybridizes to a sequence recognized by the first guide RNA at a target genomic locus, wherein the target genomic locus comprises all or part of a gene encoding a self-antigen that is homologous, orthologous, or shares an epitope of interest with a foreign antigen of interest, and (III) второй направляющей РНК или ДНК, кодирующей вторую направляющую РНК, причем вторая направляющая РНК гибридизуется с последовательностью, распознаваемой второй направляющей РНК в геномном локусе-мишени,(III) a second guide RNA or DNA encoding a second guide RNA, wherein the second guide RNA hybridizes to a sequence recognized by the second guide RNA at a target genomic locus, (ii) идентификацию генетически модифицированного эмбриона мыши или крысы на одноклеточной стадии или генетически модифицированной ЭС клетки мыши или крысы с биаллельной модификацией геномного локуса-мишени, причем экспрессия аутоантигена устраняется, и(ii) identifying a genetically modified single-cell stage mouse or rat embryo or a genetically modified mouse or rat ES cell with a biallelic modification of the target genomic locus, wherein expression of the autoantigen is abolished, and (iii) получение генетически модифицированной мыши или крысы из генетически модифицированного эмбриона мыши или крысы на одноклеточной стадии или генетически модифицированной ЭС клетки мыши или крысы, причем геномный локус-мишень модифицирован в паре соответствующих первой и второй хромосом у генетически модифицированной мыши или крысы, таким образом, что экспрессия аутоантигена устранена,(iii) producing a genetically modified mouse or rat from a genetically modified single-cell stage mouse or rat embryo or a genetically modified mouse or rat ES cell, wherein the target genomic locus is modified in a pair of corresponding first and second chromosomes in the genetically modified mouse or rat such that expression of the autoantigen is eliminated, (b) иммунизацию генетически модифицированной мыши или крысы, полученной на стадии (а), представляющим интерес чужеродным антигеном, и(b) immunizing the genetically modified mouse or rat obtained in step (a) with the foreign antigen of interest, and (c) поддержание генетически модифицированной мыши или крысы в условиях для инициирования иммунного ответа на представляющий интерес чужеродный антиген, причем генетически модифицированная мышь или крыса продуцирует антигенсвязывающие белки против представляющего интерес чужеродного антигена.(c) maintaining the genetically modified mouse or rat under conditions for initiating an immune response to a foreign antigen of interest, wherein the genetically modified mouse or rat produces antigen-binding proteins against the foreign antigen of interest. 2. Способ по п. 1, в котором белок Cas9 обладает индуцирующей двухцепочечные разрывы активностью и белок Cas9 и направляющие РНК создают спаренные двухцепочечные разрывы в разных сайтах геномного локуса-мишени.2. The method according to claim 1, wherein the Cas9 protein has double-strand break-inducing activity and the Cas9 protein and guide RNAs create paired double-strand breaks at different sites of the target genomic locus. 3. Способ по п. 1 или 2, в котором:3. The method according to item 1 or 2, wherein: (I) клетка или эмбрион на стадии (а)(i) представляет собой эмбрион мыши или крысы на одноклеточной стадии, и получение генетически модифицированной мыши или крысы на стадии (а)(iii) включает имплантацию генетически модифицированного эмбриона мыши или крысы на одноклеточной стадии суррогатной матери мыши или крысы для получения генетически модифицированной мыши или крысы, у которой геномный локус-мишень модифицирован в паре соответствующих первой и второй хромосом так, что экспрессия аутоантигена устранена, или(I) the cell or embryo in step (a)(i) is a one-cell stage mouse or rat embryo, and producing the genetically modified mouse or rat in step (a)(iii) comprises implanting the genetically modified one-cell stage mouse or rat embryo into a surrogate mouse or rat mother to produce a genetically modified mouse or rat in which the target genomic locus is modified in the pair of corresponding first and second chromosomes such that expression of the self-antigen is abolished, or (II) клетка или эмбрион на стадии (а)(i) представляет собой ЭС клетку мыши или крысы, где получение генетически модифицированной мыши или крысы на стадии (а)(iii) включает введение генетически модифицированной ЭС клетки мыши или крысы в эмбрион-хозяин мыши или крысы, и имплантацию суррогатной матери мыши или крысы эмбриона-хозяина мыши или крысы для получения генетически модифицированной мыши или крысы, у которой геномный локус-мишень модифицирован в паре соответствующих первой и второй хромосом так, что экспрессия аутоантигена устранена.(II) the cell or embryo of step (a)(i) is a mouse or rat ES cell, wherein producing the genetically modified mouse or rat of step (a)(iii) comprises introducing the genetically modified mouse or rat ES cell into a mouse or rat host embryo, and implanting a mouse or rat surrogate mother of the mouse or rat host embryo to produce a genetically modified mouse or rat in which the target genomic locus is modified in the pair of corresponding first and second chromosomes such that expression of the self-antigen is abolished. 4. Способ по любому из пп. 1-3, в котором клетка или эмбрион на стадии (a)(i) представляет собой ЭС клетку мыши или крысы.4. The method according to any one of claims 1 to 3, wherein the cell or embryo in step (a)(i) is a mouse or rat ES cell. 5. Способ по любому из пп. 1-4, дополнительно включающий:5. The method according to any of paragraphs 1-4, additionally comprising: (d) получение гибридомы из В-клеток, выделенных из иммунизированной генетически модифицированной мыши или крысы.(d) obtaining a hybridoma from B cells isolated from an immunized genetically modified mouse or rat. 6. Способ по любому из пп. 1-5, дополнительно включающий:6. The method according to any of paragraphs 1-5, additionally comprising: (d) получение от иммунизированной генетически модифицированной мыши или крысы первой последовательности нуклеиновой кислоты, кодирующей вариабельный домен тяжелой цепи иммуноглобулина одного из антигенсвязывающих белков против представляющего интерес чужеродного антигена, и/или второй последовательности нуклеиновой кислоты, кодирующей вариабельный домен легкой цепи иммуноглобулина одного из антигенсвязывающих белков против представляющего интерес чужеродного антигена.(d) obtaining from an immunized genetically modified mouse or rat a first nucleic acid sequence encoding a variable domain of an immunoglobulin heavy chain of one of the antigen-binding proteins against a foreign antigen of interest and/or a second nucleic acid sequence encoding a variable domain of an immunoglobulin light chain of one of the antigen-binding proteins against a foreign antigen of interest. 7. Способ по п. 6, в котором последовательность первой нуклеиновой кислоты и/или последовательность второй нуклеиновой кислоты получают из лимфоцита генетически модифицированной мыши или крысы или из гибридомы, полученной из лимфоцитов, или7. The method according to claim 6, wherein the first nucleic acid sequence and/or the second nucleic acid sequence are obtained from a lymphocyte of a genetically modified mouse or rat or from a hybridoma obtained from lymphocytes, or где генетически модифицированная мышь или крыса содержит гуманизированный локус иммуноглобулина, и причем первая последовательность нуклеиновой кислоты кодирует вариабельный домен тяжелой цепи иммуноглобулина человека, а вторая последовательность нуклеиновой кислоты кодирует вариабельный домен легкой цепи иммуноглобулина человека.wherein the genetically modified mouse or rat comprises a humanized immunoglobulin locus, and wherein the first nucleic acid sequence encodes a human immunoglobulin heavy chain variable domain and the second nucleic acid sequence encodes a human immunoglobulin light chain variable domain. 8. Способ по любому из пп. 1-7, в котором:8. The method according to any one of paragraphs 1-7, in which: (I) антигенсвязывающие белки, продуцируемые генетически модифицированной мышью или крысой, против представляющего интерес чужеродного антигена имеют более высокий титр, чем антигенсвязывающие белки, продуцируемые контрольной мышью или крысой, которая является диким типом в геномном локусе-мишени, после иммунизации контрольной мыши или крысы представляющим интерес чужеродным антигеном, и/или(I) antigen-binding proteins produced by the genetically modified mouse or rat against the foreign antigen of interest have a higher titer than antigen-binding proteins produced by a control mouse or rat that is wild type at the target genomic locus, following immunization of the control mouse or rat with the foreign antigen of interest, and/or (II) более разнообразный генетический репертуар антигенсвязывающих белков против представляющего интерес чужеродного антигена продуцируется генетически модифицированной мышью или крысой после иммунизации генетически модифицированной мыши или крысы представляющим интерес чужеродным антигеном по сравнению с антигенсвязывающими белками, продуцируемыми контрольной мышью или крысой, которая является диким типом в указанном геномном локусе-мишени, после иммунизации контрольной мыши или крысы представляющим интерес чужеродным антигеном, и/или(II) a more diverse genetic repertoire of antigen-binding proteins against the foreign antigen of interest is produced by the genetically modified mouse or rat following immunization of the genetically modified mouse or rat with the foreign antigen of interest compared to antigen-binding proteins produced by a control mouse or rat that is wild type at the specified target genomic locus following immunization of the control mouse or rat with the foreign antigen of interest, and/or (III) антигенсвязывающие белки, продуцируемые генетически модифицированной мышью или крысой, против представляющего интерес чужеродного антигена используют большее разнообразие сегментов тяжелой цепи V гена и/или сегментов легкой цепи V гена по сравнению с антигенсвязывающими белками, продуцируемыми контрольной мышью или крысой, которая является диким типом в геномном локусе-мишени, после иммунизации контрольной мыши или крысы представляющим интерес чужеродным антигеном, и/или(III) the antigen-binding proteins produced by the genetically modified mouse or rat against the foreign antigen of interest utilize a greater diversity of V gene heavy chain segments and/or V gene light chain segments compared to antigen-binding proteins produced by a control mouse or rat that is wild type at the target genomic locus, following immunization of the control mouse or rat with the foreign antigen of interest, and/or (IV) некоторые из антигенсвязывающих белков, продуцируемых генетически модифицированной мышью или крысой, против представляющего интерес чужеродного антигена, перекрестно реагируют с аутоантигеном.(IV) some of the antigen-binding proteins produced by the genetically modified mouse or rat against the foreign antigen of interest cross-react with the self-antigen. 9. Способ по любому из пп. 1-8, в котором последовательность, распознаваемая первой направляющей РНК, расположена в 5' положении относительно последовательности, распознаваемой второй направляющей РНК в геномном локусе-мишени, и9. The method according to any one of claims 1 to 8, wherein the sequence recognized by the first guide RNA is located in the 5' position relative to the sequence recognized by the second guide RNA in the target genomic locus, and где стадия (а)(ii) включает проведение анализа удерживания для определения того, что число копий равно 2 для участка в 5' положении и в пределах 1 т.п.о. последовательности, распознаваемой первой направляющей РНК, и/или для участка в 3' положении и в пределах 1 т.п.о. последовательности, распознаваемой второй направляющей РНК.wherein step (a)(ii) comprises performing a retention assay to determine that the copy number is 2 for the region at the 5' position and within 1 kb of the sequence recognized by the first guide RNA and/or for the region at the 3' position and within 1 kb of the sequence recognized by the second guide RNA. 10. Способ по любому из пп. 1-9, в котором представляющий интерес чужеродный антиген содержит весь или часть белка человека.10. The method according to any one of claims 1 to 9, wherein the foreign antigen of interest comprises all or part of a human protein. 11. Способ по любому из пп. 1-10, в котором геномный локус-мишень модифицируется так, чтобы содержать замену одного или более нуклеотидов, или в котором биаллельная модификация содержит биаллельную делецию всего или части гена, кодирующего аутоантиген, в паре соответствующих первой и второй хромосом.11. The method according to any one of claims 1-10, wherein the target genomic locus is modified to contain a substitution of one or more nucleotides, or wherein the biallelic modification comprises a biallelic deletion of all or part of a gene encoding an autoantigen in a pair of corresponding first and second chromosomes. 12. Способ по п. 11, в котором биаллельная делеция является точной делецией без случайных вставок и делеций (инделей) или в котором биаллельная делеция имеет размер между от 0,1 т.п.о. до 200 т.п.о.12. The method according to claim 11, wherein the biallelic deletion is an exact deletion without random insertions and deletions (indels) or wherein the biallelic deletion has a size between 0.1 kb to 200 kb. 13. Способ по любому из пп. 1-12, в котором:13. The method according to any one of paragraphs 1-12, in which: (I) последовательность, распознаваемая первой направляющей РНК, содержит старт-кодон для гена, кодирующего аутоантиген, или находится в пределах 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от старт-кодона, и последовательность, распознаваемая второй направляющей РНК, содержит стоп-кодон для гена, кодирующего аутоантиген, или находится в пределах 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от стоп-кодона, или(I) the sequence recognized by the first guide RNA contains a start codon for a gene encoding an autoantigen, or is within 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the start codon, and the sequence recognized by the second guide RNA contains a stop codon for a gene encoding an autoantigen, or is within 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the stop codon, or (II) последовательности, распознаваемые первой и второй направляющими РНК, различны, и каждая из последовательностей, распознаваемых первой и второй направляющими РНК, содержит старт-кодон для гена, кодирующего аутоантиген, или находится в пределах 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от старт-кодона, и в котором модификация содержит биаллельное разрушение старт-кодона гена, кодирующего аутоантиген.(II) the sequences recognized by the first and second guide RNAs are different, and each of the sequences recognized by the first and second guide RNAs comprises a start codon for a gene encoding an autoantigen, or is within 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 or 1000 nucleotides of a start codon, and wherein the modification comprises a biallelic disruption of a start codon of a gene encoding an autoantigen. 14. Способ по любому из пп. 1-13, в котором стадия введения (а)(i) дополнительно включает введение в ЭС клетку мыши или крысы или эмбрион мыши или крысы на одноклеточной стадии:14. The method according to any one of claims 1 to 13, wherein the step of introducing (a)(i) further comprises introducing into a mouse or rat ES cell or a mouse or rat embryo at the single-cell stage: (IV) третьей направляющей РНК или ДНК, кодирующей третью направляющую РНК, где третья направляющая РНК гибридизуется с последовательностью, распознаваемой третьей направляющей РНК, в геномном локусе-мишени, и(IV) a third guide RNA or DNA encoding a third guide RNA, wherein the third guide RNA hybridizes to a sequence recognized by the third guide RNA at a target genomic locus, and (V) четвертой направляющей РНК или ДНК, кодирующей четвертую направляющую РНК, где четвертая направляющая РНК гибридизуется с последовательностью, распознаваемой четвертой направляющей РНК, в геномном локусе-мишени.(V) a fourth guide RNA or DNA encoding a fourth guide RNA, wherein the fourth guide RNA hybridizes to a sequence recognized by the fourth guide RNA at a target genomic locus. 15. Способ по любому из пп. 1-14, в котором:15. The method according to any one of paragraphs 1-14, in which: (I) стадия (a)(i) включает введение ДНК, кодирующей белок Cas9, ДНК, кодирующей первую направляющую РНК, и ДНК, кодирующей вторую направляющую РНК, или(I) step (a)(i) comprises introducing DNA encoding a Cas9 protein, DNA encoding a first guide RNA, and DNA encoding a second guide RNA, or (II) стадия (a)(i) включает введение РНК, кодирующей белок Cas9, первой направляющей РНК и второй направляющей РНК.(II) step (a)(i) comprises introducing RNA encoding the Cas9 protein, a first guide RNA and a second guide RNA. 16. Способ по любому из пп. 1-15, в котором на стадии (а)(i) не вводится экзогенная матрица для репарации.16. The method according to any one of claims 1 to 15, wherein step (a)(i) does not introduce an exogenous repair matrix. 17. Способ по любому из пп. 1-15, в котором стадия введения (а)(i) дополнительно включает введение в ЭС клетку мыши или крысы или эмбрион мыши или крысы на одноклеточной стадии:17. The method according to any one of claims 1 to 15, wherein the step of introducing (a)(i) further comprises introducing into a mouse or rat ES cell or a mouse or rat embryo at the single-cell stage: (IV) экзогенной матрицы для репарации, содержащей 5'-плечо гомологии, которое гибридизуется с 5' последовательностью-мишенью в геномном локусе-мишени, и 3'-плечо гомологии, которое гибридизуется с 3' последовательностью-мишенью в геномном локусе-мишени, при условии, что, если клетка или эмбрион на стадии (а)(i) представляет собой эмбрион мыши или крысы на одноклеточной стадии, экзогенная матрица для репарации составляет не более чем 5 т.п.о. в длину.(IV) an exogenous repair template comprising a 5' homology arm that hybridizes to a 5' target sequence at a target genomic locus and a 3' homology arm that hybridizes to a 3' target sequence at a target genomic locus, provided that if the cell or embryo in step (a)(i) is a one-cell stage mouse or rat embryo, the exogenous repair template is no more than 5 kb in length. 18. Способ по п. 17, в котором биаллельная модификация в геномном локусе-мишени на стадии (a)(ii) создана путем рекомбинации экзогенной матрицы для репарации с геномным локусом-мишенью и содержит делецию последовательности нуклеиновой кислоты гена, кодирующего аутоантиген, в котором последовательность удаленной нуклеиновой кислоты состоит из последовательности нуклеиновой кислоты между 5' и 3' последовательностями-мишенями.18. The method of claim 17, wherein the biallelic modification at the target genomic locus in step (a)(ii) is created by recombination of an exogenous repair template with the target genomic locus and comprises a deletion of a nucleic acid sequence of a gene encoding an autoantigen, wherein the deleted nucleic acid sequence consists of a nucleic acid sequence between the 5' and 3' target sequences. 19. Способ по п. 18, в котором экзогенная матрица для репарации дополнительно содержит вставку нуклеиновой кислоты, фланкированную 5'-плечом гомологии и 3'-плечом гомологии, и19. The method according to claim 18, wherein the exogenous repair template further comprises a nucleic acid insert flanked by a 5' homology arm and a 3' homology arm, and в котором вставка нуклеиновой кислоты гомологична или ортологична геномному локусу-мишени и вставка нуклеиновой кислоты замещает удаленную последовательность нуклеиновой кислоты гена, кодирующего аутоантиген.wherein the nucleic acid insert is homologous or orthologous to the target genomic locus and the nucleic acid insert replaces a deleted nucleic acid sequence of a gene encoding an autoantigen. 20. Способ по любому из пп. 17-19, в котором длина экзогенной матрицы для репарации находится в промежутке от 50 нуклеотидов до 1 т.п.о., находится в промежутке от 80 нуклеотидов до 200 нуклеотидов, или в котором экзогенная матрица для репарации представляет собой одноцепочечный олигодезоксинуклеотид.20. The method according to any one of claims 17-19, wherein the length of the exogenous repair template is in the range of 50 nucleotides to 1 kb, is in the range of 80 nucleotides to 200 nucleotides, or wherein the exogenous repair template is a single-stranded oligodeoxynucleotide. 21. Способ по любому из пп. 17-19, в котором клетка или эмбрион на стадии (а)(i) представляет собой ЭС клетку мыши или крысы и в котором:21. The method according to any one of claims 17 to 19, wherein the cell or embryo in step (a)(i) is a mouse or rat ES cell and wherein: (a) экзогенная матрица для репарации представляет собой большой нацеливающий вектор (LTVEC), который имеет длину по меньшей мере 10 т.п.о., или(a) the exogenous repair template is a large targeting vector (LTVEC) that is at least 10 kb in length, or (b) экзогенная матрица для репарации представляет собой LTVEC, причем общая сумма 5'- и 3'-плечей гомологии LTVEC имеет длину по меньшей мере 10 т.п.о.(b) the exogenous repair template is LTVEC, wherein the sum of the 5' and 3' arms of LTVEC homology is at least 10 kb in length. 22. Способ по любому из пп. 1-21, в котором мышь или крыса содержит гуманизированный локус иммуноглобулина.22. The method according to any one of claims 1-21, wherein the mouse or rat comprises a humanized immunoglobulin locus. 23. Способ по любому из пп. 1-22, в котором отличное от человека животное представляет собой мышь и в котором линия мыши содержит линию BALB/c.23. The method according to any one of claims 1 to 22, wherein the non-human animal is a mouse and wherein the mouse strain comprises the BALB/c strain. 24. Способ по п. 23, в котором линия мышей содержит смесь линии BALB/c, C57BL/6 и 129.24. The method of claim 23, wherein the mouse strain comprises a mixture of the BALB/c, C57BL/6 and 129 strains. 25. Способ по п. 24, в котором линия мышей представляет собой 50% BALB/c, 25% C57BL/6 и 25% 129.25. The method of claim 24, wherein the mouse strain is 50% BALB/c, 25% C57BL/6, and 25% 129. 26. Способ по любому из пп. 23-25, в котором гаплотип MHC мыши представляет собой MHCb/d.26. The method according to any one of claims 23-25, wherein the mouse MHC haplotype is MHC b/d . 27. Способ по любому из пп. 23-26, в котором мышь содержит в своей зародышевой линии неперестроенные генные сегменты вариабельного участка человека, вставленные в эндогенный локус иммуноглобулина мыши, где неперестроенные генные сегменты вариабельного участка человека являются генными сегментами тяжелой цепи, а локус иммуноглобулина мыши является локусом тяжелой цепи, и/или в котором неперестроенные генные сегменты вариабельного участка человека являются сегментами легкой цепи каппа или лямбда, и локус иммуноглобулина мыши является локусом легкой цепи.27. The method of any one of claims 23-26, wherein the mouse comprises in its germline unrearranged human variable region gene segments inserted into an endogenous mouse immunoglobulin locus, wherein the unrearranged human variable region gene segments are heavy chain gene segments and the mouse immunoglobulin locus is a heavy chain locus, and/or wherein the unrearranged human variable region gene segments are kappa or lambda light chain segments and the mouse immunoglobulin locus is a light chain locus. 28. Способ по п. 27, в котором мышь содержит в своих зародышевых линиях неперестроенные генные сегменты вариабельного участка человека, функционально связанные с геном константного участка мыши, причем мышь не имеет гена константного участка человека и причем ген константного участка мыши находится в эндогенном локусе иммуноглобулина мыши.28. The method of claim 27, wherein the mouse comprises in its germ lines unrearranged human variable region gene segments functionally linked to a mouse constant region gene, wherein the mouse does not have a human constant region gene and wherein the mouse constant region gene is located in an endogenous mouse immunoglobulin locus. 29. Способ по п. 28, в котором мышь содержит:29. The method according to claim 28, wherein the mouse comprises: (I) локус тяжелой цепи, содержащий генные сегменты V, D и J тяжелой цепи иммуноглобулина человека, причем генные сегменты V, D и J тяжелой цепи иммуноглобулина человека функционально связаны с геном константного участка тяжелой цепи иммуноглобулина мыши, причем ген константного участка тяжелой цепи иммуноглобулина мыши находится в эндогенном локусе иммуноглобулина мыши, и (I) a heavy chain locus comprising human immunoglobulin heavy chain V, D, and J gene segments, wherein the human immunoglobulin heavy chain V, D, and J gene segments are operably linked to a mouse immunoglobulin heavy chain constant region gene, wherein the mouse immunoglobulin heavy chain constant region gene is located in an endogenous mouse immunoglobulin locus, and (II) локус легкой цепи, содержащий генные сегменты V и J легкой цепи иммуноглобулина человека, причем генные сегменты V и J легкой цепи иммуноглобулина человека функционально связаны с последовательностью гена константного участка легкой цепи иммуноглобулина мыши, (II) a light chain locus comprising human immunoglobulin light chain V and J gene segments, wherein the human immunoglobulin light chain V and J gene segments are operably linked to a mouse immunoglobulin light chain constant region gene sequence, причем (I) перестраивается с образованием последовательности тяжелой цепи, содержащей вариабельный участок тяжелой цепи человека, функционально связанный с константным участком тяжелой цепи мыши, и (II) перестраивается с образованием последовательности легкой цепи, содержащей вариабельный участок легкой цепи человека, функционально связанный с константным участком легкой цепи мыши, и причем мышь неспособна образовывать антитело, которое содержит вариабельный участок человека и константный участок человека.wherein (I) is rearranged to form a heavy chain sequence comprising a human heavy chain variable region operably linked to a mouse heavy chain constant region, and (II) is rearranged to form a light chain sequence comprising a human light chain variable region operably linked to a mouse light chain constant region, and wherein the mouse is incapable of forming an antibody that comprises a human variable region and a human constant region. 30. Способ по любому из пп. 23-26, в котором мышь содержит в своей зародышевой линии гуманизированный вариабельный локус легкой цепи иммуноглобулина, содержащий не более одной или не более двух перестроенных последовательностей V/J легкой цепи человека, функционально связанных с константным участком легкой цепи мыши, и при этом мышь дополнительно содержит гуманизированный вариабельный локус тяжелой цепи иммуноглобулина, содержащий по меньшей мере один неперестроенный V сегмент человека, по меньшей мере один неперестроенный D сегмент человека и по меньшей мере один неперестроенный J сегмент человека, функционально связанный с геном константного участка тяжелой цепи мыши.30. The method of any one of claims 23-26, wherein the mouse comprises in its germline a humanized immunoglobulin light chain variable locus comprising no more than one or no more than two rearranged human light chain V/J sequences operably linked to a mouse light chain constant region, and wherein the mouse further comprises a humanized immunoglobulin heavy chain variable locus comprising at least one non-rearranged human V segment, at least one non-rearranged human D segment, and at least one non-rearranged human J segment operably linked to a mouse heavy chain constant region gene. 31. Способ по п. 30, в котором мышь содержит гуманизированный вариабельный локус тяжелой цепи иммуноглобулина и гуманизированный вариабельный локус легкой цепи иммуноглобулина, причем мышь экспрессирует одну легкую цепь.31. The method of claim 30, wherein the mouse comprises a humanized immunoglobulin heavy chain variable locus and a humanized immunoglobulin light chain variable locus, wherein the mouse expresses one light chain. 32. Способ по п. 30, в котором мышь содержит:32. The method according to claim 30, wherein the mouse comprises: (a) один перестроенный вариабельный участок легкой цепи иммуноглобулина человека (VL/JL), который кодирует VL домен легкой цепи иммуноглобулина человека, причем один перестроенный участок VL/JL человека выбирается из генного сегмента Vκ1-39/Jκ5 человека или генного сегмента Vκ3-20/Jκ1 человека, и (a) one rearranged human immunoglobulin light chain variable region (V L /J L ) that encodes a V L domain of a human immunoglobulin light chain, wherein the one rearranged human V L /J L region is selected from a human Vκ1-39/Jκ5 gene segment or a human Vκ3-20/Jκ1 gene segment, and (b) замещение вариабельных генных сегментов эндогенной тяжелой цепи (VH) одним или более генными сегментами VH человека, причем генные сегменты VH человека функционально связаны с геном константного участка эндогенной тяжелой цепи (CH), и генные сегменты VH человека способны перестраиваться и формировать ген химерной тяжелой цепи человека/мыши.(b) replacing the variable gene segments of the endogenous heavy chain (V H ) with one or more human V H gene segments, wherein the human V H gene segments are operably linked to an endogenous heavy chain constant region gene ( CH ), and the human V H gene segments are capable of rearranging to form a human/mouse chimeric heavy chain gene. 33. Способ по п. 30, в котором мышь экспрессирует популяцию антител, и зародышевая линия мыши содержит только один ген вариабельного участка легкой цепи каппа иммуноглобулина, который представляет собой перестроенный ген вариабельного участка легкой цепи каппа зародышевой линии человека, 33. The method of claim 30, wherein the mouse expresses a population of antibodies, and the germline of the mouse contains only one immunoglobulin light chain variable region kappa gene that is a rearranged human germline variable region kappa light chain gene, причем мышь является либо гетерозиготной по указанному одному гену вариабельного участка легкой цепи каппа иммуноглобулина в том, что она содержит только одну копию, либо гомозиготной по одному гену вариабельного участка легкой цепи каппа иммуноглобулина в том, что она содержит две копии, причем мышь характеризуется активным созреванием аффинности так, что:wherein the mouse is either heterozygous for said single immunoglobulin kappa light chain variable region gene in that it contains only one copy, or homozygous for said single immunoglobulin kappa light chain variable region gene in that it contains two copies, wherein the mouse is characterized by active affinity maturation such that: (a) каждая легкая цепь каппа иммуноглобулина популяции содержит вариабельный домен легкой цепи, который кодируется перестроенным геном вариабельного участка легкой цепи каппа зародышевой линии человека или его соматически мутированным вариантом, (a) each kappa light chain of an immunoglobulin in a population comprises a light chain variable domain that is encoded by a rearranged human germline kappa light chain variable region gene or a somatically mutated variant thereof, (b) популяция содержит антитела, содержащие легкие цепи каппа иммуноглобулина, вариабельный домен легкой цепи которых кодируется перестроенным геном вариабельного участка легкой цепи каппа зародышевой линии человека, и антитела, содержащие легкие цепи каппа иммуноглобулина, вариабельный домен легкой цепи которых кодируется его соматически мутированными вариантами, и (b) the population comprises antibodies comprising immunoglobulin kappa light chains whose light chain variable domain is encoded by a rearranged human germline kappa light chain variable region gene and antibodies comprising immunoglobulin kappa light chains whose light chain variable domain is encoded by somatically mutated variants thereof, and (c) мышь генерирует разнообразную коллекцию соматически мутированных тяжелых цепей с высокой аффинностью, которые успешно спариваются с легкими цепями каппа иммуноглобулина с образованием антител популяции.(c) The mouse generates a diverse collection of somatically mutated high-affinity heavy chains that successfully pair with kappa immunoglobulin light chains to form population antibodies. 34. Способ по п. 30, в котором мышь является гетерозиготной или гомозиготной по своей зародышевой линии для: 34. The method of claim 30, wherein the mouse is heterozygous or homozygous in its germline for: (a) вставки в эндогенный локус вариабельного участка лёгкой цепи иммуноглобулина κ мыши перестроенной Vκ/Jκ последовательности, содержащей: (a) insertion into the endogenous variable region locus of mouse immunoglobulin κ light chain of a rearranged Vκ/Jκ sequence containing: (i) одну последовательность Vκ зародышевой линии человека, причем указанная одна последовательность Vκ зародышевой линии человека присутствует в SEQ ID NO: 148 или SEQ ID NO: 149, и (i) one human germline Vκ sequence, wherein said one human germline Vκ sequence is present in SEQ ID NO: 148 or SEQ ID NO: 149, and (ii) одну последовательность Jκ зародышевой линии человека, причем перестроенная последовательность Vκ/Jκ функционально связана с эндогенным константным участком κ мыши, и (ii) one human germline Jκ sequence, wherein the rearranged Vκ/Jκ sequence is functionally linked to an endogenous mouse κ constant region, and (b) вставки в эндогенный локус вариабельного участка тяжелой цепи иммуноглобулина мыши множества генных сегментов вариабельного участка тяжелой цепи иммуноглобулина человека, причем генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека функционально связаны с константным участком эндогенной тяжелой цепи иммуноглобулина мыши, и генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека способны перестраиваться и формировать перестроенный ген тяжелой цепи химерного иммуноглобулина человека/мыши.(b) inserting into an endogenous mouse immunoglobulin heavy chain variable region locus a plurality of human immunoglobulin heavy chain variable region gene segments, wherein the human immunoglobulin heavy chain variable region gene segments are operably linked to an endogenous mouse immunoglobulin heavy chain constant region, and the human immunoglobulin heavy chain variable region gene segments are capable of rearranging to form a rearranged chimeric human/mouse immunoglobulin heavy chain gene. 35. Способ по любому из пп. 23-34, в котором мышь содержит модификацию локуса тяжелой цепи иммуноглобулина, причем модификация уменьшает или устраняет эндогенную функцию ADAM6, 35. The method of any one of claims 23-34, wherein the mouse comprises a modification of the immunoglobulin heavy chain locus, wherein the modification reduces or eliminates endogenous ADAM6 function, причем мышь содержит эктопическую последовательность нуклеиновой кислоты, кодирующую белок ADAM6 мыши, его ортолог, его гомолог или его фрагмент, причем белок ADAM6 мыши, его ортолог, его гомолог или его фрагмент функционируют у самца мыши, и wherein the mouse comprises an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, its ortholog, its homolog, or a fragment thereof, wherein the mouse ADAM6 protein, its ortholog, its homolog, or a fragment thereof is functional in a male mouse, and причем эктопическая последовательность нуклеиновой кислоты, кодирующая белок ADAM6 мыши, его ортолог, его гомолог или его фрагмент, присутствует в локусе вариабельного участка тяжелой цепи человека.wherein the ectopic nucleic acid sequence encoding the mouse ADAM6 protein, its ortholog, its homolog, or a fragment thereof is present in the human heavy chain variable region locus. 36. Способ по любому из пп. 1-35, в котором отличное от человека животное представляет собой мышь, в котором мышь по меньшей мере частично происходит из линии BALB/c и содержит гуманизированный локус иммуноглобулина,36. The method according to any one of claims 1-35, wherein the non-human animal is a mouse, wherein the mouse is at least partially of BALB/c origin and comprises a humanized immunoglobulin locus, причем представляющий интерес чужеродный антиген представляет собой весь или часть человеческого белка, который ортологичен аутоантигену, и гдеwherein the foreign antigen of interest is all or part of a human protein that is orthologous to the self-antigen, and wherein (I) последовательность, распознаваемая первой направляющей РНК, содержит старт-кодон для гена, кодирующего аутоантиген, или находится в пределах 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от старт-кодона, и последовательность, распознаваемая второй направляющей РНК, содержит стоп-кодон для гена, кодирующего аутоантиген, или находится в пределах 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от стоп-кодона, в результате чего экспрессия аутоантигена устраняется, или(I) the sequence recognized by the first guide RNA comprises a start codon for a gene encoding an autoantigen or is within 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the start codon, and the sequence recognized by the second guide RNA comprises a stop codon for a gene encoding an autoantigen or is within 10, 20, 30, 40, 50, 100, 200, 300, 400, 500, or 1000 nucleotides of the stop codon, resulting in the expression of the autoantigen being eliminated, or (II) последовательности, распознаваемые первой и второй направляющими РНК, различны, и каждая из последовательностей, распознаваемых первой и второй направляющими РНК, содержит старт-кодон для гена, кодирующего аутоантиген, или находится в пределах 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 или 1000 нуклеотидов от старт-кодона, и модификация содержит биаллельное разрушение старт-кодона гена, кодирующего аутоантиген, в результате чего экспрессия аутоантигена устраняется.(II) the sequences recognized by the first and second guide RNAs are different, and each of the sequences recognized by the first and second guide RNAs comprises a start codon for a gene encoding an autoantigen, or is within 10, 20, 30, 40, 50, 100, 200, 300, 400, 500 or 1000 nucleotides of the start codon, and the modification comprises a biallelic disruption of the start codon of the gene encoding the autoantigen, as a result of which expression of the autoantigen is eliminated. 37. Способ по п. 36, в котором мышь содержит:37. The method of claim 36, wherein the mouse comprises: (a) последовательность эктопической нуклеиновой кислоты, кодирующую белок ADAM6 мыши, его ортолог, его гомолог или его фрагмент, причем белок ADAM6 мыши, его ортолог, его гомолог или его фрагмент функционируют у самца мыши,(a) an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, its ortholog, its homolog, or a fragment thereof, wherein the mouse ADAM6 protein, its ortholog, its homolog, or a fragment thereof is functional in a male mouse, (b) локус тяжелой цепи, содержащий генные сегменты V, D и J тяжелой цепи иммуноглобулина человека, причем генные сегменты V, D и J тяжелой цепи иммуноглобулина человека функционально связаны с геном константного участка тяжелой цепи иммуноглобулина мыши, причем ген константного участка тяжелой цепи иммуноглобулина мыши находится в эндогенном локусе иммуноглобулина мыши, и (b) a heavy chain locus comprising human immunoglobulin heavy chain V, D, and J gene segments, wherein the human immunoglobulin heavy chain V, D, and J gene segments are operably linked to a mouse immunoglobulin heavy chain constant region gene, wherein the mouse immunoglobulin heavy chain constant region gene is located in an endogenous mouse immunoglobulin locus, and (c) локус легкой цепи, содержащий генные сегменты V и J легкой цепи иммуноглобулина человека, причем генные сегменты V и J легкой цепи иммуноглобулина человека функционально связаны с последовательностью гена константного участка легкой цепи иммуноглобулина мыши, (c) a light chain locus comprising human immunoglobulin light chain V and J gene segments, wherein the human immunoglobulin light chain V and J gene segments are operably linked to a mouse immunoglobulin light chain constant region gene sequence, причем (b) перестраивается с образованием последовательности тяжелой цепи, содержащей вариабельный участок тяжелой цепи человека, функционально связанный с константным участком тяжелой цепи мыши, и (c) перестраивается с образованием последовательности легкой цепи, содержащей вариабельный участок легкой цепи человека, функционально связанный с константным участком легкой цепи мыши, и причем мышь неспособна образовывать антитело, которое содержит вариабельный участок человека и константный участок человека.wherein (b) is rearranged to form a heavy chain sequence comprising a human heavy chain variable region operably linked to a mouse heavy chain constant region, and (c) is rearranged to form a light chain sequence comprising a human light chain variable region operably linked to a mouse light chain constant region, and wherein the mouse is incapable of forming an antibody that comprises a human variable region and a human constant region. 38. Способ по п. 36, в котором мышь является гетерозиготной или гомозиготной в своей зародышевой линии по: 38. The method of claim 36, wherein the mouse is heterozygous or homozygous in its germline for: (a) последовательности эктопической нуклеиновой кислоты, кодирующей белок ADAM6 мыши, его ортолог, его гомолог или его фрагмент, причем белок ADAM6 мыши, его ортолог, его гомолог или его фрагмент функционируют у самца мыши,(a) an ectopic nucleic acid sequence encoding a mouse ADAM6 protein, its ortholog, its homolog, or a fragment thereof, wherein the mouse ADAM6 protein, its ortholog, its homolog, or a fragment thereof is functional in a male mouse, (b) вставке в эндогенный локус вариабельного участка лёгкой цепи иммуноглобулина κ мыши перестроенной Vκ/Jκ последовательности, содержащей: (b) insertion into the endogenous variable region locus of mouse immunoglobulin κ light chain of a rearranged Vκ/Jκ sequence containing: (i) одну последовательность Vκ зародышевой линии человека, причем указанная одна последовательность Vκ зародышевой линии человека присутствует в SEQ ID NO: 148 или SEQ ID NO: 149, и(i) one human germline Vκ sequence, wherein said one human germline Vκ sequence is present in SEQ ID NO: 148 or SEQ ID NO: 149, and (ii) одну последовательность Jκ зародышевой линии человека, причем перестроенная последовательность Vκ/Jκ функционально связана с эндогенным константным участком κ мыши, и (ii) one human germline Jκ sequence, wherein the rearranged Vκ/Jκ sequence is functionally linked to an endogenous mouse κ constant region, and (c) вставку в эндогенный локус вариабельного участка тяжелой цепи иммуноглобулина мыши множества генных сегментов вариабельного участка тяжелой цепи иммуноглобулина человека, причем генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека функционально связаны с константным участком эндогенной тяжелой цепи иммуноглобулина мыши и генные сегменты вариабельного участка тяжелой цепи иммуноглобулина человека способны перестраиваться и формировать перестроенный ген тяжелой цепи химерного иммуноглобулина человека/мыши.(c) inserting into an endogenous mouse immunoglobulin heavy chain variable region locus a plurality of human immunoglobulin heavy chain variable region gene segments, wherein the human immunoglobulin heavy chain variable region gene segments are operably linked to an endogenous mouse immunoglobulin heavy chain constant region and the human immunoglobulin heavy chain variable region gene segments are capable of rearranging to form a rearranged chimeric human/mouse immunoglobulin heavy chain gene. 39. Способ по любому из пп. 1-38, в котором ЭС клетка мыши или крысы представляет собой гибридную клетку или эмбрион мыши или крысы на одноклеточной стадии представляет собой гибридный эмбрион на одноклеточной стадии, и причем способ дополнительно включает:39. The method according to any one of claims 1-38, wherein the mouse or rat ES cell is a hybrid cell or the mouse or rat embryo at the one-cell stage is a hybrid embryo at the one-cell stage, and wherein the method further comprises: (a') сравнение последовательности пары соответствующих первой и второй хромосом в геномном локусе-мишени и выбор участка-мишени в пределах геномного локуса-мишени перед стадией введения (а)(i) на основе участка-мишени, имеющего более высокий процент идентичности последовательности между парой соответствующих первой и второй хромосом относительно всего или части остатка геномного локуса-мишени, причем участок-мишень содержит:(a') comparing the sequence of a pair of corresponding first and second chromosomes in a target genomic locus and selecting a target region within the target genomic locus prior to the step of introducing (a)(i) based on the target region having a higher percentage of sequence identity between the pair of corresponding first and second chromosomes relative to all or part of the remainder of the target genomic locus, wherein the target region comprises: последовательность, распознаваемую первой направляющей РНК, и по меньшей мере 10 п.о., 20 п.о., 30 п.о., 40 п.о., 50 п.о., 100 п.о., 200 п.о., 300 п.о., 400 п.о., 500 п.о., 600 п.о., 700 п.о., 800 п.о., 900 п.о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6, т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о. или 10 т.п.о. фланкирующей последовательности на 5' стороне, 3' стороне или на каждой стороне последовательности, распознаваемой первой направляющей РНК, и/илиa sequence recognized by the first guide RNA, and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, or 10 kb. flanking sequence on the 5' side, 3' side, or on each side of the sequence recognized by the first guide RNA, and/or последовательность, распознаваемую второй направляющей РНК, и по меньшей мере 10 п.о., 20 п.о., 30 п.о., 40 п.о., 50 п.о., 100 п.о., 200 п.о., 300 п.о., 400 п.о., 500 п.о., 600 п.о., 700 п.о., 800 п.о., 900 п.о., 1 т.п.о., 2 т.п.о., 3 т.п.о., 4 т.п.о., 5 т.п.о., 6, т.п.о., 7 т.п.о., 8 т.п.о., 9 т.п.о. или 10 т.п.о. фланкирующей последовательности на 5' стороне, 3' стороне или на каждой стороне последовательности, распознаваемой второй направляющей РНК.a sequence recognized by the second guide RNA, and at least 10 bp, 20 bp, 30 bp, 40 bp, 50 bp, 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, or 10 kb. flanking sequence on the 5' side, 3' side, or on each side of the sequence recognized by the second guide RNA. 40. Способ по п. 39, где участок-мишень имеет более высокий процент идентичности последовательности между парой соответствующих первой и второй хромосом относительно остальной части геномного локуса-мишени, или40. The method of claim 39, wherein the target region has a higher percentage of sequence identity between the pair of corresponding first and second chromosomes relative to the rest of the target genomic locus, or где участок-мишень имеет по меньшей мере 99,9% идентичности последовательности между парой соответствующих первой и второй хромосом, а остальная часть целевого геномного локуса-мишени имеет не более чем 99,8% идентичности последовательности между парой соответствующих первой и второй хромосом.wherein the target region has at least 99.9% sequence identity between a pair of corresponding first and second chromosomes, and the remainder of the target genomic locus has no more than 99.8% sequence identity between a pair of corresponding first and second chromosomes.
RU2024131507A 2016-05-20 2024-10-21 Methods of overcoming immunological tolerance using plurality of guide rna RU2842438C1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US62/339.472 2016-05-20
US62/368.604 2016-07-29

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2021106817A Division RU2829155C2 (en) 2016-05-20 2017-05-19 Methods of overcoming immunological tolerance using multiple targeting rnas

Publications (1)

Publication Number Publication Date
RU2842438C1 true RU2842438C1 (en) 2025-06-26

Family

ID=

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2425880C2 (en) * 2009-07-30 2011-08-10 Учреждение Российской академии наук Институт общей генетики им. Н.И. Вавилова РАН Method of producing transgene mice
WO2014093622A2 (en) * 2012-12-12 2014-06-19 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2425880C2 (en) * 2009-07-30 2011-08-10 Учреждение Российской академии наук Институт общей генетики им. Н.И. Вавилова РАН Method of producing transgene mice
WO2014093622A2 (en) * 2012-12-12 2014-06-19 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ANN RAN F. et al., Double Nicking by RNA-Guided CRISPR Cas9 for Enhanced Genome Editing Specificity, Cell, 2013, Vol.154, pp.1380-1389. *
ESTHER LATRES et al., Myostatin blockade with a fully human monoclonal antibody induces muscle hypertrophy and reverses muscle atrophy in young and aged mice, Skelet Muscle, 2015, Vol.5, N.34 doi: 10.1186/s13395-015-0060-8. YANLIANG WANG et al., Highly efficient generation of biallelic reporter gene knock-in mice via CRISPR-mediated genome editing of ESCs, Protein Cell, 2016 Feb, Vol.7, N.2, pp.152-156. *

Similar Documents

Publication Publication Date Title
US12342801B2 (en) Methods for producing antigen-binding proteins against foreign antigens
AU2021290301B2 (en) METHODS AND COMPOSITIONS FOR TARGETED GENETIC MODIFICATION USING PAIRED GUIDE RNAs
RU2842438C1 (en) Methods of overcoming immunological tolerance using plurality of guide rna
RU2829155C2 (en) Methods of overcoming immunological tolerance using multiple targeting rnas
HK1262121A1 (en) Methods for breaking immunological tolerance using multiple guide rnas
HK1262121B (en) Methods for breaking immunological tolerance using multiple guide rnas